Wikipedia:良質な記事/良質な記事の選考/ImageNet 20241023

ImageNet（ノート / 履歴 / ログ / リンク元）

選考終了日時:2024年11月6日 (水) 10:28 (UTC)

（推薦）自薦となります。ディープラーニング、とりわけ画像分野における代表的な大規模データセットの項目です。類似分野の記事が私が探した範囲では見つけられなかったのですが、そのデータセットの背景や成り立ち、深層学習への貢献や課題、データセットに付随するコンテストなど、関連する文献でよく言及されているトピックについて一通り記述できたことと、特にその成立過程や深層学習への貢献について、第三者の文献を元に加筆できたことから、良質な記事として推薦します。 --紅い目の女の子(会話/履歴) 2024年10月23日 (水) 10:28 (UTC)[返信]
賛成：推薦者票。 --紅い目の女の子(会話/履歴) 2024年10月23日 (水) 10:28 (UTC)[返信]
コメント機械学習の分野で良く目にするImageNetについて適切に出典が付与され、大部分は分かりやすく解説されている記事だと思います。最新の動向はあまり追えていなかったのですが、たいへん勉強になりました。読んでみて4点ほど気になりましたのでコメントさせて頂きます。
1. 冒頭の概説部分が知識を持たない読者には難しいのではないかという懸念があります。いつごろ誰が作ったかという基礎情報を含め、学習済みモデルの学習データとして利用されている点などを具体例を挙げつつ説明を加えることができると、より分かりやすくなるのではないかと思いました。
2. 定義について、アノテーションが行われたプリラベリングデータを「大規模な画像データベース」と言い切って良いのか不安が残りました。入門書などを出典としてどのように定義しているかを示した方がいいかもしれません。また「ImageNet」という用語自体はデータセットを指す場合と、それを管理運営しているプロジェクトを指す場合があると思いますので、その点も触れておいた方が良いように思いました。
3. ILSVRCの情報が複数の節に分散しており、「ImageNet Challengeの歴史」節が歯抜け状態になっていたり、時系列通りになっていない点が気になりました。（例えば、ResNet50が2015年に優勝したことが「深層学習への貢献」節で触れられているが、「歴史」節では言及されていないなど）個人的には歴史的な経緯は大きな流れとしてひとつの節でまとめた方がより理解がしやすいのではないかと感じています。
4. 「ILSVRC向けのデータの構築」節で「二つの課題」と解説がありますが、日本語の書籍では「分類問題部門」「物体検知部門」などの用例が確認でき、コンテストということであれば「部門」の方が適切ではと感じました。
項番1,2の冒頭（特に定義）部分の懸念が解消されればおおむね良質な記事の目安を満たすのではないかと考えています。--Gurenge（会話） 2024年10月23日 (水) 14:18 (UTC)[返信]
- 返信早速コメントをいただきありがとうございます。非常に参考になりました。

1点目については全くご指摘のとおりであると思いました。導入部が翻訳ほぼそのままでわかりづらくなってしまっているので、改めて記事全体を要約する内容にすると同時に、基礎的な情報などから入るようにするなど、できるだけ詳しくない方にもわかりやすいようにしたいと思います。

2点目の後半についてもその通りです。ImageNetプロジェクトについて本文では触れているのに、導入部では触れられていませんでした。この点も修正します。前半について、「大規模」の部分には議論の余地がないと思いますが、確かに「画像データベース」という表現はImageNetが発表された（Deng et al. 2009）で使われているので、第三者の表現を採用するほうがよいですね。

3点目についてもご指摘の通りだと思います。意図としては、今後ILSVRCの節が独立項目として成立する可能性も踏まえ、この節を抜いても最低限ImageNetについての説明が成立するようにしようと考えていたのですが、結果的にILSVRCの節の内容が不十分になってしまいました。現状ILSVRCへの言及は歴史的な側面がほとんどですので、集約してみようと思います。

4点目については、コンテストの部門の意味ではなく、コンテスト向けのデータセットを作る上での課題・問題点・障害を表す意図でした。ただ、確かにコンテストの部門とも混同しやすいので、言い回しや文の流れを調整してみます。ILSVRCの説明を歴史節にまとめてしまえばそこでコンテストの部門について先に説明できるので、それもわかりやすさに寄与するかもしれません。

週末に記事を編集する予定です。 --^紅い目の女の子(会話/履歴)

報告導入部について、全面的な改稿を行いました。また、「大規模な画像データベース」についても、改めて第三者の言及に限って調査してみると「データセット」や「dataset」としているものが多かったので、そちらの表記にあわせています。ご指摘の3,4点目に相当する部分の編集・加筆は明日(日付が変わったので、厳密には今日)実施する予定ですが、導入部自体も重要でご意見をいただければ大変ありがたいので、一度報告します。 --紅い目の女の子(会話/履歴) 2024年10月26日 (土) 15:31 (UTC)[返信]

返信 (紅い目の女の子さん宛)

賛成ご対応ありがとうございます。冒頭部分の分かり易さが向上したと思います。まだ加筆の予定ありとのことですが、いったん賛成票とさせて頂きます。--Gurenge（会話） 2024年10月27日 (日) 05:08 (UTC)[返信]

返信さっそくご確認と投票をいただきありがとうございました。先日予告していた歴史節の構成についても、ちょうど今見直しました。アドバイスいただいた通り、まとめてしまう方がわかりやすくなったと感じております。 --紅い目の女の子(会話/履歴) 2024年10月27日 (日) 08:28 (UTC)[返信]

コメント 画像認識の機械学習訓練用のデータセットということですよね。以下のような点が疑問、あるいは不明確と感じました。
- 「画像のURLと画像それぞれに対するアノテーションのデータベースを提供」ということは、ウェブ上で探した画像自体は著作権の問題もあって集めて配布することはできないから、URLとその注釈、カテゴリ分けのデータを配布することで、訓練に使おうとする人は各自でそのURLから画像を入手してくれ、みたいなことで合っているでしょうか。
- 上記の場合、デッドリンクになる画像が必ず出てくると思うのですが、ILSVRCではそれにどう対処しているのでしょうか。参加者は自分で入手した画像で訓練などをしてモデルを作成するが、最終的にはそのモデルを提出して、運営者側で統一された画像セットにそのモデルを適用してエラー率を測る、みたいなことでしょうか。
- カテゴリ分けをするために、大勢の分担作業者に報酬を提供する方式で実施する、というあたりは説明がよくわかります。では、バウンディングボックスのデータもある、となるとそのデータはどうやって作ったのでしょう。やはり大勢の分担作業者にバウンディングボックスを描かせて、複数の人のバウンディングボックスを比較して正確性を検証する、みたいなプロセスがあったのでしょうか。--Tam0031（会話） 2024年10月30日 (水) 13:44 (UTC)[返信]
- コメント コメントありがとうございます。
1点目については、その理解であっています。画像がホストされているURLと、それぞれに対するカテゴリやバウンディングボックスの座標の情報などをまとめたファイルが配布されており、画像は各自で別途入手することになります。

2点目についてです。まず、大前提として、現在の記事中の記述が不正確であることに気づきました。上述の通り、画像は直接提供していないと記載していたのですが、実はImageNetプロジェクト自身も（アノテーションをする際に必要なので当然ですが）画像の実体は保有しています。そしてそれらは、研究・学術利用目的であれば、ImageNetプロジェクトから直接もらえるようになっています(ImageNet)。ILSVRCもコンテストでの研究利用目的に該当するはずで、モデルの学習・評価を含め、リンク切れの問題は発生しないということになります。一方で、営利利用の目的では、ImageNetプロジェクトから直接ダウンロードすることはできません。1点目でご推測の通り、画像についてはURLを使って各自でスクレイピングするなりしてください、という運用です。

なお、後半部分のモデル性能の評価方法は、Tam0031さんの推測の通りです。コンテストの公平性のため、モデルの最終評価に使う画像はコンテスト期間中は公開されていません。コンテスト終了時に主催者にモデルを提出し、主催者側で評価を実施します。ここで記載した内容は、ライセンスにかかわる問題ですのでImageNetの公式なり、コンテスト開催時の要項なりに記載はあると思いますので、後ほど追記します。

3点目についても、ご推察の通りです。バウンディングボックスを複数の人に分担して書かせる作業や、それが正しいかを検証する作業などを、大勢の人に報酬を与えて実施しています。このあたりは記述が煩雑になってしまうかと思い意図的に省略したのですが、この部分で疑問を覚える方がいるならもう少し細かく書いた方がいいかもしれませんね。

3点ご質問いただいた点に関連する記述は、週末に修正する予定です。 --紅い目の女の子(会話/履歴) 2024年10月31日 (木) 02:49 (UTC)[返信]
まだ作業途中ですが、先日の返信内容に一部誤りが含まれていました。返信内容の大枠は変わらないのですが、念の為訂正します。まず、ImageNet自体はいかなる場合でも、営利目的の利用ができず、研究・非営利目的の利用のみが可能でした。また、画像のダウンロードについて、ImageNet-22K(全データ)についてはスクレイピングが必要なのですが、そのサブセットであるコンペティションでも使われるImageNet-1Kについては直接プロジェクトからデータが提供されていました。その旨、本文にも追記しております。

ただコンペティション開催当時にダウンロードができたとする記述は、適切な出典が見つからずやや独自研究になってしまっています。記述は除去しても良いかもしれませんが、ひとまず実態としてそうだったことは強く推定されるため、一旦記述することにしました。

3点目の、バウンディングボックスのアノテーション作業については、明日加筆する予定です。 --紅い目の女の子(会話/履歴) 2024年11月2日 (土) 10:42 (UTC)[返信]

コメント 1日遅くなりましたが、バウンディングボックスのアノテーション作業についても加筆しています。 --紅い目の女の子(会話/履歴) 2024年11月4日 (月) 10:05 (UTC)[返信]

賛成遅くなりました。確認できましたので賛成とさせていただきます。--Tam0031（会話） 2024年11月5日 (火) 15:24 (UTC)[返信]

選考終了時点で、賛成3票、反対0票より、通過。--Family27390（会話） 2024年11月6日 (水) 12:13 (UTC)[返信]