AI学習用データ『Qlean Dataset』の充実
Visual Bank株式会社は、AI開発の進化を目指す新しいデータソリューション『Qlean Dataset』を拡充しました。このたび追加されたのは、約1500名の老若男女を対象とした顔画像データセットです。これにより、さまざまな研究や商業的なAI開発がよりスムーズに行えるようになります。
概要とデータの特長
新たにリリースされたデータセットは、4つのカテゴリーに分かれ、各々が特定の属性を持つ多様な顔画像を含んでいます。データセットの内容は以下の通りです。
1.
多国籍・老若男女の顔画像データセット:このセクションには、110名の多国籍なモデルの顔画像が含まれています。装飾品の有無や異なる照明条件下で撮影されたこれらの画像は、AIのバイアスを軽減するために大変有用です。データ件数は15,232で、12.7GBの容量を誇ります。
2.
日本人の顔画像データセット(ver.1):200名の日本人の男女を対象にしたこのデータセットには、年齢や照明条件、装飾品の有無に応じた顔画像が含まれており、特にAIの精度向上に貢献します。データ件数は22,800で、3.99GBの容量です。
3.
日本人の顔画像データセット(ver.2):468名の日本人モデルを対象にしたこのデータは、特に多様なシチュエーションでの画像を収めており、67,224件のデータを持ちます。
4.
日本人の顔画像データセット(ver.3):762名の日本人の顔画像が含まれるこのデータセットは、年齢層も広く、さまざまなフォーマットで提供されています。
それぞれのデータセットは、研究において重要な役割を果たすことが期待されています。特に多国籍データは、バイアス検証や、マスク着用時の本人確認精度の向上を目的としたAIの開発に最適です。
ユースケースと応用
これらのデータセットは、いくつかのユースケースにおいて非常に有効です。
- - 顔認識AIの開発:多様な顔画像を用いることで、バイアスを減少させた公平なAIを開発できます。
- - AR/VR技術の向上:多角度・多解像度のデータは、代替現実やゲームにおけるリアルタイムなトラッキング技術の改善に役立ちます。
- - ジェスチャー認識:さまざまな角度で撮影されたデータは、視線推定モデルの訓練に貢献します。
研究機関への支援プログラム
Visual Bankは、アカデミア支援プログラムとして、無償でデータを提供する取り組みも行っています。大学や研究機関における高品質な学習データの使用を促進し、研究の質を高めることを目指しています。
結論
『Qlean Dataset』は、AI開発において新たな可能性を秘めたデータセットです。多様な顔画像データを活用することで、さまざまな分野でのAI技術の発展が期待されています。詳細情報やデータの取得については、公式サイトをご覧ください。
Qlean Dataset公式サイト