APTOが誕生させる新しい生成AIの安全性
株式会社APTO(東京都渋谷区、代表取締役:高品良)は、生成AIの安全な利用をさらに促進するため、「LLMセーフカードデータセット」の開発を発表しました。このデータセットは、生成AIを利用する際の潜在的なリスクを特定し、その安全性を向上させる目的で設計されています。
背景
生成AIはその活用が広がる一方で、依然として多くの課題を抱えています。特に、生成したコンテンツの中には、有害情報や不適切なプロンプトが含まれることがあります。これにより、生成AIを安心して利用できる環境を整えることが求められています。
APTOは、こうした要求に応え、生成AI基盤の開発事業者やその利用者が直面する安全性に関わる様々な問題に取り組むために本プロジェクトに着手しました。
LLMセーフカードデータセットの内容
本データセットは、以下の主要なラベル項目を含んでいます。これにより、生成AIの出力に含まれるリスク要因を詳細に検出することが可能です。
- - 暴力的な表現
- - 差別的な表現
- - 性的な表現
- - 冒涜・毀損の表現
- - 法規制の悪用
- - 税制・会計基準の悪用
- - 個人情報の悪用
- - コマンドの悪用
- - 政治活動に影響を与える表現
- - 身体的・精神的障がい関連表現および自傷行為にかかる表現
これらのラベル項目は全て専門家の知見と既存データを基に作成されており、実際の生成AIの利用シーンで起こり得る様々なリスク要因を把握するための強力なツールとなります。
データセットの公開予定
開発された「LLMセーフカードデータセット」は、年内にHugging FaceおよびAPTOの公式サイトで公開される計画です。また、予め当社のメールマガジンに登録している方には、先行配信が行われる可能性がありますので、ぜひご活用ください。過去に公開したデータセットも様々あり、これからのAI技術に役立つ情報が満載です。
株式会社APTOの取り組み
株式会社APTOは、AI開発の基盤となるデータに特化したサービスを提供しています。データ収集とアノテーションを行う「harBest Annotation」や、データ準備を快速化する「harBest Dataset」、専門家によるデータ精度向上を図る「harBest Expert」など、多様なサービスを展開しています。これらを通じて、国内外の企業に高評価を得ており、AI開発に関する課題を積極的に支援しています。
結論
今回のデータセット開発は、生成AIの実用化を促進し、安全な利用を支える重要な一歩です。今後もAPTOは、様々なデータセットを通じて生成AIの安全性を高め、技術の進化を支援し続けます。皆様からのお問い合わせもお待ちしております。