LLM勉強会開催
2025-01-08 09:20:56

国立情報学研究所でのデータセット開発に関する勉強会の開催

データセットの品質向上を目指した勉強会



2025年1月14日、国立情報学研究所にて第15回LLM勉強会が開催され、今回は株式会社APTOの機械学習エンジニア、寺澤友治朗氏が登壇しました。この勉強会は、自然言語処理や計算機システムに関心のある研究者たちが集まり、大規模言語モデル(LLM)の研究や開発についての情報を共有する場です。

LLMデータセット作成の課題


寺澤氏は、「品質の良いLLMデータセットを効率よく作成するための取り組み」について講義しました。彼は、データセットの作成やその品質管理の重要性を強調しました。特にLLMモデルの性能向上には、高品質なデータセットが不可欠であり、しかしその作成プロセスは非常に労力を要することから、効率化と自動化が求められています。

APTOのアプローチ


APTOでは、データアノテーションのプラットフォーム「harBest」を活用して、品質管理の効率化に取り組んでいます。このプラットフォームは、クラウドワーカーによるアノテーション作業を効率的に管理する仕組みを持ち、スピーディかつ品質の高いデータ作りを実現しています。特に、AI開発やデジタルトランスフォーメーション(DX)を推進する企業にとって、コスト負担を軽減しつつ必要なデータを取得できるという利点があります。

セミナーの要点


寺澤氏は「当社は高品質なLLMデータセットを提供しており、Instructionデータセットによって多くの良いフィードバックをいただいています。しかし、今後もデータの需要が増える中、効率的に高品質なデータを作成する必要があります」と述べ、勉強会を通じてその具体的な取り組みを紹介しました。

harBestプラットフォームの特長


harBestは、日本国内で唯一のクラウドワーカーによるデータアノテーションプラットフォームで、多くの企業から注目されています。タスクを効率的に細分化し、管理できるため、短期間で高品質なデータを収集・作成することが可能です。また、使用するクラウドワーカーは経験豊富であり、迅速な対応が可能です。

このような背景を持つharBestは、特にAI関連の開発を進める企業にとって魅力的な選択肢となっています。ビデオも用意しており、サービス概要を短時間で理解できるコンテンツが提供されていますので、AI開発に課題を感じている方々はぜひご覧ください。

勉強会の詳細


  • - 開催日時: 2025年1月14日(火)14:30-18:00
  • - 場所: 国立情報学研究所(オンライン参加も可能)
  • - 主催: 国立情報学研究所大規模言語モデル研究開発センター
  • - 参加申込: LLM勉強会ホームページ

株式会社APTOは、東京都渋谷区に本社を構え、「harBest」を通じたデータ管理の効率化に力を入れています。詳細なサービスに関する情報は公式ウェブサイトで確認可能です。データに関する相談も受け付けていますので、ご興味のある方は是非お問い合わせください。


画像1

会社情報

会社名
株式会社APTO
住所
東京都渋谷区神南1-5-14三船ビル4F
電話番号
03-6416-0523

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。