チューリングの革新
2024-09-10 12:05:28

チューリングが発表した初の自動運転向けVLAデータセットとは?

完全自動運転を目指すチューリング株式会社が、日本初となる自動運転向けVLA(Vision-Language-Action)モデルデータセット「CoVLA Dataset」を開発し、一部を公開しました。このデータセットは、日本国内における自動運転技術の発展に寄与することを目的としています。また、この度WACV2025という国際会議において、同データセットに関連する研究論文が採択されたことも明らかになりました。

CoVLA Datasetとは


「CoVLA Dataset」は、チューリングが開発し、公開した自動運転向けのデータセットです。車載センサーデータが含まれ、80時間以上の運転データで構成されています。これは、その規模とアノテーションの多様性において海外の既存データセットを上回るものです。特に、データ処理からキャプション生成までを自動化したスケーラブルな手法を用いて構築されています。これにより、モデルが運転環境を自然言語で詳細に描写し、適切な経路計画を生み出すことが可能です。また、同データセットを利用して開発されたVLAモデル「CoVLA-Agent」は、自動運転技術において実践的な応用が期待されています。

主要な技術と背景


完全自動運転は、複雑な状況への対応能力が求められます。そのため、画像やテキストなどの多様なデータを用いた高度な判断が重要です。しかし、AI学習用アノテーションが施された大規模データセットが不足していることが、技術の進展を妨げているという現状があります。そのため、チューリングは「CoVLA Dataset」を開発し、自動運転システムの進展を目指しています。

学術機関への公開と未来の展望


チューリングは、今後学術機関向けに「CoVLA Dataset」の全データセットを公開する計画を立てています。これにより、より安全で信頼性の高い自動運転システムの実現を狙います。同社は、視覚と言語、行動データを駆使したVLAモデルの性能を実証し、自動運転分野における効果的アプローチとして位置づけています。具体的な成果としては、言語生成や行動出力が一貫して優れた性能を示したことが挙げられます。

他の成果と関連プロジェクト


チューリングはまた、日本語のLLM(大規模言語モデル)「LIama-3-heron-brain-70B,8B」を開発し、自動運転の現場での指示理解に特化しています。このモデルは、日本の特有の言語や道路状況に対応可能であり、業界内でも高く評価されています。さらに、視覚情報とテキスト情報を結びつけるための視覚-言語データセット「Wikipedia-Vision-JA」や「Cauldron-JA」も開発しており、これらは日本の文化やニーズに特化した内容になっています。これらの成果は、チューリングのGENIACプロジェクトで進行中のものでもあり、日本国内の生成AI技術の強化を目指しています。

まとめ


チューリング株式会社は、自動運転技術の最前線で革新を続けています。「CoVLA Dataset」の公開は、自動運転の現実化への一歩であり、今後の研究や技術開発に大きな影響を与えることでしょう。完全自動運転を実現するE2Eシステムの開発により、2030年を目指して進化を続けるチューリングに、今後も注目が集まります。


画像1

画像2

画像3

会社情報

会社名
Turing株式会社
住所
東京都品川区大崎1丁目11−2 ゲートシティ大崎 イーストタワー4階
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。