AIでレシート自動分類
2024-11-07 17:22:38

東芝データが開発したAIによるレシート自動分類技術の革新

最近、スーパーマーケットやコンビニでの購買データ分析が進む中、東芝データ株式会社はレシートに基づいて商品を自動的に分類する新技術を発表しました。この技術は、特にJANコードが付与されていない総菜や生鮮食品などのインストア商品に向けたもので、AIによる革新的なアプローチによって実現されています。

背景


近年、小売業界では膨大なレシートデータを活用し、商品の開発やマーケティングの強化を図る動きが進行中です。しかし、加工や包装が店内で行われるインストア商品は、各店舗で異なるバーコードを使用しているため、共通のJANコードがありません。そのため、これらの商品を購買データから適切に分類するのが難しく、目視確認と手作業による分類が必要でした。これでは労力がかかり、効率的とは言えません。

新技術の特長


東芝データによる新たな技術は、クラスタリングや自然言語処理といった最新のAI技術を融合させた「レシート・インフォマティクス技術」です。この技術では、主に二つのAIモデルが連携して商品分類を行います。

1. LightGMAIC™モデル
このAIは、レシート印字名の分析に特化して開発されました。印字名とその部分文字列の関係を図式化して訓練し、新しい印字名に基づく適切な分類名を導出する能力を持つのです。例えば、「えびとアボカドのサラダ」という印字名が与えられた場合、「えび」「アボカド」「サラダ」といった部分に注目し分析します。

2. レシート分類学習済み大規模言語モデル
このAIは、特に分類名の正確性を高めるために設計されています。歴代のレシート印字名とその正しい分類名をデータとして学習し、新たに入力された印字名と照らし合わせて適正な分類を決定します。ですので、間違いやすい分類名も考慮に入れることができ、より精度の高い評価が可能になります。

結果と效率


上述の二つのAIによる判定結果を統合し、最終的な分類名を決定します。この手法により、87%を超える正確性が確認されており、特に人間の目で確認すべきケースを優先することで、時間の短縮にも寄与しています。

今後の展望


今後、東芝データはこの技術の更なる精度向上を目指し、2025年度にはインストア商品の購買統計データの提供を開始する予定です。さらには、飲食店のメニューなど様々なデータへと適用範囲を拡大していく考えです。レシート・インフォマティクス技術によって、より多様化する顧客ニーズに応えることが期待されています。

スマートレシートサービスの利用


この自動分類技術は、東芝テックが開発した電子レシートサービス「スマートレシート®」と連携して利用されます。このサービスは、通常の紙レシートを電子的に管理し、スマートフォンからいつでも購入履歴を確認できる利便性を提供しています。これにより、環境負担の軽減にも貢献できます。

このように、東芝データのAI技術は小売業界のデジタル化を促進し、さらなるビジネスの発展に貢献することが期待されています。


画像1

会社情報

会社名
東芝データ株式会社
住所
東京都港区芝浦1-1-1
電話番号

トピックス(IT)

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。