MLismとWEDが共に開発したレシート特化OCRモデル
MLism株式会社とWED株式会社が共同で、実環境のレシートデータに最適化したOCR(光学文字認識)モデルを開発しました。このモデルは、WEDが提供するデータ収集プラットフォーム「ONE」で収集されたレシートデータを基にしており、MLismの日本語OCRエンジン「YomiToku」を活用して設計されています。
背景と開発の必要性
WEDは、ユーザーが提供するレシートを買い取り、購買データを抽出する「ONE」というサービスを展開しています。同プラットフォームでは、1日あたり100万枚ほどのレシート画像をOCRで処理していますが、従来利用していた他社のOCRエンジンは高いランニングコストや業務要件への柔軟な対応が難しいという課題がありました。この状況を受けて、MLismは自身が開発した「YomiToku」を用いて、WEDとの協力のもと、レシート専用のOCRモデルを開発しました。
共同開発の詳細
今回の共同開発において、WEDが持つ実環境のレシートデータを使用し、「YomiToku」をレシート読取に特化した形式に改良しました。チューニングの過程では、ピンボケや手ブレ、折れ曲がり、さらには特殊なフォントなど、実際の運用で見られるさまざまな条件を考慮に入れ、モデルの最適化が進められました。この結果、基礎モデルに対して5%以上の識字率の向上を達成しました。
さらに、大量のデータ処理に対応するためのモデルの軽量化と処理パイプラインの最適化も行い、従来の手法に比べて処理時間を30%以上短縮。これにより、100万枚の画像を安定して処理できる体制を確立します。また、他社製OCRエンジンと比較して、80%以上のコスト削減が実現されました。
今後の展望
MLismは、業種別・用途別に応じたOCRモデルの提供を続けることで、企業が求める高精度かつ高効率な文字認識基盤の構築を支援していく方針です。お客様のニーズに応じた高いカスタマイズ性を保ちながら、より効率的なデータ処理が進められます。
企業のコメント
WEDの代表者は、「ONE」で集めた実データと、MLismの日本語OCRエンジン「YomiToku」を組み合わせることで、大幅なコスト削減を実現したとコメントしています。また、「YomiToku」の汎用レベルのモデル精度改善にも収集したデータが貢献しているとのこと。今後もさらなる連携を進めていく意向を示しています。
企業情報
MLism株式会社は、2024年に設立された新興企業で、千葉県柏市に本社を構えています。「YomiToku」をはじめとする高精度なOCR技術の研究・開発を行っており、次世代の文字認識サービスを通じて新しいマーケティング手法の確立を目指しています。
WED株式会社は、2016年に設立された企業で、東京都渋谷区にオフィスを持ち、レシート事業を中心とするマーケティングサービスを提供しています。データの活用を通じて、より効果的なビジネス戦略を築くサポートを行っています。
詳しくは両社のコーポレートサイトを訪れてみてください。