ネットスマイルが切り拓く生成AI-OCRの新時代
2025年9月5日、ネットスマイル株式会社が、革新的な生成AIを利用した文書画像処理技術に関する特許(特許第7738872号)を取得しました。この新しい技術は同社が展開する「なんでも読めるくん®」という生成AI-OCRに適用されており、従来のOCR技術が抱えていた課題を克服したものです。
生成AI-OCRとは?
「なんでも読めるくん®」は、次世代型のOCRサービスとして2025年4月にスタートしました。これまでのOCRとは異なり、特に多様な書式や、かすれた手書き文字には強みを発揮します。特に「テンプレート不要」であることは、導入の大きな魅力です。必要な情報項目を登録するだけで、自動でデータを取得することが可能です。
特許の背景
近年、AI-OCR市場では生成AIを活用した技術の進展が見られていますが、特有の誤った情報を生成する“ハルシネーション”という課題が存在します。「なんでも読めるくん®」が取り組むこの特許技術は、帳票が多様である請求書や契約書においても高い精度で文字を認識する手助けをします。この新技術により、導入企業は業務の効率化を実現できます。
特技術の概要
この特許技術は、ローカルOCRと生成AIを組み合わせることで、その結果を相互に検証し合う仕組みです。まず、文書画像を読み込んだローカルOCRがテキストデータを生成し、同時に生成AI-OCRが生成AIのサーバーに画像を送り結果を取得します。その後、両方の結果が比較され、最終的に精度の高いデータが選別されます。
効率的な二重処理
システム内で行われる二重のOCR処理により、正確な文字認識が実現されます。万が一誤りがあれば、ローカルOCRの結果を元にもう一度生成AIへ問い合わせることで、生成AIはヒントを得て精度を向上させることが可能です。
位置情報の特定
ローカルOCRはテキストの座標情報を把握し、生成AIからの結果を文書上の位置に対応させる機能も備えています。これにより、データがどこに存在するか明確にされます。
複数モデルの活用
加えて、複数の生成AIモデルを同時に使用することで、単一モデルに比べてより信頼性の高い結果を得ることができます。このアプローチにより、様々な業種でのテキストデータ化のニーズに応えることが期待されます。
実際の導入効果
この新技術の導入により、請求書や各種申込書の処理時間を大幅に削減し、すでに多くの業界での活用が進んでいます。また、テンプレート作成や管理の手間を減らすことができ、結果的に人手による確認作業も減少します。特に製造、物流、小売、金融といった多様な分野での導入が進む見込みです。
まとめ
「なんでも読めるくん®」は、生成AIによる文書データ化の精度向上に貢献し、企業のDX化を加速させるツールとなるでしょう。ネットスマイルの取り組みは、業務の自動化と効率化に新たな道を開いています。今後も、この技術の進展が目が離せない状況です。