LINE WORKSが新技術「CREPE」を発表
LINE WORKS株式会社は、ビジネス現場に特化したコミュニケーションツールを提供する企業であり、『文書解析と認識に関する国際会議』ICDAR2024において、新たな技術"CREPE"を発表しました。この技術は単一モデルのアプローチにより、従来のOCR(Optical Character Recognition)では実現が難しかった画像ドキュメントからのテキスト情報と座標情報の同時抽出を可能にします。
ICDARは、文書解析と認識の分野において最も権威ある国際会議であり、世界中のトップ研究者たちが集まり最新の技術や研究成果を発表する場となっています。今回、この会議での採択が決定された成果は、2024年8月30日から9月4日にかけてギリシャのアテネで開催される予定です。
CREPEの背景と目的
LINE WORKSのリサーチエンジニアであるYoungmin Baek氏と中尾亮太氏によって開発されたCREPEは、画像ドキュメントの解析性能を飛躍的に向上させることを目指しています。特に、ペーパーレス化やデジタル化が進みづらい業界にとって、文書やテキスト資料を効率的にデジタル化するための鍵となる技術です。
従来のOCRシステムは、画像から文字を抽出するために複数のモデルを sequential に組み合わせる必要があり、各ステップでの誤差が蓄積されて文書解析精度が低下するという課題がありました。CREPEはこの課題を克服し、End-to-Endの単一モデルで高精度な情報抽出を実現します。
新技術「CREPE」の仕組み
CREPEでは、画像ドキュメントを一つのフローで処理することで、OCRにありがちな誤差の蓄積を防ぎます。また、テキスト情報とその座標を同時に抽出できる点が新たな特徴です。特にドキュメントのレイアウトやフォーマットに依存するタスクに対してその性能が向上しました。さらに、弱教師あり学習の手法を用いることで、少ないデータでも高精度なモデルを構築できます。
この技術によって、LINE WORKSが提供するAI-OCRサービスへの応用も期待されており、さまざまな業種に特化した高精度な解析が可能になるでしょう。特に世界的な競技会においても、すでに計6分野で世界No.1の認識率を達成しています。
未来の可能性
LINE WORKSでは、CREPE技術を通じて引き続きAIの研究開発を進め、より多様な機能やサービスの創出に努める方針です。業務のデジタル化が進む現代において、LINE WORKSの技術はビジネスシーンにおける新たな可能性を模索し続けることでしょう。
今後、CREPEがどのように各業界のプロセスを改善し、効率化を図るのか、その動向から目が離せません。