東芝デジタルソリューションズ、アプリにOCR機能を組み込めるAPIサービスに新版、帳票識別APIを追加

[ 新製品・サービス ] 東芝デジタルソリューションズ、アプリにOCR機能を組み込めるAPIサービスに新版、帳票識別APIを追加 2021年1月22日(金) 日川 佳三(IT Leaders編集部) 東芝デジタルソリューションズは2021年1月21日、クラウド型のOCR(光学文字認識)サービスの新版「AI OCR文字認識サービス V2.5」の提供を開始した。アプリケーションにAPIを組み込んで利用する。新版では、文字を認識できるだけでなく帳票を識別できるようにした。また、文字を認識する精度を高めた。  AI OCR文字認識サービスは、クラウド型で使えるOCR(光学文字認識)サービスである。OCR機能をWeb APIの形で提供する。アプリケーションにAPIを組み込むことによって、アプリケーションの中でOCR機能を利用できるようになる。  新版では、文字認識用のAPIのほかに、帳票識別用のAPIを新たに用意した。APIを介して、帳票の種類(申請書や届出書など)を識別できる。従来は、別途専用のWeb画面で帳票識別設定を行った上で文字認識機能を利用する必要があった。これを改め、アプリケーションからAPI経由で帳票を識別できるようにした( 図1 )。 図1:帳票識別APIの概要。(A)イメージファイルと識別情報(識別したい画像中の座標、用語)を送信すると、識別結果が返る。(B)イメージファイルと帳票識別番号を送信すると、合致する識別番号が返る(出典:東芝デジタルソリューションズ) 拡大画像表示  新版ではまた、ディープラーニング(深層学習)の適用範囲を広げた。文字の認識だけでなく、画像の処理(罫線の除去、取り消し線の判別、訂正印の判別)にも利用する( 図2 )。取り消し線や訂正印を読み飛ばせるようになったほか、イメージスキャン時に画像が劣化しても、ある程度は読み取れるようになった。 図2:ディープラーニングの適用範囲を拡大し、読み取り精度を高めた(出典:東芝デジタルソリューションズ) 拡大画像表示  誤読を抑制する技術も適用した。申込書や申請用紙などで広く見られる「1枠1文字」の書式に対する認識精度を高めた。認識過程で誤読の可能性がある個所は「?」で結果を返す( 図3 )。「?」以外の部分の文字認識精度は99.7%としている。実運用においては、認識結果の「?」部分だけを確認・訂正するだけで済む。 図3:誤読抑制OCR技術の仕組み(出典:東芝デジタルソリューションズ) 拡大画像表示

Source: 東芝デジタルソリューションズ、アプリにOCR機能を組み込めるAPIサービスに新版、帳票識別APIを追加 | IT Leaders