ニュース

TOPPAN、くずし字解読アプリ「古文書カメラ」をアップデート、AI-OCRの再学習や画像編集機能で解読精度が向上

 TOPPAN株式会社(旧:凸版印刷株式会社)は12月12日、スマートフォンで撮影したくずし字を解読できる、AI-OCRアプリ「古文書カメラ」(iOS/Android版)のアップデートを実施した。

 同社は、古文書解読とくずし字資料の利活用サービス「ふみのは」として、原本画像と解読テキストを重ねて表示できる「ふみのはビューア」、オンラインくずし字解読支援システム「ふみのはゼミ」など、さまざまなくずし字解読ソリューションを提供している。

 古文書カメラは「ふみのは」サービスの一環として同社が開発したアプリで、今年6月にiOS版、10月にAndroid版の提供を開始していた。今回のアップデートでは解読精度が向上したほか、さまざまな撮影条件に対応できるよう画像編集機能を搭載している。また、解読機能の利用回数の制限が、これまでの10回から30回に増加した。

AI-OCRの解読精度向上

 学習データを追加しての再学習、およびAI-OCRモデルの刷新により、解読制度が向上した。特に手書きの古文書に対して、大幅な解読精度の改善が認められたという。

100枚程度のサンプルに対して、レイアウト認識から文字認識までフルオート処理をした場合の認識精度の変化。版本(木版を使用して印刷した書物)でも精度が向上しているが、6月版では精度が低かった手書きの古文書における改善幅が大きい

画像編集機能の搭載

 アプリで撮影した画像やスマートフォンから取り込んだ画像に対し、台形補正(斜めから撮影した画像を補正する)、ノイズ除去、トリミング、角度補正、白黒反転などの編集を行える機能が追加された。これらの編集を画像に施すことで、AI-OCRの認識精度をさらに高めることができるとしている。