ニュース

Sansanが名刺画像解析力アップへ、古文書解読技術を応用

公立はこだて未来大学と共同研究

 Sansan株式会社と公立大学法人 公立はこだて未来大学は9日、名刺画像解析に関する共同開発を開始した。

 クラウド型名刺管理サービス「Sansan」「Eight」を提供するSansanは、「文書画像解析技術」の専門家である、同大学の寺沢憲吾准教授および川崎稔夫教授のチームと共同研究を行い、より効率的な名刺データ化技術の開発を進める。

 文書画像解析技術とは、紙メディアの文書を電子化して蓄積し、コンピュータ処理によってその内容を理解させ、取り扱いやすいデータに変換する技術。これにより、文書画像データベースに対しても、Web検索で一般に用いられているような全文検索が可能になる。

 この研究は1970年代に始まり、欧米では実用に足る精度まで発展している。一方で、非定型レイアウトの文書や保存状態の悪い文書などは文書画像解析が困難な題材とされているが、公立はこだて未来大学では2011年に、寺沢准教授が古文書の解読などに役立つ「文字画像検索システム」を独自開発するなど、世界的にも先進的な取り組みを行っている。

 今回の共同研究では、この文書画像解析技術を名刺画像に特化した文字解析に応用する初の試みになるという。

 Sansanのサービスの特徴の1つとして、独自に開発した名刺データ化システムと人力オペレーションを組み合わせた正確なデータベースの構築が挙げられる。そのため、「データ化工程の効率化は事業の成長を支えるために非常に重要となる」(Sansan)。

 こうした背景から、Sansanでは文書画像解析のスペシャリストによる専門の研究部門を2013年4月に創設。現在名刺読み取り技術の主流となっているOCRに加えて、事業のグローバル展開のために言語に依存しない独自の名刺画像解析エンジンを開発している。そこへ今回の共同研究を生かし、サービス価値の向上を図るという。

(川島 弘之)