ニュース

今度の「一太郎2020」はGoogleのAI眼を身に付けた! 石碑のテキスト化も行えるなど“超入力”を追及

 株式会社ジャストシステムは、2020年2月7日に発売する日本語ワープロソフトの新バージョン「一太郎2020」の新機能などの概要を発表した。新バージョンは、文書作成の起点となる“入力”に着目し、“超入力”というコンセプトのもと機能強化を図ったという。

 超入力の文字通り目玉となるプロダクトが、新たに提供されるスマートフォンアプリ「一太郎Pad」である。一種のテキストメモアプリだが、入力の手段としてOCRに対応しているのが特徴だ。紙の書類や名刺、はがきなどをスマホで撮影することで、クラウドに送信されて画像解析され、その中の文字情報を抽出して自動的にテキストに起こしてくれる。

 ジャストシステムによると、OCR処理に使っているエンジンは、Google Cloud Platformで提供されている画像解析AIサービス「Google Cloud Vision」。その能力は非常に強力で、書類はもちろん、掲示物や、手書き文字、街中の看板、石碑に刻まれた文字も対応可能という。しかもGoogle Cloud Visionはさらなる性能・精度の向上が期待できるとしており、いずれは日本の変体仮名やくずし字の・テキスト化が実用化されることも十分に考えられそうだ。

 こうして一太郎Padで作成したテキストは、PC上の一太郎2020へWi-Fi経由でデータ転送が可能。一太郎2020でさらにテキストデータを整えることができる。具体的には、一太郎2020に搭載した「テキスト補正」という機能により、文字の半角・全角の統一、不要なスペースの削除、行頭の字下げ、誤字脱字の簡易チェックなどを行える。

 これにより、「紙しかない資料や外出先で撮影した写真内の文字を簡単にテキストデータ化でき、一太郎2020に読み込んで見栄えのよい文書に仕上げることができる」としている。

 こうした画像内の文字を抽出してテキスト化する操作は、スマートフォンの一太郎Padを使う方法のほかに、PC上だけで行う方法もある。上位版パッケージ「一太郎2020 プラチナ[35周年記念版]」にバンドルされているPDFソフト「JUST PDF 4[作成・編集・データ変換]」では、画像ファイルなどを一太郎2020で読み込める連携機能が提供される。これにより、画像内の文字を抽出して、一太郎2020でテキストデータとして扱うことが可能になる。なお、こちらの方法でのOCR処理はローカルで行われ、Google Cloud Visionとは別のエンジンを採用しているという。

 JUST PDF 4[作成・編集・データ変換]では、画像ファイルだけでなく、PDFファイルを一太郎2020で読み込める機能も提供。レイアウトを保持したまま、文字はテキストとして、画像は画像として抽出して、一太郎2020文書として編集できるという。PDFや画像ファイルのデータ変換で生じがちな不要なスペースや、期待どおりの文字変換にならなかった箇所は、テキスト補正機能を使って自動補正することも可能だ。

 このほか、一太郎2020における超入力のための機能強化ポイントとしては、1)「笑い種」や「謁見」など誤読しやすい語や読みづらい語を自動抽出し、ふりがなを一括入力する機能、2)言葉の途中で改行せず、読みやすい位置で自動改行する「文節改行」、3)政令指定都市は省略する/省略しないなど一定のルールに基づいて文書校正が行える「住所表記チェック」や、株式会社/(株)といった法人名称の表記ゆれを指摘する「法人等略語チェック」などの文書校正機能の強化、4〉カーソルがある行を1行だけ色付き表示したり、それ以外の前後の行をグレー表示することで、ひと目で編集位置が分かるようにし、その行だけに集中して作業を行えるようにする「ハイライト表示」――がある。

ふりがなの設定画面
「文節改行」設定前
「文節改行」設定後
「ハイライト表示」の一例

 一太郎2020は、Windows 10/8.1に対応し、価格は2万円(税別)。日本語入力システムの最新バージョン「ATOK for Windows 一太郎2020 Limited」もバンドルされる。

 特別パッケージの上位版である一太郎2020 プラチナ[35周年記念版]は、3万8000円(税別)。JUST PDF 4[作成・編集・データ変換]のほか、モリサワフォント26書体、グラフィックソフト「花子2020」、音声読み上げソフト「詠太10」、表計算ソフト「JUST Calc 4/R.2」、辞書ソフト「大辞林4.0 for ATOK」などもバンドルされる。

「一太郎2020 プラチナ[35周年記念版]」にバンドルされるモリサワフォントの書体例

 一太郎Padは、iOS 12/13、iPadOS 13、Android 6.0/7.0/7.1/8.0/8.1/9/10に対応。2月7日より無料で配信され、誰でもダウンロード可能。ただし、一太郎2020にデータを転送するには、一太郎2020のユーザー登録とJustアカウントによる認証が必要。認証されていない状態でも一太郎Padは使えるが、OCRによる画像からのテキスト抽出は10回までという制限がある。