ニュース

「ATOK 2017」はディープラーニングで誤変換3割減、2月3日発売

 株式会社ジャストシステムは3日、Windows用日本語入力ソフトの新バージョン「ATOK 2017 for Windows」を発表した。2017年2月3日に発売する。Windows 10/8.1/7に対応する。

 希望小売価格は、「ATOK 2017 for Windows[ベーシック]」が8000円(税別)。連携電子辞典などを同梱した上位版の「ATOK 2017 for Windows[プレミアム]」が1万2000円(税別)。ATOK登録ユーザーが対象のAAA優待版なども従来通りラインアップされる。

 ジャストシステムCPS事業部開発部の下岡美由紀氏は、今回ATOK 2017に実装されたディープラーニング技術を用いた「ATOKディープコアエンジン」について、これまでATOKにおける2回の大きな転機に並ぶものとした。

 1回めは、1993年リリースの「ATOK8」に実装されたAIによる変換技術。当時はインターネットの普及が進んでいなかったため、人手により50万もの用例を集めて知識を注入したという。

 次いで、「ATOK 2007」では、それまでのAI変換に、機械学習による統計的な自然言語処理を組み合わせることで、複文節変換時における文節区切り位置や、同音異義語の分類の正確さが向上したという。

 そして今回発表したATOK 2017のATOKディープコアエンジンでは、正確性を伝える文章や、気持ちを伝える話し言葉など、大量の日本語テキストをディープラーニング技術を用いて分析。コンピューター自らが学習し、自動的に日本語における特徴を抽出。長年培ってきたアルゴリズムと組み合わせたという。

 ATOKでは、例えば、「へんしん」と入力した際には、「変身」ではなく「返信」をあえて第1候補にしている。こうしたよさはそのままに、通常変換と推測変換双方のエンジンにおいて、文節区切り位置の決定や、同音語選択の決定において日本語の変換精度を向上。同社によれば、誤変換が30%減少するとのことだ。

 また、文節区切り位置を指定して学習させた後の誤変換も減少しているという。例えば「さとうさんとしのださん」との入力が「佐藤三都市の打算」と変換された際に、区切り位置を変更して「佐藤さんと篠田さん」とした場合などがこれに当たる。

 こうした日本語変換を実現するATOKディープコアエンジンについて、今回発表のWindows版に加え、今後はメモリや速度面を考慮しながら、Mac版やAndroid版への実装を目指す。

 このほか、ATOK 2017には、入力を日本語に切り替える前に英字で文字を入力した場合に、日本語と判断すると操作ガイダンスを表示し、入力直後なら日本語へと変換できる機能も新たに搭載されている。

 上位エディションとなるATOK 2017 for Windows[プレミアム]に搭載する5つのプレミアム辞書・辞典では、「岩波国語辞典 第七版 新版」で関連語のリンクが表示可能になったほか、「明鏡ことわざ成句使い方辞典」では、誤用から適切な表現を検索可能になったとのこと。このほか、「大修館四字熟語辞典」「ジーニアス英和辞典」「ジーニアス和英辞典」を収録する。

 また、サブスクリプション制サービスの「ATOK Passport」では現在、WindowsとMacからしか登録した単語をアップロードできないが、拡張ATOK Sync APにおいて、Androidからでも単語をアップロード可能になる機能拡張を後日、正式発表予定とのこと。