Google日本語入力は「グーグルでないと作れないソフト」


 グーグルは7日、12月3日に公開した日本語入力ソフト「Google日本語入力」ベータ版についての説明会を開催した。

 「Google日本語入力」は、グーグルが新たに開発したWindowsおよびMac OS X用の日本語入力ソフト。Webページのデータから辞書を自動生成し、辞書と入力履歴により入力途中の文字から候補を表示する「サジェスト」機能を備えるなど、Googleの持つ言語処理技術を注ぎ込んだソフトとなっている。

開発コンセプトは「思いどおりの日本語入力」

及川卓也氏

 グーグルのシニアエンジニアリングマネージャを務める及川卓也氏は、「Google日本語入力のコンセプトは『思いどおりの日本語入力』で、あえて言えば「空気のような存在」になることが目標」と説明。ベータ版の公開直後から、「我々自身が驚くほど多くの方に使っていただいているが、ベータ版ということもあって、まだまだやらなければいけないことがある。皆様からのフィードバックをいただいて、さらに理想形に近づけていきたい」と語った。

 また、グーグルのソフトということで、「入力した文字が送信されているのではないか」「ネットワーク側で処理を行っているのではないか」といった疑問が寄せられたが、Google日本語入力ではすべてローカル側で処理を行っており、オフラインでも動作すると説明。機能向上のため、使用統計情報や障害レポートをグーグルに送信するオプションは用意されているが、入力された単語や文章がグーグルに送信されることは無いと強調した。

Google日本語入力の概要入力された単語や文章がGoogleに送信されることはない

Webのありのままを反映した変換エンジン

小松弘幸氏
工藤拓氏

 Google日本語入力は、グーグルの社員が勤務時間の20%を自分が重要だと思うプロジェクトに費やせる「20%プロジェクト」から開発が始まっている。当初は、ソフトウェアエンジニアの小松弘幸氏と工藤拓氏の2人により開発が進められ、その後多くのメンバーが参加する正式なプロジェクトとなった。メンバーには「Anthy」「skkime」など多くのインプットメソッドの開発経験者が含まれているという。

 小松氏は、「最初の数カ月はデザインディスカッションのみで、コードは書かなかった。これまでの経験を踏まえ、はじめからマルチプラットフォーム対応として設計しており、開発にあたっては社内外のオープンソースソフトウェアを活用している。Google日本語入力は、Webのデータと計算機環境、そしてエンジニアが組み合わさってできたもので、Googleでないと作れないソフトウェアだと思う」と語った。

 工藤氏は、Google日本語入力は「Webのありのままを反映した変換エンジン」だと説明。クロール済みのWebデータから辞書を自動生成しており、人手ではカバーしきれないような新語や専門用語、芸能人の名前などを網羅している点が特徴だとした。また、変換エンジンとしては統計ベースのエンジンを使用しており、辞書の作成にはグーグルが開発した分散並列計算システム「MapReduce」を活用。これらの結果がすべて反映されたソフトがローカルマシン上で動作しており、更新については「Googleアップデート」を使って自動更新する予定だとした。

 また、変換機能ではサジェスト機能が話題になっているが、「危機」の直後に「いっぱつ」を入力するときちんと「一髪」と変換するなど、基本的な連文節変換の機能もきちんと備えていると説明。サジェストについても、自動的に表示しないようにする設定や、履歴を残さないようにする「シークレットモード」も備えている点をアピールした。

Googleの「20%プロジェクト」から開発がスタート「Webのありのまま」を反映した変換エンジン

日本語入力ソフトのマーケット活性化に期待

 及川氏は、「既に非常に多くのフィードバックをいただいており、できるだけ早い時期にベータが取れるようにしていきたい。Windowsの64bit版についても近日中に対応したいと考えており、Mac版についても64bit版のインストーラーに不具合があるので、これもなるべく早期に対応したい」と語った。

 日本語入力ソフトの開発に乗り出した理由としては、検索クエリーにも誤変換によるものが非常に多かったことや、Web検索の『もしかして』の機能がこうした誤変換を効率良く修正できたため、この技術を日本語入力に用いることでさらに良いものができると考えたことがきっかけになったとした。

 Web上のデータをベースにしているということで、誤用表現などが候補として表示されることについては「非常に問題だと考えており、最も優先順位の高い修正項目になっている」と説明。ただし、「Webのありのままを反映した変換エンジン」であることから、何をもって誤用とするかは答を出すことが難しい問題でもあるとした。また、不適切と思われる単語をサジェスト機能の候補から外すといった人為的な対応は現在行っておらず、こうした問題についても今後ユーザーのフィードバックをもとに改良していきたいとした。

 日本語入力ソフトを無償で提供することで、他社に与える影響をどのように考えるかという質問に対して及川氏は、「他社のビジネスにはコメントしづらいが、純粋に日本語入力環境を良くしたいと考えている。歴史的に見ると、日本語入力ソフトのマーケットはシュリンクしており、技術的なイノベーションが起きづらくなっているのではないかと思う。グーグルが新しいアプローチを提示することで、マーケットが活性化することに期待している」とコメントした。


関連情報

(三柳 英樹)

2009/12/7 19:28