日本のベンチャー企業から、独自開発の日本語自然文検索技術がまもなく正式にリリースされることになりそうだ。
早ければ年内には、一部サイトでの利用が開始されるほか、来年早々には、ブログ検索サービスの試験運用を開始することになる。本誌では、その概要をいち早くキャッチした。
● 社長の長年の研究成果を実現
|
日立ソフトウェアで、Lotus Notes/Dominoに関するソリューション開発などに従事していた真瀬正義氏。日本語自然文検索技術の実現は「夢」だという
|
日本語自然文検索技術を開発したのは、株式会社キーウォーカー(旧きゃむネット)。
大学を卒業後、日立系のソフト会社である日立ソフトウェアにおいて、Lotus Notes/Dominoに関するソリューション開発などに従事していた真瀬正義氏がスピンアウトして、2001年4月から事業を開始した企業だ。
当時の経験をもとに開発したLotus Notes/DominoをベースとしたWebシステムであるパッケージ製品のグループスケジュール&会議室予約システム「CX Schedule for Domino」、プロジェクト管理システム「CX Project for Domino」は、現在でもキーウォーカーの主力製品の1つだ。
そのほか、携帯電話サイト向けマネジメントシステムASPサービス「Mobile UP」を開発。利用者が空メールを送信すれば、企業が実施するキャンペーンにすぐ参加でき、その場でキャンペーンの当落情報がわかるといったソリューションを提供している。Mobile UPは、すでにエイベックスグループや英会話教室のNOVAなどが導入している。
今回の日本語自然文検索技術は、こうした事業の柱となる製品群とは別に、真瀬社長が「夢」として追求してきた技術だ。大学時代から取り組んできた人工知能に関する研究や、ロボットに応用できるコミュニケーション技術の開発ノウハウを応用している。それまでの真瀬社長の研究成果をもとに、2003年6月から、社内にプロジェクトチームを設置して検索エンジンの本格的な開発に着手。これまでの開発投資額は数億円規模に達する。ここにきて、実用化を視野に入れた段階にまで技術が完成してきたという。
● 3つの技術で構成
|
開発中の「KeyWalker Search」トップページ
|
キーウォーカーが開発した日本語自然文検索技術は「KeyWalker Search」と呼ばれ、「意味ネットワーク」「Preference Analyzer(嗜好等個人の特徴分析)」「Situation Analyzer(シチュエーション分析)」の3つの技術から構成される。
意味ネットワークは、独自のアーキテクチャによって開発したXMLベースのデータベースで、約20万語の単語をそれぞれに関連づけしている。意味の関連づけに際しては、独自の手法を採用。「検索サービスとして利用した際に、話題の特定とユーザーの曖昧な発言に対する柔軟な回答が可能になる」(真瀬社長)という。
この意味ネットワークによって、「芸能人がよく行く店」と自然文で入力した際に、「芸能人」と書かれたサイトだけでなく、芸能人の固有名詞や「キムタク」といった通称で書かれたサイトの検索も可能になる。
また、特許を申請しているPreference Analyzerでは、利用者の嗜好を推論するシステムで、入力された文章などから推論して、利用者が望んでいるような回答を導き出す。「メガネが好きな人は、ブランド好きの傾向があるというような利用者の潜在的な嗜好に合致した検索結果の提供が可能になる」(真瀬社長)。
一方、Situation Analyzerも特許申請中の技術で、意味ネットワークで導き出された結果に加え、利用者が置かれた立場や、サイトの意味する内容を吟味し、最適化した回答を導き出す。
「会議」と入力した場合と「打ち合わせ」と入力した場合に、求められる人数の差を推定したり、「おいしい」という言葉の前後の文章を分析して、どんな人にとっておいしいと感じるものなのか、といった状況を捉えることが可能になる。チーズ好きの人にとって「おいしい」のか、あるいは和菓子が好きな人にとって「おいしい」のか、といった判断も、このSituation Analyzerによって可能となる。
また、これらの技術を組み合わせることで、検索される用語を新たに生成することが可能となっている点も、KeyWalker Searchの特徴といえる。
例えば、「楽器の生演奏が聞けるレストラン」といった自然文で入力すると、「ライブ」や「ギター」、「ピアノ」といった言葉を検索対象用語として自動的に生成。ライブやピアノなどの文字が入ったサイトも検索できる。
検索された結果には、サイトごとにスコアが表示され、「おいしい店」といった検索の際には、「おいしい」といった言葉のほかに「最高」、「よかった」というような、新たに生成された言葉や、意味ネットワークによって導き出される関連する言葉もスコアに換算。さらに、「おいしくない」などの言葉はマイナス点として計算する。スコアの高いものから順番に表示することから、検索結果の一番最後を見れば「おいしくない店」が表示されていることになる。
「条件によって異なるが、KeyWalker Searchの現時点での精度は約8割といったところ」(真瀬社長)というが、まずは、特定分野などに特化することで、この精度を高める考えだ。
|
|
「赤坂にある静かな喫茶店」で検索。検索結果では、意味ネットワークによって関連付けられたキーワードがハイライト表示される
|
こちらは「楽器の演奏が聴ける店」で検索。「バンド」「ギター」「ピアノ」「オルガン」などをハイライト表示
|
● 一部で試験運用を開始
|
「日本発の日本語自然文検索サービスとして、広く利用してもらえるようにしたい」と抱負を語る真瀬社長
|
キーウォーカーでは、10月から11月にかけて開催される、いくつかのイベントで、この技術を初めて一般に公開する。また、一部Webサイトや玩具メーカーにおいて、サイト上での試験運用や、同技術を採用した製品化に向けた実験を開始する予定だ。12月には、レストラン情報を提供している大手レストラン・ポータルサイトにおいて、KeyWalker Searchの導入を予定しているという。
また、2006年1月には「KeyWalker Blog Grasper」として、ブログ検索エンジンのベータ版を稼働させる予定だ。ブログ検索は、一般ユーザーも利用が可能になる。
このほか、将来的には、独自の検索ポータルサイトの開設も視野に入れており、「日本発の日本語自然文検索サービスとして、広く利用してもらえるようにしたい」(真瀬社長)と話している。
日本語自然文検索サービスは、NTTレゾナントが運営する検索ポータルサイト「goo」で先頃、正式に導入されたばかりだが、その精度に関してはまだ改善の余地があるというのが一般的な見方。今回、キーウォーカーが開発したKeyWalker Searchは、まだ試験段階のものしかなく、自然文検索サービスの精度や、利便性にはまだ未知数なところもあるが、日本発の検索エンジンの1つとしても注目しておきたい。
関連情報
■URL
キーウォーカー
http://www.keywalker.co.jp/
■関連記事
・ goo、質問文をそのまま入力できる日本語自然文検索サービスを正式提供(2005/10/04)
・ 「blogWatcher」次期バージョン、視聴率よりも踏み込んだ調査が可能に(2005/08/02)
( 大河原克行 )
2005/10/17 16:51
- ページの先頭へ-
|