Internet Watch logo
記事検索
最新ニュース

米Powerset、自然言語処理によるWikipedia検索の公開ベータテスト

次世代サーチエンジンの台風の目となるか

Powersetのトップページ
 自然言語処理によるサーチエンジンを開発しているベンチャー企業の米Powersetは12日、同社としては初めてサービスを公開した。ベータテストとして公開されており、Wikipedia英語版の記事約250万件を検索できる。

 検索対象がわずか1サイトに限定されているため、大規模なWebを対象としているGoogleなどのサーチエンジンと単純に比較することはできない。しかし、Powersetの自然言語処理技術の一端を垣間見ることができる。

 Powersetでは、単にキーワードを入力するこれまでのサーチエンジンとは異なり、質問することができる。もちろん従来のキーワードやフレーズによって検索することも可能だ。

 この自然言語処理は強力で、例えば「なぜ、ジョン F.ケネディは殺されたのか」という質問を英語で入力すると、「ケネディ暗殺の捜査は完了できなかった」というWikipediaの項目がすぐに出てくる。

 ただし、Powersetは従来のサーチエンジンの概念ではとらえにくく、むしろ情報の海をナビゲートするための広義のインターフェイスとでも言えそうだ。

 検索結果の右欄あるいは画面上部に「Factz」と呼ばれるコーナーが表示される。ここでは、該当する記事から抽出した重要な単語やフレーズが列挙される。表示画面によっては、重要な単語ほど大きく表示され、目立つようになっている。

 この単語を眺めるだけでも、ある程度の情報を把握することができる。さらにその単語をクリックすると、Wikipediaの該当記事部分をすぐに表示できる。

 また、Wikipediaの該当記事のアウトラインも表示できるため、長い記事でも、見出しを追っていくことで概要をすぐに把握できる。見たい部分をクリックするだけですぐに該当部分が表示されるため、その後じっくりと記事を読むことができる。

 このように検索技術、自然言語処理、ナビゲーションが一体となったものがPowersetだと言える。

 自然言語処理による検索技術は、米XeroxのPARC研究所と、Powerset独自の研究成果によって実現された。Powersetの技術は高く評価されている一方で、計算パワーを必要とするため、Webを対象とする大規模なサーチエンジンには向かないと指摘する声もある。実際、GoogleはPowersetには関心がないとの見解を表明してきた。一方で、この弱点をカバーできれば、次世代サーチエンジンの重要な技術になるとの見方もあり、この1週間でPowersetの買収に関する噂が業界関係者のブログで取りざたされている。


関連情報

URL
  Powerset(英文)
  http://www.powerset.com/
  Powerset公式ブログの該当記事(英文)
  http://blog.powerset.com/2008/5/12/ready-powerset-go
  Powersetのスクリーンショット
  http://www.flickr.com/photos/powerset/sets/72157604966497900/
  Powersetの紹介動画(英語)
  http://vimeo.com/994819

関連記事
人工知能サーチエンジン「Powerset」、一部技術を初めて一般公開(2007/09/18)


( 青木大我 taiga@scientist.com )
2008/05/13 12:14

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.