NTTレゾナントは30日、Wikipedia日本語版の記事を検索できる「goo Wikipedia記事検索」において、話し言葉による記事検索を可能にするサービス「goo Wikipedia自然文検索」の実証実験を開始した。自然文でWikipediaの記事を検索できるサービスは、国内ポータルサイトでは初めてとしている。
「goo Wikipedia自然文検索」は、「安土城を建てたのは誰?」や「OPECって何?」といった話し言葉で質問を入力すると、Wikipediaの記事から回答を表示するサービス。回答できない場合は、回答が含まれていそうなWikipediaの記事を検索結果として表示する。話し言葉で検索できるため、知りたい情報をより簡単に調べられるとしている。
自然文検索の仕組みとしては、質問内容を解析して、人名や地名などの名称、日付や金額などの数量、言葉の定義などの質問の種類を判定。その上で、「goo Wikipedia記事検索」の検索結果から、回答候補を抽出する。また、質問に対する回答の確からしさのスコアを計算し、スコアの高い順に表示している。
また、あらかじめ「goo Wikipedia記事検索」内の記事を解析して独自のデータベースを作成し、質問文とマッチングさせている。例えば、「アイルトン・セナ」という記事では、「アイルトン・セナ」「優勝回数」「41」という表現から、「アイルトン・セナの優勝回数は41回である」という知識を抽出。これらの知識をデータベースに蓄積することで、「アイルトン・セナの優勝回数は?」「優勝回数が41回のF1ドライバーは?」といった質問に対して、それぞれ「41」「アイルトン・セナ」と回答できるという。
「goo Wikipedia記事検索」は、Wikipedia日本語版を手がけるWikimedia財団から記事提供を受けている。2008年6月現在で約48万件の記事を検索できる。なお、Wikipedia日本版の記事数は、6月20日に50万項目を突破している。
関連情報
■URL
ニュースリリース
http://help.goo.ne.jp/info/detail/1168/
goo Wikipedia 自然文検索
http://qa.wpedia.search.goo.ne.jp/
( 増田 覚 )
2008/06/30 18:27
- ページの先頭へ-
|