NTTレゾナントは28日、実験サイト「gooラボ」で、インターネット上のWebサイトを対象にした「評判検索」と「Q&A検索」の実証実験を開始した。6月16日まで公開する。
|
|
評判検索
|
Q&A検索
|
● 1億ページをインデックスした「評判検索」
|
1億ページをインデックスした「評判検索」
|
|
NTTレゾナントの竹野部長
|
評判検索では約1億ページをインデックスした。日本語のWebページを解析し、評判に関する記述があれば「何に対する評判か」「どんな表現が使用されているか」「肯定的か/否定的か」を抽出する。また、抽出した評判情報を高速に検索する特殊なインデックス構造を独自に開発。これにより、ポジティブな評判とネガティブな評判の一覧を高速に表示できるようになった。
検索結果では笑った顔(ポジティブ)と泣いた顔(ネガティブ)のアイコンで評判表現を分類し、頻出順に表示。ポジティブな評判とネガティブな評判の割合も円グラフで表示する。例えば、携帯電話の「N902i」というキーワードで検索すると、ポジティブな評判表現として「よかったです」「いい」「安心」などが、ネガティブな評判表現としては「変」「負けます」などが現われる。
このほか、検索したキーワードに関連したキーワードも表示する。なお、記事の日付を指定する検索オプションは用意しているが、時系列順に評判の推移をグラフ化するような機能は実装されていない。
評判を検索するサービスとしては、同じくgooラボで試験提供している、ブログを対象にした検索エンジン「BlogRanger」などがある。NTTレゾナントの竹野浩担当部長(ポータル事業部技術マーケティング部)は、「BlogRangerと評判検索は基本的な検索エンジンの部分は同じものを使用しているが、評判を抽出する部分が異なる」と説明。ブログではその記事の作者がある程度わかるため、BlogRangerではそのブログを書いた人も検索アルゴリズムの要素にしている。一方、一般のページでは作者が不明な場合が多い。そのため今回の評判検索では、純粋にテキストのみを抽出・解析しているという。
評判検索では、評判表現だけでなく、それらの評判表現が掲載されているWebページの一覧も表示する。竹野氏によれば、評判がWebサイトに掲載されているかどうかでスコアリングしているため、通常のWeb検索と異なり、「あまり有名なページでなくとも検索上位に表示される場合もある」という。
インターネット上の評判情報を報索できるサービスは便利だが、精度の面から言えば現状では開発途中ということもあり、万全ではない。評判検索では、ある評判表現がポジティブあるいはネガティブであるキーワード群をカテゴライズしている。例えば「高い」という評判表現をポジティブに捉える「給料」「身長」などのキーワードをひとくくりにしているという。だが、個々のキーワードによっては「ポジティブ/ネガティブが逆の場合もある」(竹野氏)。実際に「カレー」で検索すると、「辛い」という言葉をネガティブな表現として集計してしまうため、評判検索ならではの難しさもあるようだ。
● 自然文にも対応した「Q&A検索」
|
自然文検索ができる「Q&A検索」
|
Q&A検索では、インターネットから収集したQ&A約20万件に加え、「教えて!goo」に掲載している約100万件以上の項目を対象にした。検索時にはどちらを対象に検索するか切り替えられるようになっている。
収集したページは内容を解析後、統計処理による類似度を用いて文章から「概念」を抽出することで、類似する概念を検索できる「曖昧な検索」を実現したという。概念によって検索できるため、通常のキーワード検索だけでなく自然文検索も可能だ。また、キーワードが含まれていない検索結果が表示されることもあるという。
複数のキーワードを入力した場合、スライドバーを動かすことでキーワードごとに“重み付け”を設定できる。このほか、ヒットした各文章の概念をそれぞれレーダーチャート形式で表示する「意味グラフ」を表示。チャートのパラメーターは明らかにされていないが、検索結果には「概念を表わすチャートの図形が類似しているものを表示している」(竹野氏)ので、クリックする際の参考になるだろう。
● いずれはスタンダードな機能に
「評判検索の多くがブログなどを対象にしていたが、我々は通常のWebページを対象にしている。いずれは10億程度と言われる日本語ページすべてをインデックスする」と竹野氏。「評判検索、Q&A検索とも現在は別個のシステムとして作っているが、将来はWeb検索サービスのスタンダードな機能として利用できるようにしたい」と意気込みを示した。このほか、API公開については「要望があれば検討したい」とコメントした。
関連情報
■URL
評判検索
http://repu.nttrd.com/repu.html
Q&A検索
http://qa.nttrd.com/qa.html
ニュースリリース
http://help.goo.ne.jp/info/n_release/n_060328.html
■関連記事
・ NTTとNTTレゾナント、4種類のフィルタを利用したブログ検索の実装実験(2005/12/19)
・ goo、質問文をそのまま入力できる日本語自然文検索サービスを正式提供(2005/10/04)
( 鷹木 創 )
2006/03/28 15:17
- ページの先頭へ-
|