記事検索

「リアルタイム検索」で“いま”を検索。グーグルが説明会


 グーグルは16日、検索サービス「Google」で新たに開始した「リアルタイム検索」に関する説明会を開催した。

英語に続き、日本語とロシア語でのリアルタイム検索に対応


「リアルタイム検索」

 リアルタイム検索は、米Googleが2009年12月に英語によるサービスを開始済み。グーグルによれば、日本語によるリアルタイム検索は2月12日から順次提供を開始しており、ロシア語によるリアルタイム検索も合わせて開始しているという。

 リアルタイム検索の対象は、TwitterやGoogle Buzzのようなマイクロブログサービスに加え、ブログサービスやニュースサイトなど。例えば、「バンクーバー」で検索した場合、検索結果ページ上に「<検索キーワード>の最新の検索結果」という項目を表示。同項目の下に検索キーワードに適合した検索結果が自動的にスクロールしながら次々と表示される。また、検索結果の自動表示を停止できる「一時停止」ボタンも用意している。

 検索結果ページ上に表示されない場合でも、「検索ツール」の期間指定で「最新」を選べば、リアルタイム検索の表示が可能。さらに、検索対象で「アップデート」で絞り込んだ場合には、マイクロブログサービスに限定してリアルタイム検索の結果を表示できる。

 なお、外部サービスの中でTwitterに関しては、米Twitter社との提携によって、Twitterに投稿されたメッセージをリアルタイムで取得している。


検索結果ページに「<検索キーワード>の最新の検索結果」という項目が表示される 検索結果では投稿された経過時間の目安も確認できる

モーグルでの検索例。検索結果ページでは女子モーグルの話題も上位に上がっている これに対して検索対象を「最新」に絞り込むと、その後に行われた男子モーグルの話題が上位に上がった

リアルタイム検索では10以上の技術を新たに開発

 グーグルの徳生健太郎製品開発本部長は、リアルタイム検索を「『いま』を検索し、関連性の高い情報を抽出するもの」と紹介。その上で、リアルタイム検索を支える技術として、新たに10以上の技術を開発したことを明らかにした。

 徳生氏によれば、リアルタイム検索では検索クエリーに適合した内容を単純に表示するのではなく、コメントの質や投稿者の信頼性、検索クエリーとの関連度を加味した上で検索結果に表示しているという。例えば、マイクロブログサービスの場合では、コメント投稿者をフォローするユーザー数やコメントの引用(ReTweet)数などを参考にしている。徳生氏は「ページランクと同じように情報を判断している」と述べた。


グーグルの徳生氏 リアルタイム検索を支える技術

 また、リアルタイムURL解析技術も実装。Twitterでは140字という文字数の制限上、短縮URLを使ってニュース記事などに言及しているコメントもある。こうした短縮URLに関しても、Googleがリアルタイムにアクセスして、コメントとの関連性があるかを解析。また、フィッシングサイトではないかどうかの確認もしているという。

 このほか、検索キーワードの蓄積や新鮮度、キーワード数の変化なども分析。例えば、「五輪」であれば、ユーザーからの検索クエリー数や、関連するコンテンツ量の変化の相関関係を見ながら、最新の結果に反映させるかを判断しているとした。

国内マイクロブログや「2ちゃんねる」への対応も検討

 リアルタイム検索の対象サービスに関して、日本国内のマイクロブログサービスも各サービスを運営する事業者との合意が得られれば、「ぜひ対応していきたい」という。徳生氏は「日本では『Amebaなう』や『mixiボイス』などが代表的だが、『mixiボイス』はmixi内で主に友人に対してメッセージを投稿している」と述べ、リアルタイム検索ではインターネット上に一般公開されているサービスを対象にするとした。また、「2ちゃんねる」に関しても「考えたい」と述べた。

 徳生氏は「情報と検索クエリーの相関性を一瞬に判断して、検索したら即座に結果が戻ってくるスピードを保つことがリアルタイム検索のチャレンジ」と説明。その上で、「Googleでは『情報の網羅性』『関連性』『使いやすさ』『速さ』を、検索技術の4つを基準と位置付けている」点を挙げ、「情報が増える中で関連性が特に重要であり、どうやって取捨選択して検索結果に出していくかはまだまだ課題があり、リアルタイム検索はその第一歩でもある」と語った。

 また、Googleで当初から検索サービスに携わるエンジニアの「究極的には情報が発生してから伝達されるまでの理論的な上限は光の速さ」という発言を紹介。徳生氏は、同エンジニアの「リアルタイム検索や検索サービスの障壁を取り除く作業は、光の速さに到達するまで終わらない」との発言も取り上げて、引き続き検索サービスの改良に取り組んでいく姿勢を示した。


検索技術の4つの基準 Googleの推計でWeb上のデータ量が281エクサバイトに及ぶなど、情報量が増大している点も紹介された

関連情報


(村松 健至)

2010/2/16 19:21