【新サービス】

Googleが1日前の情報も検索可能に~ニュースサイトや日記も含まれる

■URL
http://www.google.com/

 米Googleの検索結果の中にニュースサイトなどの最新の情報が含まれるようになったことが判明した。Googleはロボット型のサーチエンジンであるため、通常は一定の更新周期の間にインターネットを巡回し、変化があればインデックスを変更するという形を取っている。この更新周期は公式には発表されていないものの、大体2~8週間であろうと推測されてきた。最近ではAlltheWeb.comを運営するノルウェーのFAST社が「最も最新の情報を提供するサーチエンジン」として「9日~12日」にインデックスの一部の更新頻度を上げると発表して話題になったことがある。正式には発表されていないが、今回ニュースサイトなどの最新更新ページが含まれるようになったことでGoogleの更新手続きに変化が行なわれたことが分かる。

 例えば、先週水曜日に発表されたニュースで「米Palm社が米Be社の知的財産・人材などを買収した」というものがあったが、これを検索してみようとBeのCEOであるGassee氏とPalm社を検索語として入力してみると、米CNET、米Internetnews.com、米ZDNetなどの有名ニュースサイトの該当ニュースが軒並み上位に列挙される。また、現在「fujitsu」を検索すると、富士通株式会社の構造改革案に関する、20日付けのReutersの記事のほか、19日付けのCBS MarketWatch、CNETの記事も検索結果として表示されるようになっている。


「fujitsu」での検索結果。20日付けの記事が検索された

 現在ニュースサイトの記事の最新情報をアップデートする方法としてはRSS(RDF Site Summary)やRDF(Resource Description Framework)などの方法を使うのが一般的だ。RSSやRDFとはコンテンツの更新日時などをXMLで記述した小さなファイルで、これを見ればいつコンテンツの内容を更新したのかを自動的に知ることができる仕組みだ。元々は「Internet Explorer 4.0」のチャンネル機能などで広く知られるようになったもので、最近では更新確認ソフトや、米国や欧州で人気の日記サイトの更新日時を表示するのによく使われている。今回Googleで検索できるようになった“更新の早いサイト”にはニュースサイトだけでなく、日記ページなども含まれているが、これらは大抵RSSを使っているため、この新機能にRSSが使われている可能性もある。いずれにしても更新頻度に敏感な性質を持つサイトのインデックス更新頻度を高めるような何らかのアルゴリズムを採用したものと思われる。

 リアルタイムな情報をサーチエンジンで検索したいという要望は昔から様々な識者が指摘してきた願いだったが、ロボット型サーチエンジンの仕組みからして難しいと考えられてきた。そのためP2P技術を利用してリアルタイムにニュースサイトや掲示板だけを検索するサーチエンジンを作ろうとしたInfraSearchが注目され、P2Pビジネスの期待の星として過大に投資されるなど(後にSun Microsystemsに買収された)、この分野における発展はまだ始まったばかりだ。

 Googleが今回1日前のニュースを検索結果に含められるようにしたことは、インデックスされているページ数や画像、音楽検索などの分野で激しく競ってきたサーチエンジン業界に大きな波紋を呼び起こすと思われる。また最新の情報を提供したいと願うニュースサイトにとってはGoogleの検索結果に最新の記事が含まれるようにニュースの更新頻度をいつにするか、Googleに含まれていないニュースサイトならばGoogleのアルゴリズムに合わせてページの変更を加えたりニュースの更新頻度を上げるか、などコンテンツビジネスにも大きな影響を与える可能性がある。

◎関連記事
サーチエンジンのFAST、インデックスの更新間隔を最短9日に改善
米Sun、P2P検索技術のInfraSearch買収へ~JXTAプロジェクトを推進

(2001/8/20)

[Reported by taiga@scientist.com]


INTERNET Watchホームページ

INTERNET Watchグループinternet-watch-info@impress.co.jp