Googleの新インデックス技術「Caffeine」が完成、検索結果がより“新鮮”に


 米Googleは8日、新たな検索インデックスシステム「Caffeine」が完成したと発表した。検索インデックスの更新頻度が従来よりも50%速くなるとともに、検索対象となるWebコンテンツの範囲がこれまでで最大になったとしている。

 Googleによれば、従来の検索インデックスは複数のレイヤーで構成され、各レイヤーの更新頻度にはばらつきがあった。主要なレイヤーは2~3週間おきに更新する一方で、古いインデックスを含むレイヤーについてはWeb全体を解析した上で更新していたため、検索結果に反映されるまでに時間がかかっていたという。

 これに対してCaffeineは、Webを全体ではなく小分けにして解析することで、世界中の検索インデックスを絶え間なく更新することが可能。新たなページや既存のページの更新情報などを迅速にインデックス化できるとしている。これによりユーザーは、検索エンジンを通じて、従来よりも速く新たな情報を入手できるようになる。

 Googleによれば、Caffeineがインデックス化できるのは1分あたり数十万ページ。Caffeineは1億GB近くのストレージを使用しており、1日に数十万GBの新たな情報が追加されているという。

従来の検索インデックスと「Caffeine」の比較

関連情報

(増田 覚)

2010/6/9 15:36