米Googleが把握しているURLの数が、1兆の大台を突破した。同社のWeb Search Infrastructure TeamのJesse Alpert氏とNissan Hajaj氏がGoogle公式ブログで明らかにした。
それによると、GoogleではWebページを収集する過程で、すでに1兆以上のリンクを発見している。しかし同じコンテンツでありながら複数のURLを持っていたり、自動生成されたページなどがあり、こうしたさまざま要素を取り除いた後でも、1兆の独立したURLを把握していると説明する。さらに現時点でWebページの数は1日当たり数十億ページの勢いで増加し続けているという。
Googleでは、この1兆のURLのすべてをインデックスしているわけではないという。なぜなら、コンテンツの内容が似通っていたり、Webカレンダーのリンクのように、「次の日」リンクをクリックしても新しい情報が得られるわけではないといった状況が多数あるからだ。
現在Web上にどれだけのページがあるかについては、「我々にはわからないし、すべてを見るだけの時間がない。厳密に言って、現存するページの数は無限だ」とコメントしている。
その上で、「我々は、どのサーチエンジンよりも多くのものを含むインデックスを持っていることを誇りに思っている」とコメントし、他のサーチエンジンの追随を許していないとの自負を露わにしている。
関連情報
■URL
Google公式ブログの該当記事(英文)
http://googleblog.blogspot.com/2008/07/we-knew-web-was-big.html
( 青木大我 taiga@scientist.com )
2008/07/28 12:22
- ページの先頭へ-
|