【サービス】

リアルタイムにインデックスを更新するサーチエンジン「Gigablast」

■URL
http://www.gigablast.com/
http://www.gigablast.com/beta.html

 リアルタイムにインデックスを更新する機能を持つサーチエンジン「Gigablast」が現在ベータテストを実施中だ。7,800万ページしかインデックスされていないことやバグが多いなど、検索用途に使うにはまだ物足りないかもしれないが、興味深い機能が搭載されているサーチエンジンだ。

 通常サーチエンジンにサイトが登録されるまでには、サーチエンジンのインデックスがすべて更新されるのを1週間ほど待たなければならないが、Gigablastの場合は登録した数分後、早ければ1分程後にインデックスが更新され、そのページを検索することが可能になる。またトップページにある「インデックスしたページ数」の数が実際に増えるのをリロードする度に見ることができる。このようにリアルタイムにインデックスを更新できるサーチエンジンは初だ。

10分後→
検索窓の下には現在インデックスされているページの数が表示されている。左の画面をキャプチャーしてから約10分後にリロードしてみたところ、1万以上増加していた。

 また、Advanced Searchのページからは検索結果の表示方法として「何行を表示するか」を、1行から4行までの間で選ぶことができる。こうした機能もこれまでのサーチエンジンにありそうでなかった機能だ。ページに表示される情報量を減らしたい場合には重宝しそうだ。現在のところ、日本語の表示はできる場合もあるが、安定していないところが難点だろう。またAdvanced Searchで検索結果を100まで増やすことができるようになっているが、現在のところはバグのせいか、10しか表示できない。

 ページの記述によると、このサイトの開発者はニューメキシコ工科大学で数学の修士号を取得したMatt Wells氏。同氏は1997年以降3年間サーチエンジン企業の米Infoseekで働いた後、Gigablastの開発を始めた。Gigablastの一つの大きな目標はできるだけ少ないコンピューターでできるだけ多くのインデックスを蓄えることだといい、同氏の主張によれば2,000億ページをインデックスできる能力を持つという。現在のサーチエンジンで最も大きいところが20億ページ程度であるから、その100倍ほどの能力を有していることになる。GigablastはLinuxで動作しており、ほとんどのメンテナンス作業を自動化するなど運営のコスト削減に適したアーキテクチャーになってるという。同氏は現在資金、インフラ、帯域幅などで支援を求めており、将来的にはバナー広告などの方法により企業化したい考えを明らかにしている。

(2002/7/29)

[Reported by taiga@scientist.com]

ほかの記事はこちらから

INTERNET Watch編集部internet-watch-info@impress.co.jp
Copyright (c) 2002 Impress Corporation All rights reserved.