【技術】

3,000以上のニュースサイトをリアルタイム検索
~AlltheWeb.comがバージョンアップ

■URL
http://www.alltheweb.com/
http://www.fastsearch.com/press/press_display.asp?pr_rel=103

 ノルウェーのFast Search & Transfer社は13日、同社が運営しているサーチエンジン「AlltheWeb.com」をバージョンアップし、3,000以上のオンラインニュースサイトをリアルタイムに検索できる機能を追加したことを発表した。

 AlltheWeb.comは1分間に800ものニュース記事を収集し、ニュースがインターネット上に掲載されると、ほぼリアルタイムに利用者の検索に応ずることができる体制を整えた。検索結果にはそのページがインデックスされた時間が表示されるために、最新のニュースを見つけやすくなっている。人気ではAlltheWeb.comの先を行くGoogleもニュースを検索結果に含めるサービスを開始しているが、Googleではいつそのニュースがインデックスに含まれるようになったのかを調べる方法がないため見にくく、ニュースを検索するためであればAlltheWeb.comの方がはるかに使いやすいといえる。

 実際に使ってみたところ、英語の記事を掲載しているニュースサイトの記事は多くの場合10分から20分、速ければ3分のうちにインデックスされているようだ。また言語を日本語に限定してニュースサイト検索した場合にも、1時間や2時間後にインデックスされていることが多く、ニュースを横断的に検索する場合の唯一の方法として日本のユーザーにも重宝されそうだ。


試しにApple「Airport」で検索してみたところ、10分前(!)に収集されたTime Magazineの記事が検索結果として出た。

 FASTが発表したプレスリリースの中で、最近「サーチエンジン戦略2001」会議で各サーチエンジンがどれほどの周期でインターネット全体をインデックスしているかというデータが公表された。それによるとAlltheWeb.comが9日から11日周期でインデックスしているのに対して、Googleでは28日、Inktomiは45日、AltaVistaは45日から60日かかっていることが判明した。AlltheWeb.comのバージョンアップでインデックスされた日時を表示するようになったのもこの速さに対する自信の表れだろう。

 今回のバージョンアップではニュース検索機能だけでなく、検索内容の精度を上げる機能も追加された。例えば同じような内容を含むページに関しては一つのフォルダにグループされて表示されるため、たくさんのリンクをたどっていく手間を大幅に減らすことができる。さらに英語で検索行う場合には構文解析を行なって文章の意味をある程度認識してもっとも適切な検索結果を返すことができるようになった。

 FASTでは、これら最新の技術をサーチエンジンAlltheWeb.comでいちばん最初に公開することにしており、FASTの技術をライセンスしているTerra Lycosやヨーロッパ最大のISPであるT-Online、FASTのサーチエンジン技術をライセンスしているその他の企業に対しては今後このテクノロジーを利用していくことにしている。

◎関連記事
サーチエンジンのFAST、インデックスの更新間隔を最短9日に改善

(2001/11/14)

[Reported by taiga@scientist.com]


INTERNET Watchホームページ

INTERNET Watchグループinternet-watch-info@impress.co.jp