【技術】

台湾の研究者グループが35億ページをインデックスしたサーチエンジンを発表

■URL
http://www.openfind.com/
http://www.openfind.com/en.note.html
http://www.openfind.com.tw/About_us/index.htm

 35億ページをインデックスしたサーチエンジン「Openfind」がベータテストを行なっている。世界最大のサーチエンジンとされるノルウェーの「AlltheWeb.com」は21億ページ、Googleは21億ページ弱であると言われているため、現時点でアクセスできるサーチエンジンのインデックス規模としては最大級のものとなる。

 Openfindを開発したのは台湾の中正大学情報工学科の呉昇助教授らの研究者グループ。1998年の創業で、同グループが開発したサーチエンジンは、自身が運営する検索サイトで利用できるほか、ASP形式で他のサイトにも提供されている。今回ベータテストが行なわれているのは、従来からのサーチエンジンの機能をさらに向上させたものとみられる。

 Openfindに掲載されている説明によると、このサイトを動かしているのは「70台のPentiumサーバー」で、Googleと同程度の検索をこなすのに1,000台以下のサーバー数で実現できるという。Googleでは現在1万台程のサーバーが使われていると推定されているので、もし彼らの主張が正しければ10倍ほどの効率であることになる。

 Openfindを試用してみたが、ベータテストというよりはアルファテストであるという印象を受けた。日本語を含む22の言語に対応していると書かれているのだが、日本語の検索が可能なときもあれば、文字化けしてしまって何も得られないこともある。これは他の言語についても同様だ。

 また、Googleと同じ検索語を入力した場合、確かにヒット数はGoogleよりも多いことが多々あり、インデックスの大きさを感じさせた。しかし、求めている情報が得られるかという観点から言えば、検索結果があまりにかけ離れていることが多い。インデックス規模を活かすためにも今後の改良が期待されるところだ。

(2002/7/8)

[Reported by taiga@scientist.com / okiyama@impress.co.jp]

ほかの記事はこちらから

INTERNET Watch編集部internet-watch-info@impress.co.jp
Copyright (c) 2002 Impress Corporation All rights reserved.