記事検索

プライバシーが保護される分散型サーチエンジン「YaCy」〜地道な開発が続く


分散型サーチエンジン「YaCy」公式サイト

 Googleのプライバシーポリシー改定に伴い、ユーザーのプライバシーが一企業によって利用される危険性に注目が集まった。しかしGoogleの代わりとなるサーチエンジンはあるのだろうか? 地道に開発が進められている分散型サーチエンジン「YaCy」は、唯一ではないだろうが、その問いに対するひとつの回答と言える。

 このプロジェクト「YaCy」は、P2P技術による分散型サーチエンジンだ。昨年末にバージョン1.0がリリースされ、現在バージョン1.02のWindows/Mac/Debian/Linux版クライアントがダウンロード可能。ライセンスはGPLv2で、開発者の参加を求めている。

 分散型サーチエンジンであるため、各ユーザーにインストールされたクライアントが、設定したスケジュールに基づいてクロールを行い、インデックスを作成する。そのインデックスはP2Pによって他のピアと交換される。利用者が増えれば増えるほど、ネット全体をインデックスできるようになる。

 YaCyのメリットはいくつかある。分散型のため、各国政府や機関が中央集権型サーバーによる検閲を行えない。さらに、検索エンジンが自分のPCにあるため、検索履歴を第三者が保存したり、広告表示のためにプライバシーが利用されたり、サードパーティーに流出したり、悪用される危険性がない。

 技術的観点からは、自分で好みのアルゴリズムを選択し、重みをつけたり、検索順位を変えることができる。また自分のニーズに合わないサイトを表示させない設定を行ったり、見たくないサイトをブロックするなどの設定を容易に行うことが可能だ。

 また、外部サーチエンジンを使用せずに、イントラネットの中で容易にサーチエンジンを構築できるという特徴もある。

 一方デメリットとしては、全てのピアが対等に扱われるために、悪意のあるピアが、意図的にサイト宣伝のためのデータを送り込んだり、スパム行為を行うといったことが考えられる。また、ランキングアルゴリズムの精度が商業サーチエンジンに比べて劣っていることも大きな問題だ。

 YaCyには現時点で600を超えるピアが参加しているとされる。それでも現時点でGoogleやYahoo!、Bing等の商業サーチエンジンに匹敵するとは到底言えない。そもそもYaCyは、Google等のライバルとして位置付けられることを望んでいない。それでも、YaCyのようなサーチエンジン開発が進められることの意義は「人民による人民のためのウェブ検索」というYaCyの標語に見いだせる。

 YaCy以外の分散型サーチエンジンとしてはFAROOの開発も進められている。

 Googleに限らず、Yahoo!、Bing、Baiduなど、どんなサーチエンジンであったとしても、変質してプライバシーを必要以上に利用したり、検閲されたりするリスクを伴う可能性がある。代替技術が存在すれば、一時の“ブラウザー戦争”のように、標準化技術やベストプラクティスの採用が進む可能性もある。また複数のサーチエンジンを使い分けることによって、意識的にプライバシー情報を分散することも可能かもしれない。

 今後、優秀な開発者が参加することによって、検索精度の向上、他言語への対応など、使いやすい代替サーチエンジンに成長することを期待したい。



関連情報


(青木 大我 taiga@scientist.com)

2012/3/5 06:00