INTERNET Watch Title Click

【調査結果】

Webの「地図」の研究成果が公表。10%はリンクされていない

■URL
http://www.ibm.com/news/2000/05/112.phtml
http://www.research.ibm.com/resources/news/20000511_bowtie.html

蝶ネクタイ理論

 Web全体がどのようにリンクされ、互いにつながっているのかを分析し、世界的なWebの地図を作製する研究が行なわれ、その成果が公表された。研究を行なったのはIBM Research、Compaq Corporate Research Laboratories、AltaVistaの研究員たち。
 比較的小さなサンプルに基づいて行なわれてきた以前の調査では、Webのほとんどが19の部分に分かれ、互いに密接につながっていると分析されてきた。しかし5億ページのサンプルに基づく今回の新しい研究では、Webが全体として4つの領域に分かれて存在しており、それぞれの領域にはほぼ同数のページが含まれているという結果が得られた。また注目すべきことに、Webの大きな領域を占める一部分は他と全くリンクされておらず、そのためにリンクをたどることでその領域内に達することができない、とする新しい知見も得られた。研究者たちはこの新しい理論を「蝶ネクタイ」理論と名付けた。

 蝶ネクタイ理論によると、Webの主要な4つの領域(蝶ネクタイ自体に相当する)は全体の90%を占めており、残りの10%はこれらと全く接続されていない。
 非常に強力に接続されている部分、これは蝶ネクタイの結び目に当たるところだが、ここはすべてのページの約3分の1を占めており、ネットサーファーはこれらのサイトにリンクをたどることで自由にアクセスすることができる。
 別の領域は「始まりのページ」とも言うべき領域(蝶ネクタイの片羽に相当)で、全体の4分の1を占める。これらのページからは自由に「蝶ネクタイの結び目」の領域に達することができるが、逆に結び目の領域から「始まりのページ」に達することはできない。
 さらに「終わりのページ」と名付けられた領域(蝶ネクタイのもう片羽に相当)は全体の4分の1を占める。これらのページには「結び目」の領域からアクセスすることができるが、逆に「終わりのページ」から「結び目」の領域に戻ることはできない。
 残りの領域は全く接続されていない領域で、全体の5分の1を占める。これらのページは「始まりのページ」や「終わりのページ」に接続することができるが、中心部分の「結び目」領域からは達することができない。

 研究者たちはこの蝶ネクタイ理論はWebがこれからどんどん成長していっても維持される構造だと考えており、Web全体の数学的なモデルを作ることができるのではないかと期待しているが、それ以外の応用もありそうだ。例えば、「始まりのページ」の領域に位置しているEコマースサイトは、「結び目」の領域とリンクすることでもっとネットサーファーがアクセスしやすいようにしなければならないと考えるだろう。その上で、「結び目」とつながった後は、トラフィックを計算する手法を変更してデータを再分析する必要が生じる。またEコマースサイトだけでなく、リンク情報の相互関係に頼っているサーチエンジンにとっても、Webをサーチするより効果的なアルゴリズムを開発する助けになるかもしれない。


(2000/5/12)

[Reported by taiga@scientist.com]


INTERNET Watchホームページ

ウォッチ編集部INTERNET Watch担当internet-watch-info@impress.co.jp