Googleは最近、同社技術の裏側を公式ブログで取り上げ始めており、27日にはWebスパム対策が紹介された。Webスパムとは、意味のないコンテンツを掲載していながら、検索順位を上げようとするスパムの一手法だ。当然のことながら、このスパムは情報を得ようとするユーザーの大きな邪魔となる。
GoogleのWebスパムチームでは、こうしたサイトを表示させないために、検索ログを利用しているという。このログに含まれるIPアドレスやクッキー情報によって、検索結果の品質を見極めるための測定基準が作られている。
測定基準が新たに開発されると、チームでは、それ以降新しく発見されるスパムに適用するだけでなく、検索ログを使って過去にさかのぼり、その測定基準が過去にも有効であったかどうかを確認し、効果の改善に努めるという。
しかし、検索ログの使用には注意も必要で、例えばボットが繰り返し送るクエリー情報などは検索結果の品質改善につながらないため、あらかじめ除去しておくなどの工夫が必要だという。
検索ログの保存や利用については、プライバシー保護の観点から注意が必要であり、Googleでもそのための対策を講じていると説明。その一方で、検索ログの利用がWebスパム対策に不可欠であることもまた強調している。
関連情報
■URL
Google公式ブログの該当エントリー(英文)
http://googleblog.blogspot.com/2008/06/using-data-to-fight-webspam.html
( 青木大我 taiga@scientist.com )
2008/06/30 12:13
- ページの先頭へ-
|