Internet Watch logo
記事検索
最新ニュース

Google、改良に取り組む検索要素技術について説明


 米Googleフェローで、同社サーチエンジンの核を開発しているAmit Singhal氏が16日、Googleが取り組んでいる検索技術の改良動向について公式ブログで説明した。

 Googleのサーチエンジンは、「ページランク」に代表されるリンク構造の解析によるものと理解されることが多いが、今回の説明では、それ以外にも多くの分野で非常に高度な取り組みが継続的に行われていることがわかる。

 これらの研究開発は、主に3つの目標が関係している。1つ目は、ページ内容についての理解を深めること、2つ目はユーザーが打ち込むクエリー内容について理解すること、3つ目はユーザー自身についての理解を深めることである。


ページの概念を理解することに重点

 まずページを理解することだが、Googleではページの概念を理解することに重きを置いている。例えば、ロンドンにある「Sprovieri Gallery」の公式サイトには「London」あるいはそのイタリア語の「Londra」という記述がない。それでもGoogleはこのギャラリーがロンドンにあることがわかっているので、イタリア語のクエリー「galleria sprovieri londra」に対して適切な公式アイトを表示することができる。

 これは、Googleがページに対する理解を深めるために行っている事柄の1つで、その他の方法としては、ページ中のより重要な言葉とそうでない言葉を見分けること、さらにはページに書かれている情報の新鮮さを見極めることなども含まれるという。


クエリーの意味を認識する技術

 ユーザーのクエリーについて理解することに関しては、主に3つの取り組みを挙げた。

 1つ目は、正しい綴りを推測するシステムだ。例えば「kofee annan」と入力すると、前国連事務総長のコフィ・アナン氏を意味するものと解釈し、「Kofe Annan」を推薦するが、「kofee beans」に関しては同じ「kofee」という字句が入っていても、コーヒー豆を指すと理解し、正しい綴りの「coffee beans」を推薦する。Googleではこのような試みをさまざまな言語で行っている。

2つ目は、同義語を理解するためのシステムだ。Singhal氏はこれを「Googleで解決しようとしている最も難しい問題の1つ」と指摘する。それでもGoogleはこの問題に取り組んでおり、現在、すでに100言語でこのシステムを導入しているという。

 3つ目は、クエリーの意味を認識することだ。例えば「new york times square church」というクエリーが入力された場合、Googleは「米国ニューヨークのタイムズスクエアにある有名な教会」を探しているのだと正確に理解し、「大手新聞のニューヨーク・タイムズにある記事」を探しているのではないと判断する。このような技術は、Googleが提供しているほとんどの言語で導入されているという。


ユーザーが住む地域に最適化

 ユーザーについて理解することに関しては、Googleのサーチエンジンの開発原則の1つである「ローカルに最適な検索結果をグローバルに提供する」ことと関係する。これは、ユーザーが住む地域に最適化すること、さらに高度なパーソナライゼーション技術を利用することと関係する。

 例えば、Googleで「bank」と入力したとする。このクエリーが米国内から来ていれば、米国内の銀行のWebサイトが上位に表示されなければならない。しかしユーザーが英国に入れば、英国の金融機関を表示する必要がある。このように、ローカルな情報を提供することに注意が払われている。

 もう1つのパーソナライゼーションは、「Google Web History」にサインインしたユーザーに対して提供される。この場合、アメフトに関連した検索を常日頃行っているユーザーには、アメフト関連の検索結果の方が同じクエリーに対して多数表示されることになるだろう。また、お気に入りのショッピングサイトがある場合、そのサイトの該当商品のページが表示される可能性はより高くなるという。

 このようにGoogleは、一般的なビジネス書などで言われているように単純なリンク解析だけで最適な検索結果を表示しているわけではなく、高度な自然言語処理技術などを持ち、精密な技術の積み重ねによって現在の地位を確立してきたことがわかる。

 Googleでは最近、同社の技術についてできる範囲で公開する方針を明らかにしており、今後もさらなる情報が提供されることが期待される。


関連情報

URL
  Google公式ブログの該当記事(英文)
  http://googleblog.blogspot.com/2008/07/technologies-behind-google-ranking.html

関連記事
Googleが「検索結果ランキング決定3原則」公開(2008/07/10)


( 青木大我 taiga@scientist.com )
2008/07/17 13:15

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2008 Impress Watch Corporation, an Impress Group company. All rights reserved.