Internet Watch logo
記事検索
特別企画
【 2009/06/11 】
6月のマイクロソフトセキュリティ更新を確認する
[20:03]
【 2009/06/09 】
「Googleブック検索」和解案と電子書籍ビジネスの行方(後編)
[12:52]
【 2009/06/08 】
「Googleブック検索」和解案と電子書籍ビジネスの行方(前編)
[14:12]
【 2009/06/04 】
多彩なリフィルでタスクも予定も柔軟に管理できる「xfy Planner」
[10:54]
【 2009/06/02 】
DirectShowのゼロデイ脆弱性に対応する
[14:18]
【 2009/05/28 】
ソニー「nav-u」の小さいカーナビ使ってみました<徒歩・自転車編>
[10:56]
【 2009/05/26 】
SNSはメールの10倍危険? 「心がけ」が大事とカスペルスキー氏
[11:24]
【 2009/05/21 】
被害が多発する「Gumblarウイルス」への対策を実施しよう
[19:20]
ソニー「nav-u」の小さいカーナビ使ってみました<基本機能編>
[11:00]
【 2009/05/15 】
Adobe Reader/Acrobatの脆弱性対策を考える
[15:27]
【 2009/05/14 】
5月のマイクロソフトセキュリティ更新を確認する
[12:58]
【 2009/04/16 】
4月のマイクロソフトセキュリティ更新を確認する
[15:57]

Google創業メンバーのSilverstein氏に聞く

~Googleの目指す“パーフェクトサーチエンジン”とは

 10月15日にはローカル検索サービス「Google Desktop Search」もリリースしたGoogleだが、検索サービスだけでなく、キーワード広告サービス「Adwords」や、日本語未対応ながら1GBの容量を持つWebメールサービス「Gmail」などの独自サービスも提供している。米Googleの技術部門におけるディレクターで、社員番号1番という創業メンバーの1人、Craig Silverstein氏に話を伺った。


80億のインデックスページを高速に処理できる秘密は

米Googleの技術部門におけるディレクターで、社員番号1番という創業メンバーの1人、Craig Silverstein氏
 11月中旬にGoogleのインデックスページが80億を超えた。Silverstein氏は、「開始したころの1998年当時と比べると思いもよらないほど大規模になった。80億ページというインデックス規模は、スタティックなページであればほとんど世界中のページを網羅している規模だ」という。

 巨大化する検索対象を見越したかのようにGoogleでは当初から、分散型のシステムを採用。1つのマスターサーバーに対して複数のチャンクサーバーがぶら下がり、数百TBクラスの広大な容量に対しても高速にアクセスできる分散ファイルシステム「Google File System」(GFS)や、GFSにインプットされる前にデータを単純化し、効率化するシステム「MapReduce」などを装備している。

 「GFSは、巨大なクラスタ構造で、PB(ペタバイト)サイズのファイルシステムとして運用できる。MapReduceは、データを割り振る『Map』部分、割り振られた各データを一定のアルゴリズムに従って選別・統合する『Reduce』部分の各処理で効率化する。」

 また、「両システムともに分散型のアーキテクチャを採用しているためマシントラブルに強い。また、ひとつひとつの処理を最適化しているため、処理スピードも優れている。単純な構成だからさらなる大容量化も難しくはない」と解説。こうした分散システムが「堅牢性」「スピード」「大容量」といったGoogleの特徴を支えているのだという。


GFSの概要 こちらはMapReduceの概要だ

ローカル検索は“パーフェクトサーチエンジン”に向けた第一歩

 高機能な分散システムによってインターネット上のWebサイトを「ほとんど網羅した」Googleだが、「もちろん、インターネット以外のターゲットも考えている」。ローカル検索の「Google Desktop Search」(GDS)についてSilverstein氏は「1つの目標だった」と語る。

 Googleがローカル検索を開始するのではとの噂は以前からあった。「確かに数年前から開発は進めていた。しかし、ローカル検索はWeb検索と異なり、専用ソフトウェアをダウンロードして利用する仕様で、外部からのアクセスにも配慮しなければならなかった。そうしたセキュリティ面を重視したから、新しいノウハウが必要だった」と開発に時間がかかった理由を述べた。

 「開発は難航したが、GDSによってパブリックなインターネット上の情報とプライベートなローカルの情報をシームレスに検索できるようになった。Googleの目指す“パーフェクトサーチエンジン”に向けた一歩だと言えるのではないだろうか。」

 現時点では検索対象に制限もあるGDSだが、「今後は、対象となるファイル形式も増やしていくつもりだ」と抱負も語った。


専門的な分野を収集してカテゴリ別の検索を可能に

 急激に普及しつつあるブログの存在にも触れ、「確かにWeb検索でブログがヒットする率は高まっている」と現状を解説した。しかし、「専門的サイトを検索したいときに一般的なブログをヒットさせないようにしたいという意見」に対しては、「(何かを排除するということは)Google的ではないように思える」という。「技術的には可能で、非常に興味深い意見だ」と一定の理解を示したが、「ブログを検索対象から外すというオプションは、Googleとして実施するかどうかはわからない」と明言を避けた。

 「専門的サイトを検索したいのであれば、むしろカテゴリごとにデータベースを構築する方が良いのではないか」とSilverstein氏。「官公庁のサイトや学術的なサイトをカテゴリごとに収集して、専門的な検索を実現する」考えだ。なお、Google Labsでは11月19日に学術論文検索用サーチエンジン「Google Scholar」のベータ版を公開している。査読論文、学位論文、テクニカルレポートなどの検索が可能だ。

 Web検索については「動画検索」も話題に上った。「技術的にはできないことはない」というが、動画を検索することは技術以外の部分で問題があるという。「例えば、著作権の問題だ。動画を所有するコンテンツプロバイダーに検索対象とすることを断られる可能性もある」と所有者の権利に関する問題を強調した。


「1つの目標だった」という「Google Desktop Search」 学術論文検索用サーチエンジン「Google Scholar」

AdWords、AdSenseはWebサイトを作成しているユーザーへの還元でもある

 Googleの収入の大きな柱になっているのが広告事業だ。キーワード広告サービスの「AdWords」と「AdSense」を開始した経緯についてSilverstein氏は語る。

 「もちろんGoogleにもお金は必要だった。しかし、それまでボランティアのようにWebサイトを作っていたインターネットユーザーへ還元する意味合いも強い。大企業だけではなく、個人サイトを運営しているユーザーも手軽に参加できるしね。」

 また、「AdWordsを開始する前に、ある特定のクエリ、つまり『デジカメ』とか『パソコン』といった検索キーワードは直接購買に結びつくという仮説を立てていた。実際に始めたらその通りの結果で、特定のクエリについては通常の検索結果よりもAdWordsからサイトにアクセスする方が多かった」とし、Search Engine Marketing(SEM)的なデータとしても収穫があったという。


Googleとユーザーがフレンドリーな関係になれればいい

 日本のSEO業界で話題になった“ゴッゴル”については、「大変面白いムーブメントだ」と興味深い様子。

 「米国でも特定のキーワードをサイトに書き込んで、Googleでの順位を競うという同じような“コンテスト”が開かれたと聞いている。検索キーワードを2つ入力し、検索結果が1つだけになるような“Google遊び”もあり、開始当初は情報を探すだけだったGoogleが、エンターテインメントを始め、いろいろなことに利用され始めているようだ。」

 「Googleとユーザーがフレンドリーな関係になれればいい」とSilverstein氏。「フレンドリーとは信頼感。友人の言葉はみんな信じるでしょう。Googleの検索結果を友人からの返答のように信じてもらえるようにしたい」と今後の抱負を語った。


関連情報

URL
  Google
  http://www.google.co.jp/

関連記事
米Google、学術論文サーチエンジン「Google Scholar」ベータ版発表(2004/11/19)
巨大な検索システムを耐障害性の高いソフトと安価なマシンで実現(2004/11/16)
Google、ブログサービス「Blogger」が日本語など多言語表示に対応(2004/11/16)
Googleのインデックス数が80億ページに~従来の約2倍に拡充(2004/11/11)
ローカルファイルを検索する「Google Desktop Search」ベータ版公開(2004/10/15)
米Google、無料Webメールサービス「Gmail」のベータ版~容量は1GB(2004/04/01)


( 鷹木 創 )
2004/11/29 11:24

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2004 Impress Corporation, an Impress Group company. All rights reserved.