最新ニュース

日本の「リネージュ」ユーザーは集団活動が好き〜東大池田教授が実態分析

ゴメス、2003年夏期の国内・海外旅行サイトのランキングを発表

UIS、永井豪などが登場する「コミックス・アニメ祭」を開始

インターネット接続利用者数、ブロードバンド加入者が1,100万人に近づく

1週間メールのない生活は「離婚よりストレス」〜Veritas調査

OCN、Web上でホームページを作れる「ホームページ簡単キット」

NTT西日本、ブロードバンド回線を活用したVPNサービス提供開始

テックジャム、9,500円の検索キーワード解析ツール

オンライン音楽市場はまだ成長の余地あり〜米Jupiter調査

BIGLOBE、直販サイトを集約した「BIGLOBE STORE」を開設

テレマン、31の離島で衛星ネットを活用した常時接続環境の整備構想

感染するとIEのパフォーマンスが低下するウイルス「Bingd」

CRLの研究施設公開イベントで、今年も“無線LANラジコン”が登場

米ISS、WindowsのRPCに関する脆弱性の有無をチェックできるツール

InfoSphereに@FreeD対応の固定IP付与サービス

総務省、電波再配分の給付金算定に関する報告書を公開

情報通信審議会、携帯技術やアニメ・ゲームを活かす「日本型新IT社会」提言

ITXと有線ブロード、企業向け光ブロードバンド事業で合弁会社設

NRIら、実証実験に基づいた無線LANの設計・運用サービス

IE用の国際化ドメイン名プラグイン「i-Nav」がRFCに準拠

OCNでアクセス集中によるDNS障害が発生。現在は復旧

ソフトバンクBB、必要な機能だけを追加利用できるセキュリティサービス

日本気象協会、患者が急増している熱中症の予防情報サイトを開設

日本語ドメイン名の普及に、残る課題はアプリケーションの対応〜JPRS取締役

損保ジャパン、ネット上でリアルタイムに事故対応状況を照会できるサービス

シマンテック、感染するとうるさいウイルス「Lorsis」を警告

Web上のグラフィック技術「X3D」が国際規格へと一歩前進

著名なダウンロードサイト「Download.com」が殿堂入りソフトを4本発表

ノルウェーTelenor、航空機向けに衛星経由のパケットデータサービス

【連載】検索エンジンの裏側 第10回 Yahoo!のOverture買収で浮上した3つの疑問

【サービス/検索】

goo、国内8,000万Webページを対象とした
「新鮮情報検索エンジン」の実験開始

■URL
http://www.ntt.co.jp/news/news02/0212/021203.html
http://www.goo.ne.jp/ (goo)
http://infobee.ne.jp/ (実証実験サイト)

本誌記事から「ソースコード売買」で検索したところ。他の検索サイトではこのキーワードそのものを含むページは表示されなかった
NTT-Xの大町氏(左)、NTTサイバーソリューション研究所の小川氏
 日本電信電話株式会社(以下NTT)は、NTTサイバーソリューション研究所が開発した「新鮮情報検索エンジン」の実証実験を開始すると発表した。株式会社エヌ・ティ・ティ エックス(以下NTT-X)の協力で、ポータルサイト「goo」上で展開する。今年8月から展開している「ニュース記事検索実験サービス」の技術一新と規模拡大を実施し、国内の全Webページへの対応を図る。

 これまでの全文検索エンジンは、Webページが更新されてから検索可能になるまで早くても数日、遅い場合は1ヶ月以上の時間がかかっていた。これは検索対象とするWebページが多いほど、検索対象とするのに必要なデータ処理に時間がかかるためで、このWebページのデータ規模とデータ処理を行なう更新頻度を両立させることが、全文検索エンジンにとっての大きな課題となっていた。

 NTTサイバーソリューション研究所ではこの問題を解決するため、バーチャルドメインやミラーサーバーといったWeb空間の構造を学習し、複数の収集ロボットによって効率のよいデータ収集が行なえる「Web空間自動学習による超多重収集制御技術」、Webページの更新された部分だけを判断してデータ収集を行なう「更新ページ学習収集制御技術」という2つの技術を開発。これらに加え、収集した各ページのキーワードを高速抽出してインデックスをリアルタイムに書き換え、同時にインデックスの圧縮を行ない転送量の軽減を図る「圧縮付きリアルタイムインデクシング技術」を用いることで、1億ページ以上のWebページ情報が1日で収集・検索可能な「新鮮情報検索エンジン」を実現したという。これによって、国内Webページの毎日の更新に対応した検索が可能なほか、ニュースサイトや掲示板など頻繁に更新されるサイトでは、最短で15分前に掲載された情報の検索も可能になるとしている。

 実証実験では「goo 最新Web検索実験サービス」という専用のサイトを設置したほか、gooの検索エリアに「新検索 公開実験中!」というリンクを設け、ここからもアクセスできる。Webページ全般を対象とした“最新Web”と、IT関連ニュースなどメディアサイトを対象とした“最新ニュース”の2種類の検索が可能で、いずれも新着順、適合度順での並べ替えできる。すでに4,000万ページに対応していて、2003年初頭までに国内のWebページ数と想定される8,000万ページに対応する予定だ。実験ではクローリング頻度の最適化や検索精度の調整などを行ない、更新速度の向上とより精度の高い検索を目指すという。

 NTTサイバーソリューション研究所 マルチメディア端末プロジェクト担当部長の小川克彦氏は、「Googleのインデックス更新が遅いので、もっと速さを追求することから始まった。『新鮮情報検索エンジン』はF1エンジンのようなもので、速さについては自信がある。ただ同じクルマでも、人によっては“カーナビやクーラーのあるクルマのほうがいい”という人もいるように、goo本体でのナビゲーションやコンテンツも不可欠」としている。またNTT-X 常務取締役の大町雄一氏は「実験を通じてgoo本体とのシナジー効果を発揮できる展開を探っていく。またASPで使ってもらえるなら積極的に出していく方向で、goo本体とソリューション提供の両面での展開を考えている」と述べた。

◎関連記事
NTTとgoo、最短1分で最新情報を反映する「ニュース記事検索実験サービス」

(2002/12/3)

[Reported by aoki-m@impress.co.jp]

INTERNET Watchホームページ

INTERNET Watch編集部internet-watch-info@impress.co.jp
Copyright (c) 2002 Impress Corporation All rights reserved.