【新技術】

富士通研究所、億単位のWebページの自動整理技術を開発

■URL
http://pr.fujitsu.com/jp/news/2001/07/12.html (プレスリリース)

 株式会社富士通研究所は、Webのリンク解析技術や自然言語処理技術を利用して、自動的に億単位のWebページを選別し、地域やジャンルによって分類整理する技術を開発した。これまで人手に頼って行なっていたWebページの収集・分類が、本技術を用いることで、ジャンル別や地域別などの目的に応じて、自動ですばやく収集・分類・分析できるという。

 本技術は、「知的Webクローラー(情報収集技術)」「Webページ解析技術」「モニタリング技術」の3つからなる。まず「知的Webクローラー」だが、これはWeb収集が大基本となっている。Webページの内容やリンク関係を利用して、テーマに沿ったWebページを収集する。次に「Webページ解析技術」を用いて、リンク解析や情報抽出、自動分類技術により、Webページやそれに含まれるキーワードに対する二次情報を自動生成する。例えば、リンク解析により人気度を推定し、人気の高いページを自動的に地域やジャンルなどのカテゴリーに自動分類できるという。「モニタリング技術」では、「知的Webクローラー」および「Webページ解析技術」を用いて収集・解析したコンテンツの動きを時間的変動などさまざまな形式で視覚化する。

 富士通研究所では、本技術の解析結果をASPによる提供や、コンテンツアグリゲーターおよびポータルサイト向けに2次コンテンツとして販売していく予定だという。なお、本技術の一部は、約130万件の地域情報をデータベース化した地域情報ポータルサイト「town@nifty」で運用されている。

(2001/7/12)

[Reported by moriyama@impress.co.jp]


INTERNET Watchホームページ

INTERNET Watchグループinternet-watch-info@impress.co.jp