Internet Watch logo
記事検索
最新ニュース

サイトを形態素解析、単語ごとに検索できる「スマートブラウザ」


スマートブラウザ

各種タブで機能を選択する
 株式会社ズーは、形態素解析エンジン「言語郎」と、同エンジンを利用したWebブラウザ「スマートブラウザ」を開発した。スマートブラウザはInternet Explorerの描画エンジンを利用しており、Windows XP/2000/Me/98に対応する。いずれも、まずは企業向けに提供する方針だという。

 言語郎は、51万語の辞書データに独自のインデックスを追加して高速な検索ができるという形態素解析エンジン。解析する文章の表記に一致するすべての単語を辞書から抜き出して形態素の候補を列挙する「ラティス構造」を作成し、それら単語同士の組み合わせから最も適した単語の並びを探し出す。ズーによれば、49万通り以上の単語の組み合わせについて、「Viterbiアルゴリズム」という動的計画法の一種を用いてスコア付けを行なったという。

 この言語郎を利用したスマートブラウザでは、Webサイトの記述を形態素解析し、各単語に対してYahoo!やGoogleなどの検索結果へのリンクを設定できる。また、Web検索エンジンだけでなく、辞書サイトや翻訳サイトなどへの出力も可能だ。

 さらに、形態素解析したサイトの文章に関して、テキストだけ抜き出すことや重要度が高いと思われる文を「要約」として抽出する機能も搭載した。このほか、漢字のルビ振りや単語のアクセントも表示できる。サイトに利用されている単語を品詞ごとに一覧表示することもできる。

 長野県上田市に本社を構えるズーでは、言語郎の開発に10年近く費やしたという。「1998年の長野オリンピックでは翻訳サービスの重要性にも気付いた。そのためにも日本語の適切な解析技術が重要だった」(ズーの藤井修亮取締役副社長)。当面は、企業に対してのOEM提供を行なう方針だが、「一般ユーザー向けには、ダウンロードしなくても利用できるASP型のサービスも検討している」と語った。


単語ごとに検索結果へのリンクが設定される ルビ振りも可能だ

関連情報

URL
  スマートブラウザ
  http://gengoro.zoo.co.jp/browser.php
  言語郎
  http://gengoro.zoo.co.jp/
  ズー
  http://www.zoo.co.jp/


( 鷹木 創 )
2006/01/18 14:56

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2006 Impress Watch Corporation, an Impress Group company. All rights reserved.