東京・有明の東京ビッグサイトで開催されている「IPAX 2005」では、未踏ソフトウェア創造事業部門として、東京工業大学の奥村研究室よりブログ検索サービス「blogWatcher」が出展されている。
|
|
blogWatcherの概要
|
スクリーンショット
|
blogWatcherは、2003年度のIPA未踏ソフトウェア創造プロジェクト「blogページの自動収集と監視に基づくテキストマイニング」によって開発された。HTMLの構造解析を行ない、ブログ以外のWebサイトも含めた検索が可能な点が特徴のサービスだ。また、検索キーワードの注目度を「バースト度」として表示する機能や、キーワードについての言及を分析し「ポジティブ」「ネガティブ」といったカテゴリで色分け表示する機能などを搭載する。
会場では、5月9日より公開されている新バージョン「blogWatcher 2.0」が出展されていた。blogWatcher 2.0では、インターフェイスの改善や評判検索を一新するなどの改良が施されている。また、キーワードに関連したニュース記事を自動検出する機能、収集したサイトから話題となっている出来事を自動でカテゴリ分類する機能、RSS非対応サイトからHTMLを解析しRSSフィードを自動生成する「なんでもRSS」機能などが追加されている。
なお、奥村研究所のスタッフによれば「blogWatcherでは、いわゆる形態素解析だけでなく、1ランクレベルの高い“係り受け解析”も活用している」という。また、ポジティブ/ネガティブの判定には、検索する「対象」とその「属性」、対象に関わる「評価表現」をチェックするとのこと。なお、該当するキーワードを初めて検索する際にはその評価表現をデータベースに入力する必要があるが、その後は類似した表現をインターネット上から自動的に取得するシステムになっている。
「blogWatcherは奥村研究所の日本語解析技術を反映しており、解析技術は高い。しかし、インターネットをクロールし、インデックス化する検索技術は本来の研究成果ではないため、検索精度はあまり高くないのが現状だ。今後は、検索技術などを所有するインターネット関連の企業との連携も視野に入れる。」
会場のスタッフによれば「すでにホットリンクを初めとした数社から提携の話をいただいている」という。
関連情報
■URL
blogWatcher
http://blogwatcher.pi.titech.ac.jp/
IPAX 2005
http://www.ipa.go.jp/event/ipax2005/
■関連記事
・ blogWatcher、RSS非対応ページのRSSフィード作成機能など新機能を追加(2005/05/09)
( 大久保有規彦/鷹木 創 )
2005/05/18 19:13
- ページの先頭へ-
|