NICT、Webから「概念辞書」を構築する技術などを展示


NICTの研究成果による「概念辞書」。画面は「洗濯機」と「トラブル」の関係を持つ単語の一覧

 「CEATEC JAPAN 2009」には、通信技術の研究・開発を行う独立行政法人情報通信研究機構(NICT)もブースを出展しており、産官学連携による多数の研究成果を展示している。

 音声・言語処理技術の研究・開発を行うNICTの「MASTARプロジェクト」では、クローリングしたWebページのデータから、単語の意味的関係を「概念辞書」として自動獲得できる技術を展示している。

 この技術は、「洗濯機」と「カビ」という2つの単語の間には「トラブル」という関係があるといった、単語間の関係を示す概念辞書を構築するもの。現在、180万語の辞書ができあがっており、250万語を目標にしているという。

 また、こうした関係性を獲得する技術が、既に実際のサービスにも適用されている。ニフティが1日に発表した「みんなのレシピ検索」β版には、概念辞書の作成にも用いられているNICTの「汎用自動知識獲得システム」が採用されており、2億以上のブログ記事から20万を超えるレシピ記事を、約3週間で構築できたという。

単語間の意味的関係を示す概念辞書を、Webから自動的に構築するニフティの「みんなのレシピ検索」β版にも技術が応用されている

関連情報

(三柳 英樹)

2009/10/7 11:00