「教えて!goo」のQ&A文からタグを自動付与、「QA.ON/OFF」実証実験開始


「QA.ON/OFF」の実証実験サイト

 日本電信電話株式会社(NTT)とNTTレゾナント株式会社は22日、Q&Aサービス「教えて!goo」の質問回答データを分析し、文章の内容を端的に表す3階層のタグを自動的に付与する実証実験「QA.ON/OFF」を、実証実験サイト「gooラボ」で開始した。

 「QA.ON/OFF」は、ユーザーが入力した検索キーワードに対して、「教えて!goo」のQ&Aから抽出した関連タグをナビゲーションボタンとして表示。ユーザーがボタンをオン/オフすることで、目的のQ&Aにたどりつけるようにするサービス。

 タグの抽出には、NTTが開発した「階層的オートタギング技術」を利用。「教えて!goo」内のQ&A文章を分析し、各Q&Aについてジャンルを示す「カテゴリタグ」、扱われているテーマを示す「主題タグ」、特徴的な単語を示す「キーワードタグ」の3階層のタグを自動的に抽出する。

 「階層的オートタギング技術」には、各カテゴリーで主に扱われる話題を自動発見する「主題語発見機能」や、文書中に含まれていない文字列でも内容から統計的に推定してカテゴリータグや主題タグの組を付与できる「階層分類タギング機能」、文書の構造を考慮してキーワードを抽出する「抽出タギング機能」といった特徴が含まれている。

 例えば、「最近彼氏との仲が上まくいっていません。ちょうど、彼氏の誕生日が近いのでメガネをあげようと思っているのですが、どんな物が喜ばれるでしょう?今は黒縁メガネのフレームが流行っているでしょうか…」といった質問文に対しては、「恋愛相談」「ファッション」がカテゴリタグ、「プレゼント」「メガネ」が主題タグ、「誕生日」「黒縁メガネ」「フレーム」がキーワードタグとしてそれぞれ付与される。

 NTTでは、商用環境における機能の技術的検証を行うとともに、精度向上のためのデータを得ることで、今後の開発に反映。NTTレゾナントでは、実験により利用動向やユーザーの意見をもとに、ビジネス性の評価・検討を行うとしている。


関連情報

(三柳 英樹)

2011/2/22 06:00