ニュース

NTTレゾナント、日付・時刻情報の表記ゆれを補正するAPI公開

 NTTレゾナント株式会社は31日、同社が運営する実験サイト「gooラボ」において、日付や表記ゆれを吸収する「時刻情報正規化」のAPIを公開した。

 このAPIは、リクエストで送られた日本語文字列と日時情報から、日付や時刻を表す表現を抜き出して正規化するもの。時刻は漢数字や和暦表記も認識する。例えば、「今日の9時」という文字列が「2016-04-01T08:16:32」の時刻情報と同時に送られた場合、「今日」の部分を「2016-04-01」、「9時」を「2016-04-01T09」と出力する。

 「今日の2時」といった午前・午後のどちらにも取れる表現については、日中時間帯と解釈し「2016-04-01T14」になる。「2月の30日」「深夜26時」といった表現は翌月や翌日に繰り上がる。

 このAPIを実装することにより、音声入力後、テキスト変換された日本語テキストの文中に日付・時刻に関する文字列を正規化し、ウェブサービスやアプリの中に取り込めるようになる。スケジュールアプリや家電を操作するスマホアプリなど、あいまいな表現の入力が想定されるサービスにおいても正確な日時を指定できるとしている。

 同技術はNTT研究所が開発し、gooの検索で利用してきたもの。すでに「形態素解析」「固有表現抽出」「ひらがな化」「語句類似度算出」「商品評判要約機能」「キーワード抽出機能」などを公開している。

(磯谷 智仁)