自社アプリに音声認識機能を組み込める「AmiVoice Cloud」、SDKを100万円で


 株式会社アドバンスト・メディアは22日、音声認識機能をクラウド上で利用できるようにする企業向けサービス「AmiVoice Cloud」を初夏に本格販売すると発表した。導入企業は、ソフトウェア開発キット(SDK)を使って音声認識機能を組み込んだアプリを開発し、クラウド上の音声認識処理プラットフォームを利用できる。

AmiVoice Cloudの概要

1秒以内で声をテキストに、業界特有の言い回しも認識

 アドバンスト・メディアが構築する音声認識プラットフォームは、金融や保険、製薬など各業界の専門辞書を用意し、業界特有の用語や言い回しを認識するのが特徴。音声認識機能を組み込んだアプリは、声の特徴をクラウド上に送信後、0.5秒から1秒で認識結果をテキストとして受信できるという。通信はSSLによって暗号化する。

業界ごとの専用辞書を提供しているため、業界特有の用語や言い回しにも対応する

 ビジネス用途としては例えば、スマートフォン向けアプリに音声認識機能を組み込むことで、CRMやSFA、グループウェアでの情報検索や音声入力が行えるようになる。タッチ入力する場合に比べて、音声では8分の1の時間で入力できるという。一般用途としては、ポータルサイトやECサイトの検索・入力、カーナビのコントロールなどを想定している。

 導入する企業は、自社でサーバーを用意する必要がないため、初期費用を抑えて短期間で音声認識機能が導入できるという。また、アドバンスト・メディアが提供するSDK「AmiVoice Mobile Toolkit」を利用することで、技術やノウハウがなくても、自社アプリに音声認識機能を組み込めるとしている。

AmiVoice Cloudの利用方法

今後の音声認識はクラウド活用が主流に

 SDKはiOS版とAndroid版があり、価格は3カ月間のサポート付きで各100万円。キャンペーンとして8月30日まで、iOSやAndroid向けアプリの開発実績がある企業にはSDKを50万円で販売する。なお、SDKはこれまで、ヤフーやバンダイが導入し、それぞれ自社サービスに組み込んだ実績がある。

AmiVoice Mobile Toolkitの概要

 音声認識プラットフォームの利用料金はビジネス用途が登録料20万円、1つのIDあたり月額220円、一般用途は月額10万円(5万発話まで)。導入企業はウェブページ内のテキストフィールドに音声入力が行えるブラウザーを無料で構築できる。JavaScriptを活用すれば、コンボボックス、ラジオボックス、チェックボックスの音声コントロールも行える。

音声認識ブラウザの概要「来週の金曜日羽田から関空10時」と音声入力した画面

 アドバンスト・メディアの枝連俊弘氏は、クラウドを活用した音声認識について「サーバー側に音声認識の本体があり、新しい言葉を随時辞書に反映できる」と説明。サーバーの大容量メモリーとCPUで音声を処理するため、スマートフォンのバッテリーへの負担も減るとして、「今後の音声認識はクラウドが主流になる」と話した。今後は、入力した音声の要約・修正など人手を使ったサービスや、「Siri」のような対話サービスも提供していくという。

アドバンスト・メディアの枝連俊弘氏(クラウド事業部長)

関連情報


(増田 覚)

2012/6/22 17:38