Internet Watch logo
記事検索
最新ニュース

沖電気、ユーザーコミュニティによる辞書で精度向上を目指す翻訳サイト


訳してねっとのトップページ
 沖電気工業は29日、ユーザーが辞書データを登録・管理することで翻訳精度が向上するWebサイト型の機械翻訳システム「訳してねっと」の開発に成功したと発表した。同日、翻訳サイトの一般向け無料公開を開始した。英日・日英翻訳が行なえる。

 機械翻訳システムで精度を上げるには分野に応じた辞書の増強や管理が必要となるが、これまで行なわれてきた翻訳サービス会社や個人による管理では限界があったという。これに対して訳してねっとは、分野単位で作成・管理する辞書データをその分野に精通したユーザーが行なう仕組みとなっている。

 具体的には、訳してねっとのWebサイト内に分野ごとに分かれたツリー型のディレクトリ構造があり、それぞれのディレクトリはユーザーによって作成・運営されるコミュニティとなっている。ユーザーは、翻訳したい分野に合うコミュニティにアクセスすることで、そのコミュニティが管理する専門用語辞書を使った機械翻訳が行なえる。テキスト、Web、ファイル(テキスト、Word、XMLなど)の翻訳が可能だ。

 なお、ディレクトリのトップは一般用語コミュニティとなっており、一般用語を辞書登録できる。一般用語コミュニティの辞書は、すべての専門用語コミュニティの翻訳でも使用される。

 訳してねっとでは、コミュニティにおける辞書作成作業を支援する「専門用語抽出機能」を搭載しているのも特徴。ユーザーが指定したWebページなどの文書中から、統計的な手法によって専門用語として登録すべき単語や熟語を自動的に検出することで、辞書データの登録作業時間も半分に短縮されるという。また、評価実験の結果から、登録すべき用語の約5割を自動抽出できるほか、検出した単語や熟語のうち約3割は、辞書登録することで翻訳精度の向上につながるものだということがわかったとしている。


関連情報

URL
  ニュースリリース
  http://www.oki.com/jp/Home/JIS/New/OKI-News/2004/09/z04071.html
  訳してねっと
  http://www.yakushite.net/


( 永沢 茂 )
2004/09/29 20:51

- ページの先頭へ-

INTERNET Watch ホームページ
Copyright (c) 2004 Impress Corporation All rights reserved.