Internet Watch logo
記事検索
最新ニュース

1億語の英語文書データベース、小学館が国内向けの検索サービス


 小学館は14日、BNCコンソーシアム(British National Corpus Consortium)の英語コーパスの日本人向け検索サービスを開始した。

 コーパスとは、専門的な処理が施された文書データベースのこと。文法パターンや例文などをさまざまな条件で検索でき、実際に英語がどのように使われているかを大量のデータで示してくれるという。中でもBNCは、書き言葉9,000万語、話し言葉1,000万語からなる世界最大規模のイギリス英語のコーパスとなる。

 BNCの検索サービスはこれまで英国で提供されていたが、ソフトウェアの使い勝手や英語による申し込み手続きなどがネックとなり、日本人ユーザーの利用は一部の言語専門家に限られていたという。小学館では今回、検索ソフトを独自開発し、日本語によるサービスを提供することで、中学や高校などの授業などにも気軽に利用できるようにした。料金は1IDにつき年間15,000円。このほか、BNCライセンス料2,000円と同ライセンス取得手続き代行料3,500円が初期費用として必要になる。

 小学館ではこのほか、5,600万語からなる世界第2の規模の「Wordbank Online」の検索サービスも年末にかけて提供開始する予定だ。

【お詫びと訂正】
 記事初出時、BNCは「書き言葉9,000語、話し言葉1,000語からなる世界最大規模のイギリス英語のコーパス」としておりましたが、正しくは「書き言葉9,000万語、話し言葉1,000万語」です。ご迷惑をおかけした皆様にお詫びするとともに、ここに訂正させていただきます。


関連情報

URL
  小学館コーパスネットワーク
  http://www.corpora.jp/
  BNCコンソーシアム(英文)
  http://www.natcorp.ox.ac.uk/


( 永沢 茂 )
2003/08/18 20:51

- ページの先頭へ-

Internet Watch ホームページ
Copyright (c) 2003 Impress Corporation All rights reserved.