漢字「麺」の使用が増加傾向、バイドゥのウェブコーパスが裏付け


ある“ネットスラング漢字”の出現確率の推移。2003年ごろから激減したことががわかる(Baidu Japan Blogより画像転載)

 検索エンジンを手がけるバイドゥ株式会社は、同社がクロールした1992年から2010年7月までのウェブページ上の言語現象を、秒単位の正確な時間とともに記録した「高精度時間軸ウェブコーパス」を構築した。同社プロダクト事業部のエンジニアである萩原正人氏が、その一部データをもとに、電子掲示板(BBS)やブログなどにおける文字の使用実態を調査・報告している。

 萩原氏によると、掲示板やブログでは、カタカナと漢字の割合が相対的に増加しており、「外来語の増加が背景にある」とみている。ひらがなは、依然として最も大きな割合を占めるが、相対的に減少しており、最近では出現確率が50%を下回っている。

 個々の漢字についても調査しており、「萌」「厨」「鯖」「糞」「俺」などの“ネットスラング漢字”については流行り廃りが大きいことがわかった。

 一方で、顕著な増加傾向を示している「麺」をはじめ、「暑」「寒」「嬉」「綺」「噛」「諦」「痩」などの“季節型・密着型漢字”は、「ネット上の一次情報の増加に従い重要になっている」としている。このほか、「店」「売」「販」「購」「稼」「贈」「舗」「品」「料」といった“EC系漢字”も増加しているという。

 萩原氏による調査結果は、文字研究会が8月11日に開催した「第5回ワークショップ:文字―『現実』から見た改定常用漢字表―」において、「ウェブ上における使用実態統計から改定常用漢字を考える」と題して発表されたもの。プレゼンテーション資料も公開されており、2003年ごろから使用が激減した、あるネットスラング漢字の事例なども紹介している。

 バイドゥでは、「高精度時間軸ウェブコーパス」の言語統計データを近日公開する予定だ。


関連情報


(永沢 茂)

2010/8/20 15:58