渦巻き絵文字は「台風」ではなく「まいった」、バイドゥが調査


バイドゥ代表取締役社長の井上俊一氏

 慶應義塾大学日吉キャンパス(横浜市港北区)で開催された「Webとデータベースに関するフォーラム2009(WebDB Forum 2009)」で19日、バイドゥ代表取締役社長の井上俊一氏が講演し、携帯電話の絵文字に関する興味深い調査結果を紹介した。

 バイドゥは9月末より携帯電話向け検索エンジン「Baidu モバイル」のベータ版サービスを提供しているが、最大の特徴でもあるのが絵文字検索への対応だ。今回紹介されたのは、同社が絵文字検索技術を開発するにあたって行なった調査の結果だ。

 井上氏は、赤い渦巻き状の絵文字と、オレンジ色の“M”の絵文字を示し、これらの意味を会場に問いかけた。もともとの定義は「台風」と「地下鉄(メトロ)」だが、こうした意味ではほとんど使われていないことが判明したという。

 バイドゥでは絵文字の意味を調べるために、自然言語処理技術を活用。絵文字の隣接文脈を抽出し、コロケーション(共起する単語の組み合わせ)から意味を探る方法で分析したところ、台風の絵文字の直前には、「撃沈」「やばいね」「わぁー」「バイト」「苦手です」「てぇ~」「考え中」「だるかった」「ぅぅ」などが使われていた。このことから、実際に使われている際のこの絵文字の意味は、「台風」ではなく、その見た目のまんまの「ぐるぐる」であり、「なんかもう、まいっちゃった」という気分の表現だとしている。

 一方、絵文字“M”を含むコロケーションとしては「今日もMで昼」などがあり、「マクドナルド」という意味でよく使われるという。


絵文字のもともとの定義と実際の使われ方の違い絵文字の使われ方の3つのタイプ

 バイドゥの調査によると、絵文字の使われ方は、1)単に装飾する目的で使われる「装飾的(decorative)」、2)直接意味を表さないが、近隣の要素に対して情報を与える「機能的(functional)」、3)直接意味を表し、単語の代わりとして使われる「意味的(semantic)」――という3つのタイプに分類される。

 前述の例で言えば、ぐるぐる渦巻きが「装飾的」、“M”が「意味的」ということになる。一方、「機能的」というのは、例えばサイト内の各コーナーへのリンクの先頭に付けられる数字ボタンの絵文字などが該当する。

 井上氏は「人々が探したいのは意味」だとし、「Baidu モバイル」の絵文字検索で検索結果として提示するのは「意味的」な使われ方のもののみだと説明。例えば、「ビールジョッキの絵文字+飲む」「携帯電話機の絵文字+小児科」といったかたちで、意味的に使われている絵文字をうまく利用して適切な検索結果が得られるとした。


絵文字頻度ランキング(1~10位)絵文字頻度ランキング(11~20位)

 「Baidu モバイル」がインデックスしている携帯電話向けページの中からランダムに抽出した8812ページについて調査した結果では、絵文字が含まれるページは46.6%あり、1ページ平均7.6個の絵文字が含まれていたという。検索のための要素として、すでに絵文字は無視できない存在になっていると言えそうだ。

ネイバージャパン代表取締役の森川亮氏

 講演では井上氏に引き続き、ネイバージャパン代表取締役の森川亮氏も登壇。CGMなどの潮流により情報が爆発的に増え、情報過多に陥っている現在では、システム型アプローチだけでなく人的アプローチも重要だとして、「ただ“調べる”だけの検索から、みんなで“探しあう”やさしい検索へ」という同社のコンセプトを示し、ユーザが設定したテーマで情報を提供しあうサービス「NEVERまとめ」などを紹介した。

 「WebDB Forum 2009」では、全国の大学などから情報工学分野の研究者が集まり、Web検索やWeb解析、データ処理、データベース技術などに関する研究報告が行われた。産学連携が大きな目的であり、楽天やグリー、サイバーエージェントなどインターネット関連の民間企業も多数協賛。楽天技術研究所やサイボウズ・ラボ、NTTレゾナントの「goo」の取り組みを報告するセッションも設けられた。


関連情報


(永沢 茂)

2009/11/20 06:00