ニュース

ネットで話題の候補者は大勝ちの可能性、ただし「画像」検索される人は微妙

 ヤフー株式会社は8日、Yahoo! JAPANの検索ビッグデータに基づく参院選の獲得議席数予測を発表したのに合わせ、報道関係者向けの説明会を開催した。予測モデルのベースとなった昨年12月の衆院選におけるビッグデータの分析結果について、同社執行役員の安宅和人氏(事業統括本部統括本部長)が解説した。

ヤフー株式会社執行役員の安宅和人氏(事業統括本部統括本部長)

 12月の衆院選の分析結果は、「選挙期間中における政治関係ビッグデータと選挙結果との関連性について」と題したレポートとして12月20日付でとりまとめ、PDFで公開している。同レポートでは、衆院選の公示日である12月4日から投票日前日の12月15日までの12日間のビッグデータを事後分析した結果から、政党名などの検索クエリ数と、実際の政党別の得票数・獲得議席数との間に、ヤフー自身の想定をはるかに超えるほどの高い相関が見つかったことを報告している。

 ヤフーが今回発表した参院選の予測は、同レポートでの知見に基づく検索量と得票数の「相関モデル」などによって算出したものだ(本誌2013年7月8日付関連記事を参照)。この参院選についての予測レポートでは検索量から政党ごとの獲得議席数を予測しているが、衆院選の分析レポートでは、検索量だけでなく、政党名や候補者が書き込まれたSNS(Twitter、Facebook、Yahoo!ひとこと)の投稿数との関係や、さらには検索量およびSNS投稿数と候補者ごとの得票数・当落との関係についても指摘している。

バズ量全体の3分の1が1.9%の候補者に集中

 候補者別の分析については、衆院選小選挙区の候補者1294人を対象に、検索量・SNS投稿数がそれぞれ最多の候補者を100として指数化。それを加算したものを各候補者の「注目度」とした。

 これによると、バズ量(検索量・SNS投稿数)全体を、候補者の注目度順に3分の1ずつにヘビー(H)/ミドル(M)/ライト(L)の3つの層に分類したところ、H層はわずか24人(1.9%)の候補者にバズの3分の1が集中していたことが分かった。M層は259人(20.0%)、L層は1011人(78.1%)。

バズ量と候補者の「注目度」3区分の関係(Yahoo!検索スタッフブログ2012年12月28日付記事より)

 さらに層ごとに、選挙の勝ち方についても違いがあることが分かったという。まず、注目度が最も高いH層の候補者は、当選率は42%、当落状況は「大勝」が25.0%、「勝ち」が12.5%、「僅差で勝ち」が4.2%、「僅差で負け」が25.0%、「負け」が25.0%、「大負け」が8.3%となっており、この層は大勝ちするか僅差で負けるケースが多いという。

 M層は、当選率が39%となっており、H層と大きな開きはない。しかし、当落状況は「大勝」が5.0%、「勝ち」が10.4%、「僅差で勝ち」が23.6%、「僅差で負け」が25.5%、「負け」が25.5%、「大負け」が10.0%となっている。H層に比べて大勝ちが少なく、当落ライン上の候補者が多かったことが分かる。

 L層は、当選率が19%にとどまる。当落状況は「大勝」が4.7%、「勝ち」が6.6%、「僅差で勝ち」が7.3%、「僅差で負け」が24.2%、「負け」が22.6%、「大負け」が34.5%。落選率が他の層と比べて高い上、3人に1人が大負けしていることになる。

「注目度」3区分別に見た当落状況(Yahoo!検索スタッフブログ2012年12月28日付記事より)

 なお、当落状況の定義は、「大勝」が得票率55%以上、「大負け」が得票率10%未満などとなっている。HML層に関係ない候補者1294人の当落状況の分布は、「大勝」が5.2%、「勝ち」が7.5%、「僅差で勝ち」が10.5%、「僅差で負け」が24.5%、「負け」が23.2%、「大負け」が29.1%だ。HMLの各層とも、「僅差で負け」「負け」の割合は全体の分布と大きな違いはないが、H層では「大勝」が全体の5倍に、M層では「僅差で勝ち」が同2倍に上がり、「大負け」の割合が減る。

当選する候補者は「街頭演説」で検索される傾向、落選する候補者は「画像」「動画」

 衆院選の分析レポートでは、小選挙区・比例区の全候補者1504人について、注目度のスコア順に当落状況を一覧化している。注目度が下がっていくと、当選者も減っていくという。

「注目度」スコアが最上位の候補者の選挙結果(Yahoo!検索スタッフブログ2012年12月28日付記事より)

 もちろん、注目度が上位であっても落選した候補者はいる。レポートでは、当選者・落選者それぞれの注目度上位30人を抽出し、各候補者が検索された際に用いられた第2ワードを調べた。

 これによると、当選者の第2ワードで最も多かったのは「街頭演説」の18人。対して落選者では「街頭演説」で検索されたのは3人にとどまっている。また、当選者では「選挙区」を第2ワードとして検索された候補者が14人だったのに対して、落選者では6人となっており、こちらも比較的差が目立つ。

 一方、落選者の第2ワードとして最も多かったのは「画像」の13人で、当選者では5人にとどまる。また、当選者では0人だった「動画」が、落選者では6人となっており、注目度が上位の候補者であっても、落選者の場合は個人的な関心で検索されているのではないかという。こうした結果からヤフーでは、「街頭演説」や「選挙区」といったワードとともに検索される候補者は当選している傾向がある一方で、落選した候補者は「画像」や「動画」というワードとともに検索される傾向があると説明。あくまでも傾向だが、はっきりと特徴が出ているとしている。

当選候補者・落選候補者の検索頻出第2ワード(Yahoo!検索スタッフブログ2012年12月28日付記事より)

30代以下の若い世代から検索される割合が高いのは共産党

 ヤフーによれば、Yahoo! JAPANの検索サービス経由の検索クエリは、日本国内の検索クエリの半分以上を占める規模のビッグデータだというが、そのうちどういったワードを12月の衆院選の分析レポートおよび今回新たに発表した参院選の予測レポートの対象として使っているか、また、それら分析対象のクエリ総数は公表していない。

 一方で、衆院選の分析レポートでは、Yahoo!検索のユーザー属性について性・年代別の構成比を示している。これによると、年代構成は、10代以下が8.0%、20代が22.8%、30代が28.0%、40代が24.4%、50代が11.5%、60代以上が5.3%。有権者の年代構成あるいは実際に投票に行く層の年代構成よりも、若い年代の割合が大きいことが考えられるが、ヤフーによれば、こうした年代構成が実際と異なる検索ビッグデータがベースであっても、理由は分からないものの、結果論として実際の得票数との高い相関が出ていることは間違いないという。レポートにはとりまとめていないが、衆院選より前の国政選挙1件、また、地方選挙1件についても分析したが、やはり同様の相関が見られたとし、「ネット上の活動は、リアルの活動の紛れもなく直結している。このデータは突発的な話ではない」(安宅氏)としている。

「Yahoo!検索」全体の利用者および衆院選関連ワードの検索者の年代構成(Yahoo!検索スタッフブログ2012年12月28日付記事より)

 このほか、衆院選の分析レポートでは、各政党を検索した人の男女比率や年代比率についてもグラフ化している。いずれの政党も男性が検索する割合が大きいが、最も高かったのは社民党で男性が75.7%を占めている。一方、女性比率が最も高いのは公明党の32.1%。年代では、40代未満の比較的若い層から検索される割合が最も高いのは共産党で63.2%。反対に40代未満からの検索が少ないのは新党大地の43.1%、日本未来の党の44.1%などだった。

政党名検索者の男女比率(Yahoo!検索スタッフブログ2012年12月28日付記事より)
政党名検索者の年代比率(Yahoo!検索スタッフブログ2012年12月28日付記事より)

(永沢 茂)