キーワードで読み解く人工知能

第1回『ディープラーニング(深層学習)』

ディープラーニングと人間の学習の仕方は違う

【キーワード】……ディープラーニング(深層学習)
【関連ワード】……機械学習、アルゴリズム、ニューロン、ニューラルネットワーク

 ディープラーニングとは機械学習のアルゴリズムの1つで、人工知能を作るための手法として最も注目を集めている。ディープラーニングは、神経細胞(ニューロン)の構造から着想を得て数式で再現していることは有名だ。

 神経細胞は入力される電気信号の閾値(いきち/しきいち)が一定を超えると発火し、シナプスと呼ばれる伝達手段を使って、次の神経細胞に電気信号を出力する。これを超高速で行い、脳は情報処理を行っている。

 この 入出力の組み合わせ、発火の判断、伝達をディープラーニングでは再現する 。したがって脳を模倣しているという表現は間違っていない。しかし、ディープラーニングは人間の脳を模倣しているから人工知能を作ることができると勘違いしている方が多いが、それは話が飛躍しすぎだ。

 例えば、新幹線を塗装するペンキで作った新幹線の鉄道模型があっても、速度300kmで走れるわけではない。 仕組みを真似ているだけで、脳の再現にはまったく至らない というのは知っておくべきだろう。

ディープラーニングの基本的な仕組み

 1枚のリンゴの画像で説明しよう [図1]

[図1]リンゴの画像認識を例にしたディープラーニングの仕組み

 まずは画像を細かく分解して入口にセットする。入口のノード(節)[*1]はデータを受け取ると、ノードごとに決められた条件をクリアするか計算して、クリアすればエッジ(枝)経由で次に伝える。

 その際、エッジでは重み付けを行っている。簡単に言えば、 どのノードからの情報を重要と見なすかのジャッジをしているようなものだ

 手前のノードから複数の情報を受け取ったノードは、それらを足し合わせて決められた条件をクリアするか計算する。そしてクリアすれば、またエッジ経由で次のノードに伝える。

 入口から始まった処理を何層も何層も繰り返していく。細かく分解されたデータはネットワークを経由しながら少しずつ足し合わされていき、最後には出口にたどり着く。

 最後の出口では「解答」が用意されていて、どれにもっとも近しいのかを、リンゴが80%、イチゴが20%といった確率で表現する。要はリンゴらしさ、イチゴらしさに近しいか否かを判断している。

 ちなみに入力と出力しかない場合は「単純パーセプトロン」と呼び、途中の中間層が1つなら「多層パーセプトロン」、2つから4つ程度なら「ニューラルネットワーク」、そして層がディープ(深く)になればディープラーニングと呼ぶ。出世魚のように名前が変わっているが、やっている内容はだいたい同じだと考えてよい。

 ニューラルネットワーク自体は1980年代から提唱されていたが、実現できる機械基盤の調達、学習にかかる時間などさまざまな制約があり、約四半世紀ほどの間はさほど注目が集まらない技術だった。

 あまり知られていないが、福島邦彦という日本人が「ネオコグニトロン」という今でいうディープラーニングの原型を1979年に発表している。実は日本はディープラーニング研究の先端を走っていたのだ。しかしいつの間にか海外に追い抜かれ、後塵を拝している。

[*1]……脳の神経細胞を意味する「ニューロン」を人工的に再現したものを「ノード」と表現する。ただし、あくまで数式としてであり、ニューロン自体をまま再現できたわけではない。

エッジの重み付けを人間ではなくプログラムが行う

 ディープラーニングのすごさは、 エッジの重み付けを人間が決めずに機械がデータから勝手に判断してくれる点 だ。

 それまでは人間が見た目で特徴を発見して、重み付けを人手で行っていた。人間ほどの精度は出ないかと思われたが、人間が気づいていなかった特徴を発見し、高い精度を誇った。画像認識のコンテストでは、マイクロソフトリサーチアジアがディープラーニングを使って人間よりも高い精度で認識に成功している。

 例えばリンゴの画像を使ったのに、リンゴ10%、イチゴ90%と出力されたとする。答えはリンゴだからあきらかな間違いだ。その場合、 リンゴらしさの確率が上がるように、エッジの重み付けを機械が少しずつ変えていく 。そして当初とは異なる、リンゴらしさを当てやすくなったネットワークに仕上がる。

 もちろん、モデルは最初から適切な重み付けがわかっているわけではない。したがって1枚目のリンゴの画像はリンゴと認識したのに、2枚目のリンゴの画像でイチゴと認識するかもしれない。

 だから正解が何かわかっているデータを大量に用意して、ひたすら学習させていき、リンゴはリンゴ、イチゴはイチゴだと出力するネットワークに仕上げる必要がある。

  ディープラーニングにはビッグデータが必要だと言われる所以はここにある 。もし画像が1枚しかなければ、それに合わせたネットワークに仕上がってしまうのだ。

ネットワークの解読は不可能?

 ディープラーニングの場合、中間層が30階層ぐらいあるのは珍しくない。したがって仮に入力とは違う結果が出力された場合に、どこで間違えたのかを特定するのは2018年段階では難しい。どこが間違っていたのかわからないまま、機械が全体的に重み付けを修正してくれる。

 見方を変えれば、何十にも重ね合わせた層で構成されるネットワークに、画像を大量に学習させた結果、なぜかはわからないけどリンゴらしいと認識してくれるようになったというのがディープラーニングだ。

 ちなみに人間がもっている神経細胞の数は、脳全体で数千億個と言われている。もしノードが数千億ぐらい作られれば、また違った進化があるのかもしれない。

POINT:ディープラーニングと人間の学習の仕方は違う

ディープラーニングは、例えば画像認識であれば人間よりも特徴を上手くつかんでくれる。問題は、つかみ方が上手すぎて人間がトレースできない点だ。ただしそのためには大量のデータが必要になる。一方で人間の場合、数回でも牛を見ただけで牛だとわかる。この違いはなんだろう? それが解明できない限り、ディープラーニングだけで人間に近い人工知能は作れない。

※この連載記事は、書籍「キーワードで読み解く人工知能 『AIの遺電子』から見える未来の世界」の内容の一部を転載したものです。

キーワードで読み解く人工知能『AIの遺電子』から見える未来の世界

著者:松尾公也・松本健太郎(共著)
定価:1500円(税別)
発行日:2018年6月29日
ISBN:978-4-8443-6751-2
仕様:A5判・160ページ
発行:株式会社エムディエヌコーポレーション
発売:株式会社インプレス

漫画家・山田胡瓜(やまだきゅうり)氏の人気作品『AI(アイ)の遺電子』(少年チャンピオン・コミックス)、『AIの遺電子 RED QUEEN』(別冊少年チャンピオン)のキャラクターやストーリーとともに、AI(人工知能やAIのビジネス活用について楽しみながら学べる“エンタメ系ビジネス書”。「シンギュラリティ」「産業AI」などの基本的な言葉から、「AIに自我はあるのか?」「AIと恋に落ちるか」といった話題まで、AI研究や関連テクノロジーの現状を踏まえながらキーワードごとに解説している。

松本 健太郎(まつもと・けんたろう)

株式会社デコム R&D部門 マネージャー
龍谷大学法学部政治学科、多摩大学大学院経営情報学研究科卒。株式会社デコムで、インサイトリサーチとデータサイエンスを用いて、ビッグデータからは見えない「人間を見に行く」業務に従事。野球、政治、経済、文化など多様なデータをデジタル化し、分析・予測することが得意。テレビやラジオ、雑誌に登場している。近著に『グラフをつくる前に読む本』(技術評論社)、『誤解だらけの人工知能』(光文社新書)、『AIは人間の仕事を奪うのか?』(シーアンドアール研究所)。