経営者コミュニティ「経済界倶楽部」

「AI開発には金よりもアイデア」小林雅一 KDDI総研リサーチフェロー

3度目のAI開発ブームの概要

 

自動運転車、ドローン、ディープラーニング(深層学習)など、昨年から今年にかけて人工知能(AI)、あるいはそれを搭載した次世代ロボットなどへの関心が急速に高まっている。

だがAIは過去に2度、過熱したブームとその崩壊を経験している。いずれもその後には「AIの冬」と呼ばれる長い低迷期が到来した。この時期にはAIへの投資が冷え込んだだけでなく、この分野の科学者や技術者が日陰の道を歩み、AIの研究開発や産業化は著しく停滞した。今回、3度目のブームはどうなるだろうか。

ここで注意すべきは、今回AIの技術革新が起きた分野は限られること。それはAI全体の中でも、特に「パターン認識」と呼ばれる分野だ。

この分野で、ここ10年程の間に「ディープラーニング」、あるいは「ディープ・ニューラルネット」などと呼ばれる、大きな技術革新があり、パターン認識の精度が飛躍的に向上した。この技術は既に米国の大手IT企業らが、自らのビジネスへと盛んに取り入れている。

その一例は「画像認識」だ。例えばフェイスブックに投稿されたさまざまな写真や動画(など各種画像)をコンピューターが認識して、そこに誰が写っているか、その人たちはどういう年齢層の人か、そして何をしているのか、等々を認識する。これに合わせたターゲット広告を載せることで、フェイスブックはお金を儲けることができる。

あるいはグーグルの音声検索では、ユーザーが発音した音声(言葉)をテキスト(文字)として認識し、それで検索やスマホ操作を可能にしている。これは「音声認識」と呼ばれる。

これら「画像」や「音声」は「パターン」の一種だが、それに限らず、一般にビッグデータから、ある種のパターンを認識する技術が「パターン認識」だ。

今、IT業界だけでなく産業各界の企業が、パターン認識を画像や音声以外のことにも利用しようとしている。例えば「人材斡旋会社による、企業と就職志望者とのマッチング」、「金融機関の与信審査」「小売チェーンの季節別売れ筋予測」など、数え上げれば切りがない。そこでディープラーニングによる高度なパターン認識が大きな期待を集めている。これについては既に科学的な裏付けがあるだけに、今後ビジネスにどんどん導入され、大きな効果を上げていくと私は見ている。

こうした「パターン認識」にブレークスルーをもたらしたのは、脳科学の研究成果だ。例えば人間がものを見たときの情報を処理するのは、後頭部のあたりにある視覚野という領域だ。この仕組みが1990年代に動物実験によって分かってきた。

この仕組みには汎用性があり、音声認識にも使えるということが分かり、結果的にAIの(画像や音声など)パターン認識の精度が飛躍的に向上した。

問題はその後だ。単に音声を文字に変換するだけでなく、その意味をコンピューターが理解し、人間と会話できるかどうか。ここをクリアするハードルが残っている。この技術は「自然言語処理」と呼ばれ、「パターン認識」よりも格段に難しい技術だ。

 

AIの言語処理進展には脳科学の発達も必要

 

もちろん、現時点でも「自然言語処理」の技術は、各社の製品で実用化されている。例えばIBMのAIコンピューター「ワトソン」は、ある程度まで人と会話できる。ただし、それは人間のように本当に言葉の意味を理解しているわけではない。

ワトソンに搭載された自然言語処理の技術は、(ディープラーニングのように)「脳の仕組みを参考にする」といった先端的な技術ではない。むしろ、AI研究の黎明期である50年代から今日まで、営々と開発が続けられてきた「記号処理」と呼ばれる、伝統的な技術にマイナーチェンジを重ねたものだ。

確かに、それによって性能は着実に向上したが、過去と一線を画すほど大きな技術革新があったわけではない。結果、この種のAIは汎用性がなく、用途が個別分野に限定されている。

ワトソンはもともと、クイズ番組に出演して人間のチャンピオンに勝ったAIだが、それはクイズの短い質問に答えるだけ。つまり用途を絞り込んだからできた。

IBMは今、このワトソンを「会社の経営判断」や「医師の診断サポート」など、産業各界の現場に導入しようと売り込みをかけている。ただ、本当に役に立つかは、まだよく分からない。恐らく今後数年で、結果が出るだろう。

一方、グーグルやフェイスブックは、それとは全く違った手法で自然言語処理を実現しようとしている。

例えばフェイスブックのAI研究所を率いるヤン・ルカン氏らは、ここ数年、「(脳を参考にしたAIである)ディープラーニングを改良すれば、パターン認識だけでなく、(本当の人間並みの)自然言語処理も実現できる」と言い続けている。ただ、私のように傍目から見る限り、まだ目立った成果は出ていない。

こうした停滞状況を打破するには、AI以前に脳科学のさらなる発達が求められている。

先ほどのパターン認識にブレークスルーをもたらした動物実験は、生きた動物の頭蓋骨を割り、目から出ている神経のラインを、視角野から聴覚野につなぎ直すという荒っぽいものだった。当初、視力を失ったこの動物は、数カ月後には、ぼんやりとだが目が見えるようになった。つまり時間がたつと、聴覚領域で視覚情報を処理できるようになった。ここから視覚と聴覚に通底するアルゴリズムが発見され、もっと一般的なパターン認識にも使えることが分かってきた。

このように、ものを見たり聞いたりする仕組みは、動物も人間も大差ない。しかし言語野は人間だけに備わったものなので、その仕組みを解明するには、人間の脳を研究するしかない。が、先ほどの動物とは違って、生きた人間の脳を切り開く実験は許されない。確かに「fMRI」など実験装置の進歩で、外部から人間の脳内を探ることも可能になったが、やはり限界がある。結果、脳科学者が言語領域の研究に踏み込もうとすると、高いハードルに阻まれる。これが今のAI研究にも響いている。

 

AI開発には金よりも問題意識が重要

 

そうした中、日本では今、政府が音頭をとってAIの大規模な研究開発に乗り出そうとしている。文部科学省、経済産業省、総務省を中心に、今後10年間で1千億円を投じる方針だ。だが官僚が巨額の予算を使った揚げ句、成果が出ないケースは多々ある。

逆に今注目を集めているディープラーニングなど、先端AIが生まれる端緒となったのは、それほどお金を掛けたプロジェクトではなかった。

日本だけではなく欧米でもAIが冷遇されていた時代は長く、80年代終盤から90年代まで続いていた。それでもカナダや欧米を中心に、粘り強くAI研究を続行する科学者たちがいた。彼らが2004年にカナダの財団から少額の予算を工面して研究会を始め、これが停滞を打破する引き金となった。

お金の代わりに彼らが持っていたのは、確固たる問題意識だった。例えば高速の画像処理プロセッサーを導入すれば、ニューラルネットの動作速度が上がる。あるいは視覚野の研究成果を応用すればAIの認識能力や汎用性が高まる。これら具体的なアイデアが、今のブームにつながっている。

1千兆円を超える巨額債務を抱える日本政府こそ、それを胆に銘じるべきだ。カンフル剤のような財政出動と景気刺激策の一環に、AI開発を組み入れてはいけない。(談)

 

【KDDI】関連記事一覧はこちら

【テクノロジー】の記事一覧はこちら

 
経済界 電子雑誌版のご購入はこちら!
雑誌の紙面がそのままタブレットやスマートフォンで読める!
電子雑誌版は毎月25日発売です
Amazon Kindleストア
楽天kobo
honto
MAGASTORE
ebookjapan
 

雑誌「経済界」定期購読のご案内はこちら

経済界ウェブトップへ戻る