ビジネスの場でAIという言葉を使う機会のある人は少なくはないだろう。さらにこれからその進化に合わせてさらに使う機会は増えていくだろう。しかし、その時に意味を間違えて使っていては相手に失望されてしまうこともあるだろう。そこで今回はAIとその関連の言葉である機械学習、ディープラーニングを説明していく。
AIという言葉の意味は、人工的にコンピュータ上などで人間と同様の知能を実現させるためのシステムやソフトウェアと考える人が多いだろう。まるで人間のように振る舞う機械を想像する人もかなりの数いるだろうが、これは正解でもあり間違いでもあるそうだ。実際の人工知能の研究には二つの立場がある。一つは、人間の知能そのものをもつ機械を作ろうとする立場であり、もう一つは人間が知能を使ってすることを機械にさせようとする立場なのです。さらにほとんどの研究は後者のものなようで想像したような人間のような機会を作っているというわけではないのである。
(http://www.ai-gakkai.or.jp/whatsai/より参照)
次に機械学習について考える。機械学習とは、機械が人間の持っている学習機能と同じような機能をもつことを目指す技術の事である。具体的にどのようなものかというと、データから反復的に学習し、そこに潜むパターンを見つけ出すことである。さらにそこで学習した事をデータに当てはめて将来を予測する事もできる。機械学習では反復アプローチを用いてデータから学習する場合が多いため、学習プロセスの自動化が容易であり、確固としたパターンが見つかるまで、何度でもデータ処理を繰り返すことができる。
しかしこの機械学習には、欠点があった。こうした特徴があれば、これは~であるという予測ができるのが、その特徴を学ばせるのは人間なのである。何を当たり前のことを言っているのかと思うかもしれないが、これでは機会が自分で考えるとは言えないだろう。例えば人間は、よく見る動物の特徴を覚えている。パッと見てすぐにこれは犬だとかこれは鳥だと言ったように判断することができる。目の前に見たことがない動物がいても、この特徴から犬の仲間だろうと判断することができる。自分の中で判断の線引きがされているからこのように考えることができるのだ。しかし機械学習では、機械がイヌとネコの特徴を抽出していたわけではない。つまりその判断を自分で行うことができないのだ。
この問題を解決するのが次に説明するディープラーニングなのである。つまり特徴を機械が自分で学ぶことができる可能性があるということだ。
ディープラーニングとは、高度なコンピューティング性能と特別なタイプのニューラル・ネットワークを組み合わせ、大量データの中に潜んでいる複雑なパターンを学習することだ。
この説明ではよくわかないのでGoogleのネコ認識という話を参考に考えてみる。最初にかなり多くの画像を入力情報とする。そうするとただの点の集まりと認識するので、それが何を表しているのかわからない。次に情報の数を一気に減らす。そうすることで情報を大雑把に見るしかなくなる。例えば同じ色が隣り合っているときは同一の点として見なすという行為をしなくてはいけなくなる。このようなことを繰り返すことで大雑把にとらえなくてはいけない状況を作り出す。そこで特徴を見つけることが可能になって行くということである。さらに、出力される情報をもとの画像に戻すことによって、大雑把な情報が間違っていると判断されたらやり直す事で大雑把なイメージが段々と抽象的なイメージへと変わって行くのだ。こうやって行く事で段々と特徴を見つけることができるのである。そして、特徴の関係性もだんだん認識できるようになっていくので、写真を見せればそれが何の動物の写真なのか自分で判断することができるようになるのだ。このようにデータ(写真)から概念を作りだすことはできるが、概念に自分でタグ付けのような事はできないので、それは人間がその概念は何とかの概念だと教える事で機械は様々な情報を自律的に概念化して行くのである。