ここでは AI を使って走行ルートを自動決定してみたいと思いますが、その前に AI について簡単に説明します。
AI は Artificial Intelligence(人工知能)の略で、人間の脳の代わりにコンピュータのような機械を使って知的な仕事をさせるための技術です。 知的な仕事の例としては外国語の翻訳や画像や動画の認識などがありますが、最近では絵や小説などの芸術作品等もAIを使って作られるようになってきました。
さて AI は人間の代わりに機械に知的な仕事をさせるための技術ですので、仕事前にその仕事内容を機械に学習させる必要があります。 仕事内容を機械に学習させる技術のことを"機械学習(マシン・ラーニング)"といいます。機械学習には次の3つの種類があります。
これらについて以下で簡単に説明しましょう。
"教師あり学習"は機械への入力データとそれに対する正解(ラベルといいます)を与えて機械に学習させるという学習方法です。 例えば英語の単語帳をイメージしてみると良いと思います。単語帳の場合は"入力データ=英単語"、"ラベル=日本語訳"となります。
この教師あり学習は自動運転の分野でも画像認識、音声認識、車体制御など様々なところで活用されています。 教師あり学習をおこなうための方法にもいくつか種類があるのですが、一番メジャーな方法は多分皆さんもご存知の"ニューラルネットワーク"を使った"ディープラーニング"です。
"教師なし学習"は教師あり学習とは違い、入力データだけ機械に与えてラベルは機械に決めさせるという学習方法です。 もちろん適当にラベルを決めても意味がありませんので、何らかのアルゴリズムに従って決める必要があります。 例えば眼の前にラベルがついてない食べ物が何個かある時、実際にそれらを食べてみる事をイメージして下さい。 無意識に「これは甘いからお菓子」「これは苦いから薬」みたいな学習をみなさんはしているはずです。
この教師なし学習は自動運転の分野ではこれまではあまり活用されてこなかったのですが、事前にラベルを与える必要が無いというメリットがありますので、今後は活用がどんどん進んでいくと予想されています。 教師あり学習をおこなうための方法には"クラスター分析"、"主成分分析"などの統計的手法を使う方法や"ニューラルネットワーク"を使う方法などがあります。
"強化学習"は機械がある環境や状態にいる際に次にどの様な行動をすると良いかを学習させる手法です。 教師あり学習や教師なし学習と違って事前に入力データやラベルは与えられず、トライ&エラーを繰り返しながら目的に向かって学習を進めます。 例えば遊園地にある迷路で出口を探してウロウロしている時をイメージしてください。 行き止まりにぶつかったりして、あちこち歩き回りながら脳内に地図を作成して出口までの道のりを見つけているはずです。
この強化学習は自動運転の分野では走行ルートの決定などで使われています。 強化学習でもっとも有名な手法は"Q学習"です。今回のセミナーはこの Q 学習を使って走行ルートを自動決定したいと思います。