『人工無能(AI)』はどうやって意思決定をするのか？８つのアルゴリズムを解説

「実際、AIってどんなしくみなの？」
「AIが自分で考えるって本当なの？」
「いまさらAIについて聞けない、、、」

と思ってる人は、少なくありません。
あなたは、AIについてどのくらい話せますか？

ニュースで見るけど未来の話なんて思ってたら大間違い、ごく身近で『人工知能(AI)』に触れているはずです。

この記事では、『人工知能(AI)』がどんなしくみで”自ら考え行動する”のかを解説していきます。

どうやって、人工知能を人間の知能に近づかせようとしているのか？

知りたくなりませんか？

難しい言葉はなるべく省いてますので、ぜひこの機会にAIについて学んでみてはいかがでしょうか。

『人工知能』には２種類ある
『人工知能』が意思決定するためのアルゴリズムとは？
まとめ

『人工知能』には２種類ある

『人工知能(AI)』は、反射型AI と 非反射型AI に分類できます。

反射型AIとは？

iPhoneに「Hey Siri」と呼びかけたり、 AIスピーカーに「OK Google」や「アレクサ」などと、一度は呼びかけたことはあると思います。

呼びかけると、調べたり、しゃべリ返したりと反応してしてくれますよね？
じつはこれ、典型的な反射型AIの特徴です。

反射型AIは、環境からのシグナルに応じて行動する『人工知能(AI)』です。

音に反応するだけではなく、振動、光、温度など、外で起こるさまざな変化に応じて、一定なパターンで行動をします。

ちにみに、反射型AIに「未来」という概念はなく、あるのは「現在」のみです。

非反射型AIとは？

一方で、非反射型AIは、意思決定つまり未来を見据えて行動する『人工知能(AI)』です。

たとえば、名人から勝利したことで注目されているゲームAIなどがそうです、

非反射AIは、目的を持って行動したり、計画を立てて行動したり、シュミレーションしてから行動することができます。

『人工知能』が意思決定するためのアルゴリズムとは？

自分の”感覚”を持ち、”意思決定”を行い、”行動する”人工知能を自律型人工知能といいます。

その意思決定には、意思決定アルゴリズムが用いられて「〇〇ベース」と呼ばれています。

「〇〇」に入るのは意思決定となる単位で、人間が持っている意思決定の特徴から考案されたものです。

ここでは、人工知能でよく使われる８つのベースを解説していきます。

ルールベース

複数のルールを用意して、「もし～であれば、～である」というルールをもとに意思決定を組み上げる方法がルールベースです。

たとえば、次のようなルールがあるとします。

一番強い相手を選んで、攻撃する（優先度★★☆☆）
HPが半分を切れば、回復薬を飲む（優先度★★★☆）
自分が攻撃されたら、攻撃した相手に攻撃する（優先度★☆☆☆）
味方の体力が10％を切れば、回復薬を飲ませる（優先度★★★★）

この場合、①「AとBを判定」→②「①の結果とCを判定」→③「②の結果とDを判定」という流れで条件判定していき、最終的に残ったもの（真）が適用されます。

もしくは、ルールに優先度を決めておいて、優先度の高いルールから実行させる方法もあります。

ステートベース

人工知能にどのようなときにアクションを取らせるか、つまりステート(状態)をもとに組まれた意思決定がステートベースです。

たとえば次のような場合では、「回復薬を飲む」「攻撃を受ける」「５分以上戦う」といったステートには、実際に『人工知能(AI)』がそのステートを指定されたときの動きが定義されています。

回復薬を飲んだら、攻撃する
攻撃を受けたら、一回休む
５分以上戦ったら、逃げる

ビヘイビアベース

ビヘイビアとは身体的行動のことで、連続した身体行動を組みわせる意思決定をビベイアベースといいます。

たとえば、跳び箱を跳ぶためのAIがあるとします。

この場合、「走って」→「ジャンプして」→「手をついて」→「手をはたいて」→「着地する」という一連の動作があれば「跳び箱を跳ぶ」という問題を解決します。

ゲーム業界では最もよく使われる意思決定アルゴリズムであり、2004年に「Halo2」というゲームによりビヘイビアツリーと呼ばれる構造が生み出されました。

ゴールベース

最終的なゴールを決めるか、与えられるかして、そのゴールをAI自身が作リ出す意思決定をゴールベースといいます。(ゴールファーストとも呼ばれます)

ゴールベースはプランニングとセットで用いられることから、大きく３つのアルゴリズムに分かれます。

連鎖プランニング
ゴール指向アクションプランニング
階層型ゴール指向プランニング

1980年代にスタンフォード大学で開発された「STRIPS」の系譜を「連鎖プランニング」、デジタルゲームで、アクションをつなげるプランをリアルタイムに作る「ゴール指向アクションプランニング」、最終ゴールをさらに小さなゴールに分解していく「階層型ゴール指向」プランニングがあります。

ユーティリティベース

状況によって複数の選択肢がある場合、どれだけの見返りがあるかによって選択肢を判断する意思決定をユーティリティベースといいます。

この見返りのことを、学術的には「効用(ユーティリティ)」といい、複数の行動を数値化した効用で比較することで、最大効用がある行動を選択します。

タスクベース

ある問題や目的を、タスクに分解して行動を組み立てる意思決定をタスクベースといいます。

たとえば、「車を作る」というタスクで考えてみると、まずは「外枠」「エンジン」「シート」「タイヤ」など大きな部分を作るタスクに分解されますよね。

それぞれのタスクは、より小さな部品へと詳細なタスクに分解することができますし、完成させるためには部品を組み立てたり、塗装の順番も決めなければなりません。

このような、階層的に分解しながら、タスクの順序構造をつくる手法を「階層型タスクネットワーク」といい、長期的なプランを組み立てるアルゴリズムに使われています。

現在では、リアルタイムにキャラクターの行動を組み上げるアルゴリズムとして、デジタルゲームにも応用されています。

シュミレーションベース

問題をはっきりと定義できない場合に、何度もシュミレーションをくり返して正解を見つけ出そうとするのが、シュミレーションベースのAIです。

世界中で話題になった囲碁AIは、シュミレーションベースです。

行動とその結果をシュミレーションすることは、AIが頭の中でイメージすることであり、AIの「想像」だともいえます。

ケースベース

ケース(事例)を参考にして意思決定する方法をケースベースといいます。

過去の自分の状況と行動、そして結果を覚えておくことで、次に似たような状況になったときにその記憶をもとに意思決定を行います。

事例を集めて、その解析から意思決定に必要なシステムを構築する「ケースベースドラーニング」は、AIの一つの大きな流れとなっているので覚えておくといいでしょう。

まとめ

今回紹介した８つのアルゴリズムは、数十年前から開発されているものです。

遅かれ早かれ、これらのアルゴリズムがいくつも組み込まれたAIが登場し、人間に近い行動をとるようになるでしょう。

そうすると、SF映画のような、もしくは想像できない未来が訪れるかもしれません。

そのとき、人間はどんなことをしているのでしょうか。世界はどうかわっているのでしょうか。

あなたはどう考えますか？

それでは、YAKUMOでした。