アーリタblog                 新たなる挑戦の始まり

The beginning of new challenge

強化学習

AI開発に欠かせない「強化学習」って言うのがあります。

「価値を最大化するような行動」を学習すると言うものです。

分かりにくいですよね?

例えば、10万円で買った株が、2倍になったらすべて売却すると決め、その通り売れば利益が得られます。

しかし、より長期的に利益の最大化を目指すなら、一部を残しておく方が良いかも知れません。

つまり、判断材料となる状況が常に変化する中で、とるべき行動も変化させないと、価値を最大化出来ないという事なんです。

AI将棋は、この典型例ですね。

「今、駒を捨てても、100手後に有利になっていれば良いのですから」

人間の脳は強化学習をしているそうですが、それをAIがやろうとしてるわけです。

テスラ社のイーロンマスク氏は、「GoogleがAI軍団で人類を滅亡させる」と、本気で心配してらっしゃいます。

次へ 投稿

前へ 投稿

返信する

© 2024 アーリタblog                 新たなる挑戦の始まり

テーマの著者 Anders Norén