強化学習 とは
calendar_month2020-04-01 公開 update2020-05-19 更新
機械学習の手法の1つ。強化学習では、エージェントと呼ばれるプログラムが、現在の状況を観測し、どの行動を行えば目的達成(報酬)のためによりよい効果が得られるかを予測して実行する。
そして、行動後にそれによって状況がどのように変化したかをふたたび観測する。これを繰り返すことで、プログラム自身が試行錯誤しながら、最適解となる行動の指針を決定していくという手法。
エージェントが「行動とそれによる環境の変化の観測」を自ら繰り返し行うため、教師あり学習/教師なし学習のような大量のデータを用意する必要はない。
2015年、囲碁世界王者に勝利したプログラム Alpha Go の訓練において強化学習が用いられていたことで一躍話題となったように、これまではテレビゲームやボードゲームなど、非実用的な事例で注目されることが多かった。
しかし現在、ロボットの歩行動作制御などにも応用されており、今後は、自動車の自動運転技術や工作機械の動作計画作成など、産業界への適用が増加すると見られている。
ただし、よりよい行動を判断するには、明確で計算可能(ゲームであればより高い得点が得られる、囲碁や将棋であれば勝利につながる可能性が高いなど)な指標が必要になる。
label 関連特集
![](/it-exam-guide/wp-content/uploads/2019/09/status_ai_business.jpg)
特集1:AI人材をとりまく市場環境と実態
![](/it-exam-guide/wp-content/uploads/2019/09/types_ai_talents.jpg)
特集2:AI人材モデルの解説
![](/it-exam-guide/wp-content/uploads/2019/09/how2_train_ai_talents.jpg)
特集3:AI人材の育て方
label 関連するタグ
![](https://www.seplus.jp/dokushuzemi/wp-content/uploads/2020/05/logo_mark_4_training_expert1.png)
教育研修担当 (トレーニング担当者) のためのWebマガジンを編集しています。
-
- 「こんな特集、記事を読んでみたい」というリクエスト
- 「こんな記事を書いてみたい」という執筆者の方のお問い合わせ
や誤植のご連絡など、お問い合わせフォームより受付しています。
お気軽に問い合わせくださいませ!!
contacts トレタン お問い合わせフォーム