テクノロジ系 / 基礎理論
強化学習
強化学習は、試行錯誤の結果に報酬を与え、より良い行動を学ばせる機械学習の方法です。
もう少し詳しく
行動の結果に応じて報酬(良ければプラス、悪ければマイナス)を与え、報酬が最大になる行動を試行錯誤を通じて学ばせる方法です。正解を直接教えず、経験から学びます。ゲームやロボット制御などに使われ、教師あり・なし学習と並ぶ機械学習の方法です。
試験での見方
例:良い行動に報酬を与え、ゲームの上達を学ばせるのが強化学習です。
テクノロジ系 / 基礎理論
強化学習は、試行錯誤の結果に報酬を与え、より良い行動を学ばせる機械学習の方法です。
行動の結果に応じて報酬(良ければプラス、悪ければマイナス)を与え、報酬が最大になる行動を試行錯誤を通じて学ばせる方法です。正解を直接教えず、経験から学びます。ゲームやロボット制御などに使われ、教師あり・なし学習と並ぶ機械学習の方法です。
例:良い行動に報酬を与え、ゲームの上達を学ばせるのが強化学習です。
報酬を手がかりに試行錯誤で学ぶ点が核心です。教師あり・教師なし学習との違いが頻出です。