テクノロジ系 / 基礎理論

強化学習

強化学習は、試行錯誤の結果に報酬を与え、より良い行動を学ばせる機械学習の方法です。

もう少し詳しく

行動の結果に応じて報酬（良ければプラス、悪ければマイナス）を与え、報酬が最大になる行動を試行錯誤を通じて学ばせる方法です。正解を直接教えず、経験から学びます。ゲームやロボット制御などに使われ、教師あり・なし学習と並ぶ機械学習の方法です。

黒猫の辛口メモ

報酬を手がかりに試行錯誤で学ぶ点が核心です。教師あり・教師なし学習との違いが頻出です。

例：良い行動に報酬を与え、ゲームの上達を学ばせるのが強化学習です。

テクノロジ系 / 基礎理論 / 基礎理論

小分類：情報に関する理論

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。