本文へスキップ

テクノロジ系 / 基礎理論

強化学習

強化学習は、試行錯誤の結果に報酬を与え、より良い行動を学ばせる機械学習の方法です。

もう少し詳しく

行動の結果に応じて報酬(良ければプラス、悪ければマイナス)を与え、報酬が最大になる行動を試行錯誤を通じて学ばせる方法です。正解を直接教えず、経験から学びます。ゲームやロボット制御などに使われ、教師あり・なし学習と並ぶ機械学習の方法です。

試験での見方

黒猫の闇の刻印

報酬を手がかりに試行錯誤で学ぶ点が核心です。教師あり・教師なし学習との違いが頻出です。

例:良い行動に報酬を与え、ゲームの上達を学ばせるのが強化学習です。

分類

テクノロジ系 / 基礎理論 / 基礎理論

小分類:情報に関する理論

関連トピック:機械学習

情報の根拠

IPA FEシラバス Ver.9.2 の用語例をもとに、試験対策向けに独自解説しています。

関連用語

基礎理論の用語一覧へ