FUNDAMENTAL INFORMATION TECHNOLOGY ENGINEER
基本情報技術者の問題解説
問題
過学習(オーバーフィッティング)の説明として適切なものはどれか。
- ア 学習アルゴリズムが収束しない状態
- イ 訓練データが不足し、モデルの精度が全般的に低い状態
- ウ 学習に使用する計算資源が不足している状態
- エ 訓練データに対しては高精度だが、未知のデータに対する予測精度が低い状態
出典:オリジナル問題|参考範囲:試験要綱Ver.5.5 / FEシラバスVer.9.2 科目A範囲
正解と解説
正解:訓練データに対しては高精度だが、未知のデータに対する予測精度が低い状態
過学習は、モデルが訓練データに含まれる細かな癖やノイズまで覚え込み、訓練データでは高精度でも未知データでは精度が下がる状態である。試験では「訓練データには強いが、本番データに弱い」と読めれば過学習を選ぶ。
対策には、訓練データの増加、正則化、ドロップアウト、交差検証、モデルを複雑にしすぎないことなどがある。軽い類題として、「訓練データにも未知データにも精度が低い」なら過学習ではなく、モデルの表現力不足や学習不足が疑われる。
この問題について
IPAが公開するシラバス・試験範囲・公開問題の出題形式を参考にした独自作成問題。公式問題・過去問題の転載ではありません。
公式試験問題、過去問題、公式サンプル問題、市販教材の問題文を転載したものではありません。