本文へスキップ

FUNDAMENTAL INFORMATION TECHNOLOGY ENGINEER

基本情報技術者の問題解説

テクノロジ系 標準 fe_a_s008_q009

問題

過学習を抑制する方法として適切なものはどれか。

  1. 検証データで性能を確認し、正則化や早期終了を用いる
  2. 訓練データだけの正答率を最大化し続ける
  3. 特徴量を全て削除して学習する
  4. テストデータを訓練データとして繰り返し使う
出典:オリジナル問題|参考範囲:試験要綱Ver.5.5 / FEシラバスVer.9.2 科目A範囲

正解と解説

正解:検証データで性能を確認し、正則化や早期終了を用いる

正解:検証データで性能を確認し、正則化や早期終了を用いる

考え方:過学習は,訓練データにはよく当たるのに,未知のデータに弱くなる状態です。検証データで汎化性能を確認し,正則化でモデルの複雑さを抑えたり,早期終了で学習しすぎを防いだりします。

誤答の理由:訓練データの正答率だけを最大化し続けると,むしろ過学習しやすくなります。特徴量を全て削除すると学習材料がなくなります。テストデータを訓練に使うと,最終評価の信頼性が失われます。

軽い類題:訓練正答率が99%,検証正答率が70%なら,訓練データに合わせ込みすぎている可能性があります。

この問題について

出典:オリジナル問題|参考範囲:試験要綱Ver.5.5 / FEシラバスVer.9.2 科目A範囲

IPAが公開するシラバス・試験範囲・公開問題の出題形式を参考にした独自作成問題。公式問題・過去問題の転載ではありません。

公式試験問題、過去問題、公式サンプル問題、市販教材の問題文を転載したものではありません。

参考範囲: シラバスVer.9.2参考

RELATED

関連問題