本文へスキップ

IT PASSPORT

ITパスポートの問題解説

テクノロジ系 標準 itpassport_tech_089

問題

AIや機械学習の活用に関する記述のうち、過学習(オーバーフィッティング)の説明として最も適切なものはどれか。

  1. 学習に使ったデータには高い精度で当てはまるが、未知の新しいデータに対しては正しく予測できなくなる状態
  2. 学習データの量が少なすぎて、そもそもモデルが何も学習できていない状態
  3. 複数のAIモデルを組み合わせて、互いの弱点を補い合いながら精度を高める手法
  4. 学習済みのモデルを、別の似た課題に応用して学習時間を短縮する手法
出典:オリジナル問題|参考範囲:IPA ITパスポート試験シラバス(最新版)、情報処理技術者試験の基礎知識

正解と解説

正解:学習に使ったデータには高い精度で当てはまるが、未知の新しいデータに対しては正しく予測できなくなる状態

解説:過学習とは、AIが訓練に使ったデータの細かな特徴やノイズまで覚え込みすぎてしまい、学習データに対しては非常に高い精度を出す一方、実際に使いたい新しいデータではうまく予測できなくなる状態を指します。いわば『過去問だけを丸暗記して応用が利かない』ようなものです。防ぐには、学習データとは別の検証用データで精度を確かめたり、データを増やしたり、モデルを必要以上に複雑にしすぎないようにします。なお、データが少なすぎて学べていない状態は学習不足、複数モデルを組み合わせるのはアンサンブル学習、学習済みモデルを別課題へ活かすのは転移学習で、いずれも過学習とは別の概念です。AIの実用では、未知データへの対応力(汎化性能)をどう保つかが重要になります。

覚え方:過学習=『訓練データには◎、本番データには×』。丸暗記しすぎて応用が利かない状態、とイメージすると他の用語と区別できます。

他の選択肢はなぜ違う?

  • 学習データが少なすぎて学べていない状態は、過学習ではなくむしろ学習不足(未学習)に近い状態で、説明が逆向きです。
  • 複数モデルを組み合わせる手法はアンサンブル学習などの説明であり、過学習という現象そのものを表してはいません。
  • 学習済みモデルを別の課題に応用するのは転移学習の説明で、過学習とは異なる概念です。

この問題について

出典:オリジナル問題|参考範囲:IPA ITパスポート試験シラバス(最新版)、情報処理技術者試験の基礎知識

IPAのITパスポート試験シラバスとIT基礎知識を参考に、Sikaku Master向けに独自作成した問題です。公式試験問題・過去問題の転載ではありません。

IPAの過去問題の転載ではなく、シラバス・公開情報に基づく独自問題として作成しています。

確認状況: 独自作成問題として編集確認済み。公開後も誤り報告を受け付けています。

RELATED

関連問題