IT PASSPORT
ITパスポートの問題解説
問題
生成AIや検索システムで用いられる「RAG(検索拡張生成)」の説明として、最も適切なものはどれか。
- ア 学習済みモデルに対し、特定分野のデータで追加学習を行いモデル自体を再調整する手法
- イ 学習データに人手で正解ラベルを付与し、機械学習の訓練データを整備する作業
- ウ 外部の文書やデータベースから関連情報を検索し、その内容を踏まえて生成AIに回答を作らせる手法
- エ 訓練データに適合しすぎて未知データの予測精度が下がってしまう現象
出典:オリジナル問題|参考範囲:IPA ITパスポート試験シラバス(最新版)、情報処理技術者試験の基礎知識
正解と解説
正解:外部の文書やデータベースから関連情報を検索し、その内容を踏まえて生成AIに回答を作らせる手法
解説:大規模言語モデルは学習時点の知識しか持たず、最新情報や社内固有の情報には弱く、事実と異なる回答(ハルシネーション)も起こします。RAGでは、質問に関係する文書をまず検索で取り出し、それを参考資料としてAIに渡してから回答させます。これにより最新・専門的な情報に基づいた、根拠を示せる回答が得やすくなります。モデル自体を作り直すファインチューニングとは違い、参照する情報源を差し替えるだけで対応できるのが利点です。
覚え方:RAGは『調べてから答える(検索→生成)』方式と覚えましょう。モデルそのものを鍛え直すファインチューニングとの違いを押さえると、混同を防げます。
他の選択肢はなぜ違う?
- アこれはファインチューニングの説明です。RAGはモデル自体を再学習させるのではなく、外部情報を検索して回答時に参照させる点が異なります。
- イこれはアノテーション(ラベル付け)の説明であり、検索した情報を生成に活用するRAGとは別の作業です。
- エこれは過学習(オーバーフィッティング)の説明で、機械学習で起こる問題現象を指し、RAGという手法とは関係ありません。
この問題について
IPAのITパスポート試験シラバスとIT基礎知識を参考に、Sikaku Master向けに独自作成した問題です。公式試験問題・過去問題の転載ではありません。
IPAの過去問題の転載ではなく、シラバス・公開情報に基づく独自問題として作成しています。