テクノロジ系 / 基礎理論
勾配消失問題
勾配消失問題は、層が深いネットワークで、学習に必要な情報が伝わらなくなる問題です。
もう少し詳しく
誤差逆伝播で重みを調整する際、層を深くすると、入力に近い層へ伝わる修正の手がかり(勾配)が非常に小さくなり、学習がほとんど進まなくなる問題です。深層学習の発展を妨げた課題で、活性化関数の工夫などで対策されました。深層学習で重要な概念です。
試験での見方
例:層が深いと入力側へ修正の手がかりが伝わらず学習が進まないのがこれです。
テクノロジ系 / 基礎理論
勾配消失問題は、層が深いネットワークで、学習に必要な情報が伝わらなくなる問題です。
誤差逆伝播で重みを調整する際、層を深くすると、入力に近い層へ伝わる修正の手がかり(勾配)が非常に小さくなり、学習がほとんど進まなくなる問題です。深層学習の発展を妨げた課題で、活性化関数の工夫などで対策されました。深層学習で重要な概念です。
例:層が深いと入力側へ修正の手がかりが伝わらず学習が進まないのがこれです。
深い層で勾配が小さくなり学習が進まない点が核心です。誤差逆伝播・活性化関数との関連が頻出です。