孔言的博客
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

07-梯度消失和梯度爆炸的原因及解决方法

问题梯度消失无论是笔试还是面试都是常客了,其实对应于梯度消失,还有一个梯度爆炸的概念,这又是什么导致的呢?下面我们将根据公式推导来解释何为梯度消失与梯度爆炸。 梯度消失和梯度爆炸的表现网络层数越多,模型训练的时候便越容易出现 梯度消失(gradient vanish) 和 梯度爆炸(gradient explod) 这种梯度不稳定的问题。假设现在有一个含有3层隐含层的神经网络: 梯度消失发生时的
2022-11-13
深度学习基础
#转载
123

搜索

Hexo Fluid
总访问量 次 总访问客数 人