美文网首页
使用Nvidia Apex导致的问题

使用Nvidia Apex导致的问题

作者: zelda2333 | 来源:发表于2020-06-06 11:03 被阅读0次
  1. Loss整体变大,而且很不稳定。效果变差。
  2. 会遇到梯度溢出。
    Gradient overflow. Skipping step, loss scaler 0 reducing loss scale to ....

Emmm.....写出来的目的就是看到这些不要慌张,是正常现象,至于解决的话,好像也没法解决,Gradient overflow 不是经常出现就没问题。

如果Gradient overflow频繁出现的话,可以考虑使用以下办法。

解决办法:

经过验证可以通过以下几种方法,来防止出现梯度溢出的问题:

1、O2换成O1,再不行换成O0
2、把batchsize从32调整为16会显著解决这个问题,另外在换成O0的时候会出现内存不足的情况,减小batchsize也是有帮助的
3、减少学习率也是一种方法(没有亲自验证)
4、增加Relu会有效保存梯度,防止梯度消失(亲测有效,如下说明)

参考链接:
Apex使用教程 与 梯度爆炸问题

相关文章

网友评论

      本文标题:使用Nvidia Apex导致的问题

      本文链接:https://www.haomeiwen.com/subject/sdxgzhtx.html