美文网首页
学习过程的检查

学习过程的检查

作者: 小猪吃土豆 | 来源:发表于2020-04-06 11:24 被阅读0次

(摘录源自:CS231n课程笔记

在训练神经网络的时候,应该跟踪多个重要数值。这些数值输出的图表是观察训练进程的一扇窗口,是直观理解不同的超参数设置效果的工具,从而知道如何修改超参数以获得更高效的学习过程。

损失函数

下图的左侧,绘制了不同学习大小可能出现的损失值曲线;

  • 学习率过小时,损失值下降缓慢,曲线平缓,收敛太慢;
  • 学习率偏大时,损失值下降快速,但很可能不能找到比较合适的极小值;
  • 学习率过大时,损失值先下降,后上升,因为可能在极小值点位置反复越过极小值

下图的右侧,显示了一个典型的随时间变化的损失函数值,在CIFAR-10数据集上面训练了一个小的网络,这个损失函数值曲线看起来比较合理(虽然可能学习率有点小,但是很难说),而且指出了批数据的数量可能有点太小(因为损失值的噪音很大)。
损失值的震荡程度和批尺寸(batch size)有关,当批尺寸为1,震荡会相对较大。当批尺寸就是整个数据集时震荡就会最小,因为每个梯度更新都是单调地优化损失函数(除非学习率设置得过高)。


损失值变化曲线

准确率

在训练分类器的时候,需要跟踪的第二重要的数值是验证集和训练集的准确率。
下图蓝色曲线能够展现模型过拟合的程度:

  • 在训练集准确率和验证集准确率中间的空隙指明了模型过拟合的程度。在图中,蓝色的验证集曲线显示相较于训练集,验证集的准确率低了很多,这就说明模型有很强的过拟合。
    • 遇到这种情况,就应该增大正则化强度(更强的L2权重惩罚,更多的随机失活等)或收集更多的数据。
  • 另一种可能就是验证集曲线和训练集曲线如影随形,这种情况说明你的模型容量还不够大:应该通过增加参数数量让模型容量更大些。
学习率曲线

———·———·———·———·———·———·———·———·———·———·——

(以下)暂未完全理解、体会的部分

———·———·———·———·———·———·———·———·———·———·——

权重更新比例

image.png

每层的激活数据及梯度分布

image.png

第一层可视化

image.png

相关文章

  • 学习过程的检查

    (摘录源自:CS231n课程笔记) 在训练神经网络的时候,应该跟踪多个重要数值。这些数值输出的图表是观察训练进程的...

  • 检查及手术的过程

    前段时间,正在上着班的王琳玲,突然感觉腹部不舒服。后来请假到医院找医生一检查,医生即刻建议作一次胃肠镜检查。 王琳...

  • 艰难的检查过程

    半梦半醒,一晚上都睡不踏实,终于熬到五点多。家里静悄悄的,最不喜静,倒也不准备叫醒妈妈陪我。起身去到窗边,雾...

  • 2018-04-20

    今天上午是上机课,老师检查了我们之前的学习成果,检查一个hello world 小程序,虽然过程不是特别顺利,但最...

  • 停止忧虑

    坚持每周自我分析、自我教育,检查自己在学习和应用过程中所犯的错误,所取得的进步,以及所学到的教训,以检查自己的进步...

  • 如何智斗“爱敷衍”的熊孩子?

    家长在家与小神兽的斗争已经持续一个多月了。 在陪孩子学习和检查作业的过程中,家长们会发现,检查有形的作业比较容易:...

  • Teratimes | 对高效学习而言,这是一个价值连城的秘诀

    学习过程是一个不断迭代的闭环。其过程类似这样的:我们根据对现实的理解做出预期,根据预期检查结果,然后再根据反馈改进...

  • Exception: org.apache.hadoop.io.

    学习Hadoop MapReduce使用的过程中报错,检查环境变量配置无误,看到很多解决方案说: C:\Windo...

  • 孩子做作业到底要不要陪?

    昨晚微课程,讲《一日学习法》。有家长问:对于初一的孩子,家长是监督学习过程比较好呢?还是检查学习效果比较好...

  • 三正27天

    1.今天去医院抽血检查身体。 2.餐后血糖检查过程中,看了《登天的感觉》。岳博士写得真好。 3.检查过程中,还写了...

网友评论

      本文标题:学习过程的检查

      本文链接:https://www.haomeiwen.com/subject/inpvphtx.html