美文网首页
过拟合问题

过拟合问题

作者: JaiUnChat | 来源:发表于2017-01-18 23:17 被阅读329次

下面三幅图显示了对同一组数据取不同的特征值进行拟合的结果。

拟合程度
  • 左边的是欠拟合。数据并不能十分恰当的落在直线上。
  • 中间的是合理状态。数据基本落在了求出的直线上。
  • 右边的是过拟合。 数据完美的落在了描绘的曲线上,这样会导致拟合出来的曲线不能泛化到需要预测的问题中,从而导致误差。

拟合问题是线性回归和逻辑回归中都存在的问题。下面是两种常见的解决方法:

  1. 减少特征数量:
  • 手动选择特征的去留。
  • 使用模型选择算法。
  1. 正则化 Regularization
  • 保留所有特征,但是减少某一个参数θj的重要性。
  • 当有许多有用的特征时,正规化将会非常有用。

1.正规化代价方程

比如我们有如下的参数,进行梯度下降的时候,发现了过拟合。



并不采取消除高次项的措施,而是将代价函数作如下修改。


在需要降低重要性的参数前,加上一个较大值。


也可以对所有的参数都进行正则化。

选取过大的λ会使得曲线过于光滑导致欠拟合,一般都可以先将λ参数选在1000左右。

原代价函数 正则化后的代价函数

2.正则化的梯度下降

同样对上述代价函数进行梯度下降,公式如下所示。


通常不对x0进行正则化

3.正规方程 Normal Equaltion

L就是将常数λ矩阵化,也就是除了x0外的单位矩阵
必须保证训练集数m>=参数数n,否则XTX不可逆,即XTX + λ⋅L 不可逆。

相关文章

  • 正则化逻辑回归(Regularization)

    1. 过拟合的问题(The problem of overfitting) 正则化可以减轻过拟合问题。欠拟合(un...

  • 过拟合问题

    一、过度拟合 看看另一个例子 对于第一个图,使用两个变量,可以拟合出一条直线,可以看出效果不是很好,这也是一个欠拟...

  • 过拟合问题

    下面三幅图显示了对同一组数据取不同的特征值进行拟合的结果。 左边的是欠拟合。数据并不能十分恰当的落在直线上。 中间...

  • 防止过拟合的基本方法

    过拟合是训练神经网络中常见的问题,本文讨论了产生过拟合的原因,如何发现过拟合,以及简单的解决方法。 发现过拟合问题...

  • 机器学习中的L0、L1、L2正则化

    过拟合 过拟合问题在机器学习中是一个经常遇到的问题,所谓过拟合,即模型过度地拟合了训练数据,从而导致模型在训练数据...

  • 学习曲线

    在机器学习中,模型的欠拟合和过拟合是需要格外注意的问题,同时也是经常发生的问题,其中过拟合最为常见. 欠拟合,即训...

  • 吴恩达机器学习—正则化

    过拟合问题 当变量过少时,可能存在欠拟合;当变量过多时,会存在过拟合。过拟合可能对现有数据拟合效果较好,损失函数值...

  • 2018-11-02 模型选择学习笔记

    占坑,完善中。。。。 模型的选择就是为了解决过拟合和欠拟合问题 过拟合: 解决简单问题用了过于复杂的模型, 机关枪...

  • 过拟合的问题

    第一个模型是一个线性模型,欠拟合,不能很好地适应我们的训练集;第三个模型是一个四次方的模型,过于强调拟合原始数据,...

  • 防止过拟合方法

    一、防止过拟合的方法有哪些? 过拟合是指模型参数拟合过程中的问题。由于训练集数据包含抽样误差,复杂模型在进行拟合过...

网友评论

      本文标题:过拟合问题

      本文链接:https://www.haomeiwen.com/subject/agbbbttx.html