为什么正则化惩罚项Work?上面谈到模型出现过拟合的现象,而加上\(L_2\)损失可以一直过拟合现象,我在这里简单给大家说说我得观点,不一定正确 , 希望可以帮助大家理解为什么\(L_2\)惩罚项可以在一定程度上抑制过拟合现象 。首先看一下真实数据:
文章插图
如果需要拟合的话 , 下面的结果应该是最好的,即一个正弦函数:
文章插图
下图是一个过拟合的情况:
文章插图
我们可以观察一下它真实规律正弦曲线的之间的差异:过拟合的曲线将每个点都考虑到了,因此他会有一个非常大的缺点就是”突变“,即曲线的斜率的绝对值非常大,如:
文章插图
对于一般的一次函数 \(y = ax + b\) 来说,当 \(a\) 很大的时候,斜率会很大 , 推广到复杂模型也是一样的,当模型参数很大的时候模型可能会发生剧烈的变化,即可能发生过拟合现象 。现在我们来看为什么在线性回归中加入了一个 \(L_2\) 惩罚项会减少过拟合的现象 。因为在损失函数中有权重的二范数的平方,当权重过大的时候模型的损失就会越大,但是模型需要降低损失 , 那么就需要降低权重的值,权重的值一旦低下来,突变的可能性就会变小,因此在一定程度上可以抑制过拟合现象 。而参数 \(\alpha\) 就是来调控权重在损失中的比例,当 \(\lambda\) 越大的时候对权重惩罚的越狠 , 这在实际调参的过程中需要了解 。后面的 \(Lasso\) 回归参数 \(\alpha\) 的意义也是相似的 。
Lasso回归岭回归是在损失函数中加一个\(L_2\)损失,而\(Lasso\)回归是在损失函数\(\mathcal{L(\hat{w})}\)后面加一个\(L_1\)的损失,即:
\[\mathcal{L(\hat{w})} = ||X\hat{w} - Y||_2^2 + \alpha\sum_{j=0}^{m}|{\hat{w}}_j| \tag{25}\]对公式\((25)\)求导:
\[\frac{\partial \mathcal{L(\hat{w})}}{\partial \hat{w}} = 2X^TX\hat{w} - 2X^TY + \alpha C = 0 \tag{26}\\\]\[\left\{\begin{matrix}c_i = -1\ ,\ if\\hat{w}_i < 0;\\c_i = 1\ ,\ if\\hat{w}_i \ge 0;\\\end{matrix}\right.\]其中\(C\)是和\(\hat{w}\)同维度的向量 。则可以得到:
\[\hat{w} = (X^TX)^{-1}(X^TY-\frac{\alpha}{2} C)\tag{27}\]线性回归实现过程上面提到\(\mathcal{L(w, b)}\)是一个关于 \(\hat{w}\) 的凸函数,则当它关于\(\hat{w}\)导数为0时求出的\(\hat{w}\)是\(\hat{w}\)的最优解,因此在编码实现线性回归的过程中,如果数据集比较小可以直接将所有的数据同时进行计算 , 节省计算资源,因为只需要计算一次 \(\hat{w}\) 的导数 。但是如果数据量过大的话,计算无法一次性完成,可以使用随机梯度下降法 , 或者其他的优化算法,进行多次迭代学习,得到最终的结果 。
Ridge回归和Lasso回归区别上面谈到了 \(Ridge\) 和 \(Lasso\) 的具体的实现方法,还简要谈到了 \(Ridge\) 可以有效防止模型过拟合,和他在数据个数小于数据维度的时候的使用 。那么都是增加一个惩罚项 , 那么 \(Ridge\) 和 \(Lasso\) 有什么区别呢?
- \(Ridge\) 和 \(Lasso\) 都可以在一定程度上防止模型过拟合
- \(Ridge\) 在数据个数小于数据维度的时候比较适合
- \(Lasso\) 的数据的属性之间有共线性的时候比较适合
- \(Ridge\) 会限制参数的大?。顾平?
- \(Lasso\) 是一种稀疏模型,可以做特征选择
Ridge和Lasso对权值的影响在正式讨论这个问题之间我们首先先来分析不同的权值所对应的\(RSS\)(残差平方和)值是多少 。\(RSS\)的定义如下:
\[RSS = \sum_{i=0}^{n}(x_i\hat{w} - y_i)^2\]对于一个只有两个属性的数据,对不同的权值计算整个数据集在相应权值下的 \(RSS\)。然后将 \(RSS\) 值相等的点连接起来做成一个等高线图,看看相同的\(RSS\) 值下权值围成了一个什么图形 。
推荐阅读
- 岭南师范学院招生办电话号码 岭南师范学院招生办电话
- 岭南师范学院是一本还是二本 岭南师范学院
- 铁岭佰润电子科技有限公司_工商信用信息_经营范围期限状态_法人_地址_注册资本_怎么样
- 平乐县景点排行榜 平乐县景点
- 秦岭自驾旅游最美线路 秦岭旅游景点有哪些
- 秦岭为什么被称为中华龙脉,秦岭到底有什么特别之处?
- 哪些测量仪器需要做线性分析 哪些测量仪器需要做MSA
- 岭和峰的区别图片 岭和峰的区别
- 公主岭市桑树台福源化肥经销处_工商信用信息_经营范围期限状态_法人_地址_注册资本_怎么样
- balingbridge什么意思 bridge什么意思