SVM防止过拟合
来源:互联网 发布:代言宝无水印版源码 编辑:程序博客网 时间:2024/06/09 20:04
过拟合(Overfitting)表现为在训练数据上模型的预测很准,在未知数据上预测很差。过拟合主要是因为训练数据中的异常点,这些点严重偏离正常位置。我们知道,决定SVM最优分类超平面的恰恰是那些占少数的支持向量,如果支持向量中碰巧存在异常点,那么我们傻傻地让SVM去拟合这样的数据,最后的超平面就不是最优的。
如图1所示,深红色线表示我们希望训练得到的最优分类超平面,黑色虚线表示由于过拟合得到的较差的分类面。这是由于蓝色数据中有一个异常点,即图中的那个黑圈蓝点,使得我们的SVM去将就配合它,导致最后得到的分类面(粗黑色虚线)不尽如人意。从间隔可以看出,黑色虚线两边的间隔要比红色线两边的间隔要狭窄,也就是黑色虚线的分类效果比较差。
图1 异常点导致SVM过拟合
解决过拟合的办法是为SVM引入了松弛变量ξ(slack variable),将SVM公式的约束条件改为:
(3)
从图2可以看到,引入松弛变量使SVM能够容忍异常点的存在。为什么?因为引入松弛变量后,所有点到超平面的距离约束不需要大于等于1了,而是大于0.8就行了(如果ξ=0.2的话),那么异常点就可以不是支持向量了,它就作为一个普通的点存在,我们的支持向量和超平面都不会受到它的影响。
图 2 松弛变量的作用
我们知道,事物都有两面性,对异常点太容忍会导致任意超平面都可以是“最优”超平面,SVM就失去意义了。因此SVM公示中的目标函数也需要相应修改,我们加上松弛变量的平方和,并求最小值。这样就达到一个平衡:既希望松弛变量存在以解决异常点问题,又不希望松弛变量太大导致分类解决太差。
- SVM防止过拟合
- 防止过拟合
- dropout防止过拟合
- 防止过拟合方法
- 如何防止过拟合
- 防止过拟合以及解决过拟合
- 防止过拟合以及解决过拟合
- 防止过拟合以及解决过拟合
- 防止过拟合以及解决过拟合
- 防止过拟合以及解决过拟合
- SVM如何避免过拟合
- 机器学习防止过拟合
- 神经网络简介-防止过拟合
- Dropout_layer.cpp(防止过拟合)
- 防止过拟合的方法
- 防止过拟合的方法
- 防止过拟合的方法
- Dropout_layer.cpp(防止过拟合)
- SDUT-2055
- PAT甲级1005. Spell It Right (20)
- 【转】Rancher部署Træfik实现微服务的快速发现
- TCP空闲扫描原理
- POJ3713-Transferring Sylla
- SVM防止过拟合
- iOS view圆角设置同时又不影响子视图超出父视图部分显示
- VirtualBox相关问题
- 每日一诗词 —— 古诗十九首·其十
- 路灯
- PropertyUtils的使用
- ionic3的页面的三种跳转
- Java反射机制二
- OSG-视口&LOD&Imposter