机器学习算法整理(四)

论坛 期权论坛 脚本     
匿名技术用户   2020-12-27 05:40   831   0

SVM支持向量机

支持向量机(Support Vector Machine, SVM)是一类按监督学习(supervised learning)方式对数据进行二元分类(binary classification)的广义线性分类器(generalized linear classifier),其决策边界是对学习样本求解的最大边距超平面(maximum-margin hyperplane)

数学模型

min(w,b){12wTw}min(w,b) \{\frac{1}{2}w^Tw\}s.t. yi(wTxi+b)1s.t. \space y_i(w^Tx_i+b) \ge1h(x)=sign(wT+b)h(x) = sign(w^T+b)
松弛变量的SVM数学模型:
min(w,b){12wTw+Ciξi}min(w,b) \{\frac{1}{2}w^Tw+C\sum_i\xi_i\}s.t. yi(wTxi+b)1ξi,ξi>0s.t. \space y_i(w^Tx_i+b) \ge1-\xi_i, \xi_i>0h(x)=sign(wT+b)h(x) = sign(w^T+b)
$C控制的是松弛度,越小越松弛

合页损失函数

上述条件变形:
ξi1yi(wTxi+b)\xi_i\ge1-y_i(w^Tx_i+b)
相当于:ξi=max(0,1yi(wTxi+b))\xi_i=max(0,1-y_i(w^Tx_i+b))
在这里插入图片描述
凸函数,容易优化:对于错误分类惩罚较小;支持向量个数远少于数据集,空间占比小
分段求导

求解方法

  1. 二次规划
  2. 转换为对偶问题

扩展到多分类

核函数

优缺点

  1. 对异常值(outlier)不敏感 处理方法:1. 放松限制条件s.t. 2. 处理线性不可分的情形(case在margin以内)必须放松限制
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP