超平面
任一平面都可以用它上面的一点及它的法线向量来确定。易于理解的形式:
其中 为平面到原点的距离,3 个角度分别为平面法向量在 x y z 轴方向的方向余弦
超平面 表示超平面方程为:
- 为超平面的法向量,决定了超平面的方向
- 为位移项,决定了超平面与原点的距离
任意点 到超平面 的距离 可写为:
式子的分子为法向量和以点 为终点的向量的数量积,分母为法向量的模,得出的结果即为平面上的任意一点与点 的连线的模乘以其与法向量的夹角的余弦值,显然为点到平面的距离。
超平面用于分类
设有样本 ,其类别为 ,若超平面 能将其正确分类,则 应满足:
支持向量机的基本型
距离超平面最近的几个样本点称为支持向量,支持向量点 满足
因此,两个异类支持向量到平面的距离之和为
显然,超平面与支持向量之间的距离越远越好,此时分类结果是最鲁棒的,泛化能力最强,故分类的目标是:
最大化间隔等效于最大化 的倒数,等效于最小化 ,此即为支持向量机(Support Vector Machine,SVM)的基本型
求解
利用拉格朗日乘数法来求解上述基本型
考研数学中,拉格朗日乘数法用于多元函数的求条件极值问题,若求 在条件 下的极值,只需构造拉格朗日函数 ,然后求解使其偏导均为 0 的方程组即可。
此时的条件极值的条件为: (其意义为对每一个样本 ,都能正确计算其类别)
写出拉格朗日函数:
学习中…
核函数
原始样本空间内不存在可以划分样本的超平面时,可选择将样本空间映射到一个更高维的特征空间,使样本在这个特征空间内线性可分。
如果原始空间是有限维,那么一定存在一个高维特征空间使样本可分。
令 表示 映射到高维空间后的向量,则对应的超平面可表示为:
其对偶问题为:
其中涉及到 的计算,计算比较困难,用函数 来代替,即函数
此即为核函数,关于核函数是否存在的问题,有一个核函数定理如下:
令 为输入空间, 是定义在 上的对称函数,设 是核函数当且仅当对于任意数据 ,“核矩阵” 总是半正定的。
也就是只要对称函数对应的核矩阵是半正定的,它就可以作为核函数,对于一个半正定核矩阵,总能找到一个相对应的映射空间,也就是任意一个核函数都隐式地定义了一个特征空间(称为“再生核希尔伯特空间”, RKHS)
特征空间的好坏对支持向量机至关重要,故选择核函数十分控妖,必须将样本映射到合适的特征空间,使其尽可能地线性可分,常用核函数有:

svm常用核函数_svm核函数_wolfrevoda的博客-CSDN博客
核函数的组合也是核函数
- 对于 和 均为正数的情况, 也是核函数
- 核函数的直积也是核函数
- 对于任意的函数 , 也是核函数
软间隔
软间隔允许支持向量机在一些样本上出错,即允许部分样本不满足
此时优化目标变成了:
其中 为常数, 为损失函数,常见的损失函数有:
- hinge 损失:
- 指数损失:
- 对率损失:
支持向量回归
传统回归模通常直接基于模型输出 与真实输出 计算损失,而支持向量机则允许计算值和真实值之间有一定的误差 ,也就是仅当预测值和真实值之间的绝对差大于 时才计算损失,这相当于以 为中心,构建一条宽度为 的间隔带,只要预测值落入其中,即为预测正确。