桔子建站是什么平臺國外新聞最新消息
文章目錄
- 前言
- 具體內(nèi)容
前言
總算要對稍微有點難度的地方動手了,前面介紹的線性可分或者線性不可分的情況,都是使用平面作為分割面的,現(xiàn)在我們采用另一種分割面的設(shè)計方法,也就是核方法。
核方法涉及的分割面不再是 w x + b = 0 wx+b=0 wx+b=0,而是 f ( x ) = 0 f(x)=0 f(x)=0了。
具體內(nèi)容
核方法其實就是坐標映射方法,類似于我們進行回歸的時候?qū)τ诜春瘮?shù)曲線采用 y = w x + b y=\frac{w}{x}+b y=xw?+b的形式來對數(shù)據(jù)進行擬合。
我們常用的標準做法都是先將原始數(shù)據(jù) x x x映射為 1 x \frac{1}{x} x1?,然后對于數(shù)據(jù) ( 1 x , y ) (\frac{1}{x},y) (x1?,y)尋找線性函數(shù) y = k t + b y=kt+b y=kt+b來擬合。
在非線性支持向量機中,我們需要把原始特征x
通過映射函數(shù)變換為 ? ( x ) \phi(x) ?(x),對于這個映射函數(shù)沒有什么要求,只不過什么樣的映射函數(shù)映射以后分類效果最佳是未知的,是需要通過比較才能發(fā)現(xiàn)的。
映射函數(shù)一般都是把原始特征 x x x變?yōu)榱硪粋€向量 [ 1 , x 1 , ? , x n , x 1 2 , ? , x i x j , ? , x n 2 , ? ] [1,x_1,\cdots,x_n,x_1^2,\cdots,x_ix_j,\cdots,x_n^2,\cdots] [1,x1?,?,xn?,x12?,?,xi?xj?,?,xn2?,?]其中的一項或者幾項,具體是幾項視具體情況確定,這個的目標是保留原始信息同時要增加盡可能多的生成信息,所以一般往高維方向映射。
當然這個函數(shù)設(shè)計好以后,我們在支持向量機的對偶函數(shù)中其實計算的是 K ( x i , x j ) K(x_i,x_j) K(xi?,xj?),這個函數(shù)是上面映射函數(shù)的乘積,可能計算更加復雜,所以從方便對偶函數(shù)的計算角度出發(fā),設(shè)計了專門的對偶核函數(shù),不過對偶核函數(shù)是有要求的,需要對所有特征 x x x所構(gòu)成的gram矩陣是半正定的。
而這種情況下我們可以設(shè)計方便計算的核函數(shù),比如:
多項式核函數(shù): K ( x , z ) = ( x ? z + 1 ) p K(x,z)=(x\cdot z+1)^p K(x,z)=(x?z+1)p,計算難度大大減小,而且這個多項式核函數(shù)對應(yīng)的映射函數(shù)也比較好求:
K ( x , z ) = ( x ? z + 1 ) 2 = ( x 1 z 1 + x 2 z 2 + 1 ) 2 = x 1 2 z 1 2 + 2 x 1 x 2 z 1 z 2 + 2 x 1 z 1 + x 2 2 z 2 2 + 2 x 2 z 2 + 1 = [ x 1 2 , 2 x 1 x 2 , 2 x 1 , x 2 2 , 2 x 2 , 1 ] ? [ z 1 2 , 2 z 1 z 2 , 2 z 1 , z 2 2 , 2 z 2 , 1 ] T \begin{align*} K(x,z)&=(x\cdot z+1)^2\\ &=(x_1z_1+x_2z_2+1)^2\\ &=x_1^2z_1^2+2x_1x_2z_1z_2+2x_1z_1+x_2^2z_2^2+2x_2z_2+1\\ &=[x_1^2,\sqrt{2}x_1x_2,\sqrt{2}x_1,x_2^2,\sqrt{2}x_2,1]*[z_1^2,\sqrt{2}z_1z_2,\sqrt{2}z_1,z_2^2,\sqrt{2}z_2,1]^T \end{align*} K(x,z)?=(x?z+1)2=(x1?z1?+x2?z2?+1)2=x12?z12?+2x1?x2?z1?z2?+2x1?z1?+x22?z22?+2x2?z2?+1=[x12?,2?x1?x2?,2?x1?,x22?,2?x2?,1]?[z12?,2?z1?z2?,2?z1?,z22?,2?z2?,1]T?
相當于截取了泰勒展開式中的前幾項。
換句話說,如果我們想將坐標映射為 [ 1 , x 1 , x 2 , x 1 2 , x 1 x 2 , x 2 2 ] [1,x_1,x_2,x_1^2,x_1x_2,x_2^2] [1,x1?,x2?,x12?,x1?x2?,x22?],然后利用映射后的坐標來計算 w [ 1 , x 1 , x 2 , x 1 2 , x 1 x 2 , x 2 2 ] T + b w[1,x_1,x_2,x_1^2,x_1x_2,x_2^2]^T+b w[1,x1?,x2?,x12?,x1?x2?,x22?]T+b來作為判別函數(shù),那么這個分界面問題的對偶函數(shù)中 ? ( x i ) ? ( x j ) \phi(x_i)\phi(x_j) ?(xi?)?(xj?)就是上面的 ( x ? z + 1 ) p (x\cdot z+1)^p (x?z+1)p的形式,也就是我們不用知道中間映射后的坐標,而可以直接計算 ( x i ? x j + 1 ) p (x_i\cdot x_j+1)^p (xi??xj?+1)p。
高斯核函數(shù); K ( x , z ) = exp ? ( ? ∥ x ? z ∥ 2 2 σ 2 ) K(x,z)=\exp(-\frac{{\|x-z\|}^2}{2\sigma^2}) K(x,z)=exp(?2σ2∥x?z∥2?),計算難度大大減小,但是這個核函數(shù)對應(yīng)的映射函數(shù)不容易求出來。
K ( x , z ) = exp ? ( ? ( x 1 ? z 1 ) 2 + ( x 2 ? z 2 ) 2 2 σ 2 ) = exp ? ( ? x 1 2 + z 1 2 ? 2 x 1 z 1 + x 2 2 + z 2 2 ? 2 x 2 z 2 2 σ 2 ) = exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? z 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) exp ? ( ? z 2 2 2 σ 2 ) exp ? ( 2 x 1 z 1 2 σ 2 ) exp ? ( 2 x 2 z 2 2 σ 2 ) = exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? z 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) exp ? ( ? z 2 2 2 σ 2 ) [ 1 + 2 x 1 z 1 2 σ 2 + ? + 1 n ! ( 2 x 1 z 1 2 σ 2 ) n + ? ] [ 1 + 2 x 2 z 2 2 σ 2 + ? + 1 n ! ( 2 x 2 z 2 2 σ 2 ) n + ? ] = exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? z 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) exp ? ( ? z 2 2 2 σ 2 ) [ ∑ t = 0 + ∞ ∑ k = 0 + ∞ 1 t ! ( 2 x 1 z 1 2 σ 2 ) t 1 k ! ( 2 x 2 z 2 2 σ 2 ) k ] = exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) [ 1 , x 1 σ , ? , 1 n ! ( x 1 σ ) n , ? , x 2 σ , x 1 x 2 σ 2 , ? , 1 n ! ( x 1 n x 2 σ n + 1 ) , ? , 1 t ! n ! x 1 t x 2 n σ t + n , ? ] ? exp ? ( ? z 1 2 2 σ 2 ) exp ? ( ? z 2 2 2 σ 2 ) [ 1 , z 1 σ , ? , 1 n ! ( z 1 σ ) n , ? , z 2 σ , z 1 z 2 σ 2 , ? , 1 n ! ( z 1 n z 2 σ n + 1 ) , ? , 1 t ! n ! z 1 t z 2 n σ t + n , ? ] \begin{align*} K(x,z)=&\exp(-\frac{(x_1-z_1)^2+(x_2-z_2)^2}{2\sigma^2})\\ =&\exp(-\frac{x_1^2+z_1^2-2x_1z_1+x_2^2+z_2^2-2x_2z_2}{2\sigma^2})\\ =&\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{z_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})\exp(-\frac{z_2^2}{2\sigma^2})\exp(\frac{2x_1z_1}{2\sigma^2})\exp(\frac{2x_2z_2}{2\sigma^2})\\ =&\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{z_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})\exp(-\frac{z_2^2}{2\sigma^2})[1+\frac{2x_1z_1}{2\sigma^2}+\cdots+\frac{1}{n!}(\frac{2x_1z_1}{2\sigma^2})^n+\cdots][1+\frac{2x_2z_2}{2\sigma^2}+\cdots+\frac{1}{n!}(\frac{2x_2z_2}{2\sigma^2})^n+\cdots]\\ =&\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{z_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})\exp(-\frac{z_2^2}{2\sigma^2})[\sum_{t=0}^{+\infty}\sum_{k=0}^{+\infty}\frac{1}{t!}(\frac{2x_1z_1}{2\sigma^2})^t\frac{1}{k!}(\frac{2x_2z_2}{2\sigma^2})^k]\\ =&\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})[1,\frac{x_1}{\sigma},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1}{\sigma})^n,\cdots,\frac{x_2}{\sigma},\frac{x_1x_2}{\sigma^2},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1^nx_2}{\sigma^{n+1}}),\cdots,\sqrt{\frac{1}{t!n!}}\frac{x_1^tx_2^n}{\sigma^{t+n}},\cdots]*\\ &\exp(-\frac{z_1^2}{2\sigma^2})\exp(-\frac{z_2^2}{2\sigma^2})[1,\frac{z_1}{\sigma},\cdots,\sqrt{\frac{1}{n!}}(\frac{z_1}{\sigma})^n,\cdots,\frac{z_2}{\sigma},\frac{z_1z_2}{\sigma^2},\cdots,\sqrt{\frac{1}{n!}}(\frac{z_1^nz_2}{\sigma^{n+1}}),\cdots,\sqrt{\frac{1}{t!n!}}\frac{z_1^tz_2^n}{\sigma^{t+n}},\cdots] \end{align*} K(x,z)======?exp(?2σ2(x1??z1?)2+(x2??z2?)2?)exp(?2σ2x12?+z12??2x1?z1?+x22?+z22??2x2?z2??)exp(?2σ2x12??)exp(?2σ2z12??)exp(?2σ2x22??)exp(?2σ2z22??)exp(2σ22x1?z1??)exp(2σ22x2?z2??)exp(?2σ2x12??)exp(?2σ2z12??)exp(?2σ2x22??)exp(?2σ2z22??)[1+2σ22x1?z1??+?+n!1?(2σ22x1?z1??)n+?][1+2σ22x2?z2??+?+n!1?(2σ22x2?z2??)n+?]exp(?2σ2x12??)exp(?2σ2z12??)exp(?2σ2x22??)exp(?2σ2z22??)[t=0∑+∞?k=0∑+∞?t!1?(2σ22x1?z1??)tk!1?(2σ22x2?z2??)k]exp(?2σ2x12??)exp(?2σ2x22??)[1,σx1??,?,n!1??(σx1??)n,?,σx2??,σ2x1?x2??,?,n!1??(σn+1x1n?x2??),?,t!n!1??σt+nx1t?x2n??,?]?exp(?2σ2z12??)exp(?2σ2z22??)[1,σz1??,?,n!1??(σz1??)n,?,σz2??,σ2z1?z2??,?,n!1??(σn+1z1n?z2??),?,t!n!1??σt+nz1t?z2n??,?]?
所以兩個映射函數(shù)分別如上所示:
? ( x ) = exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) [ 1 , x 1 σ , ? , 1 n ! ( x 1 σ ) n , ? , x 2 σ , x 1 x 2 σ 2 , ? , 1 n ! ( x 1 n x 2 σ n + 1 ) , ? , 1 t ! n ! x 1 t x 2 n σ t + n , ? ] \phi(x)=\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})[1,\frac{x_1}{\sigma},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1}{\sigma})^n,\cdots,\frac{x_2}{\sigma},\frac{x_1x_2}{\sigma^2},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1^nx_2}{\sigma^{n+1}}),\cdots,\sqrt{\frac{1}{t!n!}}\frac{x_1^tx_2^n}{\sigma^{t+n}},\cdots] ?(x)=exp(?2σ2x12??)exp(?2σ2x22??)[1,σx1??,?,n!1??(σx1??)n,?,σx2??,σ2x1?x2??,?,n!1??(σn+1x1n?x2??),?,t!n!1??σt+nx1t?x2n??,?]
如果只看后面的向量的話,他就是泰勒展開式中各個項,但是它前面還乘上了系數(shù) exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) \exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2}) exp(?2σ2x12??)exp(?2σ2x22??)縮放了一下。
換句話說,這個映射函數(shù)把原始特征映射為了一個無窮維的坐標,我們實際上做的是用這個映射后的坐標 exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) [ 1 , x 1 σ , ? , 1 n ! ( x 1 σ ) n , ? , x 2 σ , x 1 x 2 σ 2 , ? , 1 n ! ( x 1 n x 2 σ n + 1 ) , ? , 1 t ! n ! x 1 t x 2 n σ t + n , ? ] \exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})[1,\frac{x_1}{\sigma},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1}{\sigma})^n,\cdots,\frac{x_2}{\sigma},\frac{x_1x_2}{\sigma^2},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1^nx_2}{\sigma^{n+1}}),\cdots,\sqrt{\frac{1}{t!n!}}\frac{x_1^tx_2^n}{\sigma^{t+n}},\cdots] exp(?2σ2x12??)exp(?2σ2x22??)[1,σx1??,?,n!1??(σx1??)n,?,σx2??,σ2x1?x2??,?,n!1??(σn+1x1n?x2??),?,t!n!1??σt+nx1t?x2n??,?]去構(gòu)成分界面 w exp ? ( ? x 1 2 2 σ 2 ) exp ? ( ? x 2 2 2 σ 2 ) [ 1 , x 1 σ , ? , 1 n ! ( x 1 σ ) n , ? , x 2 σ , x 1 x 2 σ 2 , ? , 1 n ! ( x 1 n x 2 σ n + 1 ) , ? , 1 t ! n ! x 1 t x 2 n σ t + n , ? ] + b w\exp(-\frac{x_1^2}{2\sigma^2})\exp(-\frac{x_2^2}{2\sigma^2})[1,\frac{x_1}{\sigma},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1}{\sigma})^n,\cdots,\frac{x_2}{\sigma},\frac{x_1x_2}{\sigma^2},\cdots,\sqrt{\frac{1}{n!}}(\frac{x_1^nx_2}{\sigma^{n+1}}),\cdots,\sqrt{\frac{1}{t!n!}}\frac{x_1^tx_2^n}{\sigma^{t+n}},\cdots]+b wexp(?2σ2x12??)exp(?2σ2x22??)[1,σx1??,?,n!1??(σx1??)n,?,σx2??,σ2x1?x2??,?,n!1??(σn+1x1n?x2??),?,t!n!1??σt+nx1t?x2n??,?]+b作為分界面,其中 w w w為無窮維向量,那么這個分界面問題的對偶函數(shù)中 ? ( x i ) ? ( x j ) \phi(x_i)\phi(x_j) ?(xi?)?(xj?)就是上面的 exp ? ( ? ( x 1 ? z 1 ) 2 + ( x 2 ? z 2 ) 2 2 σ 2 ) \exp(-\frac{(x_1-z_1)^2+(x_2-z_2)^2}{2\sigma^2}) exp(?2σ2(x1??z1?)2+(x2??z2?)2?)的形式,也就是我們不用知道中間映射后的坐標,而可以直接計算 exp ? ( ? ( x 1 ? z 1 ) 2 + ( x 2 ? z 2 ) 2 2 σ 2 ) \exp(-\frac{(x_1-z_1)^2+(x_2-z_2)^2}{2\sigma^2}) exp(?2σ2(x1??z1?)2+(x2??z2?)2?)。