SVM理論與算法分析

上傳人：飛*** IP屬地：河北上傳時(shí)間：2025-12-18 格式：PDF 頁(yè)數(shù)：15 大?。?.55MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩10頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

硬間隔線性支撐向量機(jī)

假設(shè)給定一個(gè)特征空間上的訓(xùn)練數(shù)據(jù)集：

T={Gi,yD,62,丫2),…，(XNJN)}

其中，XjGRzYie(+l,-l),i=1,2,…,N,Xj為第i個(gè)特征向量或?qū)嵗?%為%的類標(biāo)記，當(dāng)y=1時(shí)，稱Xj為

正例，當(dāng)力=-1時(shí)，稱片為負(fù)例；',力)為樣本點(diǎn)。

假設(shè)訓(xùn)練數(shù)據(jù)集是線性可分的(存在硬間隔)，那么學(xué)習(xí)的目標(biāo)是在特征空間找到一個(gè)分別超平面，能將實(shí)

例分到不同的類。分別超平面方程w-x+b=O,它由法向量W和截距b確定，可用(w,b)表示。分別超平面

將特征空間分為兩部分，一部分是三類，一部分是負(fù)類。法向量指向的一側(cè)為正類，另一側(cè)是負(fù)類。

一般地，當(dāng)訓(xùn)練數(shù)據(jù)集線性可分時(shí)，存在無窮個(gè)分別超平面可將兩類數(shù)據(jù)正確分開,感知機(jī)利用誤分類最小

的策略，求得分別超平面，不過這是的解有無窮多。線性可分支撐向量機(jī)利用間隔最大化求最優(yōu)分別超平面，

解唯一。

一、模型推導(dǎo)

L函數(shù)間隔：一般來說,一個(gè)點(diǎn)距離分別超平面的遠(yuǎn)近可以表示分類預(yù)料的確信程度。在超平面w?x+b=0

確定的狀況下，|w?x+b|能夠相對(duì)地表示(留意：真實(shí)距離為野手)點(diǎn)x距離超平面的遠(yuǎn)近.而w?x+b的

IWII

符號(hào)與類標(biāo)記y的符號(hào)是否一樣能夠表示分類是否正確。所以可用標(biāo)量y(w-x+b)來表示分類的正確性及確信

度，值為正表示分類正確，值為負(fù)表示分類錯(cuò)誤"

超平猷w,b)關(guān)于樣本版X,,y、的函數(shù)間隔為:

Yi=yj(w-Xj+b)

超平面叫切關(guān)于訓(xùn)練數(shù)據(jù)集T的函數(shù)間隔：

Y=min%=minVj(w-x；+b)

i=l,2,...,Ni=l,2，…,N

2.幾何間隔：函數(shù)間隔可以表示分類預(yù)料的正確性及確信度，但是選擇分別超平面時(shí)，只有函數(shù)間隔還不夠。

因?yàn)橹灰杀壤刈兏黽和b,雖然超平面并沒有變更，但函數(shù)間隔(它是(w,b)的線性函數(shù))卻依原比例同

等變更。為了將(w,b)表示的超平面的唯Tt,即每個(gè)超平面對(duì)應(yīng)Rn+1中的唯一向量(w,b),可以對(duì)法向量W

加以規(guī)范化約束IIW11=1,這時(shí)函數(shù)間隔稱為幾何間隔。

超平躍w,b)關(guān)于樣本虱A,y、的幾何間隔為:

Yi_/wb\

丫戶而"隊(duì)而小+而)

超平面w,b)關(guān)于訓(xùn)練數(shù)據(jù)集T的幾何間隔為:

丫=口萼%-=用%力(高?*+島)

3.間隔最大化

支撐向量機(jī)學(xué)1習(xí)的基本想法是求解能夠正確劃分訓(xùn)練數(shù)據(jù)集并且?guī)缀伍g隔最大的分別超平面。對(duì)于線性可分

的訓(xùn)練數(shù)據(jù)集而言，線性可分分別超平面有無窮多個(gè),每一個(gè)都是一個(gè)感知機(jī)，但是幾何間隔最大的分別超

平面時(shí)唯一的。

間隔最大化的直觀說明是：對(duì)訓(xùn)練數(shù)據(jù)集找到幾何間隔最大的超平面意味著以充分大的卻新都對(duì)訓(xùn)練數(shù)據(jù)進(jìn)

行分類。也就是說，不僅將正負(fù)實(shí)例點(diǎn)要分開，而且對(duì)最難分的實(shí)例點(diǎn)(離超平面最近的點(diǎn))也有足夠多大

的確信度將它們分開。

因此所要優(yōu)化的問題表示為：

max丫

改寫為,

max-——-

w.b||W||

s.t.yj(w-Xj+b)>y,i=1,2,N

y的取值不影響最優(yōu)化問題的解(假如w,b?是最優(yōu)解，那么入w?，入b?也是最優(yōu)解，因此y是變動(dòng)的可以取到隨

意值，假如固定y,w*,b?也就變得唯一了)，令？=1,等價(jià)變換為，

max--------

w,b||W||

s.t.yj(w-Xj4-b)>1,i=1,2,...,N

(目標(biāo)函數(shù)是支撐間隔，約束是樣本點(diǎn)在間隔邊界或外側(cè)，目標(biāo)是找尋支撐向量使得間隔最大化)等價(jià)變換

為(標(biāo)準(zhǔn)無等式約束的凸二次規(guī)劃，這是為了運(yùn)算便利)，

min-IIwII2

s.t.1—yj(w,Xj+b)<0,i=1,2,N

凸二次規(guī)劃問題存在全局最優(yōu)解w?力?。

(4)分別超平面與分類決策函數(shù)

分別超平面:

w*?x+b"=0

分類決策函數(shù):

f(x)=sign(w*,x+b*)

(5)支撐向量與間隔邊界

在線性可分狀況下，訓(xùn)練數(shù)據(jù)集的樣本點(diǎn)中與分別超平面距離最近的樣本點(diǎn)的實(shí)例稱為支撐向量，支撐向量

是使約束條件等號(hào)成立的點(diǎn)，即1-%(w?為+b)=0,對(duì)于正例點(diǎn)，支撐向量在超平面w?*+b=1上，對(duì)

于負(fù)例點(diǎn)，支撐向量在超平面W?%+b=-1上，沒有實(shí)例點(diǎn)落在這兩個(gè)平行的超平面(間隔邊界)之間，

這兩個(gè)超平面之間的距離稱為間隔,它依靠于分別超平面的法向量W,等于扁。

在確定分別超平面時(shí)只有支持向量起作用，而其他實(shí)例點(diǎn)并不起作用。假如移動(dòng)支持向量將變更所求的解，

但是假如在間隔邊界以外移動(dòng)其他實(shí)例點(diǎn)，甚至去掉這些點(diǎn)，則解是不會(huì)變更的。明顯支撐向量是訓(xùn)練集中

重要的樣本。

二、模型求解

將原始問題轉(zhuǎn)化為L(zhǎng)agrange對(duì)偶問題,通過求解對(duì)偶問題來獲得原始問題的最優(yōu)解：對(duì)每個(gè)不等式約束引入

Lagrange乘子四，

1.Lagrange對(duì)偶函數(shù):

2-W(Xiyi(wXi+b)+W

L(w,b,a)=

i=li=l

其中a=...,0tN)T為拉格朗日乘子向量，四N0,i=1,2,...,NO

2.對(duì)偶問題：

maxminL(w,b,a)

aw,b

(1)求minL(w,b,a)

w,b

一W四%Xi

VwL(w,b,a)=w0

i=l

VL(w,b,a)=一26力=

i=l

得出

w=W四%

i=l

w四月=°

i=i

帶入拉格朗日函數(shù)，得出

NNN//N\\N

minL(w,b,a)四巧力竹??牛)一分四力|(W修).Xj+b)+乏%

i=lj=li=l\\j=l/Ii=l

1NNN

=一工W%咿yR,牛)+26

i=lj=li=l

(2)求maxminL(w,b,a)

aw,b

1NNN

-5WW%咿”(Xi,Xj)+W?i

(1=1j=li=l

s.t.W四0=0

i=l

?i>0,i=1,2,...?N

轉(zhuǎn)換為求微小

1NNN

^22%%片“(4.牛)一2

(i=lj=li=l

WSK=°

S.t.

i=l

?i>0,i=1,2,...,N

依據(jù)對(duì)偶理論，對(duì)上述對(duì)偶優(yōu)化存在，使W,b，是原始問題的解，a*感寸偶問題的解，因此求解原始問題,

可以轉(zhuǎn)化為求解對(duì)偶問題。

3.最優(yōu)解

依據(jù)KKT條件

Vw<L(w\b\a*)=w*一況143=0----------------------(a)

VyL(w*,b*,a*)=-Sili<Yi=0-----------------------------(b)

<(Yi(W-Xj+b*)-1)=0,i=1,2,...,N-----------------------------(C)

Yi(w*-X,4-b")-1>0,i=1,2,N----------------------------------(d)

a；>0,i=1,2，…，N----------------------------------------------------(e)

由(a)求得

i=l

其中至少有一個(gè)硫＞0（假如a*=0,那么w*=0,b，無解，明顯它不是原始最優(yōu)化問題的解），結(jié)合KKT

條件（C），得出

Yk(w*-xk+b*)-1=0

將w*帶入KKT條件，得出

兩邊同時(shí)乘以yk,由于（yk）?=1

軟間隔線性支撐向量機(jī)

一、模型推導(dǎo)

假如樣本集中存在特異點(diǎn)使得樣本集線性不行分，即不能滿意函數(shù)間隔大于等于1不等式約束條件，為了解

決這個(gè)問題，可以對(duì)每個(gè)樣本點(diǎn)(片，%)引入一個(gè)松弛變量4>0,使函數(shù)間隔加上松弛變量大于等于1.這樣

約束條件變?yōu)?/p>

yi(w*-i+b*)>l-5i

同時(shí)對(duì)每個(gè)松弛變量&,支付一個(gè)代價(jià)年,目標(biāo)函數(shù)變成

min-11w||2+eV國(guó)

w,bL乙，

i=l

這里，C>0稱為懲處參數(shù)，一般由應(yīng)用問題確定，c值大時(shí)對(duì)誤分類的懲處增大，C值小時(shí)對(duì)誤分類的懲處

減小。最小化上述目標(biāo)函數(shù)有兩層含義，要使的｝IIW||2盡量小即間隔盡量大，同時(shí)使的誤分類的點(diǎn)的個(gè)數(shù)盡

量小，C是調(diào)和二者的系數(shù)。這時(shí)的間隔稱為軟間隔，因?yàn)殚g隔內(nèi)含義特異點(diǎn)。

原始優(yōu)化問題：

min-||w||2+eV5

w.b2Z-j

i=l

s.t.1-5j-Yi(w?X)4-b)<0,i=1,2,...,N

>0,i=1,2，…,N

這仍是一個(gè)二次凸優(yōu)化，存在全局最優(yōu)解，W的解是唯一的，但b的解不唯一，b的解存在于一個(gè)區(qū)間。

二、庭求解

仍運(yùn)用Lagrange對(duì)偶方法求解

1.Lagrange函數(shù)

1NNN

L(w,b,$aM=彳Hw儼+CW8-￡ai(H(w?Xi+b)—1+&)—W內(nèi)七

i=li=li=l

其中，cqN0,內(nèi)N0。

2.對(duì)偶問題：

maxminL(w,b,ga,n)

apw,b，E

(1)求嬲L(w,b<a,p)

VwL(w,b,*a,p)=w一1四力x,=0

i=l

VbL(w,b,$a,u)=-Za.yi=0

i=l

V[L(w,b,a,p)=C-1T-aT-pT=0

得出

w=乏四力Xi

i=l

WotiYi=o

i=i

C-Qj—|lj=0

帶入拉格朗日函數(shù)，得出

minL(w,b,&aM=—?乏W叫與力"國(guó).Xj)+2四

i=lj=li=l

留意它與H無關(guān)。

(2)求maxminL(w,b,5,a,n)

aw,b，l

NNN

max一乏%%力力(、,’%)+W%

22i=l

stW%%=0

i=l

a,>0,i=1?2,...,N

Pi>0,i=

C—a；—|ij=0fi=1,2,...,N

消去內(nèi)，轉(zhuǎn)換為求微小

min

i=lj=li=l

S.t.WaiYi=0

i=l

ctj>0,i=1,2,...?N

0<aj<C

(3)最優(yōu)解

依據(jù)KKT條件

Vw*Mw*,b*I，a*N)=w*—優(yōu)=a；/Xi=0(a)

VbxL(w*,b*W,Q)=-型Ei=0------(b)

VvL(w*,b*,「a\n*)=C-l-a--p*=0--(c)

a；(yi(w*?Xj+b*)—1+《；)=0,i=1,2,...,N----------------(d)

癡后=0,i=l,2,...,N---------------------------------------(e)

>0,i=1,2,...,N------------------------------------------(f)

y.(w*?*+b*)-1+培N0,i=1,2,,N---------------------(g)

a*>0,i=1,2,...,N-----------------------------------------(h)

>0,i=1,2，…，N……--------------------------……——(i)

由(a)求得

w*=2^a；yixi

i=l

由(c)、(e)、(i)得出

(C-嗚崗=0

C-a；>0

再結(jié)合(f)得出

假如a；<C,那么尋=0；假如a：=C,^>0;................................(j)

由(d),(h)得出

假如a；>0,那么R(w*?Xj+b")-1+埼=0;假如嗚=0,y((w*?X]+b*)—1+*不確定；--------(k)

由(j),(k)得出

假如0Va；VC,那么百=0,yi(w-?Xi+b")-1+4=0,因此為(w*?Xi+b?)=1;

b*=ykXj)

j=i

由(j),(g)得出

假如a；=0,那么可=0,yi(w*X1+b*)>l；這說明Xi位于間隔邊界上或以外；

由⑴，(k)得出

假如a；=C,那么％(w*?與+b*)=1-Z0;

此種狀況下，進(jìn)一步探討：

假如￥=0,那么Xi在間隔邊界上；

假如0V<1,那么由分類正確，*在間隔邊界與分別超平面之間；

假如￥=I,那么Xi在分界面上；

假如K>1,那么Xi在分別超平面誤分一側(cè)；

因此可以看出，軟間隔的支撐向量(a；>0)*或者在間隔邊界上，或者在間隔邊界與分別超平面之間，或

者在分別超平面誤分一側(cè)。

3.支撐向量的另一種說明

最小化以下目標(biāo)函數(shù)：

，口-Yi(w-X,+b)]++A||w||

i=l

第一項(xiàng)是閱歷損失或閱歷風(fēng)險(xiǎn)，函數(shù)稱為合頁(yè)損失函數(shù)L(y(w-x+b))=[l-yi(w-xi+b)]+,下標(biāo)"+"表

示以下取正值得函數(shù)。

「1fzZ>0

[Z]+=10z<0

也就是說，當(dāng)樣本點(diǎn)被正確分類且函數(shù)間隔大于1時(shí),損失函數(shù)為0,否則(片為支撐向量時(shí))損失函數(shù)是

1-y4w?片+b),其次項(xiàng)是系數(shù)為4的w的L2范數(shù)，是正則化項(xiàng)；這兩種優(yōu)化是等價(jià)的(通過變量替換方

法)；

非線性支撐向量機(jī)

對(duì)于分類問題是非線性的（線性模型無法將正負(fù)實(shí)例正確分開），可以利用核技巧，進(jìn)行一個(gè)非線性變換，

將非線性問題變換為線性問題，通過解變換后的線性問題的方法求解原來的非線性問題。

用線性分類方法求解非線性分類問題問題分兩步：首先運(yùn)用一個(gè)變換將原空間的數(shù)據(jù)映射到新空間；然后再

新空間里用線性分類學(xué)習(xí)方法從訓(xùn)練數(shù)據(jù)中學(xué)習(xí)分類模型；

核技巧應(yīng)用到支持向量機(jī)，其基本思想：

通過一個(gè)非線性變換將輸入空間（歐氏空間R11或離散集合）對(duì)應(yīng)于一個(gè)特征空間（希爾伯特空間H）,

使得在輸入空間W中的超曲面模型對(duì)應(yīng)于特征空間H中的超平面模型（支撐向量機(jī)），這樣分類問題的學(xué)習(xí)

任務(wù)通過在特征空間中求解線性支撐向量機(jī)就可以完成。

一、非線性支撐向量機(jī)

在線性支撐向量機(jī)的對(duì)偶問題中,無論是目標(biāo)函數(shù)還是決策函數(shù)（分別超平面）都只涉及輸入實(shí)例與實(shí)

例之潮勺內(nèi)積,假如把這個(gè)內(nèi)積。?Xj看作是希爾伯特空間中的兩個(gè)特征的內(nèi)積蟻幻?（/）（%；）=K（"）=

A，Xj,其中X[=。（吟，xj=</>（%；）,那么對(duì)于在低維線性不行分的樣本氯X：,i=1,2，…,N],假如通過映

蝌變換到高維希爾伯特空恒心》,i=1,2，…,N）變得線性可分（假設(shè)能找到這樣的合適的映射g）z那么就可

以運(yùn)用核函數(shù)代替計(jì)算xa,這里Xj未知,但x]x；,K?，M）艮雙

運(yùn)用核函數(shù)后的對(duì)偶問題的目標(biāo)函數(shù)成為：

1NNN

W（a）=萬(wàn)｛W叫四力力K（Xi.x。一2四

i=lj=li=l

最優(yōu)解成為

W*=2^afYiXi

i=l

b=yk-^a；yjK（xj-xi）

j=i

分類決策函數(shù)成為

fM=signa；yiK（Xi-x）+bj

在實(shí)際應(yīng)用中，往往依靠領(lǐng)域?qū)W問干脆選擇核函數(shù):核函數(shù)選擇的有效性須要通過試驗(yàn)驗(yàn)證。

二、核函數(shù)方法

核函數(shù)：設(shè)X是輸入空間（歐氏空間Rn的子集或離散集合）,H為特征空間（希爾伯特空間），假如存在一

個(gè)從X到H的映射，

（|）（x）:X->H

使得對(duì)全部X,zEX,函數(shù)K（x,z）滿意條件

K（x,z）=6（x）?巾（z）

則稱K（x,z）為核函數(shù)，6（x）為映射函數(shù)，（|）（x）?巾（z）為（|）（x）和6（z）內(nèi)積；

（希爾伯特空間是完備化的內(nèi)積空間,其中的每個(gè)元素是一個(gè)向量（可以無窮維），向量之間定義有內(nèi)積運(yùn)

算,且空間關(guān)于內(nèi)積誘導(dǎo)出的范數(shù)是完備的）

核技巧的想法是：在學(xué)習(xí)與預(yù)料中只定義核函數(shù)K（x,z）,而不顯示地定義映射函數(shù)也，因?yàn)橥ǔ８纱嘤?jì)算

K（x,z）比較簡(jiǎn)潔,而通過Q（x）和0⑵計(jì)算K（x,z）并不簡(jiǎn)潔。留意，0（x）是輸入空間R11到特征空間H的映射，

特征空間HT殳是高維的，甚至是無窮維的。我們須要的是特征空間中兩個(gè)特征的內(nèi)積結(jié)果,而不是特征的

表丞j假如我們能通過簡(jiǎn)潔的函數(shù)K(x,z)得到巾(x)?巾⑵的內(nèi)積，那就簡(jiǎn)化了問題，不用考慮巾的形式，這正

是核函數(shù)的妙用之處。

對(duì)于給定的核函數(shù)K(x,z),特征空間H(希爾伯特子空間)和映射函數(shù)巾的取法不唯一，因?yàn)楹撕瘮?shù)給出

的是映射后的內(nèi)積結(jié)果，所選取的映射過程可能是不同的。

核函繳定定理：設(shè)K：XxXtR是對(duì)稱函數(shù)，則K(x,z)為正定核函數(shù)的充要條件是對(duì)隨意引€X,i=

1,2,…,m,K(x,z)對(duì)應(yīng)的Gram矩陣:K=[K6?內(nèi))mxm]是半正定的。

對(duì)于一個(gè)詳細(xì)函數(shù)K(x,z)來說，檢驗(yàn)它是否為正定核函數(shù)并不簡(jiǎn)潔，因?yàn)橐?duì)隨意有限輸入集驗(yàn)證K對(duì)應(yīng)

的Gram矩陣是否為半正定。在實(shí)際問題中往往應(yīng)用已有的核函數(shù)。

常用核函數(shù)：

(1)多項(xiàng)式核函數(shù)：K(x,z)=(x?z+1尸,對(duì)應(yīng)的支撐向量機(jī)是一個(gè)p次多項(xiàng)式分類器；

(2)高斯核函數(shù)：K(x,z)=exp(-甯)，對(duì)應(yīng)的支撐向量機(jī)是高斯徑向基函數(shù)分類器；

(3)字符串核函數(shù)：

1)基本定義：

有限字符表￡；

字符串s:s(l)s(2)...s(|s|)z字符串s的長(zhǎng)度|s|,空字符串長(zhǎng)度為0;

字符串連接：St,5和L分別是字符串；

長(zhǎng)度為n的字符串集合￡n；

全部字符串的集合：￡*=11二()即；

S的子串u:給定一個(gè)指標(biāo)序列i=1wii<i2<…<i|U|4⑸,u=s(i)=s(i1)s(i2)...s(i|U|),其

長(zhǎng)度記作I⑴=i|u|-h+1,假如i是連續(xù)的,則1。)=|u|；否則l(i)>|嘰

2)映射定義:

假設(shè)S是長(zhǎng)度大于或等于n字符串的集合,s是S的元素,建立字符串集合S到特征空間Hn=R曖的映射

6式S),RE”表示定義祗n卜的實(shí)數(shù)空間，其每一維對(duì)應(yīng)一個(gè)字符串ueXn,映射將字符串s對(duì)應(yīng)于空

間中R*的一個(gè)向量,其在u維上的取值為

[071(s)]〃=Si：S(i)=U^(0Z

這里,0<A<1是一個(gè)衰減參數(shù),1(。表示字符串i的長(zhǎng)度,求和在S中全部與u相同的子串上迸行。

說明：u代表維,如在字符串u維,明顯空間有腰維,每一維是字母表工上的一個(gè)長(zhǎng)度為n的字符串;

s(i)是表示通過指標(biāo)序列i,表示的一個(gè)s的子串，這個(gè)子串可以不連續(xù)；s(i)=u表示s的子串s(i)等于u;

l(i)是子串s(i)在s中的指標(biāo)序列i的最終一個(gè)重量減去第一個(gè)重量然后加一；

例子：假設(shè)Z為英文字符集，n為3,S為長(zhǎng)度大于或等于3的字符串集合，考慮將字符集S映射到特征空間

H3=產(chǎn)3,%的一維對(duì)應(yīng)于字符串a(chǎn)sd,這是，字符串"Nasdaq"在這一維上的值是[內(nèi)(Nasdaq)Kd=

只有T子串a(chǎn)sd,序號(hào)是234;字符串"lassdas"在這一維上的值是[加(lassdas)]asd=2A,因?yàn)橛袃?/p>

個(gè)asd,序號(hào)分別為236,246;

3)核函數(shù)

兩個(gè)字符創(chuàng)s和t的字符串核函數(shù)是基于映射的特征空間中的內(nèi)積：

kn(S,t)=如(S)]“血(￡)]〃=WW貂⑴

uernuern(ij)：s(i)=t(j)=u

它給出了字符串s和t中長(zhǎng)度等于n的全部子串組成的特征向量的余弦相像度.直觀上，兩個(gè)字符串相同的

子串越多，它們就越相像，字符串核函數(shù)的值就越大，字符串核函數(shù)可以由動(dòng)態(tài)規(guī)劃快速計(jì)算。

序列最小最優(yōu)化算法

支撐向量機(jī)的學(xué)習(xí)問題可以形式化為求解凸二次規(guī)劃問題，具有全局最優(yōu)解，并且有許多最優(yōu)化算法可以用

于求解這一問題。但是當(dāng)訓(xùn)練樣本容量很大時(shí),這些算法往往變得特別低效。序列最小最優(yōu)化算法，由Platt

在1998年提出，它是一種啟發(fā)式算法，相對(duì)上匕較高效。

SMO算法基本思路是：假如全部變量的解都滿意次最優(yōu)化問題的KKT條件，那么這個(gè)最優(yōu)化問題的解就得

到了，因?yàn)镵KT條件是該最優(yōu)化問題的充分必要條件,否則，選擇兩個(gè)變量，固定其他變量，針對(duì)這個(gè)兩個(gè)

變量構(gòu)建一個(gè)二次規(guī)劃問題，這個(gè)二次規(guī)劃問題關(guān)于這兩個(gè)變量的解應(yīng)當(dāng)更接近原始二次規(guī)劃問題的解，因

為這會(huì)使得原始二次規(guī)劃問題的目標(biāo)函數(shù)值變得更小。重要的是，這時(shí)子問題可以通過解析方法求解，子問

題有兩個(gè)變量，一個(gè)是違反KKT條件最嚴(yán)峻的那一個(gè)，另一個(gè)莊約束條件自動(dòng)確定-如此，算法將原問題不

斷分解為子問題并對(duì)子問題求解，進(jìn)而達(dá)到求解原問題的目的。

原始優(yōu)化問題：

min-||w||2+eV4

w,b，EZ乙」

i=l

s.tyj(w-X,+b)>1-,i=1,2,...,N

>0,i=1,2,N

對(duì)偶問題：

〔NNN

嗎“萬(wàn)2W四%力丫加收”牛)一￡四

i=lj=li=l

S.t.乏aiVi=0

i=l

0<Qj<C,i=1,2,...,N

子問題的兩個(gè)變量只有一個(gè)是自由變量，假設(shè)％,。2為兩個(gè)變量，固定。3，?4，…，?N，那么依據(jù)上面的等

式約束可知：

?1Y1=-2

i=3

由于yi*Yi=1/所以

=-YiW四%

i=2

假如確定，那么由也隨之確定，所以子問題中同時(shí)更新兩個(gè)變量。

優(yōu)化子問題：

SMO算法包含兩個(gè)部分：求解兩個(gè)兩個(gè)變量二次規(guī)劃的解析方法和選擇變量的啟發(fā)式方法。不失一般性，假

設(shè)選擇的兩個(gè)變量是,。2，其他變量。3，，…，ON固定，于是SMO的優(yōu)化問題的子問題可以寫成：

]]NN

minW(%,a?)=5Kna?+-K22a^+yiy2K12a1a2-+a2)+丫必'+y2c2[力四長(zhǎng)2

，a2i=3i=3

s.t.a1y1+a2y2=-^aiyi=<;

i=3

0<aj<C,i=1,2

其中,舊=K(Xj,Xj),ij=1,2，…,N,s是常數(shù)，目標(biāo)函數(shù)中省略了不含四,。2的常數(shù)項(xiàng)。

(1)求解兩變量二次規(guī)劃的解析方法：

■可行解范圍：

假設(shè)子問題的初始可行解為哨M,嗎”，最優(yōu)解為吧ew,anew,明顯最優(yōu)解受等式約束(直線約束)和

不等式約束(盒子約束)條件的限制：

0<嗎<C------------------------(a)

ew,dew

0<a?=y.一嗎ewy2yl=%(a；】dyi+a°y2)-agy2yi<C

化簡(jiǎn)為

ew,dew

0<a；ew=y遙_ajy2y1=a?+ag^yzYi—ctjy2y1<C

>假如y2=yi?那么

0<a?+叫Id-anew<c

a?,d+嗎E-C<嗎ew<a?Id+娉d-----------------------(b)

由(a),(b)得出：

假如y?=Yir那么L=max(0,a?,d+a?ld-C)<a^ew<min(a;,d+a^d,C)=H................(C)

>假如丫2工yi<那么

0<a?-嗎d+嗎ew<C

嗎Id_aold<anew<C_aold+aold.................(d)

由(a),(d)得出：

假如丫2#yi,那么L=max(O,a?ld-a?ld)<ajew<min(C-a?,d+砂,C)=H------------(e)

假如最優(yōu)解不在約束內(nèi)，必需被剪輯。假設(shè)在沿著約束方向a1yi+a2y2=q未經(jīng)剪輯時(shí)。2的最優(yōu)解為

a：w，unc；然后再求剪輯后的解嗎ew.

■下面忽視不等式約束，求取迭代解《""，UnC：

K22?2+y】y2K12%。2-（％+?2）+yi?i（金％四收1）

由于由yi=q-a2y2，得出

?iyiYi=（s-a2y2）y1

=（9-a2y2）y1

帶入目標(biāo)函數(shù)

W(a)=TK(^-ay)2+-Kai+yK(^-ay)a2~(＜；-?2y2)yi-?2+(，-a2y2)(2力5%1

2乙11乙222221222

\t=3

+y2a2(￡力四%2)

對(duì)。2求導(dǎo)

9W件鄧J+y2。力。得2)

旃=-y2Kli(S-a2y2)+K22a2+y2Kl2s-2Kl2a2+Y1Y2_1_Yz

=一丫2%遇+a2Kli+K22c2+y2Kl2S-2Kl2a2+YiYz-1一丫2(金力印打)+Vzgyi?jKJ

i=3

力哂，+y2力印，

=一丫2&1，+?2(K11+K22-2K12)+y2Kl2s+YiYz-1-Yz

=2(Kn+K22-2K12)-y2y2-y1+KU(；-K12＜；+

令其為0,得到

《ew,unc(K[]+_2Kl?)=y2y2.Yi+Ku,—K2S+

將,=a?,dy!+吟dy?帶入，得到

a廣u.K+K22-2K12)

?§y2+(g

ld,d工力。得2

=y2y2-yi+Ku。泮%+Kua§y2-K12a?yi-K12yj?iKii

i=3i=3

,dld

^YiOiKii-yia?Kn-y2a?K21

，d：d

y2y2-yi+K^a泮yi+Kua5y2-K12瞰yi-K12a?y2+

ld,d

-([Jyi?iKi2-yia?K12-y2a5K22

,d,d,dldld|

=y2y2-yi+Kna?yi+Kna5y2-占2?！毖?一K12a5y2-yia?Kn-y2a2＜2i

lc,d工力四％1-2%四s2

+y1a?K12+y2a5K22+

=1i=l

/NN

Y2-yi+(Kn+K22-2K12)a?y2+('力四K1一'為四K2

(\i=li=l

=(Ku+-2K12)+y21y2-y1+

K22吟日〉YiOtiKi!-y為四與2

,d2%四51一丫1

=(K11+K22-2K12)a?+y2yi?iKi2-y2

i=l

令Ei=鄧1*6。+b-力，i=1,2；其中鄧舊印舊+b是對(duì)輸入Xj的預(yù)料，因此Ej表示對(duì)輸入Xj的預(yù)料

與真實(shí)輸出力之差；那么

=(Li+K22

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

SVM理論與算法分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

SVM理論與算法分析

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔