模式識(shí)別線性判別函數(shù)與分類(lèi)器設(shè)計(jì)_第1頁(yè)
模式識(shí)別線性判別函數(shù)與分類(lèi)器設(shè)計(jì)_第2頁(yè)
模式識(shí)別線性判別函數(shù)與分類(lèi)器設(shè)計(jì)_第3頁(yè)
模式識(shí)別線性判別函數(shù)與分類(lèi)器設(shè)計(jì)_第4頁(yè)
模式識(shí)別線性判別函數(shù)與分類(lèi)器設(shè)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章線性判別函數(shù)與線性分類(lèi)器設(shè)計(jì)判別函數(shù)

線性判別函數(shù)線性判別函數(shù)的性質(zhì)線性分類(lèi)器設(shè)計(jì)梯度下降法—迭代法感知器法最小平方誤差準(zhǔn)則(MSE法)---非迭代法Fisher分類(lèi)準(zhǔn)則假設(shè)對(duì)一模式X已抽取n個(gè)特征,表示為:模式識(shí)別問(wèn)題就是根據(jù)模式X的n個(gè)特征來(lái)判別模式屬于ω1,ω2,

…,

ωm類(lèi)中的那一類(lèi)?!?.1判別函數(shù)

例如右上圖:三類(lèi)的分類(lèi)問(wèn)題,它們的邊界線就是一個(gè)判別函數(shù)用判別函數(shù)進(jìn)行模式分類(lèi),取決兩個(gè)因素:判別函數(shù)的幾何性質(zhì):線性與非線性判別函數(shù)的參數(shù)確定:判別函數(shù)形式+參數(shù)判別函數(shù)包含兩類(lèi)一類(lèi)是線性判別函數(shù)線性判別函數(shù):線性判別函數(shù)是統(tǒng)計(jì)模式識(shí)別的基本方法之一,簡(jiǎn)單且容易實(shí)現(xiàn)廣義線性判別函數(shù)所謂廣義線性判別函數(shù)就是把非線性判別函數(shù)映射到另外一個(gè)空間(高維)變成線性判別函數(shù)分段線性判別函數(shù)另一類(lèi)是非線性判別函數(shù)§2.2

線性判別函數(shù)現(xiàn)在對(duì)兩類(lèi)問(wèn)題和多類(lèi)問(wèn)題分別進(jìn)行討論:一、兩類(lèi)問(wèn)題:即:

1.二維情況:取兩個(gè)特征向量這種情況下判別函數(shù):在兩類(lèi)別情況,判別函數(shù)g

(x)

具有以下性質(zhì):這是二維情況下判別由判別邊界分類(lèi)。情況如圖:2.n維情況:現(xiàn)抽取n個(gè)特征為:判別函數(shù):

另外一種表示方法:模式分類(lèi):當(dāng)g1(x)=WTX=0為判別邊界。當(dāng)n=2時(shí),二維情況的判別邊界為一直線。當(dāng)n=3時(shí),判別邊界為一平面。當(dāng)n>3時(shí),則判別邊界為一超平面。1.第一種情況:每一模式類(lèi)與其它模式類(lèi)間可用單個(gè)判別平面把一個(gè)類(lèi)分開(kāi)。這種情況,M類(lèi)可有M個(gè)判別函數(shù),且具有以下性質(zhì):二、對(duì)于多類(lèi)問(wèn)題模式有ω1,ω2,…,ωm

個(gè)類(lèi)別,可分三種情況:此情況可理解為兩分法。

下圖所示,每一類(lèi)別可用單個(gè)判別邊界與其它類(lèi)別相分開(kāi)。如果一模式X屬于ω1,則由圖可清楚看出:這時(shí)g1(x)>0而g2(x)<0

,g3(x)<0

。ω1

類(lèi)與其它類(lèi)之間的邊界由g1(x)=0確定。例:已知三類(lèi)ω1,ω2,ω3的判別函數(shù)分別為:因此,三個(gè)判別邊界為:作圖如下:

對(duì)于任一模式X如果它的g1(x)>0,g2(x)<0,g3(x)<0,則該模式屬于ω1類(lèi)。相應(yīng)ω1類(lèi)的區(qū)域由直線-x2+1=0

的正邊、直線-x1+x2-5=0

和直線-x1+x2=0的負(fù)邊來(lái)確定。必須指出,如果某個(gè)X使二個(gè)以上的判別函數(shù)gi(x)>0。則此模式X就無(wú)法作出確切的判決。如圖中IR1,IR3,IR4區(qū)域。另一種情況是IR2區(qū)域,判別函數(shù)都為負(fù)值。IR1,IR2,IR3,IR4。都為不確定區(qū)域。問(wèn)當(dāng)x=(x1,x2)T=(6,5)T時(shí)屬于那一類(lèi)結(jié)論:

g1(x)<0,g2(x)>0,g3(x)<0所以它屬于ω2類(lèi)這樣有M(M_1)/2個(gè)判別平面。對(duì)于兩類(lèi)問(wèn)題,M=2,則有一個(gè)判別平面。同理,三類(lèi)問(wèn)題則有三個(gè)判別平面。判別函數(shù):判別邊界:判別條件:第二種情況:每個(gè)模式類(lèi)和其它模式類(lèi)間可分別用判別平面分開(kāi),一個(gè)判別界面只能分開(kāi)兩個(gè)類(lèi)別,不一定能把其余所有的類(lèi)別分開(kāi);這種情況可理解為二分法。判別函數(shù)性質(zhì):假設(shè)判別函數(shù)為:判別邊界為:用方程式作圖:?jiǎn)?未知模式X=(x1,x2)T=(4,3)T屬于那一類(lèi)?代入判別函數(shù)可得:把下標(biāo)對(duì)換可得:因?yàn)榻Y(jié)論:所以X屬于ω3類(lèi)結(jié)論:判別區(qū)間增大,不確定區(qū)間減小,比第一種情況小的多。第三種情況:判別函數(shù):

判別規(guī)則:判別邊界:gi(x)=gj(x)或gi(x)-gj(x)=0說(shuō)明:就是說(shuō),要判別模式X屬于那一類(lèi),先把X代入M個(gè)判別函數(shù)中,判別函數(shù)最大的那個(gè)類(lèi)別就是X所屬類(lèi)別。類(lèi)與類(lèi)之間的邊界可由gi(x)=gj(x)或gi(x)-gj(x)=0來(lái)確定。每類(lèi)都有一個(gè)判別函數(shù),存在M個(gè)判別函數(shù),這種情況可理解為無(wú)不確定區(qū)的二分法。右圖所示是M=3的例子。對(duì)于ω1類(lèi)模式,必然滿足g1(x)>g2(x)

和g1(x)>g3(x)

。假設(shè)判別函數(shù)為:則判別邊界為:結(jié)論:不確定區(qū)間沒(méi)有了,所以這種是最好情況。用上列方程組作圖如下:?jiǎn)柤僭O(shè)未知模式x=(x1,x2)T=(1,1)T

,則x屬于那一類(lèi)。把它代入判別函數(shù):得判別函數(shù)為:因?yàn)樗阅J絰=(1,1)T屬于類(lèi)。關(guān)于線性判別函數(shù)的結(jié)論:模式類(lèi)別若可用任一線性判別函數(shù)來(lái)劃分,這些模式就稱為線性可分;一旦線性判別函數(shù)的參數(shù)確定,這些函數(shù)即可作為模式分類(lèi)的基礎(chǔ)。對(duì)于M(M≥2)類(lèi)模式分類(lèi),第一、三種情況需要M個(gè)判別函數(shù),第二種情況需要M(M-1)/2個(gè)判別函數(shù)。對(duì)于第一種情況,每個(gè)判別函數(shù)都要把一種類(lèi)別(比如i類(lèi))的模式與其余M-1種類(lèi)別的模式劃分開(kāi),而不是僅將一類(lèi)與另一類(lèi)劃分開(kāi)。實(shí)際上,一個(gè)類(lèi)的模式分布要比M-1類(lèi)模式分布更聚集,因此后兩種情況實(shí)現(xiàn)模式線性可分的可能性要更大一些。§2.3廣義線性判別函數(shù)研究動(dòng)機(jī)線性判別函數(shù)簡(jiǎn)單,容易實(shí)現(xiàn);非線性判別函數(shù)復(fù)雜,不容易實(shí)現(xiàn);若能將非線性判別函數(shù)轉(zhuǎn)換為線性判別函數(shù),則有利于模式分類(lèi)的實(shí)現(xiàn)。基本思想設(shè)一模式集{x},在模式空間x中線性不可分,但在模式空間x*中線性可分,其中x*的各個(gè)分量是x的單值實(shí)函數(shù),x*的維數(shù)k高于x的維數(shù)n,即

x*=(f1(x),f2(x),….,fk(x)),k>n

則分類(lèi)界面在x*空間是線性的,在x空間是非線性的,此時(shí)只要將模式x進(jìn)行非線性變換,使之變換后得到維數(shù)更高的模式x*,就可用線性判別函數(shù)進(jìn)行分類(lèi)。廣義線性判別函數(shù)若將非線性判別函數(shù)表示為:式中是模式x的單值函數(shù),若定義成廣義形式:其中,,且于是,有由此可知,非線性判別函數(shù)已變換成線性,稱為廣義線性判別函數(shù)。廣義線性判別函數(shù)的意義線性的判別函數(shù):若fi(x)=ax+b是一次函數(shù),這相當(dāng)于把x空間進(jìn)行了尺度放縮和平移。fi(x)選用二次多項(xiàng)式函數(shù):對(duì)于二維情況:模式空間為,原判別函數(shù)為:可線性化為:其中對(duì)于n維情況,則有式中各項(xiàng)的組成包括x各個(gè)分量的二次項(xiàng)、一次項(xiàng)和wn+1項(xiàng),其總項(xiàng)數(shù)為顯然,x*的維數(shù)比x高,w分量的數(shù)目亦與x*的維數(shù)相同。x*的各分量的一般式為fi(x)為r次多項(xiàng)式函數(shù),x是n維的情況,則于是,判別函數(shù)g(x)可按如下遞推:討論:(1)g(x)的總項(xiàng)數(shù)為:

顯然,Nw隨r和n的增加會(huì)迅速增大,即使原來(lái)模式x的維數(shù)不高,若采用次數(shù)r較高的多項(xiàng)式來(lái)變換,也會(huì)使變換后的模式x*的維數(shù)很高,給分類(lèi)帶來(lái)很大困難(稱為維數(shù)災(zāi)難)。實(shí)際上,一般r只取2。(2)采用二次多項(xiàng)式函數(shù)fi(x)的判別函數(shù)也可用矩陣形式表示:式中,A為實(shí)對(duì)稱矩陣。判別界面的幾何形狀由矩陣A決定:若A=I,則判別函數(shù)為超球面;若A為正定,則判別函數(shù)為超橢球面,軸方向?yàn)锳的本征向量方向;A為半正定,判別函數(shù)為超橢圓柱面;A為不定,判別函數(shù)為超雙曲面體?!?.3線性判別函數(shù)的性質(zhì)一、模式空間與加權(quán)空間:模式空間:由構(gòu)成的n維歐氏空間,增廣形式為。W是此空間的加權(quán)向量,它決定模式的分界面H,W與H正交。加權(quán)空間:以為變量構(gòu)成的歐氏空間模式空間與加權(quán)空間的幾何表示如下圖:加權(quán)空間構(gòu)造為:設(shè)是加權(quán)空間分界面上的一點(diǎn),代入上式得:對(duì)于一兩類(lèi)問(wèn)題:對(duì)于樣本x1、x2、x3、x4,可知g(x1)=g

(x2)=g

(x3)=g

(x4)=0,可分別作出通過(guò)加權(quán)空間原點(diǎn)的其他平面。這是一個(gè)不等式方程組,它的解處于由ω1類(lèi)所有模式?jīng)Q定的平面的正邊和由ω2類(lèi)所有模式?jīng)Q定的平面的負(fù)邊,它的解區(qū)即為凸多面錐。加權(quán)空間的性質(zhì):加權(quán)空間的所有分界面都通過(guò)坐標(biāo)原點(diǎn)。在三維空間里,令w3=0,則為二維權(quán)空間。如圖:給定一個(gè)模式X,就決定一條直線:即分界面H,W與H正交,W稱為解向量。解向量的變動(dòng)范圍稱為解區(qū)。因x1,x2∈ω1,x3,x4∈ω2由圖可見(jiàn)x1,x3離的最近,所以分界面H可以是x1,x3之間的任一直線,由垂直于這些直線的W就構(gòu)成解區(qū),解區(qū)為一扇形平面,即陰影區(qū)域。如右圖:二、解向量和解區(qū)分界面H把不等式方程正規(guī)化:正規(guī)化:H分界面樣本的正規(guī)化,令:由此可見(jiàn),可以不管樣本原來(lái)的類(lèi)別標(biāo)識(shí),只要找到一個(gè)對(duì)全部樣本都滿足的權(quán)向量即可,叫做正規(guī)化增廣樣本向量。g(x)=WTX=0決定一個(gè)決策界面,當(dāng)g(x)為線性時(shí),該決策界面是一超平面H,有以下性質(zhì):性質(zhì)①:W與H正交(如圖所示)假設(shè)x1,x2是H上的兩個(gè)向量所以W與(x1-x2)

垂直,即W與H正交。

三、超平面的幾何性質(zhì)Ω1Ω2g(x)>0g(x)<0說(shuō)明:一般說(shuō),超平面H把特征空間分成兩個(gè)半空間。即Ω1,Ω2空間,當(dāng)x在Ω1空間時(shí)g(x)>0,W指向Ω1,為H的正側(cè),反之為H的負(fù)側(cè)。

矢量到H的正交投影與值成正比其中:xp是x在H

的投影向量,r是x

到H

的垂直向量。是W方向的單位向量。性質(zhì)②:另一方面:這是超平面的第二個(gè)性質(zhì):矢量x到超平面的正交投影正比與g(x)的函數(shù)值。性質(zhì)③:性質(zhì)④:

§2.4線性分類(lèi)器的設(shè)計(jì)

上面我們討論的線性判別函數(shù)形式為:g(x)=WTX

其中:X=(X1,X2…Xn)n維特征向量

W=(W1,W2…

Wn,Wn+1)n維權(quán)向量

通常通過(guò)特征抽取可以獲得n維特征向量,而n維權(quán)向量是要按某種準(zhǔn)則(準(zhǔn)則函數(shù))求解的。求解權(quán)向量的過(guò)程就是分類(lèi)器的訓(xùn)練過(guò)程,使用已知類(lèi)別的有限學(xué)習(xí)樣本來(lái)獲得分類(lèi)器的權(quán)向量被稱為有監(jiān)督的分類(lèi)。設(shè)計(jì)線性分類(lèi)器的主要步驟:(1)收集一組具有類(lèi)別標(biāo)識(shí)的樣本。若把每個(gè)樣本看成確定的觀測(cè)值,則這組樣本稱為確定性樣本集;若把每個(gè)樣本看成隨機(jī)變量,則這組樣本稱為隨機(jī)樣本集。(2)根據(jù)實(shí)際情況確定一個(gè)準(zhǔn)則函數(shù)J。J必須滿足:a)J是樣本集X和、的函數(shù);b)J的值反映分類(lèi)器的性能,其極值解對(duì)應(yīng)于“最好”的決策。(3)用最優(yōu)化技術(shù)求出準(zhǔn)則函數(shù)的極值解,。權(quán)向量的訓(xùn)練過(guò)程:利用已知類(lèi)別學(xué)習(xí)樣本來(lái)獲得權(quán)向量的訓(xùn)練過(guò)程如下:已知x1∈ω1,通過(guò)檢測(cè)調(diào)整權(quán)向量,最終使x1∈ω1已知x2∈ω2,通過(guò)檢測(cè)調(diào)整權(quán)向量,最終使x2∈ω2這樣就可以通過(guò)有限的樣本去決定權(quán)向量。>0x∈ω1

<0x∈ω2

x1x2…….xn1

w1

w2

wn

wn+1∑

測(cè)試統(tǒng)計(jì)與訓(xùn)練準(zhǔn)則

W1X1

W2X2

WnXn

Wn+1g(x)=wTx

已知類(lèi)別利用方程組來(lái)求解權(quán)向量對(duì)二類(lèi)判別函數(shù)g(x)=w1x1+w2x2+w3已知訓(xùn)練集:Xa,Xb,Xc,Xd且當(dāng)(Xa,Xb)∈W1時(shí)

g(x)>0

當(dāng)(Xc,Xd)∈W2時(shí)

g(x)<0設(shè)Xa=(X1a,X2a)TXb=(X1b,X2b)TXc=(X1c,X2c)TXd=(X1d,X2d)T判別函數(shù)可聯(lián)立成:

x1aw1+x2aw2+w3>0①

x1bw1+x2bw2+w3>0②

x1cw1+x2cw2+w3<0③

x1dw1+x2dw2+w3<0④

求出w1,w2,w3

將③④式正規(guī)化,得

-X1cW1-X2cW2-W3>0-X1dW1-X2dW2-W3>0所以g(x)=WTX>0

其中W=(W1,W2,W3)T

為各模式增1矩陣

為N*(n+1)矩陣N為樣本數(shù),n為特征數(shù)啟迪:認(rèn)知小樣本和高維特征空間的矛盾

由此可見(jiàn):訓(xùn)練過(guò)程就是對(duì)已知類(lèi)別的樣本集求解權(quán)向量W,這是一個(gè)線性聯(lián)立不等式方程組求解的過(guò)程。求解時(shí):①只有對(duì)線性可分的問(wèn)題,g(x)=WTX才有解②聯(lián)立方程的解是非單值,在不同條件下,有不同的解,所以就產(chǎn)生了求最優(yōu)解的問(wèn)題③求解W的過(guò)程就是訓(xùn)練的過(guò)程。訓(xùn)練方法的共同點(diǎn)是:先給出準(zhǔn)則函數(shù),再尋找使準(zhǔn)則函數(shù)趨于極值的優(yōu)化算法。不同的算法有不同的準(zhǔn)則函數(shù)。同時(shí),算法可以分為迭代法和非迭代法。

一、梯度下降法—迭代法基本思路:欲對(duì)不等式方程組WTX>0求解,首先定義準(zhǔn)則函數(shù)(目標(biāo)函數(shù))J(W),再求J(W)的極值使W優(yōu)化。因此,求解權(quán)向量的問(wèn)題就轉(zhuǎn)化為對(duì)一標(biāo)量函數(shù)求極值的問(wèn)題。解決此類(lèi)問(wèn)題的方法是梯度下降法?;痉椒ǎ壕褪菑钠鹗贾礧1開(kāi)始,算出W1處目標(biāo)函數(shù)的梯度矢量▽J(W1),則下一步的W2值為:

W2=W1-ρ1▽J(W1)W1為起始權(quán)向量,ρ1為迭代步長(zhǎng)J(W)為目標(biāo)函數(shù)▽J(W1)為W1處的目標(biāo)函數(shù)的梯度矢量在第K步的時(shí)候:

Wk+1=Wk-ρk▽J(Wk)這就是梯度下降法的迭代公式。這樣一步步迭代就可以收斂于解矢量,步長(zhǎng)ρk取值很重要。關(guān)于步長(zhǎng)ρk討論:(1)ρk太大,迭代太快,引起振蕩,甚至發(fā)散;(2)ρk太小,迭代太慢。結(jié)論:應(yīng)該選最佳ρk。選最佳ρk:目標(biāo)函數(shù)J(W)二階Taylor級(jí)數(shù)展開(kāi)式為J(W)≈J(Wk)+▽JT(W-Wk)+(W-Wk)TD(W-Wk)T/2①其中D為當(dāng)W=Wk時(shí)J(W)的二階偏導(dǎo)數(shù)矩陣

將W=Wk+1=Wk-ρk▽J(Wk)代入①式得:

J(Wk+1)≈J(Wk)-ρk||▽J||2+ρk2▽JTD▽J

其中▽J=▽J(Wk)

對(duì)ρk求導(dǎo)數(shù),并令導(dǎo)數(shù)為零,則最佳步長(zhǎng)為

ρk=||▽J||2/▽JTD▽J稱為Hessian矩陣若令W=Wk+1上式為J(Wk+1)=J(Wk)+▽JT(Wk+1-Wk)+(Wk+1-Wk)TD(Wk+1-Wk)T/2對(duì)Wk+1求導(dǎo),并令導(dǎo)數(shù)為零可得:最佳迭代公式:Wk+1=Wk-D-1▽J—牛頓法的迭代公式

D-1是D的逆陣討論:牛頓法比梯度法收斂的更快,但是D的計(jì)算量大并且要計(jì)算D-1。當(dāng)D為奇異時(shí),無(wú)法用牛頓法。二、感知器法感知器的原理結(jié)構(gòu)為:“感知器”是借于上世紀(jì)五六十年代人們對(duì)一種分類(lèi)學(xué)習(xí)機(jī)模型的稱呼,源于對(duì)生物智能的仿生學(xué)領(lǐng)域?;舅悸罚和ㄟ^(guò)對(duì)W的調(diào)整,可實(shí)現(xiàn)判別函數(shù):

g(x)=WTX>RT其中RT為響應(yīng)閾值定義感知準(zhǔn)則函數(shù)準(zhǔn)則:只考慮錯(cuò)分樣本定義:,其中X0為錯(cuò)分樣本當(dāng)分類(lèi)發(fā)生錯(cuò)誤時(shí)就有WTX<0,或-WTX>0,所以J(W)總是正值,錯(cuò)誤分類(lèi)愈少,J(W)就愈小。理想情況為,即求最小值的問(wèn)題。求最小值,對(duì)W求梯度代入迭代公式中Wk+1=Wk-ρk▽J

由J(W)經(jīng)第K+1次迭代時(shí),J(W)趨于0,收斂于所求的W值。W的訓(xùn)練過(guò)程:例如:x1,x2,x3∈ω1作

x1,x3的垂直線可得解區(qū)(如圖)

。假設(shè)起始權(quán)向量w1=0,步長(zhǎng)ρk=1:1.x1,x2,x3三個(gè)矢量相加得矢量2,垂直于矢量2的超平面H將x3錯(cuò)分;2.x3與矢量2相加得矢量3,垂直于矢量3的超平面H1,將x1錯(cuò)分;3.依上法得矢量4,垂直于矢量4做超平面,H2將x3錯(cuò)分;4.x3與矢量4相加得矢量5,矢量5在解區(qū)內(nèi),垂直于矢量5的超平面可以把x1,x2,x3分成一類(lèi)。x1x2x32H3H14H25W區(qū)間如果樣本進(jìn)行正則化處理,情況為何?感知器算法:

1.錯(cuò)誤分類(lèi)修正wk

如wkTx≤0并且x∈ω1wk+1=wk+ρkx

如wkTx≥0并且x∈ω2

wk+1=wk-ρkx2.正確分類(lèi)

,wk不修正如wkTx>0并且x∈ω1

如wkTx<0并且x∈ω2

wk+1=wk

+-Hwk+1ρkxwk權(quán)值修正過(guò)程賞罰概念:感知器算法顯然是一種賞罰過(guò)程。對(duì)正確分類(lèi)的模式則“賞”(此處用“不罰”,即權(quán)向量W不變);對(duì)錯(cuò)誤分類(lèi)的模式則“罰”,使W加上一個(gè)正比于錯(cuò)誤模式樣本X的分量。ρk選擇準(zhǔn)則:①

固定增量原則ρk固定非負(fù)數(shù)

絕對(duì)修正規(guī)則ρk>

③部分修正規(guī)則ρk=λ0<λ≤2例題:有兩類(lèi)樣本:ω1=(x1,x2)={(1,0,1),(0,1,1)},ω2=(x3,x4)={(1,1,0),(0,1,0)}

解:先求四個(gè)樣本的增值模式

x1=(1,0,1,1)x2=(0,1,1,1)x3=(1,1,0,1)x4=(0,1,0,1)

假設(shè)初始權(quán)向量w1=(1,1,1,1)ρk=1

第一次迭代:

w1Tx1=(1,1,1,1)(1,0,1,1)T=3>0所以不修正

w1Tx2=(1,1,1,1)(0,1,1,1)T=3>0所以不修正

w1Tx3=(1,1,1,1)(1,1,0,1)T=3>0所以修正w1w2=w1-x3=(0,0,1,0)w2Tx4=(0,0,1,0)T(0,1,0,1)=0所以修正w2w3=w2-x4=(0,-1,1,-1)

第一次迭代后,權(quán)向量w3=(0,-1,1,-1),再進(jìn)行第2,3,…次迭代,如下表:

直到在一個(gè)迭代過(guò)程中權(quán)向量相同,訓(xùn)練結(jié)束。

w6=w=(0,1,3,0),判別函數(shù)g(x)=-x2+3x3感知器算法只對(duì)線性可分樣本有收斂的解,對(duì)非線性可分樣本集會(huì)造成訓(xùn)練過(guò)程的振蕩,這是它的缺點(diǎn)。

訓(xùn)練樣本wkTx修正式修正后的權(quán)值wk+1迭代次數(shù)x11011x20111x31101x40101+++0w1w1w1-x3w2-x41111111100100–11-1

1x11011x20111x31101x401010+0-w3+x1w4w4-x3w51–1201–1200–22–10–22-1

2x11011x20111x31101x40101+---w5w5+x2w6w60–22–10–1300–1300–130

3x11011x20111x31101x40101++--w6w6w6w60–1300–1300–1300–130

4三、最小平方誤差準(zhǔn)則-非迭代法

前面我們討論的線性分類(lèi)器訓(xùn)練方法,其共同點(diǎn)是企圖找一個(gè)權(quán)向量W,使錯(cuò)分樣本最小?,F(xiàn)在我們把不等式組變成如下形式:WTXi=bi>0

則有聯(lián)立方程XW=b這是矛盾方程組,方程數(shù)大于未知數(shù),所以沒(méi)有精確解的存在。每個(gè)樣本有n個(gè)特征定義誤差向量:e=XW-b≠0把平方誤差作為目標(biāo)函數(shù)

W的優(yōu)化就是使J(W)最小。于是,求J(W)的梯度并令其為0,即解上方程得XTXW=XTb這樣把求解XW=b的問(wèn)題,轉(zhuǎn)化為對(duì)XTXW=XTb求解,這樣最大好處是:因XTX是方陣且通常是非奇異的,所以可以得到W的唯一解。

MSE準(zhǔn)則函數(shù)

選取合適的b,只要計(jì)算出X+就可以得到W。若取b:

此時(shí),最小平方誤差法同F(xiàn)isher法是一致(見(jiàn)邊肇祺書(shū)102頁(yè))。(MSE解)其中N/N1有N1個(gè),N/N2有N2個(gè)四、Fisher分類(lèi)準(zhǔn)則

現(xiàn)在討論通過(guò)映射投影來(lái)降低維數(shù)的方法。

X空間

映射Y空間:把X空間各點(diǎn)投影到Y(jié)空間的一直線上,維數(shù)由2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論