版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
人工神經(jīng)網(wǎng)絡(luò)及其應(yīng)用
第6章 BP神經(jīng)網(wǎng)絡(luò)1神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu一、內(nèi)容回顧二、BP網(wǎng)絡(luò)三、網(wǎng)絡(luò)設(shè)計(jì)四、改進(jìn)BP網(wǎng)絡(luò)五、內(nèi)容小結(jié)內(nèi)容安排2神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu一、內(nèi)容回顧感知機(jī)自適應(yīng)線性元件3神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu一、內(nèi)容回顧感知機(jī)感知機(jī)簡介神經(jīng)元模型網(wǎng)絡(luò)結(jié)構(gòu)功能解釋學(xué)習(xí)和訓(xùn)練局限性自適應(yīng)線性元件4神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu一、內(nèi)容回顧感知機(jī)自適應(yīng)線性元件Adline簡介網(wǎng)絡(luò)結(jié)構(gòu)網(wǎng)絡(luò)學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練5神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.1BP網(wǎng)絡(luò)簡介2.2網(wǎng)絡(luò)模型2.3學(xué)習(xí)規(guī)則2.4圖形解釋2.5網(wǎng)絡(luò)訓(xùn)練二、BP網(wǎng)絡(luò)6神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu反向傳播網(wǎng)絡(luò)(Back-PropagationNetwork,簡稱BP網(wǎng)絡(luò))是將W-H學(xué)習(xí)規(guī)則一般化,對非線性可微分函數(shù)進(jìn)行權(quán)值訓(xùn)練的多層網(wǎng)絡(luò)權(quán)值的調(diào)整采用反向傳播(Back-propagation)的學(xué)習(xí)算法它是一種多層前向反饋神經(jīng)網(wǎng)絡(luò),其神經(jīng)元的變換函數(shù)是S型函數(shù)輸出量為0到1之間的連續(xù)量,它可實(shí)現(xiàn)從輸入到輸出的任意的非線性映射2.1BP神經(jīng)網(wǎng)絡(luò)7神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wuBP網(wǎng)絡(luò)主要用于下述方面函數(shù)逼近:用輸入矢量和相應(yīng)的輸出矢量訓(xùn)練一個(gè)網(wǎng)絡(luò)逼近一個(gè)函數(shù)模式識別和分類:用一個(gè)特定的輸出矢量將它與輸入矢量聯(lián)系起來;把輸入矢量以所定義的合適方式進(jìn)行分類;數(shù)據(jù)壓縮:減少輸出矢量維數(shù)以便于傳輸或存儲具有較強(qiáng)泛化性能:使網(wǎng)絡(luò)平滑地學(xué)習(xí)函數(shù),使網(wǎng)絡(luò)能夠合理地響應(yīng)被訓(xùn)練以外的輸入泛化性能只對被訓(xùn)練的輸入/輸出在最大值范圍內(nèi)的數(shù)據(jù)有效,即網(wǎng)絡(luò)具有內(nèi)插值特性,不具有外插值性。超出最大訓(xùn)練值的輸入必將產(chǎn)生大的輸出誤差2.1BP神經(jīng)網(wǎng)絡(luò)8神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.2網(wǎng)絡(luò)模型一個(gè)具有r個(gè)輸入和一個(gè)隱含層的神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
9神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu感知器和自適應(yīng)線性元件的主要差別在激活函數(shù)上:前者是二值型的,后者是線性的BP網(wǎng)絡(luò)具有一層或多層隱含層,除了在多層網(wǎng)絡(luò)上與前面已介紹過的模型有不同外,其主要差別也表現(xiàn)在激活函數(shù)上。BP網(wǎng)絡(luò)的激活函數(shù)必須是處處可微的,因此它不能采用二值型的閥值函數(shù){0,1}或符號函數(shù){-1,1}BP網(wǎng)絡(luò)經(jīng)常使用的是S型的對數(shù)或正切激活函數(shù)和線性函數(shù)2.1網(wǎng)絡(luò)模型10神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wuBP網(wǎng)絡(luò)特點(diǎn)輸入和輸出是并行的模擬量網(wǎng)絡(luò)的輸入輸出關(guān)系由各層連接的權(quán)因子決定,沒有固定的算法權(quán)因子通過學(xué)習(xí)信號調(diào)節(jié)。學(xué)習(xí)越多,網(wǎng)絡(luò)越聰明隱含層越多,網(wǎng)絡(luò)輸出精度越高,且個(gè)別權(quán)因子的損壞不會對網(wǎng)絡(luò)輸出產(chǎn)生大的影響只有當(dāng)希望對網(wǎng)絡(luò)的輸出進(jìn)行限制,如限制在0和1之間,那么在輸出層應(yīng)當(dāng)包含S型激活函數(shù)在一般情況下,均是在隱含層采用S型激活函數(shù),而輸出層采用線性激活函數(shù)2.1網(wǎng)絡(luò)模型11神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wuS型函數(shù)具有非線性放大系數(shù)功能,可以把輸入從負(fù)無窮大到正無窮大的信號,變換成-1到l之間輸出對較大的輸入信號,放大系數(shù)較??;而對較小的輸入信號,放大系數(shù)則較大采用S型激活函數(shù)可以處理和逼近非線性輸入/輸出關(guān)系2.1網(wǎng)絡(luò)模型12神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.3學(xué)習(xí)規(guī)則BP算法屬于δ算法,是一種監(jiān)督式的學(xué)習(xí)算法主要思想對于q個(gè)輸入學(xué)習(xí)樣本:P1,P2,…,Pq,已知與其對應(yīng)的輸出樣本為:T1,T2,…,Tq使網(wǎng)絡(luò)輸出層的誤差平方和達(dá)到最小用網(wǎng)絡(luò)的實(shí)際輸出A1,A2,…,Aq,與目標(biāo)矢量T1,T2,…,Tq之間的誤差修改其權(quán)值,使Am與期望的Tm,(m=l,…,q)盡可能接近13神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wuBP算法是由兩部分組成,信息的正向傳遞與誤差的反向傳播正向傳播過程中,輸入信息從輸入層經(jīng)隱含層逐層計(jì)算傳向輸出層,每一層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元的狀態(tài)如果在輸出層未得到期望的輸出,則計(jì)算輸出層的誤差變化值,然后轉(zhuǎn)向反向傳播,通過網(wǎng)絡(luò)將誤差信號沿原來的連接通路反傳回來修改各層神經(jīng)元的權(quán)值直至達(dá)到期望目標(biāo)2.3學(xué)習(xí)規(guī)則14神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu假設(shè)輸入為P,輸入神經(jīng)元有r個(gè),隱含層內(nèi)有s1個(gè)神經(jīng)元,激活函數(shù)為F1,輸出層內(nèi)有s2個(gè)神經(jīng)元,對應(yīng)的激活函數(shù)為F2,輸出為A,目標(biāo)矢量為T2.3學(xué)習(xí)規(guī)則...15神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu信息的正向傳遞隱含層中第i個(gè)神經(jīng)元的輸出輸出層第k個(gè)神經(jīng)元的輸出定義誤差函數(shù)2.3學(xué)習(xí)規(guī)則16神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.3學(xué)習(xí)規(guī)則利用梯度下降法求權(quán)值變化及誤差的反向傳播輸出層的權(quán)值變化其中同理可得17神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.3學(xué)習(xí)規(guī)則利用梯度下降法求權(quán)值變化及誤差的反向傳播輸入到隱含層權(quán)值變化其中同理可得18神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu對于f1為對數(shù)S型激活函數(shù):對于f2為線性激活函數(shù)2.3學(xué)習(xí)規(guī)則19神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.4誤差反向傳播圖形解釋誤差反向傳播過程實(shí)際上是通過計(jì)算輸出層的誤差ek,然后將其與輸出層激活函數(shù)的一階導(dǎo)數(shù)f2’相乘來求得δki由于隱含層中沒有直接給出目標(biāo)矢量,所以利用輸出層的δki反向傳遞來求出隱含層權(quán)值的變化量Δw2ki。然后計(jì)算同樣通過將ei與該層激活函數(shù)的一階導(dǎo)數(shù)f1’相乘,而求得δij,以此求出前層權(quán)值的變化量Δw1ij如果前面還有隱含層,沿用上述同樣方法依此類推,一直將輸出誤差ek逐層的反推算到第一層為止20神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.4誤差反向傳播圖形解釋21神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.5網(wǎng)絡(luò)訓(xùn)練訓(xùn)練BP網(wǎng)絡(luò),需要計(jì)算網(wǎng)絡(luò)加權(quán)輸入矢量以及網(wǎng)絡(luò)輸出和誤差矢量,然后求誤差平方和當(dāng)所訓(xùn)練矢量的誤差平方和小于誤差目標(biāo),訓(xùn)練停止;否則在輸出層計(jì)算誤差變化,且采用反向傳播學(xué)習(xí)規(guī)則來調(diào)整權(quán)值,然后重復(fù)此過程網(wǎng)絡(luò)完成訓(xùn)練后,對網(wǎng)絡(luò)輸入一個(gè)不是訓(xùn)練集合中的矢量,網(wǎng)絡(luò)將以泛化方式給出輸出結(jié)果22神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.5網(wǎng)絡(luò)訓(xùn)練為了能夠較好地掌握BP網(wǎng)絡(luò)的訓(xùn)練過程,我們用兩層網(wǎng)絡(luò)為例來敘述BP網(wǎng)絡(luò)的訓(xùn)練步驟初始化:用小的隨機(jī)數(shù)初始化每一層的權(quán)值W和偏差B,保證網(wǎng)絡(luò)不被大的加權(quán)輸入飽和期望誤差最小值:error_goal最大循環(huán)次數(shù):max_epoch修正權(quán)值的學(xué)習(xí)速率:lr一般情況下,lr=0.l~0.823神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.5網(wǎng)絡(luò)訓(xùn)練變量表達(dá):計(jì)算網(wǎng)絡(luò)各層輸出矢量A1和A2以及網(wǎng)絡(luò)誤差EA1=tansig(W1*P,B1);A2=purelin(W2*A1,B2);E=T-A;權(quán)值修正:計(jì)算各層反傳的誤差變化D2和D1并計(jì)算各層權(quán)值的修正值以及新權(quán)值:D2=deltalin(A2,E);D1=deltatan(A1,D2,W2);[dWl,dBl]=learnbp(P,D1,lr);[dW2,dB2]=1earnbp(A1,D2,1r);W1=W1十dW1;B1=B1十dBl;W2=W2十dW2;B2=B2十dB224神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu2.5網(wǎng)絡(luò)訓(xùn)練計(jì)算權(quán)值修正后誤差平方和SSE=sumsqr(T-purelin(W2*tansig(W1*P,B1),B2))檢查:SSE是否小于err_goal。若是,訓(xùn)練結(jié)束;否則繼續(xù)以上所有的學(xué)習(xí)規(guī)則與訓(xùn)練的全過程,可以用函數(shù)trainbp.m來完成它的使用只需定義有關(guān)參數(shù):顯示間隔次數(shù),最大循環(huán)次數(shù),目標(biāo)誤差,以及學(xué)習(xí)速率。調(diào)用后返回訓(xùn)練后權(quán)值,循環(huán)總數(shù)和最終誤差TP=[disp_freqmax_epocherr_goal1r][W,B,epochs,errors]=trainbp(W,B,’F’,P,T,TP)25神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu三、網(wǎng)絡(luò)設(shè)計(jì)3.1網(wǎng)絡(luò)的層數(shù)3.2隱含層神經(jīng)元數(shù)3.3初始權(quán)值的選取3.4學(xué)習(xí)速率3.5期望誤差的選取3.6應(yīng)用舉例3.7局限性26神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.1網(wǎng)絡(luò)的層數(shù)理論上已經(jīng)證明:具有偏差和至少一個(gè)S型隱含層加上一個(gè)線性輸出層的網(wǎng)絡(luò),能夠逼近任何有理函數(shù)。定理:增加層數(shù)主要可以進(jìn)一步的降低誤差,提高精度,但同時(shí)也使網(wǎng)絡(luò)復(fù)雜化,從而增加了網(wǎng)絡(luò)權(quán)值的訓(xùn)練時(shí)間。一般情況下應(yīng)優(yōu)先考慮增加隱含層中神經(jīng)元數(shù)僅用具有非線性激活函數(shù)的單層網(wǎng)絡(luò)來解決問題沒有必要或效果不好線性問題非線性問題27神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.2隱含層神經(jīng)元數(shù)網(wǎng)絡(luò)訓(xùn)練精度的提高,可以通過采用一個(gè)隱含層,而增加其神經(jīng)元數(shù)的方法來獲得。這在結(jié)構(gòu)實(shí)現(xiàn)上,要比增加更多的隱含層簡單得多定理:實(shí)現(xiàn)任意N個(gè)輸入向量構(gòu)成的任何布爾函數(shù)的前向網(wǎng)絡(luò)所需權(quán)系數(shù)數(shù)目為在具體設(shè)計(jì)時(shí),比較實(shí)際的做法是通過對不同神經(jīng)元數(shù)進(jìn)行訓(xùn)練對比,去掉不起作用的隱單元,然后適當(dāng)?shù)丶由弦稽c(diǎn)余量28神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu隱含層神經(jīng)元數(shù)輸入r維,輸出s2維,樣本數(shù)q下,隱單元數(shù)s1:29神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.3初始權(quán)值的選取一般取初始權(quán)值在(-1,1)之間的隨機(jī)數(shù)威得羅等人在分析了兩層網(wǎng)絡(luò)是如何對一個(gè)函數(shù)進(jìn)行訓(xùn)練后,提出一種選定初始權(quán)值的策略選擇權(quán)值的量級為在MATLAB工具箱中可采用函數(shù)nwlog.m或nwtan.m來初始化隱含層權(quán)值W1和B1。其方法僅使用在第一隱含層的初始值的選取上,后面層的初始值仍然采用隨機(jī)取數(shù)30神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.4學(xué)習(xí)速率學(xué)習(xí)速率決定每一次循環(huán)訓(xùn)練中所產(chǎn)生的權(quán)值變化量大的學(xué)習(xí)速率可能導(dǎo)致系統(tǒng)的不穩(wěn)定小的學(xué)習(xí)速率導(dǎo)致較長的訓(xùn)練時(shí)間,可能收斂很慢,不過能保證網(wǎng)絡(luò)的誤差值不跳出誤差表面的低谷而最終趨于最小誤差值所以在一般情況下,傾向于選取較小的學(xué)習(xí)速率以保證系統(tǒng)的穩(wěn)定性。學(xué)習(xí)速率的選取范圍在0.1-0.8之間31神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.5期望誤差值選取在設(shè)計(jì)網(wǎng)絡(luò)的訓(xùn)練過程中,期望誤差值也應(yīng)當(dāng)通過對比訓(xùn)練后確定一個(gè)合適的值這個(gè)所謂的“合適”,是相對于所需要的隱含層的節(jié)點(diǎn)數(shù)來確定,因?yàn)檩^小的期望誤差值是要靠增加隱含層的節(jié)點(diǎn),以及訓(xùn)練時(shí)間來獲得一般情況下,作為對比,可以同時(shí)對兩個(gè)不同期望誤差值的網(wǎng)絡(luò)進(jìn)行訓(xùn)練,最后通過綜合因素的考慮來確定采用其中一個(gè)網(wǎng)絡(luò)32神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.6應(yīng)用舉例求解函數(shù)逼近問題有21組單輸入矢量和相對應(yīng)的目標(biāo)矢量,試設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)來實(shí)現(xiàn)這對數(shù)組的函數(shù)關(guān)系P=-1:0.1:1T=[-0.96-0.577-0.07290.3770.6410.660.4610.1336-0.201-0.434-0.5-0.393-0.16470.09880.30720.3960.34490.1816-0.0312-0.2183-0.3201]測試集P2=-1:0.025:133神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu網(wǎng)絡(luò)設(shè)計(jì):輸入輸出單元個(gè)數(shù)均為1.隱含層神經(jīng)元個(gè)數(shù)在3~8之間。用可變的隱含層神經(jīng)元個(gè)數(shù),通過誤差對比,確定最佳個(gè)數(shù),并檢驗(yàn)對網(wǎng)絡(luò)性能的影響。代碼:
s=3:8;res=1:6;fori=1:6net=newff(minmax(P),[s(i),1],{'tansig','logsig'},'traingdx');net.trainParam.epochs=2000;net.trainParam.goal=0.0001;net=train(net,P,T);y=sim(net,P);error=y-T;res(i)=norm(error);endres=1.58121.92701.55801.92701.58031.4449隱層輸出層訓(xùn)練函數(shù),也可選:
trainlm或
traingd34神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu網(wǎng)絡(luò)訓(xùn)練誤差個(gè)數(shù)345678910網(wǎng)絡(luò)誤差1.04120.72970.17670.14490.18070.14420.14490.1621好35神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.6應(yīng)用舉例(cont’d)目標(biāo)矢量相對于輸入矢量的圖形初始網(wǎng)絡(luò)的輸出曲線
36神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.6應(yīng)用舉例(cont’d)訓(xùn)練1000次2000次37神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.6應(yīng)用舉例(cont’d)訓(xùn)練3000次5000次38神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu3.7限制與不足需要較長的訓(xùn)練時(shí)間完全不能訓(xùn)練選取較小的初始權(quán)值采用較小的學(xué)習(xí)速率,但同時(shí)又增加了訓(xùn)練時(shí)間局部極小值BP算法可以使網(wǎng)絡(luò)權(quán)值收斂到一個(gè)解,但它并不能保證所求為誤差超平面的全局最小解,很可能是一個(gè)局部極小解39神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu四、BP網(wǎng)絡(luò)的改進(jìn)4.1目標(biāo)4.2附加動(dòng)量法4.3誤差函數(shù)改進(jìn)
4.4自適應(yīng)學(xué)習(xí)速率40神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.1目標(biāo)加快訓(xùn)練速度避免陷入局部極小值41神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.2附加動(dòng)量法利用附加動(dòng)量的作用則有可能滑過局部極小值修正網(wǎng)絡(luò)權(quán)值時(shí),不僅考慮誤差在梯度上的作用,而且考慮在誤差曲面上變化趨勢的影響,其作用如同一個(gè)低通濾波器,它允許網(wǎng)絡(luò)忽略網(wǎng)絡(luò)上微小變化特性該方法是在反向傳播法的基礎(chǔ)上在每一個(gè)權(quán)值的變化上加上一項(xiàng)正比于前次權(quán)值變化量的值,并根據(jù)反向傳播法來產(chǎn)生新的權(quán)值變化42神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.2附加動(dòng)量法帶有附加動(dòng)量因子的權(quán)值調(diào)節(jié)公式
其中k為訓(xùn)練次數(shù),mc為動(dòng)量因子,一般取0.95左右附加動(dòng)量法的實(shí)質(zhì)是將最后一次權(quán)值變化的影響,通過一個(gè)動(dòng)量因子來傳遞。當(dāng)動(dòng)量因子取值為0時(shí),權(quán)值變化僅根據(jù)梯度下降法產(chǎn)生當(dāng)動(dòng)量因子取值為1時(shí),新的權(quán)值變化則是設(shè)置為最后一次權(quán)值的變化,而依梯度法產(chǎn)生的變化部分則被忽略掉了促使權(quán)值的調(diào)節(jié)向著誤差曲面底部的平均方向變化,當(dāng)網(wǎng)絡(luò)權(quán)值進(jìn)入誤差曲面底部的平坦區(qū)時(shí),δi將變得很小,于是,Δwij(k+1)≈Δwij(k),從而防止了Δwij=0的出現(xiàn),有助于使網(wǎng)絡(luò)從誤差曲面的局部極小值中跳出
43神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.2附加動(dòng)量法在MATLAB工具箱中,帶有動(dòng)量因子的權(quán)值修正法是用函數(shù)learnbpm.m來實(shí)現(xiàn)的trainbpm.m可以訓(xùn)練一層直至三層的帶有附加動(dòng)量因子的反向傳播網(wǎng)絡(luò)下面是對單層網(wǎng)絡(luò)使用函數(shù)trainbpm.m的情形:
[W,B,epochs,errors]=
trainbpm(W,B,’F’,P,T,TP)44神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.3誤差函數(shù)改進(jìn)LMS誤差:當(dāng)ak趨向1時(shí),E趨向一個(gè)常數(shù),即處于E的平坦區(qū),f’(n)→0,可能造成完全訓(xùn)練的麻痹現(xiàn)象當(dāng)一個(gè)網(wǎng)絡(luò)的誤差曲面存在著平坦區(qū)時(shí),可以選用別的誤差函數(shù)f(tk,ak)來代替(tk-ak)2的形式,只要其函數(shù)在ak=tk時(shí)能達(dá)到最小值45神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.3誤差函數(shù)改進(jìn)包穆(Baum)等人于1988年提出一種誤差函數(shù)為不會產(chǎn)生不能完全訓(xùn)練的麻痹現(xiàn)象46神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.3誤差函數(shù)改進(jìn)與常規(guī)的誤差函數(shù)的情況δij=f’(n)(tk-ak)相比較,其中的f’(n)項(xiàng)消失了當(dāng)n增大,進(jìn)入激活函數(shù)的平坦區(qū),使f’(n)→0時(shí),不會產(chǎn)生不能完全訓(xùn)練的麻痹現(xiàn)象但由于失去了f’(n)對Δw的控制作用,過大的Δw又有可能導(dǎo)致網(wǎng)絡(luò)過調(diào)或振蕩
1989年,范爾曼(S.Fahlman)提出一種折中的方案,即取δk=[f’(n)+0.1](tk-ak)一方面恢復(fù)了f’(n)的某些影響另一方面當(dāng)|n|變大時(shí),仍能保持δk有一定的大小,從而避免了麻痹現(xiàn)象的發(fā)生
47神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.4自適應(yīng)學(xué)習(xí)速率通常調(diào)節(jié)學(xué)習(xí)速率的準(zhǔn)則是,檢查權(quán)值的修正值是否真正降低了誤差函數(shù),如果確實(shí)如此,則說明所選取的學(xué)習(xí)速率值小了,可以對其增加一個(gè)量;否則可認(rèn)為產(chǎn)生過調(diào),應(yīng)該減小學(xué)習(xí)速率的值一種自適應(yīng)學(xué)習(xí)速率的調(diào)整公式48神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu4.4自適應(yīng)學(xué)習(xí)速率MATLAB工具箱中帶有自適應(yīng)學(xué)習(xí)速率進(jìn)行反向傳播訓(xùn)練的函數(shù)為trainbpa.m可訓(xùn)練直至三層網(wǎng)絡(luò)。使用方法
[W,B,epochs,TE]=trainbpa(W,
B,’F’,P,T,TP)可以將動(dòng)量法和自適應(yīng)學(xué)習(xí)速率結(jié)合起來以利用兩方面的優(yōu)點(diǎn)。這個(gè)技術(shù)已編入函數(shù)trainbpx.m之中函數(shù)的調(diào)用和其他函數(shù)一樣,只是需要更多的初始參數(shù)而已TP=[disp_freqmax_epocherror_goallr1r_inc1r_decmom_consterr_ratio];[W,B,epochs,[error;lr]]=trainbpx(W,B,’F’,P,T,TP)49神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu五、內(nèi)容小結(jié)內(nèi)容安排一、內(nèi)容回顧二、BP網(wǎng)絡(luò)三、網(wǎng)絡(luò)設(shè)計(jì)四、改進(jìn)BP網(wǎng)絡(luò)50神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu五、內(nèi)容小結(jié)反向傳播法可以用來訓(xùn)練具有可微激活函數(shù)的多層前向網(wǎng)絡(luò),以進(jìn)行函數(shù)逼近,模式分類等工作反向傳播網(wǎng)絡(luò)的結(jié)構(gòu)不完全受所要解決的問題所限制。網(wǎng)絡(luò)的輸入神經(jīng)元數(shù)目及輸出層神經(jīng)元的數(shù)目是由問題的要求所決定輸入和輸出層之間的隱含層數(shù)以及每層的神經(jīng)元數(shù)是由設(shè)計(jì)者來決定的已經(jīng)證明,兩層S型線性網(wǎng)絡(luò),如果S型層有足夠的神經(jīng)元,則能夠訓(xùn)練出任意輸入和輸出之間的有理函數(shù)關(guān)系51神經(jīng)網(wǎng)絡(luò)-(6)BP網(wǎng)絡(luò)wu五、內(nèi)容小結(jié)反向傳播法沿著誤差表面的梯度下降,使網(wǎng)絡(luò)誤差最小,網(wǎng)絡(luò)有可能陷入局部極小值附加動(dòng)量法使反向傳播減少了網(wǎng)絡(luò)在誤差表面陷入低谷的可能性并有助于減少訓(xùn)練時(shí)間太大的學(xué)習(xí)速率導(dǎo)致學(xué)習(xí)的不穩(wěn)定,太小值又導(dǎo)致極長的訓(xùn)練時(shí)間。自適應(yīng)學(xué)習(xí)速率通過在保證穩(wěn)定訓(xùn)練的前提下,達(dá)到
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 公文培訓(xùn)封面
- 公文書寫培訓(xùn)課件
- 促進(jìn)醫(yī)患關(guān)系和諧的行為
- 護(hù)士資格培訓(xùn)管理制度
- 建筑工程培訓(xùn)管理制度
- 培訓(xùn)制度及實(shí)施計(jì)劃
- 校車安全培訓(xùn)管理制度
- 食品經(jīng)營許可證培訓(xùn)制度
- 籃球培訓(xùn)學(xué)員課時(shí)表制度
- 學(xué)校培訓(xùn)制度記錄表
- 勞動(dòng)者個(gè)人職業(yè)健康監(jiān)護(hù)檔案
- 《兩角和與差的正弦、余弦、正切公式》示范公開課教學(xué)PPT課件【高中數(shù)學(xué)人教版】
- 治理現(xiàn)代化下的高校合同管理
- 境外宗教滲透與云南邊疆民族地區(qū)意識形態(tài)安全研究
- GB/T 28920-2012教學(xué)實(shí)驗(yàn)用危險(xiǎn)固體、液體的使用與保管
- GB/T 26389-2011衡器產(chǎn)品型號編制方法
- GB/T 16588-2009帶傳動(dòng)工業(yè)用多楔帶與帶輪PH、PJ、PK、PL和PM型:尺寸
- 人大企業(yè)經(jīng)濟(jì)學(xué)考研真題-802經(jīng)濟(jì)學(xué)綜合歷年真題重點(diǎn)
- 建筑抗震鑒定標(biāo)準(zhǔn)課件
- 人教版二年級數(shù)學(xué)下冊《【全冊】完整版》優(yōu)質(zhì)課件
- 水庫工程施工測量方案
評論
0/150
提交評論