版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
MachineLearningandData 200
f=x,
3 4–不可微
wTx=f
= v>-1v£5
y=f w
=fwTx=wTf6y=f
=wT其中f
7 定義代價(jià)函數(shù)為均方誤差ew)= e2n) nh
2Nn
Dw=-Dw=-ew1=-N()Nen?e8 最小均方 :LeastMean其中e為時(shí)刻new=其中e為時(shí)刻n2 nh=- =-e ew=- =-e
9
基 n+
ew
ek2k?ek
2n nw
w
n)=-
?en
k()
eNe
?
w)=1k2Nn=1k?k
2nLL
w)=12Ln=1k?
2nekek 算法:基本概:
t exp
t=a
eat-e-ateat+e-at
Rumelhart,Hinton&Rumelhart,Hinton&Williams,“Learningrepresentationsbyback-propagatingerrors”,Nature,1986j j
en
1e2n)
2j?
av=
en=
ejn=1j?
n)L Le=1e(n)=1e2n)j j
2Ln=1j?
n
n=
n
n=-
ej
n
?wji)
ej=dj-yjj–如果神經(jīng)元jj
en
1e2n)
n=n)–C:
2j?
N
–對(duì)所有n)誘導(dǎo)局部域:v)
mwy ji vj
n+Dwjie/?wji
en=dn-
n)
n=n)–神經(jīng)元j是輸出節(jié)
1
“可見(jiàn)”誤差的瞬時(shí)能量:e =nyiyj=fjjDwji)e/?wji
n) en)en)ejnyjn)vjn)n)nynvjwjin)nvjyin)
n+=- =/=- =en=即
enenyn)vn)
enf
n)
n)n)nynvnwn)nn+hejjvjyi 神經(jīng)元局部梯度的定義:–對(duì)于輸出層神經(jīng)元
n=en)=-n=-en)en=- ?v
n
n)=
ejnfjv
n y
n=hejjvjyin=djnyi神經(jīng)元局部梯度的定義:–
n=en)=-n=-en)en=-?v
n
n)=
ejnfjv
n y
–n=-en)en)ejyjj
ynvj fjfj –對(duì)于隱藏層神經(jīng)元jdjn=-
en)=-
enyn)=-
envnn)
nv
n)–其中en
n,
=
y=fvm–于m
22
vk=wkjyjn)jen)=
k
nykvk
jjkj?yjjkj
?y
k()
?ekkkjdkjn)?=-ej
=
n=-en)nj =-jvjnjnjvjnj j)
d=ef
n=-en)
en)
f
nen)j j
fj
ej=dkj
ej=dkj
n
dj)=ejnjvjDwjin=hejjvjyin)=hdjyij:ejdkjdj=ejnjj
n=hejvjyin)=hdjyi驗(yàn)證:Dwjihe/?wjien)nwjiDwji=hdjn)yi權(quán)值校 局部梯 jvjnejjvjjjvje
yj=fjvj
=nyin)– – ek=ek=dk-ykdj=jvjnejhn)yi神經(jīng)元j在隱藏層 dj=jvjej
t= exp-
t=aftftjvj=afvjfvj=ayj-yj若jyjojdj=jvjnej=adj-ojojn1-ojdjnf
n)-j
t=a
eat-e-ateat+
at
t=a1ftftdj=jvjnejdjnf
n)
xi,dimmljvljvn=nyln)j
yn=
vn
y0n
n
yLn
n)
ej=dj-ojnfvLn
j?output
n=¢
fjv
j?hidden
n1n+hnyln)
小 機(jī)器學(xué)習(xí)與數(shù)achineLearning&DataScience
ej=dj-yj1
n=n)
en
n) N
e=1
m
=nyin)yj=fjvj
wji?Dwji)/ 稱函數(shù),如雙曲正切,DropOut(G.E.Hinton,JMLRDropConnect(L.Wanetal.ICML
DropOut(G.E.Hinton,DropConnect(L.Wanetal.784-800x800x10的31.4%1.6%BP1.4%1.6%BP(Random1.2%1.2%RBM(784-BatchWithout[1]SergeyIoffe,ChristianSzegedy,"Batchnormalization:Acceleratingdeepnetworktrainingbyreducinginternalcovariateshift".ICML,2015.
XavierweightStochasticgradientdecentMomentumNesterovacceleratedgradient[1]XavierGlorot&YoshuaBengio,"Understandingthedifficultyoftrainingdeepfeed-forwardneuralnetworks",AI&STATS2010.DwjiaDwjihdji
則是什么?最優(yōu)權(quán)值下,網(wǎng)絡(luò)實(shí)際輸出值是期望響應(yīng)向量的條件期望的 ykj表示網(wǎng)絡(luò)響應(yīng)于xj的第k個(gè)神經(jīng)元的輸出:ykjFkxjTxT 2, M, j , ,..., TFx, 2, M, jN2 N2
R=12Nj
dj-Fxj
,jj如果Fk>Fj)"j?k則把輸入向量x分類(lèi)為 ,其Fk和Fj=1x,x,...,
[1]Richard&Lippmann:NeuralNetworkclassifiersestimateBayesianaposterioriprobabilities,Computation. [1]WebbA.R.andLoweD.:Theoptimalinternalrepresentationofmultilayerclassifiernetworksperformsnonlineardiscriminant ysis,[1]WebbA.R.andLoweD.:Theoptimalinternalrepresentationofmultilayerclassifiernetworksperformsnonlineardiscriminant ysis,NeuralNetworks,vol.5,pp.480-488,1990.–線性判別分析:假設(shè)有2個(gè)類(lèi)別C1 ?在分類(lèi)意義上, Q/PerceptronGaussianGaussianModelofMixtureofExperts混合專(zhuān)家HierarchicalTopicmodel中,LatentDirichletHierarchicalSparse在KernelmachineDeepLearning
SupervisedSupervisedLearningofSemanticClassesforImageAnnotationandRetrieval,PAMI2007Q/法 理論上,一個(gè)隱藏層就足夠作為通用函數(shù)近器地推廣,因?yàn)楦鶕?jù)理論,我們需要控制兩個(gè)因素:經(jīng)驗(yàn)ReLU(x)=max(x,[1]Krizhevsky,A.,Sutskever,I.,andHinton,G.E.Imagenetclassificationwithdeepconvolutionalneuralnetworks.InNIPS,2012. 個(gè) MatthewD.ZeilerandRobFergus,"VisualizingandUnderstandingConvolutional 個(gè) Stride2:相鄰窗口每次滑動(dòng)2個(gè)像素(或單位),i.e.5個(gè)像素 Filtersize7:使用7x7的kernel作用在每個(gè)窗口內(nèi),輸出一個(gè)響應(yīng)值3x3maxpooling:下采樣(Downsampling)步驟在一個(gè)3x3鄰域內(nèi)的9個(gè)響應(yīng)3x3maxpoolingstride2:相鄰的3x3窗口每次滑動(dòng)2個(gè)像素, 個(gè) 輸入為 110x11055x55:使用3x3maxpoolingwithstride2396通道選用96個(gè)7x7x3的filters對(duì)224x224x3filter給出一個(gè)特征圖(feature個(gè) 得到256個(gè)26x26的featuremaps,然后MaxPooling之后變成13x13x256第6層和第7層為全連接層(FullConnected
[1]LeCun,Yann,etal."Backpropagationappliedtohandwrittenzipcoderecognition."Neuralcomputation,1989.[2]LeCun,Yann,etal."Gradient-basedlearningappliedtorecognition."ProceedingsoftheIEEE(1998):2278-2324.[3]AlexKrizhevsky,IlyaSutskever,andGeoffreyE.Hinton."Imagenetclassificationwithdeepconvolutionalneuralnetworks."NIPS.2012.He,K.,Ren,S.,Sun,J.,&Zhang,X.:DeepResidualLearningforImageRecognition,CVPR2016. xyxyHe,K.,Ren,S.,Sun,J.,&Zhang,X.:DeepResidualLearningforImageRecognition,CVPR[1]Hinton,G.E.,Krizhevsky,A.,Srivastava,N.,Sutskever,I.,&Salakhutdinov,R.:Dropout:asimplewaytopreventneuralnetworksfromoverfitting,JournalofMachineLearningResearch,15,1929-1958,2014.[2]He,K.,Ren,S.,Sun,J.,&Zhang,X.:DeepResidualLearningforImageRecognition,arXiv,2016.[3]SergeyIoffe,ChristianSzegedy,"Batchnormalization:Acceleratingdeepnetworktrainingbyreducinginternalcovariateshift".ICML,2015.[4]Fei-Fei,L.,Karpathy,A.,Leung,T.,Shetty,S.,Sukthankar,R.,&Toderici,G.(2014):Large-Scale NeuralNetworks.IEEECVPR.[5
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026中國(guó)資源循環(huán)集團(tuán)設(shè)備資產(chǎn)有限責(zé)任公司招聘6人備考題庫(kù)及完整答案詳解一套
- 2026年文學(xué)評(píng)論與寫(xiě)作技能測(cè)試題集
- 2026年食品安全與營(yíng)養(yǎng)知識(shí)食品安全題庫(kù)
- 遠(yuǎn)洋船舶技工考試題及答案
- 2026廣東佛山順德區(qū)北滘鎮(zhèn)第三幼兒園招聘?jìng)淇碱}庫(kù)帶答案詳解
- 2026廣西玉林市遴選公務(wù)員28人備考題庫(kù)含答案詳解
- 2026年環(huán)境影響評(píng)價(jià)與環(huán)境監(jiān)測(cè)技術(shù)環(huán)境工程師模擬題
- 2026四川成都市青羊區(qū)中醫(yī)醫(yī)院招聘計(jì)劃第一批35人備考題庫(kù)完整參考答案詳解
- 2026中共左貢縣委社會(huì)工作部選聘招聘社區(qū)工作者5人備考題庫(kù)(西藏)及參考答案詳解一套
- 2025-2030中國(guó)保鮮蒜米行業(yè)運(yùn)行現(xiàn)狀與投資戰(zhàn)略研究研究報(bào)告
- 安全生產(chǎn)目標(biāo)及考核制度
- (2026版)患者十大安全目標(biāo)(2篇)
- 大數(shù)據(jù)安全技術(shù)與管理
- 2026青島海發(fā)國(guó)有資本投資運(yùn)營(yíng)集團(tuán)有限公司招聘計(jì)劃筆試備考試題及答案解析
- 2026年北大拉丁語(yǔ)標(biāo)準(zhǔn)考試試題
- 鼻飼技術(shù)操作課件
- GB/T 13789-2022用單片測(cè)試儀測(cè)量電工鋼帶(片)磁性能的方法
- GB/T 33092-2016皮帶運(yùn)輸機(jī)清掃器聚氨酯刮刀
- GB/T 16535-2008精細(xì)陶瓷線熱膨脹系數(shù)試驗(yàn)方法頂桿法
- 中學(xué)主題班會(huì)課:期末考試應(yīng)試技巧點(diǎn)撥(共34張PPT)
- 吊索具報(bào)廢標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論