版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Python數(shù)據(jù)挖掘神經(jīng)網(wǎng)絡(luò)第八章前言神經(jīng)網(wǎng)絡(luò)作為現(xiàn)代機(jī)器學(xué)習(xí)的強(qiáng)大工具,能高效處理大數(shù)據(jù),利用高維數(shù)據(jù)學(xué)習(xí)模式與關(guān)聯(lián)性,賦能數(shù)據(jù)分類、預(yù)測(cè)及決策。隨著深度學(xué)習(xí)進(jìn)步與計(jì)算能力提升,神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)復(fù)雜任務(wù)能力顯著增強(qiáng),支持自然語(yǔ)言處理(如機(jī)器翻譯)、計(jì)算機(jī)視覺(jué)(如圖像分類)及語(yǔ)音識(shí)別、推薦系統(tǒng)等多領(lǐng)域應(yīng)用。其潛力巨大,將持續(xù)推動(dòng)AI技術(shù)發(fā)展,促進(jìn)社會(huì)各領(lǐng)域進(jìn)步與經(jīng)濟(jì)發(fā)展。目錄神經(jīng)網(wǎng)絡(luò)概述LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)算法BP反向傳播算法01神經(jīng)網(wǎng)絡(luò)概述神經(jīng)網(wǎng)絡(luò),也被稱為人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetworks,ANN)是一種模仿人類神經(jīng)系統(tǒng)的機(jī)器學(xué)習(xí)技術(shù)神經(jīng)元,即神經(jīng)元細(xì)胞,是神經(jīng)系統(tǒng)最基本的結(jié)構(gòu)和功能單位,如圖所示。分為細(xì)胞體和突起兩部分。細(xì)胞體由細(xì)胞核、細(xì)胞膜、細(xì)胞質(zhì)組成,具有聯(lián)絡(luò)和整合輸入信息并傳出信息的作用。神經(jīng)網(wǎng)絡(luò)由大量連接在一起的人工神經(jīng)元(或稱為節(jié)點(diǎn)或單元)組成,并通過(guò)這些神經(jīng)元之間的連接來(lái)模擬信息的傳遞和處理過(guò)程。神經(jīng)網(wǎng)絡(luò)的工作原理是通過(guò)學(xué)習(xí)數(shù)據(jù)的模式和關(guān)聯(lián)性來(lái)進(jìn)行預(yù)測(cè)、分類、識(shí)別或決策等任務(wù)。8.1.1.概念神經(jīng)網(wǎng)絡(luò)分為輸入層、隱藏層和輸出層。輸入層接收原始數(shù)據(jù)或特征向量作為輸入,隱藏層負(fù)責(zé)處理輸入并提取特征,輸出層產(chǎn)生最終的結(jié)果。8.1.1.概念輸入層隱藏層輸出層神經(jīng)網(wǎng)絡(luò)第一層,它接收外部輸入數(shù)據(jù)并將其傳遞給下一層。介于輸入層和輸出層之間的一層或多層。每個(gè)隱藏層由許多神經(jīng)元組成,這些神經(jīng)元通過(guò)權(quán)重和激活函數(shù)進(jìn)行連接和計(jì)算。神經(jīng)網(wǎng)絡(luò)最后一層,它根據(jù)隱藏層的計(jì)算結(jié)果生成最終的輸出結(jié)果。8.1.1.概念1.輸入層:輸入層的神經(jīng)元數(shù)量通常與輸入數(shù)據(jù)的特征數(shù)量相匹配。每個(gè)輸入神經(jīng)元表示輸入數(shù)據(jù)的一個(gè)特征,例如圖像的像素值或文本的詞向量。2.隱藏層:隱藏層中的神經(jīng)元負(fù)責(zé)對(duì)輸入數(shù)據(jù)進(jìn)行非線性的轉(zhuǎn)換和特征提取。這些層的存在使得神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)和表示更為復(fù)雜的模式和關(guān)系。3.輸出層:輸出層通常包含一個(gè)或多個(gè)神經(jīng)元,每個(gè)神經(jīng)元表示神經(jīng)網(wǎng)絡(luò)對(duì)應(yīng)的不同類別或回歸預(yù)測(cè)的輸出。假設(shè)數(shù)據(jù)集反向傳播算法使用數(shù)據(jù)集中的每一個(gè)樣本執(zhí)行前向傳播,之后根據(jù)網(wǎng)絡(luò)的輸出與真實(shí)標(biāo)簽計(jì)算誤差,利用誤差進(jìn)行反向傳播,更新權(quán)重,如圖所示8.1.1.概念8.1.1.概念(1)用于分類和預(yù)測(cè)任務(wù),通過(guò)從數(shù)據(jù)中學(xué)習(xí)模式和關(guān)聯(lián)性,可以根據(jù)輸入數(shù)據(jù)預(yù)測(cè)出未知或未標(biāo)記的數(shù)據(jù)的類別或結(jié)果。(2)用于無(wú)監(jiān)督學(xué)習(xí)任務(wù),如聚類分析。它可以通過(guò)學(xué)習(xí)數(shù)據(jù)的相似性和關(guān)聯(lián)性,將數(shù)據(jù)劃分為多個(gè)群組或聚類。神經(jīng)網(wǎng)絡(luò)可以幫助檢測(cè)數(shù)據(jù)中的異?;螂x群點(diǎn)。通過(guò)學(xué)習(xí)正常數(shù)據(jù)的模式,當(dāng)出現(xiàn)與正常模式不一致的數(shù)據(jù)時(shí),可以識(shí)別出異常。神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘中承擔(dān)著重要的作用(3)在自然語(yǔ)言處理和語(yǔ)音識(shí)別領(lǐng)域也有廣泛應(yīng)用,可以進(jìn)行文本分類、情感分析、機(jī)器翻譯、語(yǔ)音識(shí)別等任務(wù)。神經(jīng)網(wǎng)絡(luò)還可以用于分析金融市場(chǎng)和預(yù)測(cè)股票價(jià)格、匯率等金融指標(biāo)。神經(jīng)網(wǎng)絡(luò)的發(fā)展歷程可以追溯到上世紀(jì)40年代至今,發(fā)展總過(guò)程如圖所示,主要分為以下四個(gè)階段:8.1.2.發(fā)展歷程1.神經(jīng)元階段8.1.2.發(fā)展歷程神經(jīng)網(wǎng)絡(luò)仿神經(jīng)元設(shè)計(jì),神經(jīng)元研究歷史深遠(yuǎn),1904年已知其結(jié)構(gòu):多樹(shù)突接收信息,單軸突傳遞至多神經(jīng)元,通過(guò)軸突末梢與樹(shù)突相連形成“突觸”傳遞信號(hào)。2.單層神經(jīng)網(wǎng)絡(luò)1958年,弗蘭克·羅森布拉特提出單層神經(jīng)網(wǎng)絡(luò)“感知器”,為首個(gè)可學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)。3.兩層神經(jīng)網(wǎng)絡(luò)1986年兩層網(wǎng)絡(luò)通過(guò)隱藏層非線性轉(zhuǎn)換與特征提取,增強(qiáng)學(xué)習(xí)復(fù)雜模式能力,輸出層完成最終分類、預(yù)測(cè)或識(shí)別。4.多層神經(jīng)網(wǎng)絡(luò)(深度學(xué)習(xí))2006年Hinton提出“深度信念網(wǎng)絡(luò)”,引入“深度學(xué)習(xí)”概念,助力解決更復(fù)雜問(wèn)題。8.1.3.應(yīng)用領(lǐng)域1.圖像分類和目標(biāo)檢測(cè)神經(jīng)網(wǎng)絡(luò)在圖像分類和目標(biāo)檢測(cè)領(lǐng)域中表現(xiàn)出色。通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以實(shí)現(xiàn)高準(zhǔn)確率的圖像分類,例如將圖像正確分類為貓或狗等。此外,神經(jīng)網(wǎng)絡(luò)還能夠檢測(cè)圖像中的目標(biāo)物體,并進(jìn)行定位和識(shí)別。2.自然語(yǔ)言處理(NLP)神經(jīng)網(wǎng)絡(luò)在自然語(yǔ)言處理領(lǐng)域也取得了很大的突破。它能夠進(jìn)行文本分類、情感分析、機(jī)器翻譯等任務(wù)。例如,神經(jīng)網(wǎng)絡(luò)可以實(shí)現(xiàn)準(zhǔn)確的情感分析,判斷文本中的情感傾向是積極、消極還是中性。8.1.3.應(yīng)用領(lǐng)域3.語(yǔ)音識(shí)別和合成神經(jīng)網(wǎng)絡(luò)在語(yǔ)音識(shí)別和合成方面也有很好的表現(xiàn)。通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以實(shí)現(xiàn)高準(zhǔn)確率的語(yǔ)音識(shí)別,將語(yǔ)音轉(zhuǎn)換為文本。同時(shí),神經(jīng)網(wǎng)絡(luò)還可以進(jìn)行語(yǔ)音合成,根據(jù)文本生成自然流暢的語(yǔ)音。4.人臉識(shí)別神經(jīng)網(wǎng)絡(luò)在人臉識(shí)別領(lǐng)域發(fā)揮著重要作用。通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以進(jìn)行準(zhǔn)確的人臉檢測(cè)和識(shí)別。神經(jīng)網(wǎng)絡(luò)能夠從圖像中提取面部特征,并與已知的人臉特征進(jìn)行匹配,實(shí)現(xiàn)精確的人臉識(shí)別。8.1.3.應(yīng)用領(lǐng)域5.推薦系統(tǒng)神經(jīng)網(wǎng)絡(luò)在推薦系統(tǒng)中也非常有用。它可以根據(jù)用戶的歷史行為和興趣,提供個(gè)性化的推薦。通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以挖掘用戶的喜好和偏好,為用戶推薦符合其興趣的內(nèi)容和產(chǎn)品。6.醫(yī)療診斷和預(yù)測(cè)神經(jīng)網(wǎng)絡(luò)在醫(yī)療領(lǐng)域中具有廣泛的應(yīng)用。它可以幫助醫(yī)生進(jìn)行疾病預(yù)測(cè)、醫(yī)療影像分析、藥物設(shè)計(jì)等。通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,可以從大量的醫(yī)療數(shù)據(jù)中學(xué)習(xí)并識(shí)別疾病模式,提供準(zhǔn)確的診斷和治療建議。02LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)算法LSTM在處理序列數(shù)據(jù)時(shí)具有長(zhǎng)期記憶和捕捉長(zhǎng)距離依賴性的能力。相比于傳統(tǒng)的RNN,LSTM利用門(mén)控機(jī)制有效地解決了梯度消失和梯度爆炸等問(wèn)題,使得它在處理長(zhǎng)序列數(shù)據(jù)時(shí)更為有效。8.2.1.基本原理
LSTM的核心思想是引入了三個(gè)門(mén)(輸入門(mén)、遺忘門(mén)和輸出門(mén))來(lái)控制信息流入和流出,以及決定是否保留或遺忘一部分輸入。這些門(mén)的作用機(jī)制使得LSTM能夠?qū)斎霐?shù)據(jù)進(jìn)行選擇性地遺忘、保存或輸出信息,從而實(shí)現(xiàn)了對(duì)長(zhǎng)期依賴關(guān)系的建模。8.2.1.基本原理輸入門(mén)(InputGate)控制著新信息的流入,決定是否更新記憶狀態(tài)。遺忘門(mén)(ForgetGate)控制著前一時(shí)刻的記憶狀態(tài)是否更新,通過(guò)遺忘一部分信息可以增強(qiáng)模型對(duì)長(zhǎng)時(shí)間依賴的記憶能力。記憶狀態(tài)(CellState)保存網(wǎng)絡(luò)中的信息,通過(guò)輸入和遺忘門(mén)進(jìn)行加權(quán)操作,更新并傳遞到下一個(gè)時(shí)刻。輸出門(mén)(OutputGate)控制著記憶狀態(tài)的輸出,將記憶狀態(tài)加權(quán)后輸出作為本時(shí)刻的隱藏狀態(tài),供下一層或下一個(gè)時(shí)間步的網(wǎng)絡(luò)使用。LSTM的關(guān)鍵就是細(xì)胞狀態(tài),如圖所示,水平線在圖上方貫穿運(yùn)行。細(xì)胞狀態(tài)類似于傳送帶。直接在整個(gè)鏈上運(yùn)行,只有一些少量的線性交互。信息在上面流傳保持不變會(huì)很容易。可以將其看作網(wǎng)絡(luò)的“記憶”。理論上講,細(xì)胞狀態(tài)能夠?qū)⑿蛄刑幚磉^(guò)程中的相關(guān)信息一直傳遞下去。因此,即使是較早時(shí)間步長(zhǎng)的信息也能攜帶到較后時(shí)間步長(zhǎng)的細(xì)胞中來(lái),這克服了短時(shí)記憶的影響。8.2.2.算法流程具體而言,LSTM包含以下幾個(gè)關(guān)鍵組件:8.2.2.算法流程1.輸入門(mén)(InputGate):輸入門(mén)決定是否更新細(xì)胞狀態(tài)的部分。它通過(guò)使用Sigmoid激活函數(shù)來(lái)控制輸入的權(quán)重。若輸入門(mén)接近0,則對(duì)應(yīng)的信息被忽略;若接近1,則對(duì)應(yīng)的信息被保留。2.遺忘門(mén)(ForgetGate)遺忘門(mén)決定是否從細(xì)胞狀態(tài)中丟棄信息的部分。它通過(guò)使用Sigmoid激活函數(shù)來(lái)控制細(xì)胞狀態(tài)中的權(quán)重。若遺忘門(mén)接近0,則對(duì)應(yīng)的信息被完全遺忘;若接近1,則對(duì)應(yīng)的信息被完全保留。具體而言,LSTM包含以下幾個(gè)關(guān)鍵組件:8.2.2.算法流程3.細(xì)胞狀態(tài)(CellState):細(xì)胞狀態(tài)用于存儲(chǔ)和傳遞信息的長(zhǎng)期記憶。它可以被輸入門(mén)和遺忘門(mén)控制性地更新。4.輸出門(mén)(OutputGate)輸出門(mén)決定輸出的部分。它通過(guò)使用Sigmoid激活函數(shù)來(lái)控制細(xì)胞狀態(tài)的權(quán)重,并通過(guò)Tanh激活函數(shù)來(lái)生成當(dāng)前時(shí)刻的輸出。(一)案例背景:隨著各國(guó)工業(yè)化的發(fā)展,溫室氣體排放的增加導(dǎo)致全球氣候變暖,而“污染無(wú)國(guó)界”,溫室氣體排放導(dǎo)致的全球氣候變曖已經(jīng)超出一國(guó)范圍成為全球性的重大問(wèn)題,而氣候問(wèn)題早已超出了科學(xué)的范圍影響到經(jīng)濟(jì)、能源、生態(tài)和健康等各個(gè)領(lǐng)域。氣候變化將會(huì)增加極端天氣事件發(fā)生的頻率和強(qiáng)度,提高平均氣溫,并使海平面上升,由此帶來(lái)的風(fēng)險(xiǎn)將對(duì)全球經(jīng)濟(jì)和金融體系產(chǎn)生深遠(yuǎn)影響,已成為全球范圍內(nèi)最為緊迫的問(wèn)題之一。在本次研究中,我們將全球GDP數(shù)據(jù)作為衡量經(jīng)濟(jì)發(fā)展水平的變量,而將自1961年-2019年的氣溫變化作為衡量全球氣候變化的一個(gè)變量。使用了長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型進(jìn)行分析,最終結(jié)果顯示,溫度變化對(duì)經(jīng)濟(jì)發(fā)展的影響并不大。隨著經(jīng)濟(jì)社會(huì)不斷發(fā)展以及人類活動(dòng)范圍持續(xù)拓寬,全球氣候變化的速度不斷加快,且未來(lái)可能會(huì)進(jìn)一步加劇??紤]到極端氣候沖擊對(duì)經(jīng)濟(jì)社會(huì)穩(wěn)定發(fā)展的不利影響,評(píng)估氣候變化的宏觀經(jīng)濟(jì)效應(yīng),探討能夠弱化氣候變化不利沖擊的積極因素和政策選擇,無(wú)疑具有重要的現(xiàn)實(shí)意義和應(yīng)用價(jià)值。8.2.3.算法案例1.導(dǎo)入數(shù)據(jù)原數(shù)據(jù)集是以Excel表格的形式保存的,需要先另存為csv格式,再導(dǎo)入軟件。導(dǎo)入后查看前五行數(shù)據(jù),如表所示。8.2.3.算法案例2.數(shù)據(jù)可視化數(shù)據(jù)可視化主要是借助于圖形化手段,清晰有效地傳達(dá)與溝通信息,如圖所示。8.2.3.算法案例3.LSTM預(yù)估(1)數(shù)據(jù)處理(2)建立模型進(jìn)行預(yù)測(cè),如左圖所示,結(jié)果對(duì)比如右圖所示4.結(jié)果評(píng)估本案例使用了長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型對(duì)歷年溫度變化和全球GDP進(jìn)行分析,最終結(jié)果顯示,溫度變化對(duì)經(jīng)濟(jì)發(fā)展的影響并不大。8.2.3.算法案例(二)案例背景:近年來(lái),股票市場(chǎng)波動(dòng)大,預(yù)測(cè)股票價(jià)格成為投資熱點(diǎn)。鑒于股票價(jià)格預(yù)測(cè)的高度非線性及時(shí)間序列特性,本案例旨在采用循環(huán)神經(jīng)網(wǎng)絡(luò)(特別是長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM)對(duì)股票價(jià)格進(jìn)行預(yù)測(cè),以輔助自然人股民決策。研究聚焦于道瓊斯指數(shù),該指數(shù)歷史悠久,能反映市場(chǎng)趨勢(shì),是投資的重要參考。本案例利用1980年12月23日至2020年2月7日間9866個(gè)交易日的道瓊斯指數(shù)開(kāi)盤(pán)與收盤(pán)價(jià)格數(shù)據(jù),通過(guò)劃分訓(xùn)練集、驗(yàn)證集與測(cè)試集,構(gòu)建LSTM模型以預(yù)測(cè)收盤(pán)價(jià)格,旨在提升對(duì)股市的預(yù)測(cè)準(zhǔn)確性和投資效率。8.2.3.算法案例1.導(dǎo)入庫(kù)importpandasaspdimportnumpyasnpimportmatplotlib.pyplotaspltfromsklearn.preprocessingimportMinMaxScalerfromtensorflow.keras.modelsimportSequentialfromtensorflow.keras.layersimportDense,LSTM,Dropoutfromtensorflow.keras.optimizersimportAdam8.2.3.算法案例2.數(shù)據(jù)處理,取數(shù)據(jù)集前三百行8.2.3.算法案例3.將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集4.建立LSTM模型進(jìn)行預(yù)測(cè)8.2.3.算法案例5.預(yù)測(cè)結(jié)果可視化,如圖所示。6.結(jié)論本案例使用了長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型對(duì)對(duì)股票收盤(pán)價(jià)預(yù)測(cè)進(jìn)行分析,最終結(jié)果顯示,在LSTM模型下的對(duì)股票收盤(pán)價(jià)預(yù)測(cè)值較為準(zhǔn)確和穩(wěn)定。8.2.3.算法案例03BP反向傳播算法1.核心作用與原理:核心方法:訓(xùn)練神經(jīng)網(wǎng)絡(luò),支持深度學(xué)習(xí)。原理:基于梯度下降,計(jì)算輸出與期望之間的誤差,通過(guò)鏈?zhǔn)椒▌t反向傳播誤差,逐層更新權(quán)重,以減小誤差,提升網(wǎng)絡(luò)性能。2.映射關(guān)系與特性:映射關(guān)系:實(shí)現(xiàn)從n維到m維歐氏空間的連續(xù)映射,具有高度非線性。函數(shù)復(fù)現(xiàn)能力:通過(guò)簡(jiǎn)單非線性函數(shù)的多次復(fù)合,具備強(qiáng)大的信息處理與函數(shù)復(fù)現(xiàn)能力。8.3.1.基本原理8.3.1.基本原理3.應(yīng)用領(lǐng)域與實(shí)例:邏輯門(mén)映射:訓(xùn)練神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)邏輯門(mén)(如與、或、非)的邏輯值映射。手寫(xiě)數(shù)字識(shí)別:通過(guò)訓(xùn)練樣本學(xué)習(xí)數(shù)字特征,實(shí)現(xiàn)準(zhǔn)確分類?;ɑ芊诸悾豪脠D像數(shù)據(jù)和類別標(biāo)簽,學(xué)習(xí)花卉特征進(jìn)行分類。情感分析:分析文本內(nèi)容,自動(dòng)判斷情感傾向(積極、消極、中性)。神經(jīng)機(jī)器翻譯:學(xué)習(xí)源語(yǔ)言到目標(biāo)語(yǔ)言的映射關(guān)系,實(shí)現(xiàn)自動(dòng)翻譯。8.3.1.基本原理前向傳播:神經(jīng)網(wǎng)絡(luò)通過(guò)前向傳播將輸入數(shù)據(jù)從輸入層傳遞到輸出層。每層神經(jīng)元會(huì)根據(jù)輸入數(shù)據(jù)和對(duì)應(yīng)的權(quán)重計(jì)算輸出,并將其傳遞給下一層。最終,輸出層給出了網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)的預(yù)測(cè)結(jié)果。反向傳播:通過(guò)比較網(wǎng)絡(luò)的預(yù)測(cè)輸出和真實(shí)標(biāo)簽之間的差異,我們可以計(jì)算出網(wǎng)絡(luò)的損失(即誤差)。反向傳播算法將這個(gè)誤差從輸出層向隱藏層反向傳播,根據(jù)每個(gè)權(quán)重對(duì)誤差的貢獻(xiàn)程度進(jìn)行分配。這意味著,網(wǎng)絡(luò)中每個(gè)權(quán)重都會(huì)根據(jù)其對(duì)總誤差的貢獻(xiàn)進(jìn)行調(diào)整。反向傳播的核心工作原理如下:權(quán)重更新:在反向傳播過(guò)程中,每個(gè)權(quán)重都會(huì)根據(jù)其對(duì)誤差的貢獻(xiàn)進(jìn)行微調(diào)。通過(guò)使用梯度下降法,網(wǎng)絡(luò)會(huì)以小步長(zhǎng)的方式沿著誤差梯度的反方向更新權(quán)重,以逐漸減小誤差。這個(gè)過(guò)程會(huì)不斷迭代,直到網(wǎng)絡(luò)的誤差最小化,即達(dá)到收斂。8.3.1.基本原理1.隱藏層表示能力:通過(guò)反向傳播算法,神經(jīng)網(wǎng)絡(luò)具有了多層隱藏層,這使得網(wǎng)絡(luò)能夠?qū)Ω鼜?fù)雜的模式進(jìn)行建模。隱藏層可以提取輸入數(shù)據(jù)中的高級(jí)特征,并將其傳遞給輸出層進(jìn)行分類或回歸等任務(wù)。2.非線性激活函數(shù):反向傳播算法支持在每個(gè)神經(jīng)元中使用非線性激活函數(shù)。這些激活函數(shù)(如Sigmoid、ReLU、Tanh等)引入了非線性變換,使網(wǎng)絡(luò)能夠捕捉更加復(fù)雜的關(guān)系和非線性模式。8.3.1.基本原理3.并行計(jì)算能力:反向傳播算法可以在計(jì)算每層神經(jīng)元的輸出時(shí),同時(shí)計(jì)算所有神經(jīng)元的梯度。這使得網(wǎng)絡(luò)的訓(xùn)練過(guò)程可以進(jìn)行并行計(jì)算,加快了訓(xùn)練的速度。4.逐層訓(xùn)練:反向傳播算法使用逐層的方式進(jìn)行權(quán)重更新,在每一輪迭代中,先計(jì)算輸出層的誤差,然后逐層向前計(jì)算隱藏層的誤差。這種逐層訓(xùn)練的方式使得網(wǎng)絡(luò)能夠逐漸學(xué)習(xí)到數(shù)據(jù)的分布和特征,提高了訓(xùn)練的穩(wěn)定性。5.梯度下降優(yōu)化:反向傳播算法使用梯度下降法更新網(wǎng)絡(luò)的權(quán)重,通過(guò)計(jì)算誤差對(duì)于每個(gè)權(quán)重的導(dǎo)數(shù),即權(quán)重梯度,并沿著梯度的方向更新權(quán)重。這種優(yōu)化算法能夠使網(wǎng)絡(luò)朝著最小化誤差的方向進(jìn)行調(diào)整,逐漸改進(jìn)網(wǎng)絡(luò)的性能。反向傳播算法的核心思想是使用鏈?zhǔn)角髮?dǎo)法則,將輸出誤差沿網(wǎng)絡(luò)的每一層反向傳播,計(jì)算每個(gè)參數(shù)對(duì)誤差的貢獻(xiàn),并利用梯度下降法更新參數(shù),從而實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和優(yōu)化,如圖所示。8.3.2.算法流程1.計(jì)算輸出層的梯度8.3.2.算法流程首先計(jì)算輸出層的梯度,它告訴我們?cè)诰W(wǎng)絡(luò)輸出上的誤差如何影響輸出層的參數(shù)??梢酝ㄟ^(guò)誤差函數(shù)對(duì)輸出層輸出的導(dǎo)數(shù)來(lái)計(jì)算。2.反向傳播誤差到前一層將輸出層的梯度乘以權(quán)重矩陣的轉(zhuǎn)置,得到將誤差向后傳播到前一層的梯度。這表示輸出層的誤差對(duì)前一層的影響。3.計(jì)算前一層的梯度使用前一層的梯度和該層的激活函數(shù)的導(dǎo)數(shù),計(jì)算前一層的梯度。4.重復(fù)步驟2和3重復(fù)步驟2和3,將梯度逐層向后傳播,直到達(dá)到網(wǎng)絡(luò)的輸入層。在每一層,計(jì)算梯度并將其乘以前一層輸出的轉(zhuǎn)置,以傳播梯度在網(wǎng)絡(luò)中的各層之間。8.3.2.算法流程前向傳播:從輸入層開(kāi)始,通過(guò)網(wǎng)絡(luò)的每一層進(jìn)行前向計(jì)算,將輸入數(shù)據(jù)經(jīng)過(guò)權(quán)重和偏置的線性組合,并通過(guò)激活函數(shù)得到每層的輸出值。計(jì)算損失:將網(wǎng)絡(luò)的輸出與真實(shí)標(biāo)簽進(jìn)行比較,計(jì)算出一個(gè)損失函數(shù),用來(lái)衡量神經(jīng)網(wǎng)絡(luò)當(dāng)前的性能。反向傳播誤差:從輸出層開(kāi)始,利用鏈?zhǔn)角髮?dǎo)法則,將損失函數(shù)的梯度按照相反的方向依次傳播回每一層。在每一層,根據(jù)該層的輸出值和上一層傳播回來(lái)的梯度,計(jì)算該層的梯度。計(jì)算梯度:利用反向傳播得到的每個(gè)參數(shù)的梯度,可以衡量該參數(shù)對(duì)整體損失的貢獻(xiàn)程度。梯度可以反映參數(shù)調(diào)整的方向和速度,可以通過(guò)梯度下降法或其變體來(lái)更新每個(gè)參數(shù)的數(shù)值。參數(shù)更新:根據(jù)梯度下降法則,對(duì)每個(gè)參數(shù)進(jìn)行相應(yīng)的更新,使其沿著損失函數(shù)下降的方向逐步調(diào)整,從而降低損失函數(shù)的值。重復(fù)迭代:通過(guò)反復(fù)進(jìn)行前向傳播、反向傳播和參數(shù)更新的過(guò)程,迭代優(yōu)化神經(jīng)網(wǎng)絡(luò),直到達(dá)到預(yù)設(shè)的停止準(zhǔn)則(如達(dá)到最大迭
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026山東濟(jì)寧高新區(qū)教育系統(tǒng)急需緊缺人才招聘10名備考題庫(kù)及一套答案詳解
- 2026中國(guó)旅游集團(tuán)總部及所屬企業(yè)崗位招聘9人備考題庫(kù)有完整答案詳解
- 2026安徽亳州市蒙城縣直幼兒園面向農(nóng)村學(xué)校選調(diào)教師55人備考題庫(kù)及完整答案詳解一套
- 2026四川樂(lè)山馬邊彝族自治縣婦幼保健計(jì)劃生育服務(wù)中心招聘4人備考題庫(kù)及答案詳解(新)
- 2026四川成都市錦江發(fā)展集團(tuán)下屬錦東公司第一次項(xiàng)目制員工招聘4人備考題庫(kù)參考答案詳解
- 2026上半年貴州事業(yè)單位聯(lián)考印江自治縣招聘83人備考題庫(kù)及答案詳解1套
- 2026四川成都市地質(zhì)環(huán)境監(jiān)測(cè)站考核招聘1人備考題庫(kù)及參考答案詳解
- 2026中國(guó)中檢云南公司滇東片區(qū)文山公司招聘1人備考題庫(kù)及參考答案詳解1套
- 2026寧夏固原市審計(jì)局聘請(qǐng)專業(yè)人員輔助審計(jì)工作6人備考題庫(kù)完整參考答案詳解
- 2026中國(guó)通號(hào)招聘3人備考題庫(kù)(辦公室、戰(zhàn)略投資部)有答案詳解
- 江蘇省無(wú)錫市2025屆高三上學(xué)期期末教學(xué)質(zhì)量調(diào)研測(cè)試-數(shù)學(xué)試卷(含答案)
- 慢性胃炎的護(hù)理業(yè)務(wù)查房
- 經(jīng)典名著《紅樓夢(mèng)》閱讀任務(wù)單
- 古田會(huì)議學(xué)習(xí)課件
- 高寒地區(qū)建筑工程冬季施工技術(shù)規(guī)范研究
- 電流保護(hù)原理課件
- DBJT15-212-2021 智慧排水建設(shè)技術(shù)規(guī)范
- 民俗學(xué)課件萬(wàn)建中
- 能源與動(dòng)力工程專業(yè)培養(yǎng)目標(biāo)合理性評(píng)價(jià)分析報(bào)告
- 公司員工活動(dòng)室管理制度
- 2025年水晶手鏈?zhǔn)袌?chǎng)需求分析
評(píng)論
0/150
提交評(píng)論