版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
新版人工神經(jīng)網(wǎng)絡新版人工神經(jīng)網(wǎng)絡第1頁2023/4/272蔣宗禮軟件學科部聯(lián)絡電話:67392508Email:jiangzl@辦公地點:信息北樓214新版人工神經(jīng)網(wǎng)絡第2頁2023/4/273教材書名:《人工神經(jīng)網(wǎng)絡導論》出版社:高等教育出版社出版日期:年8月定價:12.4元作者:蔣宗禮新版人工神經(jīng)網(wǎng)絡第3頁2023/4/274主要參考書目1、PhilipD.Wasserman,
NeuralComputing:TheoryandPractice,VanNostrandReinhold,19892、胡守仁、余少波、戴葵,神經(jīng)網(wǎng)絡導論,國防科技大學出版社,1993年10月3、楊行峻、鄭君里,人工神經(jīng)網(wǎng)絡,高等教育出版社,1992年9月4、聞新、周露、王丹力、熊曉英,MATLAB神經(jīng)網(wǎng)絡應用設計,科學出版社,.5.新版人工神經(jīng)網(wǎng)絡第4頁2023/4/275課程目標和基礎要求
作為人工神經(jīng)網(wǎng)絡入門課程,用于將學生引入人工神經(jīng)網(wǎng)絡及其應用研究領域。介紹人工神經(jīng)網(wǎng)絡及其基礎網(wǎng)絡模型,使學生了解智能系統(tǒng)描述基礎模型掌握人工神經(jīng)網(wǎng)絡基礎概念、單層網(wǎng)、多層網(wǎng)、循環(huán)網(wǎng)等各種基礎網(wǎng)絡模型結構、特點、經(jīng)典訓練算法、運行方式、經(jīng)典問題掌握軟件實現(xiàn)方法。新版人工神經(jīng)網(wǎng)絡第5頁2023/4/276課程目標和基礎要求了解人工神經(jīng)網(wǎng)絡相關研究思想,從中學習開拓者們個別問題求解方法。經(jīng)過試驗深入體會相關模型使用方法和性能,獲取一些初步經(jīng)驗。查閱適當參考文件,將所學知識與自己未來研究課題(包含碩士論文階段研究課題)相結合起來,到達既豐富學習內(nèi)容,又有一定研究和應用目標。新版人工神經(jīng)網(wǎng)絡第6頁2023/4/277主要內(nèi)容
智能及其實現(xiàn)ANN基礎PerceptronBPCPN統(tǒng)計方法Hopfield網(wǎng)與BAMART新版人工神經(jīng)網(wǎng)絡第7頁2023/4/278主要內(nèi)容第一章:引論智能概念、智能系統(tǒng)特點及其描述基礎模型,物理符號系統(tǒng)與連接主義觀點及其比較;人工神經(jīng)網(wǎng)絡特點、發(fā)展歷史。
新版人工神經(jīng)網(wǎng)絡第8頁2023/4/279主要內(nèi)容第二章
人工神經(jīng)網(wǎng)絡基礎本章在介紹了基礎神經(jīng)元后,將概要介紹人工神經(jīng)網(wǎng)絡普通特征。主要包含,生物神經(jīng)網(wǎng)絡模型,人工神經(jīng)元模型與經(jīng)典激勵函數(shù);人工神經(jīng)網(wǎng)絡基礎拓撲特征,存放類型(CAM──LTM,AM──STM)及映象,Supervised訓練與Unsupervised訓練。新版人工神經(jīng)網(wǎng)絡第9頁2023/4/2710主要內(nèi)容第三章
感知器感知器與人工神經(jīng)網(wǎng)絡早期發(fā)展;單層網(wǎng)能處理線性可分問題,而無法處理線形不可分問題,要想處理這一問題,必須引入多層網(wǎng);Hebb學習律,Delta規(guī)則,感知器訓練算法。試驗:實現(xiàn)一個感知器。
新版人工神經(jīng)網(wǎng)絡第10頁2023/4/2711主要內(nèi)容第四章
向后傳輸BP(Backpropagation)網(wǎng)絡組成及其訓練過程;隱藏層權調(diào)整方法直觀分析,BP訓練算法中使用Delta規(guī)則(最速下降法)理論推導;算法收斂速度及其改進討論;BP網(wǎng)絡中幾個主要問題。試驗:實現(xiàn)BP算法。
新版人工神經(jīng)網(wǎng)絡第11頁2023/4/2712主要內(nèi)容第五章
對傳網(wǎng)生物神經(jīng)系統(tǒng)與異構網(wǎng)引入;對傳網(wǎng)網(wǎng)絡結構,Kohonen層與Grossberg層正常運行,對傳網(wǎng)輸入向量預處理,Kohonen層訓練算法及其權矩陣初始化方法;Grossberg層訓練;完整對傳網(wǎng)。試驗:實現(xiàn)基礎對傳網(wǎng)。
新版人工神經(jīng)網(wǎng)絡第12頁2023/4/2713主要內(nèi)容第六章
統(tǒng)計方法統(tǒng)計方法是為了處理局部極小點問題而引入,統(tǒng)計網(wǎng)絡基礎訓練算法,模擬退火算法與收斂分析,Cauchy訓練,人工熱處理與臨界溫度在訓練中使用,BP算法與Cauchy訓練相結合。試驗:實現(xiàn)模擬退火算法。
新版人工神經(jīng)網(wǎng)絡第13頁2023/4/2714主要內(nèi)容第七章循環(huán)網(wǎng)絡循環(huán)網(wǎng)絡組織,穩(wěn)定性分析;相聯(lián)存放;統(tǒng)計Hopfield網(wǎng)與Boltzmann機;Hopfield網(wǎng)用于處理TSP問題。BAM(BidirectionalAssociativeMemory)用于實現(xiàn)雙聯(lián)存放;基礎雙聯(lián)存放網(wǎng)絡結構及訓練;其它幾個相聯(lián)存放網(wǎng)絡。試驗:實現(xiàn)一個Hopfield網(wǎng)。
新版人工神經(jīng)網(wǎng)絡第14頁2023/4/2715主要內(nèi)容第八章
自適應共振理論人腦穩(wěn)定性與可塑性問題;ART模型總體結構與分塊描述;比較層與識別層之間兩個聯(lián)接矩陣初始化,識別過程與比較過程,查找實現(xiàn);訓練討論。
新版人工神經(jīng)網(wǎng)絡第15頁2023/4/2716第1章
引言主要內(nèi)容:智能與人工智能;ANN特點;歷史回顧與展望重點:智能本質(zhì);ANN是一個非線性大規(guī)模并行處理系統(tǒng)難點:對智能刻畫
新版人工神經(jīng)網(wǎng)絡第16頁2023/4/2717第1章
引言1.1人工神經(jīng)網(wǎng)絡提出1.2人工神經(jīng)網(wǎng)絡特點1.3歷史回顧新版人工神經(jīng)網(wǎng)絡第17頁2023/4/2718第1章
引言人類對人工智能研究能夠分成兩種方式對應著兩種不一樣技術:傳統(tǒng)人工智能技術——心理角度模擬基于人工神經(jīng)網(wǎng)絡技術——生理角度模擬新版人工神經(jīng)網(wǎng)絡第18頁2023/4/27191.1人工神經(jīng)網(wǎng)絡提出
人工神經(jīng)網(wǎng)絡(ArtificialNeuralNetworks,簡記作ANN),是對人類大腦系統(tǒng)一階特征一個描述。簡單地講,它是一個數(shù)學模型,能夠用電子線路來實現(xiàn),也能夠用計算機程序來模擬,是人工智能研究一個方法。
新版人工神經(jīng)網(wǎng)絡第19頁2023/4/27201.1人工神經(jīng)網(wǎng)絡提出1.1.1智能與人工智能
一、
智能含義智能是個體有目標行為,合理思維,以及有效、適應環(huán)境綜合能力。
智能是個體認識客觀事物和利用知識處理問題能力。
人類個體智能是一個綜合能力。新版人工神經(jīng)網(wǎng)絡第20頁2023/4/27211.1人工神經(jīng)網(wǎng)絡提出智能能夠包含8個方面感知與認識客觀事物、客觀世界和自我能力感知是智能基礎——最基礎能力
經(jīng)過學習取得經(jīng)驗與積累知識能力這是人類在世界中能夠不停發(fā)展最基礎能力。了解知識,利用知識和經(jīng)驗分析、處理問題能力這一能力能夠算作是智能高級形式。是人類對世界進行適當改造,推進社會不停發(fā)展基礎能力。新版人工神經(jīng)網(wǎng)絡第21頁2023/4/27221.1人工神經(jīng)網(wǎng)絡提出聯(lián)想、推理、判斷、決議語言能力這是智能高級形式又首先。預測和認識“主動”和“被動”之分。聯(lián)想、推理、判斷、決議能力是“主動”基礎。利用進行抽象、概括能力上述這5種能力,被認為是人類智能最為基礎能力
新版人工神經(jīng)網(wǎng)絡第22頁2023/4/27231.1人工神經(jīng)網(wǎng)絡提出作為5種能力綜合表現(xiàn)形式3種能力發(fā)覺、創(chuàng)造、創(chuàng)造、創(chuàng)新能力實時、快速、合理地應付復雜環(huán)境能力預測、洞察事物發(fā)展、改變能力
新版人工神經(jīng)網(wǎng)絡第23頁2023/4/27241.1人工神經(jīng)網(wǎng)絡提出二、人工智能人工智能:研究怎樣使類似計算機這么設備去模擬人類這些能力。研究人工智能目標增加人類探索世界,推進社會前進能力深入認識自己三大學術流派符號主義(或叫做符號/邏輯主義)學派聯(lián)接主義(或者叫做PDP)學派進化主義(或者叫做行動/響應)學派新版人工神經(jīng)網(wǎng)絡第24頁2023/4/27251.1人工神經(jīng)網(wǎng)絡提出1.1.2物理符號系統(tǒng)
人腦反應形式化
現(xiàn)實信息數(shù)據(jù)
物理系統(tǒng)物理符號系統(tǒng)
表現(xiàn)智能新版人工神經(jīng)網(wǎng)絡第25頁2023/4/27261.1人工神經(jīng)網(wǎng)絡提出Newell和Simon假說:一個物理系統(tǒng)表現(xiàn)智能行為充要條件是它有一個物理符號系統(tǒng)概念:物理符號系統(tǒng)需要有一組稱為符號實體組成,它們都是物理模型,能夠在另一類稱為符號結構實體中作為成份出現(xiàn),以組成更高等級系統(tǒng)新版人工神經(jīng)網(wǎng)絡第26頁2023/4/27271.1人工神經(jīng)網(wǎng)絡提出困難:抽象——舍棄一些特征,同時保留一些特征形式化處理——用物理符號及對應規(guī)則表示物理系統(tǒng)存在和運行。局限:對全局性判斷、含糊信息處理、多粒度視覺信息處理等是非常困難。新版人工神經(jīng)網(wǎng)絡第27頁2023/4/27281.1人工神經(jīng)網(wǎng)絡提出1.1.3聯(lián)接主義觀點
關鍵:智能本質(zhì)是聯(lián)接機制。
神經(jīng)網(wǎng)絡是一個由大量簡單處理單元組成高度復雜大規(guī)模非線性自適應系統(tǒng)
ANN力爭從四個方面去模擬人腦智能行為物理結構
計算模擬
存放與操作
訓練
新版人工神經(jīng)網(wǎng)絡第28頁2023/4/27291.1人工神經(jīng)網(wǎng)絡提出1.1.4兩種模型比較
心理過程邏輯思維高級形式(思維表象)
生理過程
形象思維
低級形式(思維根本)
仿生
人工神經(jīng)網(wǎng)絡聯(lián)結主義觀點物理符號系統(tǒng)新版人工神經(jīng)網(wǎng)絡第29頁2023/4/27301.1人工神經(jīng)網(wǎng)絡提出物理符號系統(tǒng)和人工神經(jīng)網(wǎng)絡系統(tǒng)差異
項目物理符號系統(tǒng)人工神經(jīng)網(wǎng)絡處理方式邏輯運算模擬運算執(zhí)行方式串行并行動作離散連續(xù)存放局部集中全局分布新版人工神經(jīng)網(wǎng)絡第30頁2023/4/27311.1人工神經(jīng)網(wǎng)絡提出兩種人工智能技術比較項目傳統(tǒng)AI技術ANN技術
基礎實現(xiàn)方式串行處理;由程序實現(xiàn)控制
并行處理;對樣本數(shù)據(jù)進行多目標學習;經(jīng)過人工神經(jīng)元之間相互作用實現(xiàn)控制基礎開發(fā)方法設計規(guī)則、框架、程序;用樣本數(shù)據(jù)進行調(diào)試(由人依據(jù)已知環(huán)境去結構一個模型)定義人工神經(jīng)網(wǎng)絡結構原型,經(jīng)過樣本數(shù)據(jù),依據(jù)基礎學習算法完成學習——自動從樣本數(shù)據(jù)中抽取內(nèi)涵(自動適應應用環(huán)境)適應領域
準確計算:符號處理,數(shù)值計算非準確計算:模擬處理,感覺,大規(guī)模數(shù)據(jù)并行處理模擬對象
左腦(邏輯思維)右腦(形象思維)新版人工神經(jīng)網(wǎng)絡第31頁2023/4/27321.2人工神經(jīng)網(wǎng)絡特點信息分布表示運算全局并行和局部操作處理非線性
新版人工神經(jīng)網(wǎng)絡第32頁2023/4/27331.2.1人工神經(jīng)網(wǎng)絡概念1、定義
1)Hecht—Nielsen(1988年)人工神經(jīng)網(wǎng)絡是一個并行、分布處理結構,它由處理單元及其稱為聯(lián)接無向訊號通道互連而成。這些處理單元(PE—ProcessingElement)含有局部內(nèi)存,并能夠完成局部操作。每個處理單元有一個單一輸出聯(lián)接,這個輸出能夠依據(jù)需要被分枝成希望個數(shù)許多并行聯(lián)接,且這些并行聯(lián)接都輸出相同信號,即對應處理單元信號,信號大小不因分支多少而改變。新版人工神經(jīng)網(wǎng)絡第33頁2023/4/27341.2.1人工神經(jīng)網(wǎng)絡概念(1)Hecht—Nielsen(1988年)(續(xù))處理單元輸出信號能夠是任何需要數(shù)學模型,每個處理單元中進行操作必須是完全局部。也就是說,它必須僅僅依賴于經(jīng)過輸入聯(lián)接抵達處理單元全部輸入信號當前值和存放在處理單元局部內(nèi)存中值。新版人工神經(jīng)網(wǎng)絡第34頁2023/4/27351.2.1人工神經(jīng)網(wǎng)絡概念強調(diào):
①
并行、分布處理結構;②一個處理單元輸出能夠被任意分枝,且大小不變;③輸出信號能夠是任意數(shù)學模型;④處理單元完全局部操作
新版人工神經(jīng)網(wǎng)絡第35頁2023/4/27361.2.1人工神經(jīng)網(wǎng)絡概念(2)Rumellhart,McClelland,HintonPDP1)
一組處理單元(PE或AN);2)
處理單元激活狀態(tài)(ai);3)
每個處理單元輸出函數(shù)(fi);4)
處理單元之間聯(lián)接模式;5)
傳遞規(guī)則(∑wijoi);6)
把處理單元輸入及當前狀態(tài)結合起來產(chǎn)生激活值激活規(guī)則(Fi);7)
經(jīng)過經(jīng)驗修改聯(lián)接強度學習規(guī)則;8)
系統(tǒng)運行環(huán)境(樣本集合)。
新版人工神經(jīng)網(wǎng)絡第36頁2023/4/27371.2.1人工神經(jīng)網(wǎng)絡概念(3)Simpson(1987年)人工神經(jīng)網(wǎng)絡是一個非線性有向圖,圖中含有能夠經(jīng)過改變權大小來存放模式加權邊,而且能夠從不完整或未知輸入找到模式。
新版人工神經(jīng)網(wǎng)絡第37頁2023/4/27381.2.1人工神經(jīng)網(wǎng)絡概念2、關鍵點(1)
信息分布表示(2)
運算全局并行與局部操作(3)
處理非線性特征3、對大腦基礎特征模擬1)
形式上:神經(jīng)元及其聯(lián)接;BN對AN2)
表現(xiàn)特征:信息存放與處理新版人工神經(jīng)網(wǎng)絡第38頁2023/4/27391.2.1人工神經(jīng)網(wǎng)絡概念4、別名人工神經(jīng)系統(tǒng)(ANS)神經(jīng)網(wǎng)絡(NN)自適應系統(tǒng)(AdaptiveSystems)、自適應網(wǎng)(AdaptiveNetworks)聯(lián)接模型(Connectionism)神經(jīng)計算機(Neurocomputer)新版人工神經(jīng)網(wǎng)絡第39頁2023/4/27401.2.2學習(Learning)能力人工神經(jīng)網(wǎng)絡能夠依據(jù)所在環(huán)境去改變它行為自相聯(lián)網(wǎng)絡異相聯(lián)網(wǎng)絡:它在接收樣本集合A時,能夠抽取集合A中輸入數(shù)據(jù)與輸出數(shù)據(jù)之間映射關系。——“抽象”功效。不一樣人工神經(jīng)網(wǎng)絡模型,有不一樣學習/訓練算法新版人工神經(jīng)網(wǎng)絡第40頁2023/4/27411.2.3基礎特征自動提取
因為其運算不準確性,表現(xiàn)成“去噪音、容殘缺”能力,利用這種不準確性,比較自然地實現(xiàn)模式自動分類。普化(Generalization)能力與抽象能力
新版人工神經(jīng)網(wǎng)絡第41頁2023/4/27421.2.4信息分布存放信息分布存提供容錯功效因為信息被分布存放在幾乎整個網(wǎng)絡中,所以,當其中某一個點或者某幾個點被破壞時,信息依然能夠被存取。系統(tǒng)在受到局部損傷時還能夠正常工作。并不是說能夠任意地對完成學習網(wǎng)絡進行修改。也正是因為信息分布存放,對一類網(wǎng)來說,當它完成學習后,假如再讓它學習新東西,這時就會破壞原來已學會東西。
新版人工神經(jīng)網(wǎng)絡第42頁2023/4/27431.2.5適應性(Applicability)問題
擅長兩個方面:對大量數(shù)據(jù)進行分類,而且只有較少幾個情況;必須學習一個復雜非線性映射。當前應用:大家主要將其用于語音、視覺、知識處理、輔助決議等方面。在數(shù)據(jù)壓縮、模式匹配、系統(tǒng)建模、含糊控制、求組合優(yōu)化問題最正確解近似解(不是最正確近似解)等方面也有很好應用。
新版人工神經(jīng)網(wǎng)絡第43頁2023/4/27441.3歷史回顧
1.3.1萌芽期(20世紀40年代)人工神經(jīng)網(wǎng)絡研究最早能夠追溯到人類開始研究自己智能時期,到1949年止。1943年,心理學家McCulloch和數(shù)學家Pitts建立起了著名閾值加權和模型,簡稱為M-P模型。發(fā)表于數(shù)學生物物理學會刊《BulletinofMethematicalBiophysics》1949年,心理學家D.O.Hebb提出神經(jīng)元之間突觸聯(lián)絡是可變假說——Hebb學習律。
新版人工神經(jīng)網(wǎng)絡第44頁2023/4/27451.3.2第一高潮期(1950~1968)
以MarvinMinsky,F(xiàn)rankRosenblatt,BernardWidrow等為代表人物,代表作是單級感知器(Perceptron)。可用電子線路模擬。大家樂觀地認為幾乎已經(jīng)找到了智能關鍵。許多部門都開始大批地投入此項研究,希望盡快占領制高點。
新版人工神經(jīng)網(wǎng)絡第45頁2023/4/27461.3.3反思期(1969~1982)
M.L.Minsky和S.Papert,《Perceptron》,MITPress,1969年
異或”運算不可表示
二十世紀70年代和80年代早期研究結果
認識規(guī)律:認識——實踐——再認識
新版人工神經(jīng)網(wǎng)絡第46頁2023/4/27471.3.4第二高潮期(1983~1990)
1982年,J.Hopfield提出循環(huán)網(wǎng)絡用Lyapunov函數(shù)作為網(wǎng)絡性能判定能量函數(shù),建立ANN穩(wěn)定性判別依據(jù)說明了ANN與動力學關系用非線性動力學方法來研究ANN特征指出信息被存放在網(wǎng)絡中神經(jīng)元聯(lián)接上
新版人工神經(jīng)網(wǎng)絡第47頁2023/4/27481.3.4第二高潮期(1983~1990)2)1984年,
J.Hopfield設計研制了以后被大家稱為Hopfield網(wǎng)電路。很好地處理了著名TSP問題,找到了最正確解近似解,引發(fā)了較大轟動。3)1985年,UCSDHinton、Sejnowsky、Rumelhart等人所在并行分布處理(PDP)小組研究者在Hopfield網(wǎng)絡中引入了隨機機制,提出所謂Boltzmann機。
新版人工神經(jīng)網(wǎng)絡第48頁2023/4/27491.3.4第二高潮期(1983~1990)4)1986年,并行分布處理小組Rumelhart等研究者重新獨立地提出多層網(wǎng)絡學習算法——BP算法,很好地處理了多層網(wǎng)絡學習問題。(Paker1982和Werbos1974年)我國首屆神經(jīng)網(wǎng)絡大會是1990年12月在北京舉行。
新版人工神經(jīng)網(wǎng)絡第49頁2023/4/27501.3.5再認識與應用研究期(1991~)
問題:1)應用面還不夠寬2)結果不夠準確3)存在可信度問題
新版人工神經(jīng)網(wǎng)絡第50頁2023/4/27511.3.5再認識與應用研究期(1991~)
研究:1)開發(fā)覺有模型應用,并在應用中依據(jù)實際運行情況對模型、算法加以改造,以提升網(wǎng)絡訓練速度和運行準確度。2)充分發(fā)揮兩種技術各自優(yōu)勢是一個有效方法3)希望在理論上尋找新突破,建立新專用/通用模型和算法。4)深入對生物神經(jīng)系統(tǒng)進行研究,不停地豐富對人腦認識。
新版人工神經(jīng)網(wǎng)絡第51頁2023/4/2752第2章人工神經(jīng)網(wǎng)絡基礎主要內(nèi)容:BN與AN;拓撲結構;存放;訓練重點:AN;拓撲結構;訓練難點:訓練新版人工神經(jīng)網(wǎng)絡第52頁2023/4/2753第2章人工神經(jīng)網(wǎng)絡基礎2.1生物神經(jīng)網(wǎng)2.2人工神經(jīng)元2.3人工神經(jīng)網(wǎng)絡拓撲特征2.4存放與映射2.5人工神經(jīng)網(wǎng)絡訓練新版人工神經(jīng)網(wǎng)絡第53頁2023/4/27542.1生物神經(jīng)網(wǎng)1、組成胞體(Soma)枝蔓(Dendrite)胞體(Soma)
軸突(Axon)突觸(Synapse)2、工作過程新版人工神經(jīng)網(wǎng)絡第54頁2023/4/27552.1生物神經(jīng)網(wǎng)3、六個基礎特征:1)神經(jīng)元及其聯(lián)接;2)神經(jīng)元之間聯(lián)接強度決定信號傳遞強弱;3)神經(jīng)元之間聯(lián)接強度是能夠隨訓練改變;4)信號能夠是起刺激作用,也能夠是起抑制作用;5)一個神經(jīng)元接收信號累積效果決定該神經(jīng)元狀態(tài);6)每個神經(jīng)元能夠有一個“閾值”。新版人工神經(jīng)網(wǎng)絡第55頁2023/4/27562.2人工神經(jīng)元
神經(jīng)元是組成神經(jīng)網(wǎng)絡最基礎單元(構件)。人工神經(jīng)元模型應該含有生物神經(jīng)元六個基礎特征。
新版人工神經(jīng)網(wǎng)絡第56頁2023/4/27572.2.1人工神經(jīng)元基礎組成
人工神經(jīng)元模擬生物神經(jīng)元一階特征。輸入:X=(x1,x2,…,xn)聯(lián)接權:W=(w1,w2,…,wn)T網(wǎng)絡輸入:
net=∑xiwi向量形式:
net=XWxnwn∑x1w1x2w2net=XW…新版人工神經(jīng)網(wǎng)絡第57頁2023/4/27582.2.2激活函數(shù)(ActivationFunction)
激活函數(shù)——執(zhí)行對該神經(jīng)元所取得網(wǎng)絡輸入變換,也能夠稱為激勵函數(shù)、活化函數(shù):o=f(net)
1、線性函數(shù)(LinerFunction)
f(net)=k*net+c
netooc新版人工神經(jīng)網(wǎng)絡第58頁2023/4/27592、非線性斜面函數(shù)(RampFunction)
γ ifnet≥θf(net)=k*net if|net|<θ -γ ifnet≤-θ
γ>0為一常數(shù),被稱為飽和值,為該神經(jīng)元最大輸出。
新版人工神經(jīng)網(wǎng)絡第59頁2023/4/27602、非線性斜面函數(shù)(RampFunction)γ-γθ
-θ
net
o
新版人工神經(jīng)網(wǎng)絡第60頁2023/4/27613、閾值函數(shù)(ThresholdFunction)階躍函數(shù)
β ifnet>θf(net)= -γ ifnet≤θβ、γ、θ均為非負實數(shù),θ為閾值二值形式:
1 ifnet>θf(net)= 0 ifnet≤θ雙極形式:
1 ifnet>θf(net)= -1 ifnet≤θ
新版人工神經(jīng)網(wǎng)絡第61頁2023/4/27623、閾值函數(shù)(ThresholdFunction)階躍函數(shù)β
-γθonet0新版人工神經(jīng)網(wǎng)絡第62頁2023/4/27634、S形函數(shù)
壓縮函數(shù)(SquashingFunction)和邏輯斯特函數(shù)(LogisticFunction)。f(net)=a+b/(1+exp(-d*net))a,b,d為常數(shù)。它飽和值為a和a+b。最簡單形式為:f(net)=1/(1+exp(-d*net))
函數(shù)飽和值為0和1。S形函數(shù)有很好增益控制
新版人工神經(jīng)網(wǎng)絡第63頁2023/4/27644、S形函數(shù)
a+bo(0,c)netac=a+b/2新版人工神經(jīng)網(wǎng)絡第64頁2023/4/27652.2.3M-P模型
x2w2
∑fo=f(net)xnwn…net=XWx1w1McCulloch—Pitts(M—P)模型,也稱為處理單元(PE)
新版人工神經(jīng)網(wǎng)絡第65頁2023/4/2766上次課內(nèi)容回顧擅長兩個方面當前應用語音、視覺、知識處理數(shù)據(jù)壓縮、模式匹配、系統(tǒng)建模、含糊控制、求組合優(yōu)化問題最正確解近似解(不是最正確近似解)輔助決議——預報與智能管理通信——自適應均衡、回波抵消、路由選擇、ATM中呼叫接納、識別與控制空間科學——對接、導航、制導、飛行程序優(yōu)化新版人工神經(jīng)網(wǎng)絡第66頁2023/4/2767上次課內(nèi)容回顧發(fā)展過程萌芽期(20世紀40年代)M-P模型Hebb學習律第一高潮期(1950~1968)Perceptron興衰反思期(1969~1982)第二高潮期(1983~1990)4個標志性結果再認識與應用研究期(1991~)新版人工神經(jīng)網(wǎng)絡第67頁2023/4/2768上次課內(nèi)容回顧生物神經(jīng)網(wǎng)六個基礎特征神經(jīng)元及其聯(lián)接、信號傳遞、訓練、刺激與抑制、累積效果、“閾值”。人工神經(jīng)元基礎組成xnwn∑x1w1x2w2net=XW…新版人工神經(jīng)網(wǎng)絡第68頁2023/4/2769上次課內(nèi)容回顧激活函數(shù)與M-P模型
線性函數(shù)、非線性斜面函數(shù)、閾值函數(shù)
S形函數(shù)
M-P模型x2w2
∑fo=f(net)xnwn…net=XWx1w1新版人工神經(jīng)網(wǎng)絡第69頁2023/4/27702.3人工神經(jīng)網(wǎng)絡拓撲特征
連接拓撲表示
ANi wij ANj
新版人工神經(jīng)網(wǎng)絡第70頁2023/4/27712.3.1聯(lián)接模式
用正號(“+”,可省略)表示傳送來信號起刺激作用,它用于增加神經(jīng)元活躍度;用負號(“-”)表示傳送來信號起抑制作用,它用于降低神經(jīng)元活躍度。層次(又稱為“級”)劃分,造成了神經(jīng)元之間三種不一樣互連模式:
新版人工神經(jīng)網(wǎng)絡第71頁2023/4/27722.3.1聯(lián)接模式
1、
層(級)內(nèi)聯(lián)接層內(nèi)聯(lián)接又叫做區(qū)域內(nèi)(Intra-field)聯(lián)接或側聯(lián)接(Lateral)。用來加強和完成層內(nèi)神經(jīng)元之間競爭2、
循環(huán)聯(lián)接反饋信號。
新版人工神經(jīng)網(wǎng)絡第72頁2023/4/27732.3.1聯(lián)接模式3、層(級)間聯(lián)接
層間(Inter-field)聯(lián)接指不一樣層中神經(jīng)元之間聯(lián)接。這種聯(lián)接用來實現(xiàn)層間信號傳遞前饋信號反饋信號
新版人工神經(jīng)網(wǎng)絡第73頁2023/4/27742.3.2網(wǎng)絡分層結構
單級網(wǎng)
簡單單級網(wǎng)
新版人工神經(jīng)網(wǎng)絡第74頁2023/4/2775簡單單級網(wǎng)……x1x2…xno1o2omwnmw11w1mw2mwn1輸出層輸入層 新版人工神經(jīng)網(wǎng)絡第75頁2023/4/2776簡單單級網(wǎng)W=(wij)輸出層第j個神經(jīng)元網(wǎng)絡輸入記為netj:
netj=x1w1j+x2w2j+…+xnwnj其中,1≤j≤m。取NET=(net1,net2,…,netm)NET=XWO=F(NET)新版人工神經(jīng)網(wǎng)絡第76頁2023/4/2777單級橫向反饋網(wǎng)輸出層x1o1w11w1mx2o2w2m………xnomwn1輸入層 V新版人工神經(jīng)網(wǎng)絡第77頁2023/4/2778單級橫向反饋網(wǎng)
V=(vij)NET=XW+OVO=F(NET)時間參數(shù)——神經(jīng)元狀態(tài)在主時鐘控制下同時改變考慮X總加在網(wǎng)上情況NET(t+1)=X(t)W+O(t)V O(t+1)=F(NET(t+1))O(0)=0考慮僅在t=0時加X情況。
穩(wěn)定性判定新版人工神經(jīng)網(wǎng)絡第78頁2023/4/2779多級網(wǎng)輸出層隱藏層輸入層o1o2om…x1x2xn………………新版人工神經(jīng)網(wǎng)絡第79頁2023/4/2780層次劃分
信號只被允許從較低層流向較高層。層號確定層高低:層號較小者,層次較低,層號較大者,層次較高。輸入層:被記作第0層。該層負責接收來自網(wǎng)絡外部信息輸出層隱藏層輸入層o1o2om…x1x2xn………………新版人工神經(jīng)網(wǎng)絡第80頁2023/4/2781第j層:第j-1層直接后繼層(j>0),它直接接收第j-1層輸出。輸出層:它是網(wǎng)絡最終一層,含有該網(wǎng)絡最大層號,負責輸出網(wǎng)絡計算結果。隱藏層:除輸入層和輸出層以外其它各層叫隱藏層。隱藏層不直接接收外界信號,也不直接向外界發(fā)送信號輸出層隱藏層輸入層o1o2om…x1x2xn………………新版人工神經(jīng)網(wǎng)絡第81頁2023/4/2782約定
:輸出層層號為該網(wǎng)絡層數(shù):n層網(wǎng)絡,或n級網(wǎng)絡。第j-1層到第j層聯(lián)接矩陣為第j層聯(lián)接矩陣,輸出層對應矩陣叫輸出層聯(lián)接矩陣。今后,在需要時候,普通咱們用W(j)表示第j層矩陣。輸出層隱藏層輸入層o1o2om…x1x2xn………………W(1)W(2)W(3)W(h)新版人工神經(jīng)網(wǎng)絡第82頁2023/4/2783多級網(wǎng)——h層網(wǎng)絡輸出層隱藏層輸入層o1o2om…x1x2xn………………W(1)W(2)W(3)W(h)新版人工神經(jīng)網(wǎng)絡第83頁2023/4/2784多級網(wǎng)非線性激活函數(shù)
F(X)=kX+CF3(F2(F1(XW(1))W(2))W(3))新版人工神經(jīng)網(wǎng)絡第84頁2023/4/2785循環(huán)網(wǎng)x1o1輸出層隱藏層輸入層x2o2omxn…………………新版人工神經(jīng)網(wǎng)絡第85頁2023/4/2786循環(huán)網(wǎng)
假如將輸出信號反饋到輸入端,就可組成一個多層循環(huán)網(wǎng)絡。輸入原始信號被逐步地“加強”、被“修復”。大腦短期記憶特征——看到東西不是一下子就從腦海里消失。穩(wěn)定:反饋信號會引發(fā)網(wǎng)絡輸出不停改變。咱們希望這種改變逐步減小,而且最終能消失。當改變最終消失時,網(wǎng)絡到達了平衡狀態(tài)。假如這種改變不能消失,則稱該網(wǎng)絡是不穩(wěn)定。
新版人工神經(jīng)網(wǎng)絡第86頁2023/4/27872.4存放與映射
空間模式(SpatialModel)時空模式(SpatialtemporalModel)空間模式三種存放類型1、
RAM方式(RandomAccessMemory)隨機訪問方式是將地址映射到數(shù)據(jù)。2、
CAM方式(ContentAddressableMemory)內(nèi)容尋址方式是將數(shù)據(jù)映射到地址。3、
AM方式(AssociativeMemory)相聯(lián)存放方式是將數(shù)據(jù)映射到數(shù)據(jù)。
新版人工神經(jīng)網(wǎng)絡第87頁2023/4/27882.4存放與映射后續(xù)兩種方式是人工神經(jīng)網(wǎng)絡工作方式。在學習/訓練期間,人工神經(jīng)網(wǎng)絡以CAM方式工作;權矩陣又被稱為網(wǎng)絡長久存放(LongTermMemory,簡記為LTM)。網(wǎng)絡在正常工作階段是以AM方式工作;神經(jīng)元狀態(tài)表示模式為短期存放(ShortTermMemory,簡記為STM)。
新版人工神經(jīng)網(wǎng)絡第88頁2023/4/27892.4存放與映射自相聯(lián)(Auto-associative)映射:訓練網(wǎng)絡樣本集為向量集合為{A1,A2,…,An}在理想情況下,該網(wǎng)絡在完成訓練后,其權矩陣存放將是上面所給向量集合。
新版人工神經(jīng)網(wǎng)絡第89頁2023/4/27902.4存放與映射異相聯(lián)(Hetero-associative)映射
{(A1,B1),(A2,B2),…,(An,Bn)}該網(wǎng)絡在完成訓練后,其權矩陣存放將是上面所給向量集合所蘊含對應關系。當輸入向量A不是樣本第一分量時,樣本中不存在這么元素(Ak,Bk),使得
Ai≤Ak≤A或者A≤Ak≤Aj且此時有
Ai≤A≤Aj則向量B是Bi與Bj插值。
新版人工神經(jīng)網(wǎng)絡第90頁2023/4/27912.5人工神經(jīng)網(wǎng)絡訓練
人工神經(jīng)網(wǎng)絡最含有吸引力特點是它學習能力。1962年,Rosenblatt給出了人工神經(jīng)網(wǎng)絡著名學習定理:人工神經(jīng)網(wǎng)絡能夠學會它能夠表示任何東西。人工神經(jīng)網(wǎng)絡表示能力大大地限制了它學習能力。人工神經(jīng)網(wǎng)絡學習過程就是對它訓練過程新版人工神經(jīng)網(wǎng)絡第91頁2023/4/27922.5.1無導師學習
無導師學習(UnsupervisedLearning)與無導師訓練(UnsupervisedTraining)相對應
抽取樣本集合中蘊含統(tǒng)計特征,并以神經(jīng)元之間聯(lián)接權形式存于網(wǎng)絡中。新版人工神經(jīng)網(wǎng)絡第92頁2023/4/27932.5.1無導師學習Hebb學習律、競爭與協(xié)同(CompetitiveandCooperative)學習、隨機聯(lián)接系統(tǒng)(RandomlyConnectedLearning)等。Hebb算法[D.O.Hebb在1961年]關鍵:當兩個神經(jīng)元同時處于激發(fā)狀態(tài)時被加強,不然被減弱。數(shù)學表示式表示:Wij(t+1)=Wij(t)+αoi(t)oj(t)新版人工神經(jīng)網(wǎng)絡第93頁2023/4/27942.5.2有導師學習
有導師學習(SupervisedLearning)與有導師訓練(SupervisedTraining)相對應。輸入向量與其對應輸出向量組成一個“訓練對”。有導師學習訓練算法主要步驟包含:
1)
從樣本集合中取一個樣本(Ai,Bi);
2)
計算出網(wǎng)絡實際輸出O;
3)
求D=Bi-O;
4)
依據(jù)D調(diào)整權矩陣W;
5)對每個樣本重復上述過程,直到對整個樣本集來說,誤差不超出要求范圍。
新版人工神經(jīng)網(wǎng)絡第94頁2023/4/2795Delta規(guī)則
Widrow和Hoff寫法:Wij(t+1)=Wij(t)+α(yj-aj(t))oi(t)也能夠寫成:Wij(t+1)=Wij(t)+?Wij(t)?Wij(t)=αδjoi(t)δj=yj-aj(t)Grossberg寫法為:?Wij(t)=αai(t)(oj(t)-Wij(t))更普通Delta規(guī)則為:?Wij(t)=g(ai(t),yj,oj(t),Wij(t))新版人工神經(jīng)網(wǎng)絡第95頁2023/4/2796其它再例學習外部環(huán)境對系統(tǒng)輸出結果給出評價,學習系統(tǒng)經(jīng)過強化受獎動作來改進本身性能。學習規(guī)則誤差糾錯學習Hebb學習競爭學習新版人工神經(jīng)網(wǎng)絡第96頁2023/4/2797練習題P291、4、6、10、15
新版人工神經(jīng)網(wǎng)絡第97頁2023/4/2798上次課內(nèi)容回顧:網(wǎng)絡分層結構聯(lián)接模式刺激聯(lián)接與抑制聯(lián)接前饋信號與反饋信號層(級)內(nèi)聯(lián)接循環(huán)聯(lián)接層(級)間聯(lián)接簡單單級網(wǎng):NET=XW;O=F(NET)單級橫向反饋網(wǎng):NET=XW+O(t)V;O(t)=F(NET)新版人工神經(jīng)網(wǎng)絡第98頁2023/4/2799上次課內(nèi)容回顧:網(wǎng)絡分層結構非循環(huán)多級網(wǎng)層次劃分非線性激活函數(shù):
F3(F2(F1(XW1)W2)W3)循環(huán)網(wǎng)短期記憶特征及其對輸入信號修復作用時間參數(shù)與主時鐘穩(wěn)定性新版人工神經(jīng)網(wǎng)絡第99頁2023/4/27100上次課內(nèi)容回顧:存放與映射模式空間模式時空模式模式三種存放類型RAM、CAM、AM模式存放與運行CAM——LTM——訓練AM——STM——運行相聯(lián):自相聯(lián)映射、異相聯(lián)映射新版人工神經(jīng)網(wǎng)絡第100頁2023/4/27101上次課內(nèi)容回顧:訓練Rosenblatt學習定理無導師學習抽取樣本集合中蘊含統(tǒng)計特征樣本集:{A1,A2,…,An}Hebb算法:Wij(t+1)=Wij(t)+αoi(t)oj(t)有導師學習抽取樣本蘊含映射關系樣本集:{(A1,B1),(A2,B2),…,(An,Bn)}
訓練算法Delta規(guī)則新版人工神經(jīng)網(wǎng)絡第101頁2023/4/27102第3章
感知器
主要內(nèi)容:感知器與人工神經(jīng)網(wǎng)絡早期發(fā)展;線性可分問題與線性不可分問題;Hebb學習律;Delta規(guī)則;感知器訓練算法。重點:感知器結構、表示能力、學習算法難點:感知器表示能力
新版人工神經(jīng)網(wǎng)絡第102頁2023/4/27103第3章
感知器3.1感知器與人工神經(jīng)網(wǎng)絡早期發(fā)展
3.2感知器學習算法
3.2.1離散單輸出感知器訓練算法
3.2.2離散多輸出感知器訓練算法3.2.3連續(xù)多輸出感知器訓練算法3.3線性不可分問題3.3.1異或(Exclusive–OR)問題
3.3.2線性不可分問題克服
實現(xiàn)!問題發(fā)覺與處理!新版人工神經(jīng)網(wǎng)絡第103頁2023/4/271043.1感知器與ANN早期發(fā)展McCulloch和Pitts1943年,發(fā)表第一個系統(tǒng)ANN研究——閾值加權和(M-P)數(shù)學模型。1947年,開發(fā)出感知器。1949年,提出Hebb學習律。單輸出感知器(M-P模型)x2x1oxn…新版人工神經(jīng)網(wǎng)絡第104頁2023/4/271053.1感知器與ANN早期發(fā)展1962年,Rosenblatt宣告:人工神經(jīng)網(wǎng)絡能夠學會它能表示任何東西
o1多輸出感知器x1x2o2omxn…
………輸入層輸出層新版人工神經(jīng)網(wǎng)絡第105頁2023/4/271063.2感知器學習算法
感知器學習是有導師學習感知器訓練算法基礎原理起源于著名Hebb學習律基礎思想:逐步地將樣本集中樣本輸入到網(wǎng)絡中,依據(jù)輸出結果和理想輸出之間差異來調(diào)整網(wǎng)絡中權矩陣
新版人工神經(jīng)網(wǎng)絡第106頁2023/4/271073.2.1離散單輸出感知器訓練算法
二值網(wǎng)絡:自變量及其函數(shù)值、向量分量值只取0和1函數(shù)、向量。權向量:W=(w1,w2,…,wn)輸入向量:X=(x1,x2,…,xn)訓練樣本集:{(X,Y)|Y為輸入向量X對應輸出}新版人工神經(jīng)網(wǎng)絡第107頁2023/4/27108算法3-1離散單輸出感知器訓練算法
1.初始化權向量W;2.重復以下過程,直到訓練完成:
2.1對每個樣本(X,Y),重復以下過程:
2.1.1輸入X;
2.1.2計算o=F(XW);
2.1.3假如輸出不正確,則 當o=0時,取W=W+X, 當o=1時,取W=W-X新版人工神經(jīng)網(wǎng)絡第108頁2023/4/271093.2.2離散多輸出感知器訓練算法
樣本集:{(X,Y)|Y為輸入向量X對應輸出}輸入向量:X=(x1,x2,…,xn)理想輸出向量:Y=(y1,y2,…,ym)激活函數(shù):F
權矩陣W=(wij)實際輸出向量:O=(o1,o2,…,om)o1多輸出感知器x1x2o2omxn…
………輸入層輸出層新版人工神經(jīng)網(wǎng)絡第109頁2023/4/27110算法3-2離散多輸出感知器訓練算法
1.初始化權矩陣W;2.重復以下過程,直到訓練完成:
2.1對每個樣本(X,Y),重復以下過程:
2.1.1輸入X;
2.1.2計算O=F(XW);
2.1.3forj=1tomdo執(zhí)行以下操作:
ifoj≠yjthen ifoi=0thenfori=1ton wij=wij+xi elsefori=1tondo wij=wij-xi新版人工神經(jīng)網(wǎng)絡第110頁2023/4/27111算法3-2離散多輸出感知器訓練算法算法思想:將單輸出感知器處理逐一地用于多輸出感知器輸出層每一個神經(jīng)元處理。第1步,權矩陣初始化:一系列小偽隨機數(shù)。
新版人工神經(jīng)網(wǎng)絡第111頁2023/4/27112算法3-2離散多輸出感知器訓練算法第2步,循環(huán)控制。方法1:循環(huán)次數(shù)控制法:對樣本集執(zhí)行要求次數(shù)迭代改進——分階段迭代控制:設定一個基礎迭代次數(shù)N,每當訓練完成N次迭代后,就給出一個中間結果新版人工神經(jīng)網(wǎng)絡第112頁2023/4/27113算法3-2離散多輸出感知器訓練算法方法2:精度控制法:給定一個精度控制參數(shù)精度度量:實際輸出向量與理想輸出向量對應分量差絕對值之和;實際輸出向量與理想輸出向量歐氏距離和“死循環(huán)”:網(wǎng)絡無法表示樣本所代表問題新版人工神經(jīng)網(wǎng)絡第113頁2023/4/27114算法3-2離散多輸出感知器訓練算法方法3:綜合控制法:將這兩種方法結合起來使用
注意:精度參數(shù)設置。依據(jù)實際問題選定;初始測試階段,精度要求低,測試完成后,再給出實際精度要求。新版人工神經(jīng)網(wǎng)絡第114頁2023/4/271153.2.3連續(xù)多輸出感知器訓練算法
用公式wij=wij+α(yj-oj)xi取代了算法3-2第2.1.3步中多個判斷yj與oj之間差異對wij影響由α(yj-oj)xi表現(xiàn)出來好處:不但使得算法控制在結構上更輕易了解,而且還使得它適應面更寬
新版人工神經(jīng)網(wǎng)絡第115頁2023/4/27116算法3-3連續(xù)多輸出感知器訓練算法
1.用適當小偽隨機數(shù)初始化權矩陣W;2.初置精度控制參數(shù)ε,學習率α,精度控制變量d=ε+1;3.Whiled≥εdo3.1d=0;
3.2for每個樣本(X,Y)do 3.2.1輸入X(=(x1,x2,…,xn));
3.2.2求O=F(XW);
3.2.3修改權矩陣W:
fori=1ton,j=1tomdo wij=wij+α(yj-oj)xi;
3.2.4累積誤差
forj=1tomdo d=d+(yj-oj)2新版人工神經(jīng)網(wǎng)絡第116頁2023/4/27117算法3-3連續(xù)多輸出感知器訓練算法
1、程序實現(xiàn):ε、α、d、i、j、n、m為簡單變量來表示,W為n行m列二維數(shù)組。樣本集二維數(shù)組2、系統(tǒng)調(diào)試3、Minsky在1969年證實,有許多基礎問題是感知器無法處理4、問題線性可分性可能與時間相關5、極難從樣本數(shù)據(jù)集直接看出問題是否線性可分6、未能證實,一個感知器終究需要經(jīng)過多少步才能完成訓練。新版人工神經(jīng)網(wǎng)絡第117頁2023/4/271183.3線性不可分問題
3.3.1異或(Exclusive–OR)問題
g(x,y)y01x001110新版人工神經(jīng)網(wǎng)絡第118頁2023/4/27119用于求解XOR單神經(jīng)元感知器
xyo單神經(jīng)元感知器圖像ax+by=θ1yx1(0,0)(1,1)新版人工神經(jīng)網(wǎng)絡第119頁2023/4/27120線性不可分函數(shù)變量函數(shù)及其值xyf1f2f3f4f5f6f7f8f9f10f11f12f13f14f15f16000000000011111111010000111100001111100011001100110011110101010101010101新版人工神經(jīng)網(wǎng)絡第120頁2023/4/27121線性不可分函數(shù)R.O.Windner1960年
自變量個數(shù)函數(shù)個數(shù)線性可分函數(shù)個數(shù)144216143256104465,536188254.3*10994,57261.8*10195,028,134新版人工神經(jīng)網(wǎng)絡第121頁2023/4/271223.3.2線性不可分問題克服
用多個單級網(wǎng)組合在一起,并用其中一個去綜合其它單級網(wǎng)結果,咱們就能夠組成一個兩級網(wǎng)絡,該網(wǎng)絡能夠被用來在平面上劃分出一個封閉或者開放凸域來一個非凸域能夠拆分成多個凸域。按照這一思緒,三級網(wǎng)將會更普通一些,咱們能夠用它去識別出一些非凸域來。處理好隱藏層聯(lián)接權調(diào)整問題是非常關鍵
新版人工神經(jīng)網(wǎng)絡第122頁2023/4/27123兩級單輸出網(wǎng)在n維空間中劃分出m邊凸域
…x1ANmAN1ANoxn…o新版人工神經(jīng)網(wǎng)絡第123頁2023/4/27124第1次課堂測試(5分*4)Newell和Simon物理符號系統(tǒng)所基于假說是什么?它在什么層面上怎樣實現(xiàn)對人類智能模擬?聯(lián)接主義觀點所基于假說是什么?它在什么層面上怎樣實現(xiàn)對人類智能模擬?畫出有導師算法流程圖。證實:一個激活函數(shù)為線性函數(shù)3級非循環(huán)網(wǎng)等價于一個單級網(wǎng)。新版人工神經(jīng)網(wǎng)絡第124頁2023/4/27125習題P381、6新版人工神經(jīng)網(wǎng)絡第125頁2023/4/27126第1次課堂測試解答關鍵點Newell和Simon物理符號系統(tǒng)所基于假說是什么?它在什么層面上怎樣實現(xiàn)對人類智能模擬?關鍵點:物理符號系統(tǒng);心理;符號對事務及變換描述聯(lián)接主義觀點所基于假說是什么?它在什么層面上怎樣實現(xiàn)對人類智能模擬?
關鍵點:聯(lián)接機制;生理;模式、聯(lián)接權調(diào)整與對變換表示新版人工神經(jīng)網(wǎng)絡第126頁2023/4/27127第1次課堂測試解答關鍵點畫出有導師學習算法流程圖。
關鍵點:怎樣處理精度與樣本集兩層循環(huán)證實:一個激活函數(shù)為線性函數(shù)3級非循環(huán)網(wǎng)等價于一個單級網(wǎng)。
關鍵點:一級網(wǎng)與多級網(wǎng)數(shù)學模型新版人工神經(jīng)網(wǎng)絡第127頁2023/4/27128上次課內(nèi)容回顧:學習算法離散單輸出感知器訓練算法W=W+X;W=W-XW=W+(Y-O)X離散多輸出感知器訓練算法Wj=Wj+(yj-oj)X連續(xù)多輸出感知器訓練算法wij=wij+α(yj-oj)xi新版人工神經(jīng)網(wǎng)絡第128頁2023/4/27129上次課內(nèi)容回顧:線性不可分問題ax+by=θ1yx1(0,0)(1,1)線性不可分問題克服兩級網(wǎng)絡能夠劃分出封閉或開放凸域多級網(wǎng)將能夠識別出非凸域隱藏層聯(lián)接權調(diào)整問題是非常關鍵新版人工神經(jīng)網(wǎng)絡第129頁2023/4/27130第4章
BP網(wǎng)絡
主要內(nèi)容:BP網(wǎng)絡組成隱藏層權調(diào)整分析Delta規(guī)則理論推導算法收斂速度及其改進討論BP網(wǎng)絡中幾個主要問題
重點:BP算法難點:Delta規(guī)則理論推導
新版人工神經(jīng)網(wǎng)絡第130頁2023/4/27131第4章
BP網(wǎng)絡4.1概述
4.2基礎BP算法
4.3算法改進
4.4算法實現(xiàn)
4.5算法理論基礎
4.6幾個問題討論
新版人工神經(jīng)網(wǎng)絡第131頁2023/4/271324.1概述
1、BP算法出現(xiàn)非循環(huán)多級網(wǎng)絡訓練算法UCSDPDP小組Rumelhart、Hinton和Williams1986年獨立地給出了BP算法清楚而簡單描述1982年,Paker就完成了相同工作1974年,Werbos已提出了該方法2、弱點:訓練速度非常慢、局部極小點逃離問題、算法不一定收斂。3、優(yōu)點:廣泛適應性和有效性。新版人工神經(jīng)網(wǎng)絡第132頁2023/4/271334.2基礎BP算法
4.2.1網(wǎng)絡組成
神經(jīng)元網(wǎng)絡輸入:
neti=x1w1i+x2w2i+…+xnwni神經(jīng)元輸出:新版人工神經(jīng)網(wǎng)絡第133頁2023/4/27134輸出函數(shù)分析
0.5f′(net)0.25o01
1(0,0.5)
net(0,0)o應該將net值盡可能控制在收斂比較快范圍內(nèi)能夠用其它函數(shù)作為激活函數(shù),只要該函數(shù)是處處可導新版人工神經(jīng)網(wǎng)絡第134頁2023/4/27135網(wǎng)絡拓撲結構x1o1輸出層隱藏層輸入層x2o2omxn…………………W(1)W(2)W(3)W(L)新版人工神經(jīng)網(wǎng)絡第135頁2023/4/27136網(wǎng)絡拓撲結構
BP網(wǎng)結構輸入向量、輸出向量維數(shù)、網(wǎng)絡隱藏層層數(shù)和各個隱藏層神經(jīng)元個數(shù)決定試驗:增加隱藏層層數(shù)和隱藏層神經(jīng)元個數(shù)不一定總能夠提升網(wǎng)絡精度和表示能力。BP網(wǎng)普通都選取二級網(wǎng)絡。新版人工神經(jīng)網(wǎng)絡第136頁2023/4/27137網(wǎng)絡拓撲結構x1o1輸出層隱藏層輸入層x2o2omxn…………WV新版人工神經(jīng)網(wǎng)絡第137頁2023/4/271384.2.2訓練過程概述
樣本:(輸入向量,理想輸出向量)權初始化:“小隨機數(shù)”與飽和狀態(tài);“不一樣”確保網(wǎng)絡能夠學。1、向前傳輸階段:(1)從樣本集中取一個樣本(Xp,Yp),將Xp輸入網(wǎng)絡;(2)計算對應實際輸出Op:
Op=Fl(…(F2(F1(XpW(1))W(2))…)W(L))新版人工神經(jīng)網(wǎng)絡第138頁2023/4/271394.2.2訓練過程概述
2、向后傳輸階段——誤差傳輸階段:(1)計算實際輸出Op與對應理想輸出Yp差;(2)按極小化誤差方式調(diào)整權矩陣。(3)網(wǎng)絡關于第p個樣本誤差測度:(4)網(wǎng)絡關于整個樣本集誤差測度:新版人工神經(jīng)網(wǎng)絡第139頁2023/4/271404.2.3誤差傳輸分析
1、輸出層權調(diào)整wpq=wpq+?wpq?wpq=αδqop
=αfn′(netq)(yq-oq)op =αoq(1-oq)(yq-oq)op
wpqANpANq第L-1層第L層?wpq新版人工神經(jīng)網(wǎng)絡第140頁2023/4/271412、隱藏層權調(diào)整
ANpANqANhvhp δpk-1δ1kwp1wpqδqkwpmδmk第k-2層第k層第k-1層……新版人工神經(jīng)網(wǎng)絡第141頁2023/4/271422、隱藏層權調(diào)整δpk-1值和δ1k,δ2k,…,δmk
相關不妨認為δpk-1經(jīng)過權wp1對δ1k做出貢獻,經(jīng)過權wp2對δ2k做出貢獻,……經(jīng)過權wpm對δmk做出貢獻。δpk-1=fk-1′(netp)(wp1δ1k+wp2δ2k+…+wpmδmk)新版人工神經(jīng)網(wǎng)絡第142頁2023/4/271432、隱藏層權調(diào)整vhp=vhp+?vhp
?vhp=αδpk-1ohk-2 =αfk-1′(netp)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-2 =αopk-1(1-opk-1)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-2ANpANqANhvhp δpk-1δ1kwp1wpmδqkwpqδmk第k-2層第k層第k-1層……新版人工神經(jīng)網(wǎng)絡第143頁2023/4/27144上次課內(nèi)容回顧基礎BP算法neti=x1w1i+x2w2i+…+xnwni
新版人工神經(jīng)網(wǎng)絡第144頁2023/4/27145上次課內(nèi)容回顧x1o1輸出層隱藏層輸入層x2o2omxn…………WV新版人工神經(jīng)網(wǎng)絡第145頁2023/4/27146上次課內(nèi)容回顧樣本權初始化向前傳輸階段Op=Fn(…(F2(F1(XpW(1))W(2))…)W(n))誤差測度新版人工神經(jīng)網(wǎng)絡第146頁2023/4/27147上次課內(nèi)容回顧向后傳輸階段——誤差傳輸階段輸出層權調(diào)整?wpq=αδqop=αfn′(netq)(yq-oq)op=αoq(1-oq)(yq-oq)op隱藏層權調(diào)整ANpANqANhvhp δpk-1δ1kwp1wpqδqkwpmδmk……?vhp=αopk-1(1-opk-1)(wp1δ1k+wp2δ2k+…+wpmδmk)ohk-2新版人工神經(jīng)網(wǎng)絡第147頁2023/4/271484.2.4基礎BP算法
樣本集:S={(X1,Y1),(X2,Y2),…,(Xs,Ys)}
基礎思想:逐一地依據(jù)樣本集中樣本(Xk,Yk)計算出實際輸出Ok和誤差測度E1,對W(1)
,W(2)
,…,W(L)各做一次調(diào)整,重復這個循環(huán),直到∑Ep<ε。用輸出層誤差調(diào)整輸出層權矩陣,并用此誤差預計輸出層直接前導層誤差,再用輸出層前導層誤差預計更前一層誤差。如此取得全部其它各層誤差預計,并用這些預計實現(xiàn)對權矩陣修改。形成將輸出端表現(xiàn)出誤差沿著與輸入信號相反方向逐層向輸入端傳遞過程
新版人工神經(jīng)網(wǎng)絡第148頁2023/4/27149算法4-1
基礎BP算法
1fork=1toLdo 1.1初始化W(k);2初始化精度控制參數(shù)ε;3E=ε+1;4whileE>εdo
4.1E=0;
新版人工神經(jīng)網(wǎng)絡第149頁2023/4/27150算法4-1
基礎BP算法4.2對S中每一個樣本(Xp,Yp):
4.2.1計算出Xp對應實際輸出Op;
4.2.2計算出Ep;
4.2.3E=E+Ep;
4.2.4依據(jù)對應式子調(diào)整W(L);
4.2.5k=L-1;
4.2.6whilek≠0do 依據(jù)對應式子調(diào)整W(k);
k=k-1
4.3E=E/2.0
新版人工神經(jīng)網(wǎng)絡第150頁2023/4/271514.3算法改進
1、BP網(wǎng)絡接收樣本次序對訓練結果有較大影響。它更“偏愛”較后出現(xiàn)樣本2、給集中樣本安排一個適當次序,是非常困難。3、樣本次序影響結果原因:“分別”、“依次”
4、用(X1,Y1),(X2,Y2),…,(Xs,Ys)“總效果”修改W(1)
,W(2)
,…,W(L)。 ?w(k)ij=∑?pw(k)ij
新版人工神經(jīng)網(wǎng)絡第151頁2023/4/27152算法4-2消除樣本次序影響B(tài)P算法
1fork=1toLdo 1.1初始化W(k);2初始化精度控制參數(shù)ε;3E=ε+1;4whileE>εdo 4.1E=0; 4.2對全部i,j,k:?w(k)ij=0;
新版人工神經(jīng)網(wǎng)絡第152頁2023/4/271534.3對S中每一個樣本(Xp,Yp):
4.3.1計算出Xp對應實際輸出Op;
4.3.2計算出Ep;
4.3.3E=E+Ep;
4.3.4對全部i,j依據(jù)對應式子計算?pw(L)ij;
4.3.5對全部i,j:?w(L)ij=?w(L)ij+?pw(L)ij;
4.3.6k=L-1;
4.3.7whilek≠0do 對全部i,j依據(jù)對應式子計算?pw(k)ij;
對全部i,j:?w(k)ij=?w(k)ij+?pw(k)ij;
k=k-1
4.4對全部i,j,k:w(k)ij=w(k)ij+?w(k)ij;4.5E=E/2.0
新版人工神經(jīng)網(wǎng)絡第153頁2023/4/27154算法4-2分析
很好地處理了因樣本次序引發(fā)精度問題和訓練抖動問題
收斂速度:比較慢偏移量:給每一個神經(jīng)元增加一個偏移量來加緊收斂速度沖量:聯(lián)接權此次修改要考慮上次修改影響,以降低抖動問題
新版人工神經(jīng)網(wǎng)絡第154頁2023/4/27155算法4-2分析——沖量設置Rumelhart等人1986年?wij=αδjoi+β?wij′?wij′為上一次修改量,β為沖量系數(shù),普通可取到0.9
Sejnowski與Rosenberg,1987年?wij=α((1-β)δjoi+β?wij′)
?wij′也是上一次修改量,β在0和1之間取值
新版人工神經(jīng)網(wǎng)絡第155頁2023/4/271564.4算法實現(xiàn)
主要數(shù)據(jù)結構W[H,m]——輸出層權矩陣;V[n,H]——輸入(隱藏)層權矩陣;?o[m]——輸出層各聯(lián)接權修改量組成向量;?h[H]——隱藏層各聯(lián)接權修改量組成向量;O1——隱藏層輸出向量;O2——輸出層輸出向量;(X,Y)——一個樣本。
新版人工神經(jīng)網(wǎng)絡第156頁2023/4/27157算法主要實現(xiàn)步驟
用不一樣小偽隨機數(shù)初始化W,V;初始化精度控制參數(shù)ε;學習率α;
循環(huán)控制參數(shù)E=ε+1;循環(huán)最大次數(shù)M;循環(huán)次數(shù)控制參數(shù)N=0;
whileE>ε&N<Mdo
4.1N=N+1;E=0;
4.2對每一個樣本(X,Y),執(zhí)行以下操作
新版人工神經(jīng)網(wǎng)絡第157頁2023/4/271584.2對每一個樣本(X,Y),執(zhí)行操作
4.2.1計算:O1=F1(XV);O2=F2(O1W);4.2.2計算輸出層權修改量
fori=1tom ?o[i]=O2[i]*(1-O2[i])*(Y[i]-O2[i]);4.2.3計算輸出誤差:fori=1tomE=E+(Y[i]-O2[i])2;新版人工神經(jīng)網(wǎng)絡第158頁2023/4/271594.2對每一個樣本(X,Y),執(zhí)行操作4.2.4計算隱藏層權修改量:fori=1toH Z=0;
forj=1tomdoZ=Z+W[i,j]*?o[j];
Δh[i]=Z*O1[i](1-O1[i])
;4.2.5修改輸出層權矩陣:fork=1toH&i=1tom W[k,i]=W[k,i]+α*O1[k]*?o[i];4.2.5修改隱藏層權矩陣:fork=1ton&i
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件開發(fā)項目績效獎金分配方案
- 安全員A證考試過關檢測試卷附參考答案詳解(基礎題)
- 護理職教本科人才培養(yǎng)方案范文
- 押題寶典安全員A證考試考試題庫附參考答案詳解(b卷)
- 安全員A證考試過關檢測試卷含答案詳解【培優(yōu)b卷】
- 安全員A證考試綜合練習帶答案詳解(綜合題)
- 安全員A證考試題型+答案(考點題)附答案詳解(綜合題)
- 2025年一級建造師之一建鐵路工程實務通關考試題庫帶答案解析
- 安全員A證考試練習題(一)含完整答案詳解(必刷)
- 安全員A證考試檢測卷講解及參考答案詳解(達標題)
- 管網(wǎng)安全生產(chǎn)管理制度
- DB2310-T 099-2022 牡丹江市中藥材火麻仁種植技術規(guī)程
- 婦產(chǎn)??漆t(yī)院危重孕產(chǎn)婦救治中心建設與管理指南
- 2026年建筑物智能化與電氣節(jié)能技術發(fā)展
- 民航華東地區(qū)管理局機關服務中心2025年公開招聘工作人員考試題庫必考題
- 自平衡多級泵培訓課件
- 晝夜明暗圖課件
- 壓力性尿失禁教學課件
- 光伏電纜專業(yè)知識培訓課件
- 養(yǎng)牛場消防知識培訓
- 管控人力成本課件
評論
0/150
提交評論