巖石力學(xué)反問(wèn)題_第1頁(yè)
巖石力學(xué)反問(wèn)題_第2頁(yè)
巖石力學(xué)反問(wèn)題_第3頁(yè)
巖石力學(xué)反問(wèn)題_第4頁(yè)
巖石力學(xué)反問(wèn)題_第5頁(yè)
已閱讀5頁(yè),還剩165頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、巖石力學(xué)反問(wèn)題 呂愛(ài)鐘,第一章 緒論,第一節(jié)反問(wèn)題,一、反問(wèn)題的內(nèi)容及特點(diǎn),固體力學(xué)的正問(wèn)題是指在物體的幾何形狀、材料性質(zhì)及外荷載已知的情形下,求其物體內(nèi)部的應(yīng)力分布與變形規(guī)律。 而相應(yīng)的反問(wèn)題是指正問(wèn)題中的某些待求量通過(guò)實(shí)地量測(cè)或人為指定變?yōu)橐阎浚承┮阎孔鳛榇罅俊?近幾年固體力學(xué)所關(guān)心的反問(wèn)題有孔形優(yōu)化問(wèn)題,即已知材料性質(zhì)及外荷載,如何設(shè)計(jì)孔洞的形狀,使孔洞周邊或孔外域的二次應(yīng)力場(chǎng)(或位移場(chǎng))滿足預(yù)先指定的要求。 孔形優(yōu)化問(wèn)題也是巖石力學(xué)工作者所關(guān)心的一類(lèi)反問(wèn)題,它可以指導(dǎo)我們?nèi)绾伍_(kāi)挖巷道,使巷道在有一定工作空間的要求下處于最佳的受力狀態(tài),以利于巷道的維護(hù)。,礦山巖石力學(xué)所關(guān)心的第

2、二類(lèi)反問(wèn)題是:已知巷道的開(kāi)挖形狀,根據(jù)實(shí)地量測(cè)的變形規(guī)律(位移場(chǎng)),求其描述這個(gè)系統(tǒng)的最佳模型及模型參數(shù)(巖石的性質(zhì)參數(shù))或原始地應(yīng)力場(chǎng),這類(lèi)反問(wèn)題稱(chēng)為位移反分析。,在數(shù)學(xué)中我們?cè)缇徒佑|過(guò)反問(wèn)題,例如,在初等代數(shù)學(xué)中已知方程求根若稱(chēng)為正問(wèn)題的話,那么由根求方程的系數(shù)就是代數(shù)方程的反問(wèn)題; 在矩陣論中,由矩陣求特征值也對(duì)應(yīng)著它的反問(wèn)題已知特征值反求矩陣。,由“結(jié)果”推斷“原因”的反問(wèn)題在人類(lèi)認(rèn)識(shí)自然與改造自然中起到了重要的作用,例如,遙測(cè)與遙感技術(shù)是通過(guò)接收回波(反射波)信息去判斷人們感興趣的物體的形狀,地球物理勘探中的反問(wèn)題就是借助于地球表面接收到的主動(dòng)場(chǎng)或被動(dòng)場(chǎng)的數(shù)據(jù),經(jīng)過(guò)處理判斷地層的結(jié)構(gòu)

3、。,應(yīng)用反問(wèn)題思想解決實(shí)際問(wèn)題的例子比比皆是,例如: (1)各類(lèi)案件的偵破 (2)建筑質(zhì)量的判斷 (3)各類(lèi)設(shè)備故障原因的調(diào)查與確定 (4)各類(lèi)事故的調(diào)查與責(zé)任的判定 (5)考古研究 (6)內(nèi)科大夫看病,以往在礦山巖石力學(xué)中實(shí)際上也求解了一些反問(wèn)題,例如,利用應(yīng)力解除法求原始地應(yīng)力,就是通過(guò)量測(cè)應(yīng)變或位移反求荷載,平板試驗(yàn)就是利用量測(cè)位移反求巖體性質(zhì)參數(shù),所采用的求解方法都為逆法,只是未被普遍認(rèn)識(shí)。,由“結(jié)果”推斷的“原因”可能解不唯一(多解性),即某一特定“結(jié)果”可能引起的“原因”有多種,這是反問(wèn)題的一類(lèi)不適定性,反問(wèn)題還可能具有解的不存在性和解的不穩(wěn)定性這些特點(diǎn),如果反問(wèn)題的提法不正確,可

4、能會(huì)導(dǎo)致反問(wèn)題的解不存在,反問(wèn)題的不穩(wěn)定性是指實(shí)測(cè)資料有一定的微小誤差時(shí),反求出的結(jié)果產(chǎn)生很大偏差,甚至無(wú)法控制。如果反問(wèn)題的解存在,唯一且穩(wěn)定,則我們稱(chēng)反問(wèn)題為適定的。,不適定問(wèn)題的解法研究已成為計(jì)算數(shù)學(xué)中心問(wèn)題之一,在這一領(lǐng)域中理論上作出重要貢獻(xiàn)的是原蘇聯(lián)學(xué)者古洪諾夫,1974年他出版了“不適定問(wèn)題的解法”一書(shū),這是有關(guān)這方面的第一本專(zhuān)著,美國(guó)、中國(guó)相繼翻譯成英文、中文出版。,二、研究巖石力學(xué)反問(wèn)題的意義,巷道形狀優(yōu)化設(shè)計(jì)(孔形優(yōu)化)是一項(xiàng)很有實(shí)際意義的工作,它可以指導(dǎo)我們?nèi)绾卧O(shè)計(jì)巷道斷面使巷道在有一定工作空間的要求下,處于容易維護(hù)的狀態(tài),達(dá)到既安全又經(jīng)濟(jì)的目的。,孔形優(yōu)化是在巖石性質(zhì)參數(shù)

5、及原始地應(yīng)力已知的條件下進(jìn)行的,巖石的性質(zhì)參數(shù)及地應(yīng)力的確定是解決巖石力學(xué)問(wèn)題的關(guān)鍵所在,巖石力學(xué)工作者多年來(lái)一直在專(zhuān)門(mén)研究這個(gè)問(wèn)題,但效果并不理想。巖石性質(zhì)參數(shù)的確定一般都是在實(shí)驗(yàn)室或現(xiàn)場(chǎng)試件進(jìn)行的,試件尺寸與巷道尺寸比較仍然太小,試件不能反映實(shí)際巖體的結(jié)構(gòu),試件的受力狀態(tài)與巷道的實(shí)際受力狀態(tài)相差很大,這樣根據(jù)試件確定的巖石性質(zhì)參數(shù)對(duì)于解決實(shí)際的巖石力學(xué)問(wèn)題,其結(jié)果相差很大。,計(jì)算結(jié)果與實(shí)際量測(cè)結(jié)果相差很大的原因并非完全是由以上原因引起的,通常的原始地應(yīng)力測(cè)定可靠性較差或者是選擇的力學(xué)模型不正確都可以造成很大的誤差。 以往求解巖石力學(xué)問(wèn)題的主要特點(diǎn)是把力學(xué)模型的選擇、巖石性質(zhì)參數(shù)及地應(yīng)力的確

6、定三個(gè)過(guò)程單獨(dú)進(jìn)行的。現(xiàn)在,有了位移反分析我們可以直接利用實(shí)地量測(cè)的變形規(guī)律,根據(jù)選擇的力學(xué)模型同時(shí)求出巖石性質(zhì)參數(shù)及原始地應(yīng)力。,實(shí)地量測(cè)就是一個(gè)最反映實(shí)際情況的現(xiàn)場(chǎng)試驗(yàn),究竟采用何種力學(xué)模型這不能憑空事先決定,而必須由實(shí)地量測(cè)的變形規(guī)律在已知的一組模型里求出與實(shí)際變形規(guī)律最接近的最佳模型,這就是模型鑒別的內(nèi)容。求出了模型(包括參數(shù))和原始地應(yīng)力,我們?cè)侔凑龁?wèn)題去計(jì)算,預(yù)測(cè)以后開(kāi)挖所表現(xiàn)的各種力學(xué)行為。,確定支護(hù)結(jié)構(gòu)上的荷載,這是地下結(jié)構(gòu)設(shè)計(jì)與地面結(jié)構(gòu)設(shè)計(jì)的最大不同點(diǎn),對(duì)于地面結(jié)構(gòu)所承受的荷載較易確定,而地下支護(hù)結(jié)構(gòu)所承受的荷載是不能事先知道的,結(jié)構(gòu)承受的荷載取決于結(jié)構(gòu)與巖體的相互作用,它的

7、大小及分布規(guī)律與巖體性質(zhì)、原始地應(yīng)力場(chǎng)、支護(hù)剛度及支護(hù)時(shí)間等多種因素有關(guān),分析結(jié)構(gòu)與巖體的相互作用,要利用巖體和結(jié)構(gòu)的力學(xué)模型,但由于目前巖體力學(xué)模型的研究尚未成熟,故根據(jù)相互作用從理論上精確給出結(jié)構(gòu)上的荷載是困難的。,現(xiàn)在有了位移反分析,我們可以在可靠性較高的結(jié)構(gòu)模型的基礎(chǔ)上,利用結(jié)構(gòu)上的位移量測(cè)值反求結(jié)構(gòu)上的荷載,當(dāng)結(jié)構(gòu)的力學(xué)模型正確時(shí),反算的荷載是可信的。,長(zhǎng)期以來(lái),地下結(jié)構(gòu)的荷載缺乏合適的確定方法,設(shè)計(jì)主要依靠經(jīng)驗(yàn)類(lèi)比,從而往往導(dǎo)致安全儲(chǔ)備不足而破壞或者安全儲(chǔ)備過(guò)大而嚴(yán)重浪費(fèi)。 目前,位移反分析已廣泛應(yīng)用于巖體的力學(xué)性質(zhì)參數(shù)及原始地應(yīng)力的辨識(shí)。當(dāng)然,利用位移反分析也可以辨識(shí)出支架上的荷

8、載。,根據(jù)巖石力學(xué)的發(fā)展水平,地下結(jié)構(gòu)上荷載的確定可劃分為三個(gè)階段: 第一階段(上世紀(jì)末和本世紀(jì)前半葉),沿用地面結(jié)構(gòu)的特點(diǎn),地下結(jié)構(gòu)被看作僅是承受荷載的結(jié)構(gòu),荷載大小(為了區(qū)別,這里的荷載稱(chēng)為主動(dòng)荷載)是根據(jù)當(dāng)時(shí)的地壓假說(shuō)來(lái)確定。假定地下結(jié)構(gòu)本身對(duì)作用在其上的荷載大小和分布不產(chǎn)生影響,在地壓計(jì)算中不考慮地下結(jié)構(gòu)的變形,即不考慮圍巖抗力(圍巖抗力稱(chēng)為被動(dòng)荷載)。比較有影響的地壓假說(shuō)是冒落拱假說(shuō)和壓力拱假說(shuō)。,第二階段(自本世紀(jì)30年代起),與第一階段不同的是考慮在主動(dòng)荷載作用下地下結(jié)構(gòu)的變形,其特點(diǎn)是作用在地下結(jié)構(gòu)上的荷載由主動(dòng)荷載和被動(dòng)荷載組成。主動(dòng)荷載仍根據(jù)地壓假說(shuō)確定;被動(dòng)荷載是根據(jù)圍巖

9、限制地下結(jié)構(gòu)在主動(dòng)荷載作用下產(chǎn)生的變形而引起的抗力來(lái)確定。圍巖抗力通常根據(jù)熟知的文克爾(E.Winkler)假設(shè)(圍巖的彈性抗力與結(jié)構(gòu)變位成正比)計(jì)算。,第三階段(現(xiàn)代階段),不再區(qū)分主動(dòng)荷載和被動(dòng)荷載,地下結(jié)構(gòu)的荷載根據(jù)圍巖支架共同作用原理來(lái)確定。即,給定支架、圍巖的力學(xué)模型,通過(guò)計(jì)算圍巖對(duì)支架的作用力來(lái)確定地下結(jié)構(gòu)受到的荷載。常用的力學(xué)模型有彈性模型、彈塑性模型及粘、彈塑性模型等。,從理論上講,根據(jù)支架?chē)鷰r共同作用原理確定地下結(jié)構(gòu)的荷載是完善的。這樣獲得的荷載能夠綜合反映巖體性質(zhì)、原始地應(yīng)力、地下結(jié)構(gòu)的性質(zhì)及開(kāi)挖與支護(hù)間隔時(shí)間等多種因素的影響,不僅能夠得到地下結(jié)構(gòu)的法向荷載而且能夠得到其切

10、向荷載,克服了直接按主動(dòng)荷載和被動(dòng)荷載確定地下結(jié)構(gòu)荷載的不足。但是,由于巖體是地質(zhì)介質(zhì),其力學(xué)性質(zhì)具有非均質(zhì)、各向異性、流變性質(zhì)等特性,更重要的是巖體是裂隙體,即巖體中含有斷層、節(jié)理、裂隙等不連續(xù)面,因此,至今未能建立起符合實(shí)際情況的力學(xué)模型,故此,難以根據(jù)圍巖支架共同作用原理有效地確定地下結(jié)構(gòu)的荷載。,此外,人們?cè)ㄟ^(guò)在襯砌與圍巖之間埋設(shè)測(cè)壓元件直接量測(cè)地下結(jié)構(gòu)的荷載。由于測(cè)壓元件的剛度與圍巖的剛度不匹配,測(cè)壓元件的存在擾動(dòng)了地下結(jié)構(gòu)上的荷載分布,因此,通過(guò)測(cè)壓元件量測(cè)得到的地下結(jié)構(gòu)荷載不可靠,而且該方法不能量測(cè)地下結(jié)構(gòu)的切向荷載,此外該法費(fèi)用較高。,上述確定地下結(jié)構(gòu)荷載的三個(gè)階段都是沿用地

11、面結(jié)構(gòu)設(shè)計(jì)的思路先確定荷載,再進(jìn)行結(jié)構(gòu)設(shè)計(jì)、計(jì)算。地下工程的特點(diǎn)是應(yīng)先求反問(wèn)題再求正問(wèn)題。這里的反問(wèn)題指,通過(guò)量測(cè)受載后支架上某些點(diǎn)間的相對(duì)位移,反算支架的荷載。,第二節(jié) 系統(tǒng)辨識(shí)和參數(shù)辨識(shí),如果把所討論的對(duì)象作為一個(gè)系統(tǒng)的話,則正問(wèn)題是指已知描述系統(tǒng)的模型及輸入,求輸出,如圖1.1所示,在這種情況下,不但模型結(jié)構(gòu)是已知的,而且所有有關(guān)的參數(shù)也是已知的。 而反問(wèn)題是指通過(guò)量測(cè)輸出,來(lái)求系統(tǒng)的模型或模型參數(shù),有些情況下,當(dāng)模型和模型參數(shù)已知時(shí),反問(wèn)題是指由輸出求輸入。 按對(duì)系統(tǒng)的了解程度,反問(wèn)題可分為系統(tǒng)辨識(shí)和參數(shù)辨識(shí)兩類(lèi)。,一、系統(tǒng)辨識(shí),系統(tǒng)辨識(shí)是通過(guò)量測(cè)得到系統(tǒng)的輸出和輸入數(shù)據(jù)來(lái)確定描述這個(gè)

12、系統(tǒng)的數(shù)學(xué)方程,即模型結(jié)構(gòu)。為了得到這個(gè)模型,我們可以用各種輸入來(lái)試探該系統(tǒng)并觀測(cè)其響應(yīng)(輸出),然后將輸入輸出數(shù)據(jù)進(jìn)行處理來(lái)得到模型。,近年來(lái),系統(tǒng)辨識(shí)的應(yīng)用領(lǐng)域日益擴(kuò)大,在通信工程、航空航天工程、地質(zhì)學(xué)、經(jīng)濟(jì)學(xué)、生物學(xué)、醫(yī)學(xué)等方面都得到應(yīng)用,各個(gè)領(lǐng)域都在利用系統(tǒng)辨識(shí)方法建立各自系統(tǒng)的定量模型,從而由定性到定量地解決實(shí)際問(wèn)題,另一方面,也由于現(xiàn)代計(jì)算工具發(fā)展,使許多問(wèn)題可以通過(guò)計(jì)算機(jī)加以解決,這又推動(dòng)了系統(tǒng)辨識(shí)的發(fā)展。,基于對(duì)系統(tǒng)先驗(yàn)信息的了解程度,我們可以把系統(tǒng)辨識(shí)問(wèn)題分為兩類(lèi): “黑箱問(wèn)題”:也叫完全辨識(shí)問(wèn)題,在這種情況下,被辨識(shí)的系統(tǒng)的基本特性是完全未知的。例如,系統(tǒng)是線性的還是非線性

13、的,是動(dòng)態(tài)的還是靜態(tài)的,對(duì)這些基本的信息都一無(wú)所知,要辨識(shí)這類(lèi)系統(tǒng)當(dāng)然是很困難的,目前尚無(wú)有效的辦法。,“灰箱問(wèn)題”又叫不完全辨識(shí)問(wèn)題,在這一類(lèi)問(wèn)題中,系統(tǒng)的某些基本特性(例如線性)為已知的,不能確切知道的只是系統(tǒng)方程的階次和系數(shù)。當(dāng)然,這類(lèi)問(wèn)題比“黑箱問(wèn)題”容易處理。 幸好,許多工程上的辨識(shí)問(wèn)題屬于“灰箱問(wèn)題”,這樣,系統(tǒng)辨識(shí)問(wèn)題就簡(jiǎn)化為模型鑒別和參數(shù)辨識(shí)問(wèn)題了,參數(shù)辨識(shí)是系統(tǒng)辨識(shí)中最重要也是研究得最成熟的部分。,二、參數(shù)辨識(shí),參數(shù)辨識(shí)是近幾年發(fā)展較快的年輕學(xué)科,在各個(gè)領(lǐng)域都引起了重視,它的名字還沒(méi)有完全統(tǒng)一起來(lái),參數(shù)辨識(shí)的其它名字有非線性估計(jì)(nonlinear estimation)、非

14、線性回歸(nonlinear regression)、參數(shù)優(yōu)化(optimization of parameters),有的文獻(xiàn)干脆稱(chēng)為建模(model building)或系統(tǒng)辨識(shí)(identification of systems)。 “估計(jì)”是數(shù)理統(tǒng)計(jì)中的術(shù)語(yǔ),“辨識(shí)”是電氣工程上的術(shù)語(yǔ)。,對(duì)于礦山巖石力學(xué)問(wèn)題,我們一般把易量測(cè)的位移作為系統(tǒng)的輸出,巷道及支護(hù)的形狀、尺寸作為輸入,與模型結(jié)構(gòu)有關(guān)的變形參數(shù)可作為模型參數(shù),地應(yīng)力既可以作為輸入,也可看作為待識(shí)別的參數(shù)。,第二章參數(shù)辨識(shí)方法的基礎(chǔ)知識(shí),第一節(jié) 參數(shù)辨識(shí)的幾個(gè)要素,一、模型,在自然科學(xué)和工程領(lǐng)域中,模型的建立與實(shí)驗(yàn)、觀察具有同等

15、重要的地位,模型的建立是實(shí)驗(yàn)、觀察、認(rèn)識(shí)問(wèn)題的一個(gè)飛躍。模型是實(shí)際系統(tǒng)“原型”的一種“類(lèi)似”,它與“原型”必定存在一定的差別,任何原型都有數(shù)不清的層次和特征,能反映出原型一切特征的只能是原型本身,而不是模型。建模的目的不是將原型的一切方面都表達(dá)出來(lái),模型只是在所要研究的主題范圍內(nèi)能表達(dá)人們最需要知道的那些特征即可,從而達(dá)到對(duì)原型的抽象,以模型為基礎(chǔ),較方便地對(duì)原型進(jìn)行分析、研究,以便通過(guò)模型的預(yù)測(cè)結(jié)果來(lái)正確指導(dǎo)我們作出某種決策。,模型的表達(dá)形式可以是概念性的、物理的或者是數(shù)學(xué)的,這取決于模型建立的特定目的。采用數(shù)學(xué)描述的形式所建立的模型我們稱(chēng)為數(shù)學(xué)模型,它是系統(tǒng)中的各個(gè)物理量之間的關(guān)系所構(gòu)成的

16、數(shù)學(xué)結(jié)構(gòu),象代數(shù)方程、微分方程等等。不言而喻,目前在巖石力學(xué)中采用的彈性模型、彈塑性模型、粘彈模型都為數(shù)學(xué)模型。 模型結(jié)構(gòu)的形式有:靜態(tài)的或是動(dòng)態(tài)的,線性的或是非線性的,參數(shù)是定常的或是時(shí)變的,確定型的或是隨機(jī)型的,參數(shù)模型或是非參數(shù)模型。,二、參數(shù)和狀態(tài),由常微分或偏微分方程給出的數(shù)學(xué)模型,有時(shí)它的解是一組比較簡(jiǎn)單的代數(shù)方程。在任何情形下,都有自變量和因變量以及一些常數(shù)。因變量有時(shí)稱(chēng)為狀態(tài)變量(或信號(hào)),而常數(shù)稱(chēng)為參數(shù)。,在實(shí)驗(yàn)中,常常直接量測(cè)的是狀態(tài),而參數(shù)一般不能直接量測(cè)出來(lái),參數(shù)只能由狀態(tài)的量測(cè)值反求出來(lái)。有的教科書(shū)所關(guān)心的是參數(shù)估計(jì)問(wèn)題,而有的教科書(shū)則側(cè)重于狀態(tài)的估計(jì)(預(yù)測(cè))。參數(shù)估

17、計(jì)與狀態(tài)估計(jì)(預(yù)測(cè))兩個(gè)問(wèn)題非常相似,在參數(shù)估計(jì)的同時(shí),通常狀態(tài)估計(jì)(預(yù)測(cè))自動(dòng)完成。,參數(shù)和狀態(tài)這兩個(gè)概念可以由下面的簡(jiǎn)單例子說(shuō)明之。 例1:根據(jù)牛頓第二定律可知:ax(t)=mFx(t) 這里Fx(t)是x方向的力,ax(t)是x方向的加速度,它們都是時(shí)間t的函數(shù),m是質(zhì)量。Fx(t),ax(t)我們可以看作為狀態(tài),而質(zhì)量m則是參數(shù)。力和加速度通??扇菀椎赝ㄟ^(guò)量測(cè)獲得。對(duì)此問(wèn)題,質(zhì)量不但可以根據(jù)力和加速度求得,而且也可以直接量測(cè)獲得,但是對(duì)有些情況,質(zhì)量則必須根據(jù)力和加速度推算而得,例如,要確定慧星和行星的質(zhì)量就是一個(gè)例子,這時(shí)不可能直接量測(cè)而得它們的質(zhì)量。,例2:以初速度v0垂直上拋一個(gè)

18、物體,已知物體離開(kāi)地面的距離s可由公式s=v0t-1/2gt2表示。這里g是重力加速度,它是一個(gè)參數(shù),時(shí)間t為自變量,s是狀態(tài)。v0既可看作為參數(shù),也可看作為狀態(tài)。,例3:一等截面拉桿,截面積為A,原長(zhǎng)為L(zhǎng),它一端固定,一端受拉力P的作用(圖2.1),每個(gè)截面都產(chǎn)生x方向的位移,距原點(diǎn)O,x處的截面位移為u(x): u(x)=Px/EA 這里u(x)為狀態(tài),x是自變量,E、A、P為參數(shù),但A、P可直接量取獲得,E必須由狀態(tài)值求得。,以上所舉的這些參數(shù)與統(tǒng)計(jì)參數(shù)比較,一般稱(chēng)為物理參數(shù),象量測(cè)誤差的方差、相關(guān)系數(shù)這樣的參數(shù)稱(chēng)為統(tǒng)計(jì)參數(shù)。物理參數(shù)和統(tǒng)計(jì)參數(shù)在某些問(wèn)題中可能都要辨識(shí),而我們最關(guān)心的是物

19、理參數(shù)的辨識(shí)。,三、準(zhǔn)則函數(shù),若模型能精確地反映我們對(duì)“原型”所關(guān)心的那些特征,則模型的輸出就是系統(tǒng)的實(shí)際輸出,如果對(duì)輸出的量測(cè)值也不存在誤差,且所討論的反問(wèn)題為適定的,則由量測(cè)的輸出總可列出也只能列出與待辨識(shí)參數(shù)個(gè)數(shù)相等的獨(dú)立方程,由這些方程即可唯一地求出待求的參數(shù)。,實(shí)際上,由于模型的近似性和量測(cè)誤差的存在,則按以上方法求得的參數(shù)不能很好地反映整個(gè)系統(tǒng)的特征。如何能夠求出反映整個(gè)系統(tǒng)的最優(yōu)參數(shù)呢?最直觀的做法是:量測(cè)的數(shù)量必須大大地超過(guò)待求參數(shù)的個(gè)數(shù),這樣可以降低量測(cè)噪聲對(duì)待求參數(shù)的影響,這樣列出的方程個(gè)數(shù)多于待求的參數(shù)個(gè)數(shù),所得的方程組為矛盾方程組,通過(guò)適當(dāng)?shù)淖顑?yōu)化技術(shù)可以求解這樣的問(wèn)題

20、,使得在某種意義下求得的參數(shù)為最優(yōu)參數(shù)。如何衡量最優(yōu)?最優(yōu)準(zhǔn)則如何確定?這是參數(shù)辨識(shí)首先要解決的問(wèn)題。,我們一般把最優(yōu)化準(zhǔn)則稱(chēng)為準(zhǔn)則函數(shù),記為J。準(zhǔn)則函數(shù)總體上可分為兩大類(lèi),一類(lèi)是以輸出信號(hào)為基礎(chǔ)的準(zhǔn)則函數(shù),一類(lèi)是以量測(cè)誤差或參數(shù)的概率統(tǒng)計(jì)性質(zhì)為基礎(chǔ)的準(zhǔn)則函數(shù),后面我們將分別稱(chēng)為第一類(lèi)和第二類(lèi)準(zhǔn)則函數(shù)。,第一類(lèi)準(zhǔn)則函數(shù)一般表示為系統(tǒng)的實(shí)際輸出量測(cè)值y(t)和模型的輸出(t)的偏差的某個(gè)函數(shù),例如,可取 等一些誤差函數(shù)作為準(zhǔn)則函數(shù)。式中:n為量測(cè)數(shù)量,(ti)是輸入和參數(shù)的函數(shù),給定模型結(jié)構(gòu)也就是知道了(ti)的函數(shù)形式,t是自變量。對(duì)于以時(shí)間作為自變量的模型,ti表示第i時(shí)刻,對(duì)于以位置作為自

21、變量的模型,ti表示第i個(gè)位置。y(ti)是已知的量測(cè)值,當(dāng)輸入為已知時(shí),顯然,準(zhǔn)則函數(shù)J的大小隨著所選的模型參數(shù)不同而不同,當(dāng)J達(dá)到最小值時(shí)的參數(shù)即為最優(yōu)參數(shù)。,對(duì)于第一類(lèi)準(zhǔn)則函數(shù),參數(shù)辨識(shí)實(shí)際上可作為一個(gè)最優(yōu)化問(wèn)題處理,即通過(guò)所選的準(zhǔn)則函數(shù)如何尋求使準(zhǔn)則函數(shù)達(dá)到極小的參數(shù)值。就此而言,準(zhǔn)則函數(shù)稱(chēng)為目標(biāo)函數(shù)。根據(jù)求解的問(wèn)題不同,在不同場(chǎng)合下J往往還有其它的名字,例如誤差函數(shù)、損失函數(shù)、成本函數(shù)等等。,以量測(cè)誤差或參數(shù)的概率統(tǒng)計(jì)性質(zhì)為基礎(chǔ)的第二類(lèi)準(zhǔn)則函數(shù)的參數(shù)辨識(shí),事先考慮了輸出信號(hào)量測(cè)誤差的統(tǒng)計(jì)特性,把待求參數(shù)作為確定性常數(shù)或隨機(jī)變量。參數(shù)的最優(yōu)并不是象第一類(lèi)準(zhǔn)則函數(shù)直接以輸出的偏差最小為衡

22、量準(zhǔn)則,而是以參數(shù)誤差(參數(shù)真值與參數(shù)估計(jì)值的差)為最小或以特定輸出量測(cè)值出現(xiàn)可能性為最大等概率統(tǒng)計(jì)特性為衡量準(zhǔn)則。 對(duì)于第二類(lèi)準(zhǔn)則函數(shù),參數(shù)辨識(shí)作為估計(jì)問(wèn)題處理,參數(shù)估計(jì)的具體實(shí)現(xiàn)同樣離不開(kāi)最優(yōu)化技術(shù)。,兩類(lèi)準(zhǔn)則函數(shù)相比,由于后者利用了一些概率統(tǒng)計(jì)知識(shí),所以后者比前者的最大優(yōu)點(diǎn)是可以計(jì)算量測(cè)噪聲對(duì)參數(shù)辨識(shí)的影響程度,有時(shí)所求出的參數(shù)估計(jì)值具有較好的統(tǒng)計(jì)特性。,第二節(jié)參數(shù)辨識(shí)的方法分類(lèi),參數(shù)辨識(shí)具有多種方法。 根據(jù)不同的準(zhǔn)則函數(shù)可得出一系列參數(shù)辨識(shí)法,例如,以第一類(lèi)準(zhǔn)則函數(shù)為基礎(chǔ)的最小二乘法、加權(quán)最小二乘法,以第二類(lèi)準(zhǔn)則函數(shù)為基礎(chǔ)的最小方差法、極大似然法、貝葉斯法等等。以第一類(lèi)準(zhǔn)則函數(shù)為基礎(chǔ)的

23、各種參數(shù)辨識(shí)方法統(tǒng)稱(chēng)為確定性方法,以第二類(lèi)準(zhǔn)則函數(shù)為基礎(chǔ)的各種參數(shù)辨識(shí)方法統(tǒng)稱(chēng)為隨機(jī)性方法。,根據(jù)辨識(shí)的方式可分為離線辨識(shí)和在線辨識(shí),所謂離線辨識(shí)是在全部量測(cè)數(shù)據(jù)的基礎(chǔ)上求解模型參數(shù);而在線辨識(shí)是指收集到新的量測(cè)值以后,就在前一次參數(shù)估計(jì)值的基礎(chǔ)上立刻進(jìn)行遞推計(jì)算,盡快地給出新的估計(jì)值,例如,序貫最小二乘法就是一種在線辨識(shí)。 準(zhǔn)則函數(shù)選定以后,參數(shù)辨識(shí)的過(guò)程是尋求準(zhǔn)則函數(shù)的極值點(diǎn),對(duì)于巖土工程問(wèn)題,根據(jù)問(wèn)題的性質(zhì)及尋求準(zhǔn)則函數(shù)極值點(diǎn)的算法,參數(shù)辨識(shí)方法可分為逆法和正法兩大類(lèi)。,以第一類(lèi)準(zhǔn)則函數(shù)(2-1)為例說(shuō)明逆法和正法。 所謂逆法是指能把模型輸出表示成待求參數(shù)的顯函數(shù),由模型輸出的量測(cè)值,利

24、用這個(gè)函數(shù)關(guān)系反求出待求參數(shù),這個(gè)過(guò)程恰好與正問(wèn)題的求解過(guò)程相反,逆法由此而得名。 若考慮誤差的存在,則這個(gè)方法的具體實(shí)施過(guò)程是這樣的:由(2-1)的J達(dá)到極小值的必要條件(即J關(guān)于參數(shù)的一階偏導(dǎo)數(shù)等于零)所列的方程組,求解待求參數(shù) 。,逆法的應(yīng)用決定于模型輸出是否能表示成待求參數(shù)的函數(shù),以及函數(shù)關(guān)系的性質(zhì)如何? 當(dāng)模型輸出是參數(shù)的線性函數(shù)時(shí),一般才利用逆法。此時(shí),由極值必要條件所列的以參數(shù)為未知量的方程組為線性方程組,線性方程組的求解是輕而易舉的事。,模型輸出可以是待解的微分方程組,也可以是它的解析解。若已有解析解,參數(shù)辨識(shí)就可以以解析解為出發(fā)點(diǎn),這時(shí)計(jì)算量少。若無(wú)解析解則需要以待解方程組及

25、具體問(wèn)題的定解條件為出發(fā)點(diǎn),在巖土工程中,這是一種普遍情形,這時(shí)要利用有限單元法等數(shù)值方法。,正法與逆法不同,它不是利用極值的必要條件求出待求參數(shù),而是首先對(duì)待求參數(shù)指定“初值”,然后計(jì)算模型輸出值并和輸出量測(cè)值比較,如果吻合良好,假設(shè)的參數(shù)“初值”就是要找的參數(shù)值,實(shí)際上當(dāng)然不會(huì)這么巧,這時(shí)修改參數(shù)值,重新計(jì)算模型輸出值,重新比較一直到準(zhǔn)則函數(shù)達(dá)到極小值,此時(shí)的參數(shù)值即為所要求的參數(shù)。 若模型輸出是待解的微分方程組,則由參數(shù)“初值”計(jì)算模型輸出是求解正問(wèn)題,由此看出此時(shí)的參數(shù)辨識(shí)過(guò)程是解一系列正問(wèn)題,正法由此而得名。,可以看出,正法和逆法都是尋求準(zhǔn)則函數(shù)的極小點(diǎn),但尋求的算法不同。正法比逆法

26、具有更廣泛的適用性,它既適用于模型輸出是參數(shù)的線性函數(shù)的情形,也適用于模型輸出是參數(shù)的非線性函數(shù)的情形。它的另一個(gè)優(yōu)點(diǎn)是仍可沿用現(xiàn)成的正問(wèn)題計(jì)算方法及程序。 最優(yōu)化技術(shù)中的直接法是求解正法的有力工具,模式搜索法(Hooke-Jeeves)(也有稱(chēng)步長(zhǎng)加速法)、變量輪換法、單純形法、鮑威爾(Powell)法等方法都是最優(yōu)化技術(shù)中廣泛應(yīng)用的直接法。 以上用第一類(lèi)準(zhǔn)則函數(shù)說(shuō)明了正法和逆法,同樣對(duì)第二類(lèi)準(zhǔn)則函數(shù)也存在正法和逆法。,第三節(jié)參數(shù)辨識(shí)方法簡(jiǎn)述,本節(jié)主要講述按第一、二類(lèi)準(zhǔn)則函數(shù)分類(lèi)的各種參數(shù)辨識(shí)方法的基本思想,而不涉及方法的本身細(xì)節(jié)。,一、觀測(cè)變量和參數(shù)之間的關(guān)系,一組可觀測(cè)變量(y,x1,x

27、k),一批參數(shù)(1,m)和一組隨機(jī)變量(,(1),(p)總可以假定以一定的函數(shù)關(guān)系存在。這里,我們只討論每次觀測(cè)只包含一個(gè)隨機(jī)變量的情形,即只有一個(gè)存在,其它的(1),(p) 不考慮,不同次的觀測(cè)用下標(biāo)i區(qū)別,即第i次的觀測(cè)包含的隨機(jī)變量用i表示。,選擇一個(gè)量測(cè)變量y,并用其它量測(cè)變量x1,,xk表示,即 y=f(x1,xk; 1,m; ) (2-2) 通常稱(chēng)y為因變量,稱(chēng)x1,xk為自變量。 如果誤差是可加的,即 y=(x1,xk;1,m)+ (2-3) 那么這是很幸運(yùn)的,這對(duì)于我們求解問(wèn)題是方便的,在式(2-3)中,的分布與未知參數(shù)1,m無(wú)關(guān)。,把式(2-3)用矢量記法進(jìn)行縮寫(xiě)對(duì)于書(shū)寫(xiě)是方

28、便的,記 X(x1, x2, , xk)T 則: 第i次觀測(cè)通過(guò)下標(biāo)i表示,即 yi=(xi1,xik;1,m)+i =(Xi;)+i=i+i,進(jìn)行了n次量測(cè),則有y1,yn,1,n等等,為了書(shū)寫(xiě)更方便,則可記 Y=(y1,yn)T =(1,n)T (X1,Xn)可寫(xiě)成矩陣形式,即 X=X1,XnT=,的分布一般來(lái)說(shuō)是未知的,如果i(i=1,n)是相關(guān)的,那么以第二類(lèi)準(zhǔn)則函數(shù)為基礎(chǔ)的參數(shù)辨識(shí)困難較大,本文主要討論i(i=1,n)不相關(guān)的情形。,二、線性問(wèn)題,如果能夠把(X;)寫(xiě)成以下形式 (X;)=1x1+2x2+mxm (2-4)即在同一時(shí)刻(或同一位置),模型輸出(X;)是參數(shù)的線性函數(shù),

29、則稱(chēng)式(2-4)為線性模型。 對(duì)于線性模型,有 y= 1x1+2x2+mxm + (2-5)由式(2-5)來(lái)確定參數(shù)的估計(jì)值,稱(chēng)為線性估計(jì)。 如果模型輸出(X;)是參數(shù)的非線性函數(shù),則稱(chēng)非線性模型,非線性模型的參數(shù)估計(jì)比線性模型的參數(shù)估計(jì)復(fù)雜。,三、常規(guī)最小二乘估計(jì),已有一組量測(cè)值y1,yn則在模型結(jié)構(gòu)已知的情形下可寫(xiě)出 使式(2-6)達(dá)到極小值的稱(chēng)為參數(shù)估計(jì)值。這個(gè)參數(shù)估計(jì)方法稱(chēng)為常規(guī)最小二乘法(ordinary least squares method)。對(duì)于線性模型,由逆法可以求出的解析式,對(duì)于非線性模型,一般用正法求解。 常規(guī)最小二乘法沒(méi)有利用的概率統(tǒng)計(jì)特性。,四、高斯馬爾可夫估計(jì)(G

30、auss-markov estimation),如果對(duì)于不同的量測(cè)時(shí)刻(或量測(cè)位置),式(2-5)中的i(i=1,n)是不相關(guān)的,但i的方差不盡相同,若令i相應(yīng)的方差分別為:12,n2則可令準(zhǔn)則函數(shù)為 由(2-7)極小求出的參數(shù)估計(jì)值 一般比常規(guī)最小二乘法求得的參數(shù)估計(jì)值好,這是因?yàn)榱繙y(cè)精度越高,相應(yīng)的量測(cè)數(shù)據(jù)占的比重越大,這由式(2-7)可清楚看出(量測(cè)精度越高,誤差i的方差i2越小)。,五、最大似然估計(jì)(maximum likelihood estimation), 如果已知i(i=1,n)的聯(lián)合分布形式,那么yi(i=1,n)的聯(lián)合分布即可確定,此時(shí)把參數(shù)作為未知的確定性常量,則yi的聯(lián)

31、合分布為條件分布,它可由概率密度函數(shù)p(Y/)描述。 由p(Y/)極大求出的參數(shù)估計(jì)值稱(chēng)為參數(shù)的最大似然估計(jì)。 p(Y/)即為準(zhǔn)則函數(shù)。 最大似然估計(jì)與i(i=1,n)的分布有關(guān),后面我們將會(huì)發(fā)現(xiàn),如果i是零均值同方差的獨(dú)立正態(tài)分布(高斯分布)時(shí),最大似然估計(jì)量與常規(guī)最小二乘估計(jì)量是相同的。,六、最大驗(yàn)后估計(jì)與貝葉斯估計(jì),如果隨機(jī)變量的分布已知(并知道的分布參數(shù),例如方差是已知的),待求參數(shù)也為隨機(jī)變量,并且它的概率密度函數(shù)p()(稱(chēng)為參數(shù)的驗(yàn)前分布)也為已知,那么根據(jù)貝葉斯定理,我們可以獲得最大驗(yàn)后估計(jì)(MAP estimation, MAP是Maximum A Posterior的簡(jiǎn)寫(xiě))和

32、貝葉斯估計(jì)(Bayess estimation)。最大驗(yàn)后估計(jì)量 是根據(jù)驗(yàn)后分布p(/Y)取極大值的條件求得的,它是觀測(cè)值為Y的條件下,參數(shù)的“最可能”數(shù)值。 p(/Y)即為準(zhǔn)則函數(shù)。,為了方便地說(shuō)明貝葉斯估計(jì),下面討論待估參數(shù)只有一個(gè)分量的情形。 設(shè) 為的估計(jì)值,則定義準(zhǔn)則函數(shù)為 使上式達(dá)到極小的 稱(chēng)為貝葉斯估計(jì)。由式(2-8)可得貝葉斯估計(jì)量 這就是參數(shù)驗(yàn)后分布p(/Y)的期望值。 式(2-8)表示參數(shù)估計(jì)值對(duì)真值的均方差,所以在取得觀測(cè)值Y的條件下,平均來(lái)講,隨機(jī)參數(shù)最靠近其貝葉斯估計(jì)值,因此,可以說(shuō)是參數(shù)的“最有效”的估計(jì)值。,最大似然估計(jì)、最大驗(yàn)后估計(jì)、貝葉斯估計(jì)與最小二乘估計(jì)、高斯

33、馬爾可夫估計(jì)一樣,既適合線性模型的情形,也適合非線性模型的情形,但對(duì)于非線性模型,難于直接求出概率密度函數(shù)p(Y/)或p(/Y),所以此時(shí)的參數(shù)估計(jì)也存在一定的困難,它們可通過(guò)線性模型的估計(jì)值經(jīng)多次迭代而求得。 當(dāng)模型結(jié)構(gòu)和參數(shù)的驗(yàn)前分布滿足一定的要求時(shí),最大似然估計(jì)量、最大驗(yàn)后估計(jì)量、貝葉斯估計(jì)量與最小二乘估計(jì)量、高斯馬爾可夫估計(jì)量是相同的。,第四節(jié) 參數(shù)估計(jì)量的統(tǒng)計(jì)特性,上節(jié)介紹的各種參數(shù)辨識(shí)方法,一種情形是事先把參數(shù)作為確定性的量,一種情形是事先把參數(shù)作為隨機(jī)變量。而兩種情形求出的參數(shù)估計(jì)量都是隨機(jī)變量,后種情形是顯然的。前種情形也不難理解,由n次量測(cè)可求出參數(shù)估計(jì)值 ,由于量測(cè)誤差的存

34、在,所求出的估計(jì)值不可能是參數(shù)真值,如果另取一組n個(gè)量測(cè)值去求參數(shù),由于誤差的隨機(jī)性,則得到的和上次不同,所以說(shuō),盡管參數(shù)本身不是隨機(jī)變量,但是這樣求出的估計(jì)量卻總是隨機(jī)變量。 估計(jì)量是隨機(jī)變量,必須從統(tǒng)計(jì)的觀點(diǎn)分析,衡量估計(jì)量的優(yōu)劣,無(wú)偏性、有效性和一致性是鑒別和比較估計(jì)量好壞的重要標(biāo)準(zhǔn)。,一、無(wú)偏性,我們總是希望未知參數(shù)與它的估計(jì)值 在某種意義上最接近,當(dāng)然作為某一次的估計(jì)值它與真值可能是不同的,然而,如果通過(guò)一系列試驗(yàn)求出的不同估計(jì)值,我們很自然地要求這些估計(jì)值的平均值與未知參數(shù)的真值相等,這就是說(shuō),要求參數(shù)的估計(jì)量 的數(shù)學(xué)期望(也有稱(chēng)數(shù)學(xué)期望為均值)等于參數(shù)的真值,即如果關(guān)系式 E(

35、)= 成立,那么我們稱(chēng)滿足這種要求的估計(jì)量為參數(shù)的無(wú)偏估計(jì)量。 估計(jì)量的無(wú)偏性意味著無(wú)論重復(fù)多少次量測(cè),要求估計(jì)值能在被估計(jì)參數(shù)的真值附近擺動(dòng),而其平均值就等于參數(shù)真值。,二、有效性,無(wú)偏性還不能完全決定估計(jì)量的性質(zhì),對(duì)于一個(gè)估計(jì)量,還需要進(jìn)一步考慮到估計(jì)值和參數(shù)真值的平均偏離的大小,或者說(shuō)估計(jì)值圍繞真值擺動(dòng)幅度的大小問(wèn)題,方差能夠反映估計(jì)值的這種離散程度,一個(gè)估計(jì)量的方差愈小,這個(gè)估計(jì)量取得接近它的數(shù)學(xué)期望的值就愈頻繁,或者說(shuō)未知參數(shù)的估計(jì)值處在它的真值附近的概率愈大。 用不同估計(jì)方法得到的各種無(wú)偏估計(jì)中,某估計(jì)量的方差達(dá)到最小,則稱(chēng)該估計(jì)量為參數(shù)的有效估計(jì)。 在參數(shù)的所有無(wú)偏估計(jì)量中,可能

36、存在一個(gè)方差最小的估計(jì)量,這個(gè)估計(jì)量叫做佳效估計(jì)量。,三、一致性,一個(gè)估計(jì)量,不論它是無(wú)偏的還是有偏的,也不論它的方差大小如何,我們總是希望當(dāng)量測(cè)次數(shù)增加時(shí),對(duì)未知參數(shù)的估計(jì)值 會(huì)愈來(lái)愈精確?;蛘哒f(shuō),估計(jì)值會(huì)越來(lái)越靠近參數(shù)的真值。因此提出了估計(jì)量的一致性要求,按照數(shù)學(xué)定義,如果隨著量測(cè)次數(shù)n增加, 依概率收斂于,則稱(chēng) 為的一致估計(jì)。 一致性也有這樣定義的:估計(jì)差 -的協(xié)方差矩陣cov -作為估計(jì)值 對(duì)真值的平均偏離程度的量度,若 為無(wú)偏估計(jì),則 cov - =E( -)( -)T。如果滿足 則就是的一致估計(jì),也有稱(chēng) 是相容估計(jì)量。,第三章 簡(jiǎn)單線性模型 的參數(shù)辨識(shí),第一節(jié) 引 言,處理問(wèn)題都是

37、從簡(jiǎn)單到復(fù)雜,參數(shù)辨識(shí)也是一樣,本章研究2個(gè)簡(jiǎn)單的線性代數(shù)模型的參數(shù)辨識(shí)問(wèn)題,通過(guò)這些簡(jiǎn)單線性代數(shù)模型的討論可以引出許多參數(shù)辨識(shí)有關(guān)的概念,對(duì)于非線性代數(shù)模型或者由微分方程表示的模型的參數(shù)辨識(shí),在概念理解上沒(méi)有增加任何復(fù)雜性。 簡(jiǎn)單的代數(shù)模型除有利于教學(xué)外,實(shí)際上,在許多問(wèn)題中也得到了廣泛的應(yīng)用。簡(jiǎn)單的代數(shù)模型也稱(chēng)為回歸函數(shù)。本章只討論以下兩個(gè)模型: 模型1i=1xi (3-1) 模型2i=1xi1+2xi2 (3-2) 變量稱(chēng)為因變量,xi, xi1, xi2稱(chēng)為自變量,它可以表示時(shí)間、位置、溫度等等。 在這些模型中,自變量xi也可以是時(shí)間t(或位置等)的各種函數(shù),或者是它們的某些組合。,在

38、這些模型中,自變量xi也可以是時(shí)間t(或位置等)的各種函數(shù),或者是它們的某些組合。 本章討論的誤差一般假定是可加的,例如,對(duì)于模型1有: yi=1xi+i (3-3) 這里i是未知誤差,yi是在xi時(shí)(處)的量測(cè)值。式(3-3)給出的模型可以表示下列兩種情形: 誤差模型A,誤差在量測(cè)中產(chǎn)生,即 i=1xi yi=i+i (3-4) 誤差模型B,誤差(噪聲)在過(guò)程中,即 i=1xi+i yi=i (3-5) 這里i表示要量測(cè)的量,yi表示它的量測(cè)值。,必須注意,在這些模型中有這樣的假定:在xi中沒(méi)有誤差,即xi不是一個(gè)隨機(jī)變量,而只有yi和i是隨機(jī)變量,在模型B中,i同樣也是一個(gè)隨機(jī)變量。在誤差

39、模型A中,只存在量測(cè)誤差,而在i中不存在誤差,為了確定i,我們可以研究量測(cè)裝置的誤差特性,量測(cè)裝置越精確,這些誤差越小,隨著技術(shù)不斷改進(jìn),誤差會(huì)愈來(lái)越小,系統(tǒng)模型本身假定是無(wú)誤差的(無(wú)噪聲的)是指對(duì)物理現(xiàn)象有充分的了解,以致于沒(méi)有隨機(jī)噪聲參入i。,在誤差模型B中,量測(cè)假定是無(wú)誤差的,但模型()含有誤差,誤差是由某些隨機(jī)性引起的,實(shí)際上,誤差也可能是由于模型本身的近似性引起的。 誤差模型A和B分別表示了誤差存在于量測(cè)中和模型中,實(shí)際上誤差可以同時(shí)存在于量測(cè)和模型中。 無(wú)論是誤差模型A正確還是誤差模型B正確,對(duì)于本章討論的模型,參數(shù)辨識(shí)形式上是相同的,我們將把模型A作為本章討論的模型。,第二節(jié) 常

40、規(guī)最小二乘估計(jì)(簡(jiǎn)稱(chēng)OLS估計(jì)),常規(guī)最小二乘估計(jì)的準(zhǔn)則函數(shù)由式(2-6)已經(jīng)給出,即 式中i是參數(shù)的函數(shù),n表示n次量測(cè),量測(cè)次數(shù)必須大于待求參數(shù)的個(gè)數(shù)。使(3-6)達(dá)到極小的參數(shù)值便為常規(guī)最小二乘估計(jì)量。 常規(guī)最小二乘法的最早應(yīng)用可以追溯到大約1795年,那時(shí)高斯為了完成行星軌道預(yù)測(cè)工作首先開(kāi)創(chuàng)了此法,以后這種方法成為參數(shù)辨識(shí)的主要工具,雖然目前有其它幾種方法可利用,例如,最大似然法、貝葉斯法等等,但最小二乘法仍然是工程師和科學(xué)家最熟悉的方法,這方法之所以普及,是因?yàn)樗绕渌椒ㄈ菀桌斫?,并且在獲得參數(shù)估計(jì)量時(shí)不需要任何統(tǒng)計(jì)假設(shè)。 但獲得了參數(shù)估計(jì)量后,為了討論估計(jì)量的統(tǒng)計(jì)特性,這時(shí)量測(cè)誤

41、差的統(tǒng)計(jì)信息必須給出。,以模型1為例,此時(shí)準(zhǔn)則函數(shù)(3-6)可寫(xiě)為 由dJ/d1=0,并用參數(shù)估計(jì)值1*代替dJ/d1=0中的1可得 這里“”是 的簡(jiǎn)寫(xiě),以后凡是出現(xiàn),都默認(rèn)為 。式(3-8)的解為 1*=yixi)(xi2)-1 (3-9) 1*估計(jì)值沒(méi)有使用任何統(tǒng)計(jì)假設(shè)。由估計(jì)值的表達(dá)式可以看出:至少需要一次量測(cè),且至少一個(gè)xi不為零。,由xi時(shí)(處)的量測(cè)值yi,我們求得了參數(shù)估計(jì)值,在xi處模型輸出的估計(jì)值我們可以根據(jù)模型求出,此時(shí)模型中的參數(shù)用估計(jì)值代替。用yi*表示xi處的估計(jì)值,則估計(jì)值為 yi*=1* xi (3-10) 設(shè)xi處的量測(cè)值yi減去估計(jì)值yi的差為ei,則 ei=

42、yi-yi* (3-11) ei稱(chēng)為殘差,注意ei不等于誤差i,但ei能夠用來(lái)估計(jì)i。,(一)估計(jì)量的均值和方差 若誤差i是可加的,有零均值,且1不是隨機(jī)變量,由此我們可以求得模型1的參數(shù)估計(jì)值1的均值為 E(1*)=(xi2)-1xiE(yi)=(xi2)-1xi1xi=1 因此,在以上所述的假設(shè)下,最小二乘估計(jì)1是無(wú)偏估計(jì)。 若再假定誤差i是互不相關(guān)的且具有相同的方差,則可求得1的方差為 V(1)=(xi2)-2xi22=2(xi2)-1(3-12) 從(3-12)可以看出:量測(cè)次數(shù)越多,估計(jì)量的方差越小,當(dāng)xi滿足一定的取值要求時(shí),有,這說(shuō)明1是一致估計(jì)量。隨著量測(cè)次數(shù)的增多,估計(jì)精度越

43、來(lái)越高,這自然要求量測(cè)誤差滿足以上的假定,例如,量測(cè)是相關(guān)的,則以上結(jié)論不一定成立。 同樣必須注意,對(duì)于該模型有一個(gè)優(yōu)化的量測(cè)位置,當(dāng)量測(cè)位置(時(shí)刻)取在xi值較大處時(shí),估計(jì)值的方差(3-12)越小,這樣(3-12)給我們提供了最優(yōu)量測(cè)位置,根據(jù)估計(jì)值方差安排量測(cè)位置,這是優(yōu)化實(shí)驗(yàn)設(shè)計(jì)的內(nèi)容。,(二)例題 軸對(duì)稱(chēng)圓形巷道徑向位移計(jì)算公式為 此式是按平面應(yīng)變條件求得的,式中為圍巖的泊松比,E為圍巖的彈性模量,R0為巷道半徑,P0為原始地應(yīng)力,r為圍巖內(nèi)任一點(diǎn)距巷道中心的距離?,F(xiàn)假設(shè)ri處的徑向位移uri量測(cè)值為yi,圍巖的彈性模量和泊松比是已知的,根據(jù)yi使用常規(guī)最小二乘法確定原始地應(yīng)力P0的估

44、計(jì)值P0*。,(3-23)表示的模型,在E、R0已知的情況下,符合模型1的情形,即1=P0,xi=(1+)R02 / (Eri),則直接利用(3-9)可得 P0*的方差可由(3-12)得到 由此可以看出,ri越小,V(P0*)越小,即量測(cè)點(diǎn)越靠近巷道周邊估計(jì)值P0*的方差越小,從而估計(jì)精度越高;反之,ri越大,V(P0*)越大,即量測(cè)點(diǎn)越遠(yuǎn)離巷道,估計(jì)值P0*的方差越大,從而估計(jì)精度越差。,第三節(jié)最大似然估計(jì)(maximum likelihood Estimation),最大似然估計(jì)在估計(jì)理論中是一個(gè)很老的估計(jì)方法,1906年弗希爾(R. A. Fisher)首先使用了這個(gè)方法。為了方便,我們

45、把最大似然估計(jì)簡(jiǎn)記為ML估計(jì)。 ML估計(jì)是在量測(cè)誤差分布已知的情形下的參數(shù)估計(jì),它利用了有關(guān)量測(cè)的所有信息。ML估計(jì)的前提條件為:誤差是可加的,即yi=(Xi;)+i; 式中的誤差i(i=1,n)是相互獨(dú)立的正態(tài)分布,且有零均值和已知方差i2;參數(shù)是確定性的量,即不是隨機(jī)變量。 因1,n是n個(gè)隨機(jī)變量,則由以上的假定知:y1,yn也是n個(gè)隨機(jī)變量。一次試驗(yàn)所獲得的n次量測(cè)只是n個(gè)隨機(jī)變量的樣本值y1,yn,這里隨機(jī)變量和樣本使用同一符號(hào)yi(i=1,n)。,量測(cè)值yi是隨機(jī)變量是指在同樣的條件下,重復(fù)量測(cè)所得的各次量測(cè)值也會(huì)各不相同。這意味著同一觀測(cè)者使用相同的儀器,如果試驗(yàn)是可重復(fù)的,那么在

46、同一時(shí)刻(或位置)的量測(cè)值也可能是不會(huì)相同的,這主要是偶然誤差引起的,例如,觀測(cè)者本身感官分辨本領(lǐng)的限制,就是偶然誤差的一個(gè)來(lái)源。 為了辨識(shí)參數(shù),對(duì)系統(tǒng)輸出進(jìn)行了n次量測(cè)yi(i=1,n),因i(i=1,n)是相互獨(dú)立的,則這n次量測(cè)是相互獨(dú)立的,每個(gè)yi的概率密度函數(shù)可由i的概率密度函數(shù)確定,yi(i=1,n)的聯(lián)合概率密度函數(shù)稱(chēng)為樣本的似然函數(shù)。因yi(i=1,n)是相互獨(dú)立的,則樣本的似然函數(shù)為每個(gè)yi的概率密度之積,即 ,對(duì)于一組給定的量測(cè)值y1,yn,似然函數(shù)(3-34)只是未知參數(shù)的函數(shù),選擇使似然函數(shù)取得最大值的參數(shù)作為參數(shù)的估計(jì)值,這是很自然的一種選取估計(jì)值的辦法,稱(chēng)為的最大似

47、然估計(jì),即ML估計(jì)。 (3-34)表示的似然函數(shù)即為ML估計(jì)的準(zhǔn)則函數(shù),使準(zhǔn)則函數(shù)達(dá)到最大的似然估計(jì)應(yīng)當(dāng)是方程 的解。由于似然函數(shù)L是多個(gè)因子的乘積,利用對(duì)數(shù)lnL進(jìn)行計(jì)算比較方便(lnL是單調(diào)函數(shù),并且當(dāng)L為最大時(shí),lnL也為最大,所以這樣做是可行的),所以通常解似然方程 以求得ML估計(jì)。,由ML估計(jì)的前提條件可知i的概率密度函數(shù)為 在yi=(Xi;)+i中,i的概率密度函數(shù)已知,(Xi;)是非隨機(jī)的確定性量,則可以求出yi的概率密度函數(shù)為 這樣似然函數(shù)可根據(jù)式(3-36)寫(xiě)出,式(3-37)兩邊取對(duì)數(shù),可得 ,由式(338)中,物理參數(shù)只包含在JML中,其它兩項(xiàng)與無(wú)關(guān),所以求lnL的極大點(diǎn)

48、*,也就是求JML的極小點(diǎn)(注意式(338)中的負(fù)號(hào)),這樣JML便為我們要討論的準(zhǔn)則函數(shù),它與高斯馬爾可夫估計(jì)中的準(zhǔn)則函數(shù)(2-7)完全相同。 由式(339)可以看出:當(dāng)12=22=n2=2時(shí), 這與常規(guī)最小二乘估計(jì)中的準(zhǔn)則函數(shù) 只差一個(gè)因子,這因子與參數(shù)無(wú)關(guān),所以使J達(dá)到極小值的也必使JML達(dá)到極小值,這說(shuō)明此時(shí)ML估計(jì)與OLS估計(jì)相同,這正是第二章第三節(jié)中已給出的結(jié)論。,第四節(jié)最大驗(yàn)后估計(jì)(貝葉斯估計(jì)),在最大似然估計(jì)中,利用了有關(guān)量測(cè)的所有信息,認(rèn)為誤差是可加的,誤差i(i=1,n)是相互獨(dú)立的正態(tài)分布,且有零均值和已知方差,事先把參數(shù)作為是確定性的量。 而在本節(jié)討論的最大驗(yàn)后估計(jì)中,

49、除把參數(shù)作為隨機(jī)變量外,其它假設(shè)條件與最大似然估計(jì)相同。 在以上假設(shè)條件下,同樣可求出yi(i=1,n)的聯(lián)合概率密度函數(shù)p(y1,yn/),在求p(y1,yn/)的時(shí)候把作為常量,這時(shí)求得的p(y1,yn/)與最大似然估計(jì)中求得的p(y1,yn/)完全相同。在最大驗(yàn)后估計(jì)中,只知道p(y1,yn/)還不夠,還必須知道參數(shù)的概率密度函數(shù)p(),p()稱(chēng)為驗(yàn)前分布,這里我們假定p()是已知均值和方差的正態(tài)分布。,在p(Y/)p(Y/)是p(y1,yn/)的簡(jiǎn)寫(xiě)和p()已知的情形下,貝葉斯給出了驗(yàn)后概率密度函數(shù)p(/Y),p(/Y)表示當(dāng)量測(cè)結(jié)果恰好為某一組特定值的條件下,參數(shù)的概率分布,即 使式

50、(3-49)達(dá)到極大值的*稱(chēng)為最大驗(yàn)后估計(jì),簡(jiǎn)記為MAP估計(jì),因MAP估計(jì)是以貝葉斯公式(3-49)為基礎(chǔ)的,所以也有稱(chēng)MAP估計(jì)為貝葉斯估計(jì)(Bayess estimation)。,式(3-49)給出的驗(yàn)后概率密度函數(shù)為貝葉斯估計(jì)的準(zhǔn)則函數(shù),它比ML估計(jì)的準(zhǔn)則函數(shù)(似然函數(shù))多了兩項(xiàng)p(),p(Y),并且p(Y/)和p()是相乘的,不言而喻通過(guò)式(3-49)求MAP估計(jì)比ML估計(jì)要復(fù)雜。本節(jié)我們只討論模型1:i=1xi,在此1是隨機(jī)變量,貝葉斯估計(jì)除上面已給的假設(shè)條件外,還有一條假設(shè),即1與i(i=1,n)相互獨(dú)立,由此可以得到1與i不相關(guān),由獨(dú)立性可以推出不相關(guān)性,但是反過(guò)來(lái)不一定成立,不

51、過(guò)當(dāng)1和i都為正態(tài)分布時(shí),獨(dú)立性與不相關(guān)性卻是一致的。,因p(1)為正態(tài)概率分布,有E(1)=, V(1)=V, p(i)也為正態(tài)概率分布,并有E(i)=0,V(i)=i2,所以由yi=1xi+i知,在1和i互相獨(dú)立的條件下,yi也服從正態(tài)分布,這可由數(shù)理統(tǒng)計(jì)中已知的定理得證。 定理:若1和2是兩個(gè)互相獨(dú)立的正態(tài)變量,其概率密度函數(shù)分別為N(1,1,12)和N(2,2,22),則隨機(jī)變量=1+2也服從正態(tài)分布,其均值及方差分別為1和2的均值及方差之和,即=1+2N(,1+2,12+22) 在此不給出定理的證明,這里我們利用了N( )表示概率密度函數(shù)。,對(duì)于我們的問(wèn)題yi=1xi+i,這與=1+

52、2的形式大體相同,稍有不同的是,1xi項(xiàng)為一隨機(jī)變量1與一確定性量xi之積。我們知道,1的概率密度函數(shù)已知,則可求出1xi的概率密度函數(shù)為p(1xi)=1/xip(1/xi),式中p(1/xi)與p(1)的形式完全相同,不同的是把p(1)中的1換為1/xi,這說(shuō)明p(1/xi)與p(1)為同分布,即都為正態(tài)分布,但分布的均值和方差不同。由此證明了yi也服從正態(tài)分布。,因 即p(1xi)的均值和方差分別為xi和Vxi2,這個(gè)結(jié)果實(shí)際可以更方便地求出為: E(1xi)=xiE(1)=xi V(1xi)=xiV(1)=xi2V 這樣yi的均值和方差可根據(jù)定理和已知條件求得 E(yi)=E(1xi)+

53、E(i)=xi+0=xi V(yi)=V(1xi+i)=V(1xi)+V(i)=xi2V+i2,由此可以寫(xiě)出yi的概率密度函數(shù) 則yi的聯(lián)合概率密度函數(shù)為 式(3-49)中的p(Y/)在式(3-37)中已經(jīng)給出,將i=1xi代入,則 ,驗(yàn)后概率密度函數(shù)p(/Y)即為式(3-54)與式(3-50)之積并除以式(3-53)。因式(3-53)中不含有參數(shù)1,故在求使p(/Y)達(dá)到極大值的1時(shí),可去掉p(Y)。這樣準(zhǔn)則函數(shù)變?yōu)槭?3-54)與式(3-50)之積,即 在上式兩邊取對(duì)數(shù)得,由式(3-55)可求出dlnJ/d1,令 dlnJ/d1 =0,并用1代替式中的1,可得方程 將式(3-56)整理得

54、式中: Fi=yi/i Zi=xi/i (3-58ab) 由式(3-57)可解得,因 所以1為1的無(wú)偏估計(jì),這與以前定義的無(wú)偏估計(jì)稍有不同,那時(shí)無(wú)偏估計(jì)的條件是:E(1)=1,1是確定性量。對(duì)于貝葉斯估計(jì),1是隨機(jī)變量,所以按E(1)=E(1)定義無(wú)偏估計(jì)是合理的。,1的方差也可由式(3-59)求得 由式(3-60)及式(3-58b)可以看出,1的方差不僅受到量測(cè)誤差的影響,而且也受到1的方差的影響。一般我們關(guān)心的是估計(jì)誤差1*-1的方差(思考:為什么前面的常規(guī)最小二乘估計(jì)和最大似然估計(jì)不求估計(jì)誤差的方差?),使用式(3-59)我們可以得到 由此可以求得1-1的方差為 ,在推導(dǎo)(3-61)的過(guò)

55、程中,利用了V(-1)=V(1),對(duì)于OLS估計(jì)和ML估計(jì),若也求1*-1的方差,則因1為確定性量,故V(1*-1)=V(1),即1*的方差與估計(jì)誤差的方差相同。 由式(3-61)可以看出:量測(cè)次數(shù)越多, 越大,則V(1-1)越小,這說(shuō)明量測(cè)次數(shù)越多,估計(jì)的精度越高。另外,量測(cè)次數(shù)越多,參數(shù)1的先驗(yàn)信息V1對(duì)式(3-61)的影響相對(duì)削弱。,將式(3-61)和式(3-44)比較可知,貝葉斯估計(jì)的誤差方差總小于ML估計(jì)的誤差方差,就此而言,貝葉斯估計(jì)優(yōu)于ML估計(jì)。 從式(3-59)可以看了,若V=,那么可得 式(3-62)表示的估計(jì)量1與式(3-43)表示的估計(jì)量完全相同。V=表明我們對(duì)參數(shù)1的驗(yàn)

56、前信息毫無(wú)了解,這是貝葉斯估計(jì)(MAP估計(jì))的一種特殊情形,此時(shí)參數(shù)估計(jì)值與ML估計(jì)值完全相同,不言而喻,當(dāng)i2=2時(shí),此時(shí)的貝葉斯估計(jì)與常規(guī)最小二乘估計(jì)也是相同的。,第四章線性模型參數(shù)辨識(shí) 的矩陣方法及非線性模型參數(shù)辨識(shí)方法的最優(yōu)化方法,第三章討論的線性模型參數(shù)辨識(shí)是在模型參數(shù)不多于兩個(gè)(而本次課討論了只有一個(gè)模型參數(shù))的情形下進(jìn)行的。對(duì)于許多問(wèn)題,模型的參數(shù)往往多于兩個(gè),這時(shí)根據(jù)第三章求解問(wèn)題的思路當(dāng)然也可以得到這種情形的解,但得到的解沒(méi)有一般性,有了矩陣的知識(shí),我們可以把各種各樣的線性模型,歸結(jié)為一個(gè)用矩陣表示的通用式子,這樣可以有效地進(jìn)行參數(shù)辨識(shí),使運(yùn)算符號(hào)更緊湊,運(yùn)算起來(lái)更方便,適用

57、性更強(qiáng)。,在此有必要再?gòu)?qiáng)調(diào)一下什么是線性模型?所謂線性模型是指模型輸出是參數(shù)的線性函數(shù),這有別于固體力學(xué)中所提的線性問(wèn)題,若把位移作為模型輸出,則位移可以是彈性模量和泊松比的非線性函數(shù),這時(shí),在固體力學(xué)中雖是線性問(wèn)題,但在參數(shù)辨識(shí)中就是非線性問(wèn)題。 本章前三節(jié)用矩陣方法討論與第三章相應(yīng)的各種參數(shù)估計(jì)方法,為了討論方便起見(jiàn),附錄A給出了矩陣的有關(guān)基本知識(shí),以便于后面各節(jié)的使用。,一、線性模型的矩陣表示,用矩陣表示的線性模型比用代數(shù)符號(hào)表示的線性模型一般性強(qiáng),用矩陣表示的線性模型的一般式為 =X 表示模型輸出,表示參數(shù)矢量,它是一個(gè)m維的列矩陣,若對(duì)量測(cè)n次,則可記為n維列矩陣,由上式可以看出,此

58、時(shí)X必為一nm的矩陣,我們稱(chēng)X為靈敏矩陣,這是因?yàn)樗顷P(guān)于參數(shù)的導(dǎo)數(shù)。 ,X和的矩陣表示為 此式包括了第三章討論的所有模型。,二、常規(guī)最小二乘法,對(duì)于線性模型=X,常規(guī)最小二乘法的準(zhǔn)則函數(shù)為J=(Y-X) T(Y-X)(4-1) 顯然,準(zhǔn)則函數(shù)J的值,隨著所選的參數(shù)的不同而不同,使J為最小的,應(yīng)該是的最好估計(jì)。 當(dāng)XTX為非奇異陣,可解得為 =(XTX)-1XTY(4-4) 式(4-4)這個(gè)結(jié)果稱(chēng)為參數(shù)的最小二乘估計(jì)量,由式(4-4)可以看出,估計(jì)量是量測(cè)值Y的線性函數(shù)。也有稱(chēng)這樣的估計(jì)為線性估計(jì)。 可以證明估計(jì)量式(44)是無(wú)偏、有效估計(jì),只有特定的某些X,才是一致估計(jì)。,三、加權(quán)最小二乘法,一般地說(shuō),由于量測(cè)往往是在不同條件(時(shí)刻或位置,儀器精度、環(huán)境)下進(jìn)行的,這些量測(cè)所得的數(shù)據(jù)對(duì)于參數(shù)估計(jì),有的“價(jià)值”大,有的“價(jià)值”小,在利用這些數(shù)據(jù)來(lái)估計(jì)時(shí),往往希望“價(jià)值”大的數(shù)據(jù)占有較大的比重,使其對(duì)估計(jì)結(jié)果產(chǎn)生較多的影響,我們就用一個(gè)數(shù)值來(lái)表示量測(cè)的“信任程度”,這就稱(chēng)之為“權(quán)”,引入“權(quán)”這個(gè)概念以后,最小二乘法就進(jìn)一步推廣為加權(quán)最小二乘法。 它與上述的常規(guī)最小二乘法的不同點(diǎn)是在準(zhǔn)則函數(shù)(4-1)中乘上一個(gè)權(quán)矩陣,即 J=(Y-X)TW(Y-X)(4-25) 這里W限于對(duì)稱(chēng)正定矩陣。 顯然,準(zhǔn)則函數(shù)J的值,除了隨著的不同而不同外,它也隨著所選權(quán)的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論