半參數核估計理論及應用_第1頁
半參數核估計理論及應用_第2頁
半參數核估計理論及應用_第3頁
半參數核估計理論及應用_第4頁
半參數核估計理論及應用_第5頁
已閱讀5頁,還剩33頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、 本科畢業(yè)論文(設計)題目: 半參數核估計理論及應用 姓 名: 高華 學號: 20111114487 院(系): 信工學院 專業(yè): 測繪工程 指導教師: 梁新美 職稱: 教授 評 閱 人: 潘 雄 職稱: 教授 2015 年 02 月學位論文原創(chuàng)性聲明本人鄭重聲明:所呈交的論文是本人在導師的指導下獨立進行研究所取得的研究成果。除了文中特別加以標注引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫的成果作品。本人完全意識到本聲明的法律后果由本人承擔。作者簽名: 年 月 日 學位論文版權使用授權書本學位論文作者完全了解學校有關保障、使用學位論文的規(guī)定,同意學校保留并向有關學位論文管理部門或

2、機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權省級優(yōu)秀學士學位論文評選機構將本學位論文的全部或部分內容編入有關數據庫進行檢索,可以采用影印、縮印或掃描等復制手段保存和匯編本學位論文。本學位論文屬于1 保密 ,在_年解密后適用本授權書。2 不保密 。(請在以上相應方框內打“”)作者簽名: 年 月 日 導師簽名: 年 月 日 摘 要 現代科學技術的飛速發(fā)展,為測繪科學提供了一個良好的發(fā)展機遇,同時也對測繪科學提出了更高的要求。首先由于現代測量儀器發(fā)展和觀測數據的復雜性,測繪學界對測量數據處理的精度要求越來越高,但是整個測量平差系統是由眾多因素共同確定的,其中一些影響因素與觀測值函數關

3、系并不明確,得到的一些復雜的觀測數據導致經典最小二乘準則失效,最終導致沒有明確了解的觀測值部分系統誤差影響無法消除等。半參數模型包含一個參數分量和一個非參數分量,對于與觀測值函數關系已知部分的參數采取與最小二乘估計類似的方法,即將這部分參數完全參數化;對于函數關系未知或難以用函數關系表達的因素不采用任何具體函數表達,而是采用抽象的函數給與表達,即事先不規(guī)定具體函數形式,其函數關系形式可以任意的,具體應用時,根據實際情況不同構造不同函數,其可以克服參數和非參數模型表達不完善的部分,彌補了參數模型和非參數模型的不足,能夠解決許多的實際問題,具有更強的模型解釋能力和適應能力。大量的研究表明半參數模型

4、在處理觀測量與待估參數之間的復雜關系時有很明顯的優(yōu)點,因此在很多領域得到了研究與應用。半參數模型估計能夠很好的處理系統誤差和粗差,并且能分離出系統誤差和粗差,提供更加可靠的解算成果。半參數核估計包括偏核光滑估計、偏殘差估計、近鄰核估計、最小二乘核估計以及N-W核估計等。本文主要研究半參數的最小二乘核估計和偏核光滑估計,通過解算其參數分量和非參數分量及推導其期望、偏差、方差及均方誤差等統計性質,研究窗寬參數的選取,并通過模擬算例證明和對比最小二乘核估計和偏核光滑估計各自在參數和非參數分量估計以及估計系統誤差等方面的有效性和可行性,并將半參數核估計應用到平面坐標轉換中。本論文共分為五章,第一章緒論

5、主要闡述了半參數模型在統計領域的研究現狀及半參數回歸模型在測量數據處理應用的兩種主要方法:補償最小二乘法和基于外延預測預測的核估計;著重介紹了半參數核估計理論方面的國內國外研究現以及本文研究的內容。半參數核估計包括偏核光滑估計、偏殘差估計、近鄰核估計、最小二乘核估計以及N-W核估計等,本文主要研究半參數最小二乘法和偏核光滑估計法。第二章主要研究半參數核估計的理論,包括核權函數和核函數的選取問題;介紹了核估計的兩種方法,即最小二乘核估計和偏核光滑估計,分析了這兩種方法的各自特點,并解算了其參數和非參數分量;同時討論了窗寬參數在核估計中的重要作用,在小樣本估計中,樣本的大小,核函數的選取以及窗寬參

6、數共同決定了核估計性能的好壞。第三章主要是推導了半參數核估計量(即參數分量和非參數分量)的統計性質,其估計性質包括期望、方差、偏差、均方誤差。同時也討論了窗寬參數的選取問題,窗寬參數是一個非常重要的光滑參數,它對曲線的擬合程度和光滑程度起平衡作用,實際上是起到一個平滑因子的角色,它的選擇好壞對估計量的性質影響很大。窗寬越小,則核估計的偏差越小,但估計的方差卻越大。在窗寬參數的選取中,討論了最小均方誤差法和經典的CV和GCV法等等。窗寬的變化,不可能使核估計的偏差和方差同時變小。因此,最佳窗寬選擇的標準必須在核估計的偏差和方差之間進行權衡。第四章對測量誤差進行了概述,介紹了系統誤差相關特性。通過

7、模擬算例證明半參數核估計在估計參數分量,剔除粗差和分離系統誤差方面的可行性,通過半參數核估計可明顯提高估計效果。將半參數核估計理論應用到平面坐標轉換,此前,并未有過用核估計進行坐標轉換,本章通過實際算例證明了核估計在高低精度坐標系轉換之間可以消除系統誤差,取得較高精度。關鍵詞:半參數模型,核估計,統計性質,系統誤差,坐標轉換AbstractThe rapid development of modern science and technology not only provides a good opportunity for the development of surveying and

8、mapping science, but also a higher requirement on Surveying and Mapping .First, as the development of modern measuring instruments and the complexity of observational data ,the precision of the measurement data processing becomes increasingly demanding, but the entire survey adjustment system is det

9、ermined by numerous factors, some of which affect the observation function not clearly.The complex observational data lead classical least squares criterion to failure, resulting in some systematic error can not be eliminated and so on. Semi-parametric model contains a parameter component and a non-

10、parametric component, for a function with the observed values of the parameters of the known part of the pre-squares estimation taken a similar approach, some parameters about which fully parameterized; For the function is unknown or difficult to use the function relationship factor expression expre

11、ssion does not use any specific function, instead of using abstract functions give expression, that does not require prior specific functional form, which can be any function of the form, the specific application, different configurations according to the actual situation of different functions, and

12、 its can overcome the parametric and non-parametric models expressing the imperfect parts, make up the parameters of the model and the lack of non-parametric model that can solve many practical problems, with more models to explain and adaptability. Numerous studies indicate that semi-parametric mod

13、el in dealing with the concept of measurement parameters to be estimated when the complex relationship between the obvious advantages, so in many fields research and application. Semi-parametric estimation model can well handle system errors and outliers, and can be isolated from system errors and g

14、ross errors, provide more reliable solver results.Semi-parametric kernel estimation including migraine kernel smooth estimation, partial residuals estimated neighbor kernel estimation, least squares estimation and NW kernel kernel estimation. This paper studies the migraine kernel smooth estimation

15、and least squares estimation, solves parametric component and non-parametric components, derives their expectations, deviation, variance and mean square error,discuss the problem of window width parameter selection , find the model scope;and through simulations and comparative examples demonstrate t

16、hat kernel smooth estimation and least squares estimation is effective and feasible in parametric and non-parametric estimation,namely we can estimate the system error. The thesis is divided into five chapters, first chapter mainly describes the research of semi-parametric models in the field of sta

17、tistics and two methods that semi-parametric regression model applies in the measurement data processing: Compensation based on least squares method and the epitaxial Forecast Forecast kernel estimation; highlights the semi-parametric estimation theoretical aspects of kernel research at home and abr

18、oad ,and the contents of this paper are: semi-parametric kernel estimation including migraine kernel smooth estimation, partial residuals estimated neighbor kernel estimation, least squares estimation and NW kernel estimation, this paper mainly studies migraine kernel smooth estimation and least squ

19、ares estimation. The second chapter studies the theory of semi-parametric kernel estimation.including kernel weight functions and kernel function selection roduces two kernel estimation method, namely migraine kernel smooth estimation and least squares estimation,analysis of the character

20、istics of each of these two methods,and extract forget their parametric and nonparametric component.in a small sample estimates, the sample size, the selection of kernel function and window width parameters together determine the kernel estimation performance quality.Finally, numerical examples demo

21、nstrates that the component parameters of two methods is correct and we compare the result. The third chapter is to derive a semi-parametric kernel estimation (parametric and non-parametric component component) of the statistical properties, according to which We can infer the scope of application o

22、f the model.The properties includes its estimated expectation, variance, bias, mean square error. It also discusses the problem of the window width parameter selection, window width is an important parameter smoothing parameter, It Plays a balancing role on the degree of curve fitting and smoothness

23、,in fact, it is to play a role as a smoothing factor,that it is good or not influences the properties of the estimation,.The smaller Window width is, the smaller the kernel estimation bias is, but the greater estimates of the variance is. In the window width parameter selection, we discuss minimum m

24、ean square error method and classic GCV method and so on.When window width changes, it is impossible to make kernel estimation bias and variance simultaneously smaller. Therefore, the optimal window width selection criteria must be balanced in the kernel trade-off between bias and variance. This cha

25、pter provides an overview of the measurement error and introduces the related characteristics of systematic errors . Through simulation examples and examples of measurements, it Proves that semi-parametric kernel estimation is feasible in removing outliers and separating system errors.applying the s

26、emi-parametric kernel estimation theory to the gravity measurements,through the practical examples given in this chapter, we prove that kernel estimation is effective in Coordinate transformation.KeyWords: Semi-parametric model, Kernel estimation,Statistical properties,Systematic errors, Coordinate

27、transformation目錄第一章 緒論11.1 引言11.2 半參數核估計理論應用研究現狀5第二章 半參數核估計方法72.1 半參數核估計理論72.2 最小二乘核估計102.3 半參數偏核光滑估計11第三章 估計量的統計性質和窗寬參數的選取133.1 最小二乘核估計估計量的性質133.2 半參數偏核光滑估計量的性質163.3 半參數核估計中窗寬參數的選取193.3.1 最小均方誤差法193.3.2 CV和GCV法19第四章 算例分析214.1 模擬算例214.2 在坐標系換算中的應用25第五章 結論與展望27致謝28參考文獻29302013.6 中國地質大學(武漢)學士學位論文 第一章

28、緒論1.1 引言 半參數模型是八十年代發(fā)展起來的一種重要的統計模型,它既含有參數分量,描述了觀測量中已知函數關系;又包含有非參數分量,用來表示函數關系中未知的的系統誤差和模型偏差,因此可以概括和描述眾多實際問題,因而引起測繪界的廣泛關注;在統計領域中,處理數據的半參數模型是將我們常用的參數回歸模型和非參數回歸模型結合在一起,這樣就為我們求解系統誤差或者模型誤差提供了思路,但它并不僅僅是這兩種模型的疊加,半參數模型比一般的回歸模型都更為復雜,其解算也更加困難。所以,半參數模型在測繪領域是一種既有用又充滿挑戰(zhàn)性的理論。目前,一些學者對半參數模型已經做了一些研究,并取得了一定的成果:Engle1,G

29、reen&Silverman(1994)2,Heckman(1986)3等人對樣條光滑估計的內容做了研究;Robinson(1988)對基于半參數的回歸模型做了深入探討;在此基礎上Severini&Staniswalis(1994)4、Hrdle,Mammen&Mller(1998)5等學者對廣義的半參數回歸模型做了研究;Eubank(1990)7對于半參數模型中的三角級數估計法做了研究;由David等學者編著的書Semi-paremetric Regression對半參數回歸模型做了詳細介紹;還有一些學者對基于大樣本的半參數模型中的分量性質做了深入研究。我國對于半參數回歸的研究,主要在統計領

30、域內,其中主要研究內容包括:洪圣巖13對于半參數回歸模型中的一系列估計理論做了研究;柴根象和孫平14對于大樣本估計的性質和半參數中估計量的性質做了研究;朱仲義(1999)15用統計的方法對于半參數非線性模型做了系統的研究;曾林蕊(2004)18對廣義的半參數模型中的統計診斷方法做了研究;其中,柴根象、洪圣巖(1995)17的著作-半參數回歸模型對于半參數中的理論與方法做了系統的介紹和研究?;诎雲的P洼^于參數模型和非參數模型不可替代的優(yōu)點,半參數模型近幾年來被廣泛地運用到工業(yè)、農業(yè)、經濟、醫(yī)藥、金融等各種不同領域:基于半參數統計模型的中長期電量負荷預測應用,中外股票市場聯動性的非參數與半參數

31、建模研究,中國人口預測的具有外生變量的半參數回歸模型等。從以上內容分析可以看出,對于半參數回歸模型國內外的研究主要有以下幾個方面:一、在模型基礎上,研究各種不同方法求解參數和非參數的估計量,以及不同誤差情況下,估計量的一些大樣本性質分析;二、將半參數模型引入到測量數據處理中進行參數估計處理系統誤差,并有效的探測粗差;三、在統計中的應用,即將半參數模型引入到CPI的研究中去,分析居民的消費結構及分析框架;四、在經濟中的應用,半參數模型應用于通貨膨脹、商品房價格指數、市場風險度量以及人口預測等方面。近些年來學者將半參數模型應用到在測繪領域,利用半參數回歸模型來解決實際測量數據中含有系統信號的問題,

32、與參數平差模型、非參數平差模型相比,半參數平差模型能利用其參數信號和非參數信號解決參數平差模型、非參數平差模型等單一解決方法不能解決的實際問題,并且所得的估計量效果要好一些。Green、Engle et al和Silverman利用半參數模型相比較參數模型有明顯的優(yōu)點研究了半參數平差模型在解決觀測量與待估參數之間的復雜關系;Moritz提出了正則化的數據平滑處理方法是為了解決重力測量問題;在美國導航協會技術會議上,Minghaijia(2000)首次提出利用半參數模型中的非參數分量表示電磁波穿過電離層的系統誤差,分析GPS測量中的多路徑效應的影響等等;陶本藻(1997)23研得出函數模型誤差和

33、隨機模型誤差之間是可以相互轉化的,并從理論上研究了模型誤差對參數分量的估值是如何影響的;武大測繪學院的孫海燕、陶本藻、王新洲、張松林、胡宏昌、丁士俊等人把統計領域的半參數模型應用到測量數據處理中來:孫海燕(2002)24將半參數模型引入到測量學界,并研究了半參數平差模型的相關算法,證明了半參數平差模型能夠發(fā)現并識別模型誤差或觀測值中的系統誤差,還進一步討論了正規(guī)化矩陣半正定時的計算方法;吳云(2003)30利在研究半參數模型中的參數估計時對正則化矩陣的求解運用了數學中的三次樣條函數;張松林(2003)26在基于最小二乘準則下對線性半參數模型的一系列估計理論做了系統分析,同時也研究了非線性半參數

34、模型中對參數分量的估計值的求解和推導了參數分量的統計性質,并將非線性模型運用到實際問題中提取和分離GPS定位中包含的系統誤差;胡宏昌(2004)28對于半參數模型中的附有系統參數的平差模型做了深入研究,解算出半參數模型中非參數分量的結果并推導其統計性質,對半參數補償最小二乘法中的關鍵問題如何選取正則矩陣和光滑因子用做了較為系統的研究;潘雄(2005)27主要研究了半參數補償最小二乘法,計算出半參數模型中各估計量的結果并推導出估計量統計性質的計算公式,最后根據其統計性質判斷出不同平差模型的適用范圍;丁士俊25(2005)在參數回歸診斷方法的基礎上研究了半參數模型的數據診斷方法,提出了穩(wěn)健估計方法

35、并推算出估計量的基本公式,同時探討了半參數平差模型中的廣義最小二乘估計,提出了抗差廣義補償最小二乘估計方法,最后將半參數平差模型應用到GPS變形分析等問題中;王振杰(2006)29基于不同的正則化參數和正則化矩陣,對半參數補償最小二乘法中的不適定問題做了研究。觀測數據是我們進行測繪研究和分析的基礎,然而人們運用各種測量手段得到測量數據,由于觀測條件、系統誤差、偶然誤差等原因,觀測結果與被觀測量的真實值產生了差異,這就是測量中產生的各種誤差,如何提高觀測數據的質量和有效地減小測量中的誤差,最終得到觀測數據的最佳平差值,這是測量平差中即測量數據處理中,我們所要解決的最重要問題。而我們所用的經典平差

36、模型是高斯一馬爾柯夫模型,具體形式如下: 函數模型: (1-1) 隨機模型: (1-2)在上述平差模型中,觀測值只包含參數分量,表現為參數分量的線性形式,但是這種平差模型求解有一個前提條件:觀測值只含有偶然誤差。在這種理想情況下,偶然誤差的數學期望為零,運用最小二乘準則,最終解得參數分量的解,根據其統計性質可以驗證參數解的偏差為零,即為無偏估計量。但是隨著科學技術的不斷進步與發(fā)展,先進的觀測技術、精度更高的儀器已經應用到測量數據采集中,這樣使得所測數據不含有系統誤差或者模型誤差這種理想的情況不存在??偠灾S著測量數據的復雜性增加和解算精度要求增高,使得經典的平差模型已經難以處理現代測繪數據

37、。一是因為影響觀測值的因素眾多,往往無法全面得考慮到所有的影響因素;其二是由于參數與觀測量的函數關系較為復雜,只是用簡單的線性模型來對實際問題進行近似描述往往也是不精確的。最后是隨機模型也會產生難以消除的誤差。所以,經典的高斯平差模型并沒有從根本上消除觀測數據中的誤差,也沒有從本質上區(qū)分系統誤差與粗差,當平差模型存在系統誤差或者粗差時,經典平差模型就會失去處理數據的能力。綜上所述,對不同的平差模型進行深入研究,更加精確地解算觀測量的最佳估值是現代測量數據處理中的基本首要內容。對于較為復雜的測量數據,一般情況下影響觀測量的因素可分為兩方面:一部分影響因素與的關系表現為是己知的線性關系,并且是觀測

38、值的主要影響項,最終可以用參數通過數學關系式或者經驗來表達;而另一部分影響因素與的關系完全是未知的,某些學者將這些因素作為觀測量的干擾項來處理,并不是誤差項的一部分。如果運用參數模型處理,則忽略了干擾項;但是若采用非參數模型處理,又會失去觀測值的主要影響項,模型對實際問題的描述能力也明顯降低。為了彌補參數和非參數模型的各自不足,測繪學界又將統計領域中的偏線性回歸模型引入到測量數據處理中,這就是現在的半參數平差模型,并取得了顯著的研究成果。 半參數回歸模型是統計領域的一種重要的估計模型,形式如下,給我們解決上述問題提供了思路: (1-3)上式中:是表示觀測值函數關系中的系統誤差量或者是模型誤差,

39、是關于參數個數的函數,由于數據來源的復雜性,造成了作為模型誤差或系統誤差的的形態(tài)難以用單一的回歸模型進行模擬,不能僅僅只用少數的參數表示,所以在這個因個觀測方程中都添加一個未知量,這個未知量組成的維列向量就是半參數模型中的非參數分量,這樣的形式比一般的平差模型具有更強的求解最佳估計量的特性:一是因為半參數回歸模型克服了傳統平差模型在處理復雜數據時的不適應性;二是半參數模型與客觀實際更加趨近;三是在已知觀測值和參數關系的情況下再運用一定準則對半參數模型進行求解可以分別求出模型中的估計量即參數分量、非參數分量、,它們分別代表觀測中的真值、系統誤差、偶然誤差。因此,我們可以將半參數模型與測量中許多方

40、面結合進行系統誤差提取等。 當今統計界對半參數模型的估計方法研究得較多的主要有樣條估計,最小二乘核估計,三角級數估計和分塊多項式估計,而且參數部分的模型只適用于線性函數模型,對于非線性模型研究得較少。在統計領域,關于半參數模型的估計問題被認為是一個帶有無窮維多余形狀參數的歐氏空間的點估計問題。半參數模型的估計途徑歸納起來有三種:第一種是對函數空間施加一定的限制;第二是兩步估計,本文主要研究的最小二乘核估計就是典型的兩步估計;第三是兩階段估計。在測量數據處理中,目前有研究的主要是基于補償最小二乘準則的光滑樣條估計,而近鄰估計、小波估計、二階段估計、分塊多項式估計、核估計、三角級數估計等其他估計方

41、法卻沒有進行深入探討。 到目前為止,在測繪界中對半參數平差模型研究具體主要分為以下兩種:(1)附加系統參數的半參數平差模型: (1-4)上式中,觀測值為維列向量,參數向量為維列向量,為是經典平差模型中求得唯一解的必需觀測數,代表了參數分量的關系,是一個列滿秩矩陣,觀測誤差向量為維列向量,維未知向量是描述了模型誤差或者觀測中的系統誤差。其誤差方程的形式為: (1-5)根據最小二乘準則,求得法方程為: (1-6)在上式中為觀測值的權陣,是一個對稱正定方陣;和是待求參數分量(個)和非參數分量(個),但是觀測值方程只有個,因而無法求得唯一解。這時就必須引入新的平差準則對結果進行約束:定義一個光滑因子和

42、矩陣,它們在和之間起平衡作用,通過改變和得出最佳值,具體形式如下: (1-7)(2)基于外延預測的半參數平差模型,其具體表達形式為: (1-9)在上式中:觀測向量為維向量;待估參數為維向量;模型非參數部分為維向量,由于它可以表達出與觀測值函數關系不確定的因素部分,對觀測值進行部分調整,其擬合程度更加精確,使得最終平差值與真實值很接近。,為某一函數空間上的關系未知函數;為代表了參數關系,是一個維列滿秩矩陣;觀測誤差向量為維向量。上面這兩種模型的主要區(qū)別是在于解算的過程中:模型(1-4)是先計算非參數分量再計算參數分量;模型(1-9)是先計算參數分量再計算非參數分量。參數平差模型中的函數形式是已知

43、的,而非參數平差模型中的回歸函數是未知的,所以參數模型只是需求解待定參數。由以上內容分析可知,半參數平差模型的兩個特例是參數平差模型與非參數平差模型,當時為非參數平差模型,將歸入誤差項則為參數平差模型。1.2 半參數核估計理論應用研究現狀目前國內外對于核估計已經做了很多研究:在國外,Silverman(1986)對自適應核估計做了研究;M.Hagmann(2007)對非對稱核密度估計進行了研究,并深入討論了如何偏差校正;Scott(1992)、Jones(1995)研究了核光滑估計;Peter M.Robinson(2003)對高階核半參數估計做了研究;T.Alberts、R.J.Karuna

44、muni(2003)對如何運用核密度估計來消除半參數邊界誤差以及交替的核混合密度估計做了研究;Sebastiano Manzan(2005)對基于偏線性相加模型下的核密度估計做了研究;Eva Ferreira(1997)對在不穩(wěn)定情況下的相關誤差,討論了核回歸估計中的曲線如何增長;Tae Yoon Kim(1995)對較強混合過程中的核密度估計做了研究;D.CHAUDHURI(1996)對數據驅動密度估計及其相關應用做了研究;Nils Lid Hjort(2000)對核密度估計中的最佳窗寬選取做了研究;Bert van Es(1997)對非光滑核密度估計中的積分均方誤差進行了分析;Yuri G

45、oegebeur(2010)對極值統計中的參數核估計做了研究; R.J. Karunamuni(2006)對有限混合模型核估計的漸進正態(tài)自適應性做了研究;Fateh Chebana(2006),Michel Carbon,Carlos Tenreiro,Abdelkader Mokkadem,Delaigle等學者均深入研究了核估計。在國內,洪圣巖對如何在核估計中選取最佳窗寬做了研究;薛留根對密度函數核估計進行了相關問題的研究;趙林城(1984)將核估計同近鄰估計進行了對比,并且通過的自適應估計最終可以得到最優(yōu)收斂速度;秦更生對隨機刪失場合中的部分線性模型的核光滑方法進行了研究;王啟華對隨機刪

46、失情況下概率密度核估計中的光滑Bootstrap逼近進行了分析;朱仲義、李朝暉對最小二乘估計與半參數函數模型的核進行了研究。將半參數回歸模型同核估計理論相結合并應用到測繪領域,是一種全新的測量平差方法,雖然目前不管在理論研究還是實際應用方面都研究得較少,但是也取得了許多的成就:丁士俊25將詳細分析了偏核光滑估計和偏殘差核估計方法,并對兩種方法的估計性能和效果進行了對比分析;張松林26解算出最小二乘核估計的非參數分量和參數分量的公式,對參數分量的估計結果的有偏性和漸近正態(tài)性進行了證明;潘雄32用半參數模型中的非參數分量來模擬系統誤差,提出了處理測量中系統誤差的一種新方法等等。第二章 半參數核估計

47、方法2.1 半參數核估計理論目前,研究半參數平差模型的主要方法有偏樣條估計、最小二乘估計、分塊多項式估計、二階段估計、多項式估計、三角級數估計、小波估計等,但是目前只有張松林26、丁士俊25等對于半參數平差模型中的核估計進行了研究。 本文所要研究的半參數核估計理論方法,其模型形式為式(1-9)。在本章,主要研究的核估計理論,包括核函數和核權函數的定義與選?。唤榻B了偏核光滑估計和最小二乘核估計兩種估計方法。在小樣本的情況下,選取不同的核權函數,不同的核函數,估計結果也就不一樣,不同的核估計方法有不同的特點,因而兩種半參數核估計方法也有各自的適用范圍。在數理統計學中,我們在判斷和估計一個數學模型的

48、主要思想就是用從總體樣本中所隨機抽取的部分樣本來對總體進行估計,而本文研究的核估計就是來源于這種思想。在此基礎上,數理界定義了核估計:設為己知給定樣本空間中獨立同分布的一維隨機變量,且的密度函數未知,則可以得到一組形式如下的函數: (2-1)其中為定義在()上的一個Borel可測函數,稱為概率密度核權函數,也成為核函數。窗口參數0為常數,稱為窗寬,它是與樣本容量有關的一列正實數,并且當時,。因此,稱這樣的一組為未知函數的核估計。同非參數平差模型一樣,一提到半參數核估計理論就不得不引入權函數。權函數對于相應變量的空間分布具有較大的影響,在測繪數據處理中,使用比較廣泛的權函數有概率密度權函數、最小

49、二乘權函數、丹麥法權函數、Huber權函數、Andrews權函數、Turkey權函數、Hampel權函數以及IGG權函數等等,當然,不同的權函數所產生的估計結果也就不一樣。模型為(1-9),則的權函數估計可表示為: =其中為權函數,設是選定的n個依賴于t的 Borel函數,總是的線性組合,一個對應一個,與一般無對應關系,的構造可能與全體或部分的有關,視具體函數而定,故一般寫為,是整個樣本相對于點的權,它反映了在估計時,樣本作用的大小。在一般的實際問題中,設概率權函數 ,權函數其滿足下面的條件:, (2-2)滿足以上條件的權函數為概率權,由不同的權函數形式衍生出不同的估計方法,核權函數和近鄰權函

50、數是最基本的概率密度權函數,由此所產生的相應的半參數估計是核估計和近鄰估計,核估計和近鄰估計理論也是基于平差模型的基礎上的,張松林,柴根象等已對近鄰估計的方法進行過研究。而在本文中要研究的半參數核估計理論中所采用權函數都是概率密度權函數,基于最小二乘原理下概率密度權函數參數估計結果,具有無偏性、有效性、穩(wěn)定性和一致性。 核權函數是一種最重要的權函數,對于如何選擇適當的權函數以用于特定的問題中,對這個問題可以從大樣本理論的觀點得出一些一般性的指導原則。Watson與Nadaraja(1964)提出了一種適合非參數模型的核函數,即選定R空間上的核函數(一般為概率密度),核權函數的定義為: (2-3

51、)則的權函數估計可表示為:= (2-4)這種核估計被稱為Waston-Nadaraja核估計,上式中窗寬參數是一個重要的光滑參數,當以-1,1為其范圍,且是單峰、對稱,是集中在附近一個鄰域的樣本的加權平均值,而正好是該鄰域的寬度。假如較小時,則參與平均的樣本就少,這樣估計量的偏差就小,但是降低了估計的精度;假如較小時,則結果正好相反。除上述核估計之外,還有其他形式的核權函數: = (2-5) = (2-6)在核估計中,如何確定核函數,一般要考慮實際應用情況,是定義在上的概率密度函數,一般為以下九種函數: (2-7) (2-8) (2-9) (2-10) (2-11) (2-12) (2-13)

52、 (2-14) (2-15)觀察這九個核函數的定義式可以分析出核函數所具有的一般性質:一是核函數是定義在上的可測實函數,且有上確界;二是核函數一般為某個隨機變量的關于軸對稱的概率密度函數;三是核函數都滿足積分和為1。 可以看出,在半參數核估計中隨著核權函數和核函數的變化會產生不同的估計結果,因此在解決實際問題進行核估計時,我們要根據實際情況選擇適當的核函數。因為核函數的選取,對估計結果有很大影響。如果在確定了觀測數據樣本和核函數的基礎上,核估計結果就主要由窗寬參數決定。單從定義式來看,核估計在每一個觀察點都會一個“碰撞”。而核函數決定 “碰撞”的形狀,而窗寬參數則決定的則決定這些“碰撞”的寬度,估計量都是這些“碰撞”的和。如果選擇窗寬參數太小,核估計會出現比較大的干擾尤其是圖像尾部,這時就會有增大方差的趨勢;相反,如果選擇窗寬參數太大,經過數學壓縮變換之后平均化作用就會顯得突出,結果是密度的細節(jié)部分便就淹沒了,我們在實際應用中應該根據實際情況來適當的選擇窗寬參數,來平衡前述討論的兩種不同情況。2.2 最小二乘核估計 兩步估計的典型例子是最小二乘核估計。首先根據本章第一節(jié)內容

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論