非參數(shù)統(tǒng)計的_第1頁
非參數(shù)統(tǒng)計的_第2頁
非參數(shù)統(tǒng)計的_第3頁
非參數(shù)統(tǒng)計的_第4頁
非參數(shù)統(tǒng)計的_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、非參數(shù)統(tǒng)計非參數(shù)統(tǒng)計(nonparametric statistics),數(shù)理統(tǒng)計學重要內(nèi)容。研究非參數(shù)問題,探究非參數(shù)方法。非參數(shù)問題是指統(tǒng)計總體分布形式未知或雖已知卻不能用有限個參數(shù)刻畫的統(tǒng)計問題。在多數(shù)場合下,與參數(shù)問題界線清楚,只在少數(shù)情況下會因為各人出發(fā)點不同而有不同看法。非參數(shù)方法有擬合優(yōu)度檢驗、次序統(tǒng)計量、U統(tǒng)計量、秩統(tǒng)計量與秩方法、置換檢驗、非參數(shù)回歸與判別等等。非參數(shù)方法并非絕對只能解決非參數(shù)問題,有些也可用于典型的參數(shù)統(tǒng)計問題。非參數(shù)統(tǒng)計方法無法依賴總體的具體分布形式,構造的統(tǒng)計量常與具體分布無關,故又稱非參數(shù)方法為自由分布方法。這樣,非參數(shù)方法的性能對分布的實際形式如何并

2、不敏感,即非參數(shù)方法常具較好的穩(wěn)健性。非參數(shù)方法需要考慮在約束條件十分寬松的情況下使用,有可能導致效率的下降。非參數(shù)統(tǒng)計難以建立小樣本理論,基本屬于大樣本理論的內(nèi)容。非參數(shù)統(tǒng)計形成于20世紀40年代,已成為一個體系龐大、理論精深且富有實用價值的統(tǒng)計分支。參數(shù)簡介非參數(shù)統(tǒng)計是統(tǒng)計學的一個重要分支,它在實踐中有著廣泛的應用。所謂統(tǒng)計推斷,就是由樣本觀察值去了解總體,它是統(tǒng)計學的基本任務之一。若根據(jù)經(jīng)驗或某種理論我們能在推斷之前就對總體作一些假設,則這些假設無疑有助于提高統(tǒng)計推斷的效率。這種情況下的統(tǒng)計方法稱為“參數(shù)統(tǒng)計”。如果我們所知很少,以致于在推斷之前不能對總體作任何假設,或僅能作一些非常一般

3、性(例如連續(xù)分布、對稱分布等)的假設,這時如果仍然使用參數(shù)統(tǒng)計方法,其統(tǒng)計推斷的結果顯然是不可信的,甚至有可能是錯的。在對總體的分布不作假設或僅作非常一般性假設條件下的統(tǒng)計方法稱為“非參數(shù)統(tǒng)計”。由于非參數(shù)統(tǒng)計方法與總體究竟是什么分布幾乎沒有什么關系,所以它的應用范圍很廣,它在社會學、醫(yī)學、生物學、心理學、教育學等領域都有著廣泛的應用。由于有關于總體的假設,所以參數(shù)統(tǒng)計的推斷方法是針對這個假設的。相對而言,非參數(shù)統(tǒng)計的推斷方法是很一般的,它僅應用樣本觀察值中一些非常直觀(例如次序)的信息。所以非參數(shù)統(tǒng)計分析含有豐富的統(tǒng)計思想。舉例說明例如,檢驗“兩個總體有相同分布”這個假設,若假定兩總體的分布

4、分別為正態(tài)分布N(1,2)和N(2,2),則問題只涉及三個實參數(shù)1,2,2,這是參數(shù)統(tǒng)計問題。若只假定兩總體的分布為連續(xù),此外一無所知,問題涉及的分布不能用有限個實參數(shù)刻畫,則這是非參數(shù)統(tǒng)計問題。又如,估計總體分布的期望,若假定總體分布為正態(tài) N(,2),則問題是參數(shù)性的;若只假定總體分布的期望值存在,則問題是非參數(shù)性的。不過參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計之間并沒有涇渭分明的界線。例外有的統(tǒng)計問題,從不同的角度,可以理解為參數(shù)性的,也可以理解為非參數(shù)性的。例如線性回歸(見回歸分析)問題,若關心的是估計回歸系數(shù),它只是有限個實參數(shù),因而可以看成是參數(shù)性的。但是,如果對隨機誤差的分布類型沒有作任何假定,則從

5、問題的總體分布這個角度看,也可以看成是非參數(shù)性的。統(tǒng)計方法重要的非參數(shù)統(tǒng)計方法秩方法是基于秩統(tǒng)計量(見統(tǒng)計量)的一類重要的非參數(shù)統(tǒng)計方法。設有樣本X1,X2,Xn,把它們由小到大排列,若Xi在這個次序中占第Ri個位置(最小的占第1個位置),則稱Xi的秩為Ri(i=1,2,n)。1945年F.威爾科克森提出的兩樣本秩和檢驗是一個有代表性的例子。設X1,X2,Xm和Y1,Y2,Yn分別是從分布為 F(x)和 F(x-)的總體中抽出的樣本,F(xiàn)連續(xù)但未知,也未知,檢驗假設 H:=0,備擇假設為0(見假設檢驗)。記Yi在混合樣本(X1,X2,Xm,Y1,Y2,Yn)中的秩為Ri,且為諸秩的和,當W C時

6、,否定假設H,這里C決定于檢驗的水平。這是一個性能良好的檢驗。秩方法的一個早期結果是C.斯皮爾曼于1904年提出的秩相關系數(shù)。設(X1,Y1),(X2,Y2),(Xn,Yn)是從二維總體(X,Y)中抽出的樣本,Ri為Xi在(X1,X2,Xn)中的秩,Qi為Yi在(Y1,Y2,Yn)中的秩,定義秩相關系數(shù)為(Ri,Qi)(i=1,2,n)的通常的相關系數(shù)(見相關分析)。它可以作為X、Y之間相關程度的度量,也可用于檢驗關于X、Y獨立性的假設。次序統(tǒng)計量和U 統(tǒng)計量在非參數(shù)統(tǒng)計中也有重要應用。前者可用于估計總體分布的分位數(shù)(見概率分布)、檢驗兩總體有相同的分布及構造連續(xù)總體分布的容忍限和容忍區(qū)間(見

7、區(qū)間估計)等。后者主要用于構造總體分布的數(shù)字特征的一致最小方差無偏估計(見點估計)及基于這種估計的假設檢驗。蘇聯(lián)數(shù)學家.柯爾莫哥洛夫和.斯米爾諾夫在20世紀30年代的工作開辟了非參數(shù)統(tǒng)計的一個方面,他們的方法基于樣本X1,X2,Xn的經(jīng)驗分布函數(shù)Fn(x)(見樣本)??聽柲缏宸蚩疾?Fn(x)與理論分布F(x)的最大偏差墹n,當墹n超過一定限度時,否定這個理論分布F(x)。這就是柯爾莫哥洛夫檢驗。斯米爾諾夫則考察由兩個分布為F(x)和g(x)的總體中抽出的樣本X1,X2,Xm和Y1,Y2,Yn計算其經(jīng)驗分布Fm(x)和gn(x)的最大偏差墹mn,當墹mn超過一定限度時,否定“F與g相等”這個

8、假設。這就是斯米爾諾夫檢驗。在非參數(shù)性估計方面,有關于估計分布的對稱中心、概率密度函數(shù)和回歸函數(shù)等比較重要的成果 ?;咎攸c非參數(shù)統(tǒng)計問題中對總體分布的假定要求的條件很寬,因而針對這種問題而構造的非參數(shù)統(tǒng)計方法,不致因為對總體分布的假定不當而導致重大錯誤,所以它往往有較好的穩(wěn)健性(見穩(wěn)健統(tǒng)計),這是一個重要特點。但因為非參數(shù)統(tǒng)計方法需要照顧范圍很廣的分布,在某些情況下會導致其效率的降低。不過,近代理論證明了:一些重要的非參數(shù)統(tǒng)計方法,當與相應的參數(shù)方法比較時,即使在最有利于后者的情況下,效率上的損失也很小。由于非參數(shù)統(tǒng)計中對分布假定要求的條件寬,因而大樣本理論(見大樣本統(tǒng)計)占據(jù)了主導地位。第

9、二次世界大戰(zhàn)前,非參數(shù)統(tǒng)計的大樣本理論已有了一些結果,從20世紀50年代直到現(xiàn)代,更有了顯著的進展,尤其是關于秩統(tǒng)計量與U 統(tǒng)計量的大樣本理論,及基于這種理論的大樣本非參數(shù)方法,研究成果很多。適用范圍非參數(shù)統(tǒng)計最常用于具備下述特征的情況:1、待分析數(shù)據(jù)不滿足參數(shù)檢驗所要求的假定,因而無法應用參數(shù)檢驗。例如,我們曾遇到過的非正態(tài)總體小樣本,在t-檢驗法也不適用時,作為替代方法,就可以采用非參數(shù)檢驗。2、僅由一些等級構成的數(shù)據(jù),不能應用參數(shù)檢驗。例如,消費者可能被問及對幾種不同商標的飲料的喜歡程度,雖然,他們不能對每種商標都指定一個數(shù)字來表示他們對該商標的喜歡程度,卻能將幾種商標按喜歡的順序分成等

10、級。這種情形也宜采用非參數(shù)檢驗。3、所提的問題中并不包含參數(shù),也不能用參數(shù)檢驗。例如,我們想判斷一個樣本是否為隨機樣本,采用非參數(shù)檢驗法就是適當?shù)摹?、當我們需要迅速得出結果時,也可以不用參數(shù)統(tǒng)計方法而用非參數(shù)統(tǒng)計方法來達到目的。一般說來,非參數(shù)統(tǒng)計方法所要求的計算與參數(shù)統(tǒng)計方法相比,完成起來既快且易。有些非參數(shù)統(tǒng)計方法的計算,就算對統(tǒng)計學知識不熟練的人,也能在收集數(shù)據(jù)時及時予以完成 。相對優(yōu)點非參數(shù)統(tǒng)計與傳統(tǒng)的參數(shù)統(tǒng)計相比,有以下優(yōu)點:1、非參數(shù)統(tǒng)計方法要求的假定條件比較少,因而它的適用范圍比較廣泛。2、多數(shù)非參數(shù)統(tǒng)計方法要求的運算比較簡單,可以迅速完成計算取得結果,因而比較節(jié)約時間。3、大多數(shù)非參數(shù)統(tǒng)計方法在直觀上比較容易理解,不需要太多的數(shù)學基礎知識和統(tǒng)計學知識。4、大多數(shù)非參數(shù)統(tǒng)計方法可用來分析如象由等級構成的數(shù)據(jù)資料,而對計量水準較低的數(shù)據(jù)資料,參數(shù)統(tǒng)計方法卻不適用。5、當推論多達3個以上時,非參數(shù)統(tǒng)計方法尤具優(yōu)越性。相對缺點非參數(shù)統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論