版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
隨機估計和VDR檢驗(一)程維虎戴家佳楊振海張國志2013-2-49:09:27來源:《數(shù)理統(tǒng)計與管理》(京)2012年1期第32?54頁內(nèi)容提要:眾所周知統(tǒng)計推斷有三種理論:普遍承認的Neyman理論(頻率學派),Bayes推斷和信仰推斷(Fiducial)。Bayes推斷基于后驗分布,由先驗分布和樣本分布求得。信仰推斷是基于信仰分布(ConfidenceDistribution,簡稱CD),直接利用樣本求得。兩者推斷方式一致,都是用分布函數(shù)作推斷,稱為分布推斷。從分析傳統(tǒng)的參數(shù)估計、假設(shè)檢驗特性來看,經(jīng)典統(tǒng)計推斷也可以視為分布推斷。通常將置信上限看做置信度的函數(shù)。其反函數(shù),即置信度是置信上界的函數(shù),恰是分布函數(shù),該分布恰是近年來引起許多學者興趣的CD。在本文中,基于隨機化估計(其分布是一CD)的概率密度函數(shù),提出VDR檢驗。常見正態(tài)分布期望或方差的檢驗,多元正態(tài)分布期望Hoteling檢驗等是其特例。VDR(verticaldensityrepresentation)檢驗適合于多元分布參數(shù)檢驗,實現(xiàn)了非正態(tài)的多元線性變換分布族的參數(shù)檢驗。VDR構(gòu)造的參數(shù)的置信域有最小Lebesgue測度。關(guān)鍵詞:隨機推斷VDR檢驗最小Lebesgue測度置信域作者簡介:程維虎,北京工業(yè)大學應用數(shù)理學院(北京100124);戴家佳,貴州大學理學院(貴州貴陽550025);楊振海,北京工業(yè)大學應用數(shù)理學院;張國志,哈爾濱理工大學(黑龍江哈爾濱150080)。0引言首先考慮一維參數(shù)的推斷問題。所謂一維參數(shù)假設(shè)檢驗問題,是指假設(shè)涉及的參數(shù)是一維的,可以是分布參數(shù)的分量。為問題明確,將總體分布或密度函數(shù)寫作忑~八躡鼻)理電JVC1R,AeAgjH-*1.NxAM參數(shù)空間。設(shè)注=(每,…「是抽自f(訶丿)的樣本,樣本空間記柞滋口考慮假設(shè)螞:耳=羽i #刑. {])關(guān)于假設(shè)(1),入是冗余參數(shù)。關(guān)于參數(shù)n統(tǒng)計推斷,眾所周知有三種理論:頻率學派,F(xiàn)iducial推斷和Bayes推斷?,F(xiàn)在普遍接受的Neyman理論,稱為頻率學派。認為未知參數(shù)是常數(shù),用統(tǒng)計量推斷參數(shù),包括點估計、置信區(qū)間和假設(shè)檢驗。Fiducial推斷和Bayes推斷都是以概率分布推斷參數(shù)。認為參數(shù)是隨機變量,統(tǒng)計推斷就依據(jù)參數(shù)的分布,分別稱作Fiducial分布和后驗分布。兩者求法不同,而推斷參數(shù)的方法一致,稱為分布推斷。通常認為他們的推斷機制是不同于Neyman理論的。隨機估計源于Fisher的信仰推斷,是經(jīng)典統(tǒng)計的概念。Fisher提出的信仰推斷(Fiducialinference)是用信仰分布推斷參數(shù)。什么是信仰分布?Fisher于1930年,在他的“Inverseprobability"—文中作為挑戰(zhàn)Bayes的后驗分布而提出信仰分布概念。設(shè)F(.,0)是隨機變量X的分布函數(shù),概率密度函數(shù)是f(.,0)。給定x,F(xiàn)isher定義信仰分布密度函數(shù)為該公式也適用于基于樞軸量計算參數(shù)的信仰分布密度函數(shù)。h(x,n)是定義在?曠xn上,取值于n上的函數(shù)。對給定n,h(X,n)的分布函數(shù)Q(?)與參數(shù)n,入無關(guān),對給定樣本x,h(x,?)是N-N的單調(diào)函數(shù),則稱h(x,n)是參數(shù)n的樞軸量。Q(?)的概率密度函數(shù)記作q(?)。Fisher認為n是隨機變量,其分布密度函數(shù)是WW)= 冷))駕^切ph(X,r))z切(?),⑶公式(2)或(3)的導出有兩步:1?確定樞軸量h(X,n)的分布時n是常數(shù)參數(shù),x是隨機變量;2?求信仰分布密度函數(shù)時又認為n是隨機變量,樣本為x是常數(shù)。參數(shù)n是常數(shù)還是隨機變量?這就是所謂Fisher疑惑。若n是隨機變量,h(x,n)=v?q(?),公式(3)是正確的。只是導出隨機變量v的分布時n是常數(shù),導出信仰分布時又成了隨機變量。既然存在邏輯上的不一致為什么信仰推斷至今還是研究熱點之一?除是大師Fisher提出的概念外,還因為在眾多情形下信仰推斷結(jié)果和經(jīng)典結(jié)果一致;有些經(jīng)典統(tǒng)計難題,容易用信仰推斷來解決,如Behrens-Fisher問題。對正態(tài)總體經(jīng)典推斷和信仰推斷結(jié)果是一致的。為消除邏輯上的疑惑,引進隨機估計概念。用隨機變量"I估計(常數(shù))參數(shù)n,叫做參數(shù)n的隨機化估計或就叫隨機估計,它應滿足(4)V=b(x.(4)的密度函數(shù)由(3)給出。隨機估計是取值于參數(shù)空間的隨機變量,其分布依賴于樣本。它不同于統(tǒng)計量,統(tǒng)計量是樣本的函數(shù),其分布依賴于參數(shù)。當存在參數(shù)的充分統(tǒng)計量時樣本可用充分統(tǒng)計量代替。如對樣本大小為D的正態(tài)分布樣本.設(shè)為樣木方差、則h(“(/)=(n-1 (k)/(t2是樞軸量.其分布是自由度為升-1的丄分布。于是,參數(shù)的Fiducial分布密度是脅血*加-(歸竺)上疋\、辿)w2*0<w<00,其中chikM自由度為k的/分布的密度函數(shù)巾a2的隨機估itf滿足方程也C即s(n-1)4"X盒7r的簫度函數(shù)是pM(?)*自由度為n-1的逆£分布nNeyman理論核心觀點認為參數(shù)是未知常數(shù),用統(tǒng)計量估計參數(shù),無論點估計還是區(qū)間估計都是隨機變量。是容易被人接受的符合常理的觀點。而Fiducial推斷和Bayes推斷都將參數(shù)看作隨機變量。無論哪種推斷,都認為在觀測樣本時參數(shù)是不變的。初看起來,Neyman理論與Fiducial推斷和Bayes推斷完全不同。但是,三種理論是有內(nèi)在聯(lián)系的,換一個視點看Neyman理論,三種推斷參數(shù)方式的一致性就出現(xiàn)了,Neyman理論參數(shù)推斷也可視為分布推斷,僅有看待參數(shù)觀點上的差異。參數(shù)的點估計、置信區(qū)間和假設(shè)檢驗是統(tǒng)計推斷的基本內(nèi)容,即使比簡單樣本更復雜的數(shù)據(jù),不管多么復雜的統(tǒng)計模型的觀測數(shù)據(jù),都要研究這些內(nèi)容。這些內(nèi)容是相互關(guān)聯(lián)的,相互確定的。點估計可以視為置信區(qū)間的特例。通常認為經(jīng)典統(tǒng)計、信仰推斷和Bayes推斷是不同的。換一種觀點看經(jīng)典統(tǒng)計,亦看作分布推斷。以下討論經(jīng)典推斷的分布推斷特性。通常將置信上界看做置信度的函數(shù),如果將兩者地位互換,就可發(fā)現(xiàn)三種推斷方式的共性。對任意給定的x,設(shè)樞軸量h(X,n)是口的單增函數(shù)。n的置信度為Y的置信上界帀二帀(X,Y)由下式確定:hg朗=屁(門o<7<h(珞—oo)= oo)=1F易見,點估計W.信度為1-a直信區(qū)間蚣fl-PKor/2)^L-a/2)];>信度為1-a置信下界9=現(xiàn)口k假設(shè)檢驗問題可歸結(jié)為置信區(qū)間冋虬或迸信上下界問題二由此可見.統(tǒng)計推晰內(nèi)容或信息集屮于置信上界’通??偸菍⑦^信上限看柞置信度的函數(shù),且通曲認為置信度不小于從置信上界計算無需這限制’如公武9)所示。可以將置倍度看作賈信上界的函數(shù):乍二凡F饑JJ),亓€朋 (6)孟是具體樣本。特別強調(diào)F叩)定義比參數(shù)空何N上的甬數(shù)■樣本工可觀為函數(shù)參數(shù)°由(D式、“,")有氐下性質(zhì):F,p(t,-?>=O.Fhp()l.?)=lt凡昭石工)<凡pgy),VI<y.不管用什么方掛確定的笠信上界,這些關(guān)系都是成宜的。可見*皐耳八)是依額于樣本的分布函數(shù)’或者以樣本?為分布參數(shù)的參數(shù)空間N上的分布函數(shù)。曲它的分位點可以導岀點怙計,置信區(qū)間及確定參數(shù)檢驗規(guī)則。簡言之,參數(shù)推斷信息濃縮在F嚇(札?)上」將(6)代人(5),有二h/F料(「¥)),故Q(b(x,v))=Q(hQ(Fup(xtv)))=^(^v).(7)⑺蘊含著臨(兒門服從[0J]上的均勻分布,F叩(孟,?)是N上的分布函數(shù).恰是參數(shù)習的CD(confendencedistribution)0對于正態(tài)樣本,均值A(chǔ)的佃為陽仗間=臥7(丫(為V))由它可導出"的經(jīng)典推斷。Neyman提出CD概念,作為對1930年Fisher提出的信仰分布(FiducialDistribution)的解釋。盡管CD概念由來已久,近年來作為頻率學派的概念重新研究,新瓶裝舊酒,作為推斷方法加以發(fā)展。如前所述,用它代替點估計和區(qū)間估計等統(tǒng)計推斷。有影響的工作或?qū)W者有Efron(1993,1998),F(xiàn)raser(1991,1996),Lehmann(1993),Schweder和Hjort
(2002),認為CD是頻率學派的后驗分布,是以后統(tǒng)計研究的重點。研究成果
清楚表明經(jīng)典推斷也是分布推斷。K.Singh,XieM.G.andW.E.Strawderman(2007)的文章,關(guān)于CD做了詳盡全面論述,還試圖將CD概念推廣到多維。在這個意義上講,經(jīng)典統(tǒng)計,信仰推斷和貝葉斯分析都是用分布函數(shù)做推斷的。Bayes推斷用后驗分布,信仰推斷用信仰分布(FiducialDistribution),經(jīng)典統(tǒng)計用經(jīng)典推斷分布或CD,分布推斷是三者的共同點??梢哉fCD是信仰分布的擴展。設(shè)玄;是樣本空間,N是參數(shù)空間。H(x,?)是定義在上,取值于[0,1]上的函數(shù),且滿足條件:對給定樣本X=x,H(x,?)是N上的分布函數(shù);對給定nUN,h(X,n)?[■“,其中x?J(?,n,入),則稱H(x,?)是一CD。顯然陰&小)是CD,概括了參數(shù)推斷信息。也有人將CD定義為檢驗假設(shè)%: 的p值函數(shù)■實際上各種定文是一致的。K.Sm^i,XieMG.andW.E.Stawderman(2007)的文章*給出如上述的CD的定義,還定義了漸近CDJf給出了比載CD的原則七尤苴定義了參數(shù)F的基于)隨機化怙用它是N上的隨機變址*其分布函數(shù)是Hg?K以下稱&為參數(shù)M的隨機怙計。(OJJ上的均勻分布4MIE作山則&由下式定義U=H(xt^). (8)一般地講,基于樞軸量的經(jīng)典置信區(qū)間和假設(shè)檢驗規(guī)則和基于同一樞軸量產(chǎn)生的隨機估計的置信區(qū)間和假設(shè)檢驗規(guī)則是一致的。能否將CD推廣到多維參數(shù)?這是眾多學者關(guān)心的問題。樞軸量推廣到多維參數(shù)并不難,關(guān)鍵要有處理多維樞軸量的工具。VDR恰是處理多維樞軸量的有效工具。本文基于隨機估計的概率密度函數(shù)討論參數(shù)假設(shè)檢驗,提出了VDR檢驗。第1節(jié)討論樞軸量和VDR檢驗。第2節(jié)應用VDR檢驗得到一維參數(shù)檢驗,給出正態(tài)總體方差檢驗的最短置信區(qū)間。第3節(jié)討論VDR檢驗在線性變換分布族中的應用,并給出正態(tài)總體下的一些結(jié)果。第4節(jié)展望發(fā)展前景。1多維參數(shù)的隨機估計和VDR檢驗所謂多維參數(shù)假設(shè)檢驗問題,是指假設(shè)涉及的分布參數(shù)是多維的,可以是分布參數(shù)向量或其部分分量。設(shè)總體X是p維隨機向量,p$l是常整數(shù)。將總體密度函數(shù)寫作xeExCER1,AeAc不失一離性,設(shè)"=呃,貫上的域記作錢設(shè)-X是抽自X*小總)的隨機樣本(或稱簡單樣本人即X的獨立觀察值口隨機樣本和具體樣本分別記作X=(Xl-sX,>Jx=<Xt,? 樣本空間記作Xxp- <i<nteX,€SHP,,于是,/r(Xt^A)=ftfgg対迪盂"匕的jft率密度t=i函數(shù),且蕓z人(M町人)疋€筋"??紤]假設(shè)舊0:葉二咖I殆:>1詳*7少 (9)關(guān)于假設(shè)(9),久是冗余參數(shù)。1.1接受域和拒絕域為檢驗假設(shè)(9),將樣本空聞分為兩部分:接受域5拒絕域掘“\廠S=1肚觀測到樣本%接受頂假設(shè)鳳’録盂“}-令a=^(XeS'}打式(兀6,)0墳*稱a為顯著水平?即拒絕接受原假設(shè)的風險■原假設(shè)成立時仍以概率紐拒絶原假設(shè)&a就是熟知的,犯第亠類錯謀的概率。如何確定F或$呢?當H,為真時,按極大個然原則使似然函數(shù)在S上平均值f⑻_從血g號A)dx最大G只P島(勺蘭]-ci*這意味著S的Lebesgue測度-⑶最小。若寥満足k(S*)^mf|U(S)=P%(9)=1-a,S匚X1時,稱酣為最小Lebe唧聽測度檢驗。¥DR檢驗是址小UbesgMe測度檢驗乜1.2樞軸量定義1-】(樞軸tft) -h^■…凡?。?(虬(憑?。?1(憑")尸是1維向量函數(shù)?是更“乂JN的鋼可測變換◎滿足1-對給定匕)是N^N杓1-1可測變換。2.對結(jié)定參數(shù)I]亡N,h(扎創(chuàng)是定文在船“b取值于陽的髓機向董,其分布函數(shù)Q2?)不依賴于參數(shù)“h,則稱h(%Tn)是參數(shù)q的樞軸笊口樞軸罰定義的第一點?對給定尤丄(読「》是^tN的1-1可測變換,可用;° :尹…訪逆爐應…跡皿珂如 如\代替。該定罠意味著、樞軸量h(勲"不含參數(shù)勺的信息,怵現(xiàn)在它的分布隔數(shù)Q(?)不依賴于鑫數(shù)小爲摳軸址的自變橄杲樣本和參數(shù),含參數(shù)的充分信息,說明樞軸輦的結(jié)構(gòu)充分運用了自變量中的參數(shù)信息丫使樞軸盤值不含參數(shù)信息勺樞軸於體現(xiàn)了總體結(jié)構(gòu)”是推斷參數(shù)F的依據(jù)。QX*)MN=M'上的分布函數(shù),它的密度函數(shù)記作業(yè)(?幾由Q,導岀的(",第J上的概率測度記作%(?幾N-.N的悄導變換Z:Z(??)-Hlv是概率空間(M,越上的隨機向量,其概率分布恰覽P「分布函數(shù)是Qq實際計算或摸擬時T珂取定參數(shù)值抽取樣本茲則Z可取作禹=町爼珈)“ (10)對給定樣本兒定義Pa(A)^P.(h(XfA))二R)({j/:f/—h(AfR7^)TifCA}),VAE砌”P.<?〉是參數(shù)F們推斷測度。P/-)的分布萌數(shù)是耳卜)孟P,Aj^P°(h(石他)).其中A,=!V=(V|,■■■,¥!):V.=],-]|.
僅當h(X,n)是口各分量的增函數(shù)時才有,Ft(u)=這總味著公式(7)對髙維參數(shù)不成宜‘難將CD直⑴)接推廣刮高維°然而%(□)的密度函數(shù)是迤(&¥)&V⑴)=Q((h(^V))J(^,V)+容易將(町推廣到多準參數(shù)口F的霸機估計叭,是參數(shù)空間N上的隨機向拭‘由下式定義Z-h(xTW,)t戒叫4(詢.(12)的概率分布恰是卩£?人概率密度函數(shù)是qx(X,?幾當I"時*g^W)=戲依(呂對)血密吵恰是Fuducial分布的密度確數(shù)口Fuducid分布就是怙計參數(shù)的隨機變注,即隨機怙計的分布。通常的點怙計就是E叭或qz(ZA)的扱大值點G一般情形下,或者可使樞軸量滿足j%v)?j(Af)TVveV.務(wù)此條件為樞軸戢的正則條件,或稱為正則樞軸對正則摳釉帰公式(】1}簡化為qx(v)=qtfhf^.v))J(X)' (13)例如,正態(tài)總林的方差參數(shù)(/的摳軸凰通常砸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年泰和縣人民法院公開招聘聘任制司法輔助人員備考題庫及完整答案詳解1套
- 2026年西藏自治區(qū)人民政府辦公廳急需緊缺人才引進6人備考題庫及1套完整答案詳解
- 2025-2030中國女裝高領(lǐng)毛衣行業(yè)市場發(fā)展分析及發(fā)展趨勢預測與戰(zhàn)略投資研究報告
- 2025至2030中國抗精神分裂癥長效注射劑依從性改善與市場推廣報告
- 2025至2030智能禮品包裝技術(shù)應用與產(chǎn)業(yè)鏈投資機會研究報告
- 中國古代史研究
- 公務(wù)員閬中市委組織部關(guān)于閬中市2025年考調(diào)35人備考題庫及一套完整答案詳解
- 2025-2030中國草甘膦產(chǎn)業(yè)銷售規(guī)模與未來發(fā)展?jié)摿υu估研究報告
- 2026年西昌市財政局單位招聘政府雇員備考題庫附答案詳解
- 2026年睢陽區(qū)消防救援大隊招聘政府專職消防員備考題庫附答案詳解
- 2026年揚州工業(yè)職業(yè)技術(shù)學院高職單招職業(yè)適應性測試參考題庫含答案解析
- 2026國家電投集團蘇州審計中心選聘15人筆試模擬試題及答案解析
- 2026年桐城師范高等??茖W校單招職業(yè)技能考試題庫及答案1套
- 霧化吸入操作教學課件
- 2025年小學圖書館自查報告
- 【語文】廣東省佛山市羅行小學一年級上冊期末復習試卷
- 2025年醫(yī)療器械注冊代理協(xié)議
- 新疆三校生考試題及答案
- 2025新疆亞新煤層氣投資開發(fā)(集團)有限責任公司第三批選聘/招聘筆試歷年參考題庫附帶答案詳解
- 圍手術(shù)期心肌梗塞的護理
- 超市門口鑰匙管理制度
評論
0/150
提交評論