非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件_第1頁
非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件_第2頁
非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件_第3頁
非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件_第4頁
非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二章單樣本檢驗(yàn)第二章單樣本檢驗(yàn)

假設(shè)某地的10棟房屋出售價(jià)格(由低到高排列)為56,69,85,87,90,94,96,113,118,179(單位:萬元),問該地區(qū)的平均房屋價(jià)格是否和人們相信的84萬元的水平大體一致。我們用M表示價(jià)格分布的中心(這里考慮中位數(shù)),如假設(shè)該分布對(duì)稱,則M也是均值。我們要檢驗(yàn)H0:M=84,H1:M≠84按照傳統(tǒng)的參數(shù)方法,假設(shè)房屋價(jià)格服從正態(tài)分布N(84,σ2),則檢驗(yàn)統(tǒng)計(jì)量為,其值為1.384,結(jié)論呢?假設(shè)某地的10棟房屋出售價(jià)格(由低到高排列)為第一節(jié)符號(hào)檢驗(yàn)和置信區(qū)間第一節(jié)符號(hào)檢驗(yàn)和置信區(qū)間非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件假設(shè)總體,Me是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)問題:是待檢驗(yàn)的中位數(shù)取值

定義,,,則,在零假設(shè)情況下,在顯著性水平為的拒絕域?yàn)槠渲衚是滿足上式最大的k值。

假設(shè)總體,Me是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)結(jié)果討論結(jié)果討論結(jié)果討論結(jié)果討論非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件大樣本結(jié)論當(dāng)n較大時(shí)

雙邊:,p-值左側(cè):,p-值右側(cè):,p-值

大樣本結(jié)論當(dāng)n較大時(shí)檢驗(yàn)步驟檢驗(yàn)步驟

Ex.某國(guó)12位總統(tǒng)的壽命(歲)分別為46,57,58,60,60,63,64,67,72,78,88,90.問該國(guó)總統(tǒng)壽命的中位數(shù)是否不小于71.5歲?根據(jù)題目,要檢驗(yàn)的是H0:M0.5≥71.5,H1:M0.5<71.5顯然,當(dāng)S_太小時(shí)拒絕原假設(shè)。經(jīng)計(jì)算,K=min(S_,S+)=4P(K≤4)=?0.1938Ex.某國(guó)12位總統(tǒng)的壽命(歲)分別為46,假設(shè)總體,Mp是總體的p分位數(shù),對(duì)于假設(shè)檢驗(yàn)問題:是待檢驗(yàn)的分位數(shù)取值

定義,,,則,在零假設(shè)情況下,在顯著性水平為的拒絕域?yàn)槠渲衚是滿足上式最大的k值。

廣義符號(hào)檢驗(yàn)假設(shè)總體,Mp是總體的p分位數(shù),對(duì)于假設(shè)檢

例.5年前成年人在每日24小時(shí)中的睡眠量中位數(shù)是7.5小時(shí),每日睡眠量為6小時(shí)或少于6小時(shí)的占調(diào)查總數(shù)的5%,9小時(shí)和9小時(shí)以上的也占5%。現(xiàn)對(duì)8個(gè)普通成年人的抽樣調(diào)查結(jié)果為:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.問現(xiàn)在成年人的睡眠量是否少于5年前根據(jù)5年前的數(shù)據(jù),對(duì)0.05,0.5和0.95分位數(shù),至少檢驗(yàn)一個(gè)假定。H0:M0.5=7.5,H1:M0.5<7.5H0:M0.05=6,H1:M0.05<6H0:M0.95=9,H1:M0.95<9例.5年前成年人在每日24小時(shí)中的睡眠量中位字符型數(shù)據(jù)的符號(hào)檢驗(yàn)

例.為了解顧客對(duì)咖啡、茶的喜好情況,在某商店隨機(jī)抽取15名顧客進(jìn)行調(diào)查,結(jié)果有12名顧客更喜歡茶,2名顧客更喜歡咖啡,1名對(duì)兩者同樣喜好。問顧客對(duì)咖啡和茶的喜好是否有差異?若有,是否更喜歡茶?此處的目的只是為了比較兩者中哪個(gè)更受歡迎,并無定量的數(shù)值,因而可采用符號(hào)檢驗(yàn),只要把更喜歡茶視為“成功+”,反之視為“失敗-”。故可建立如下假設(shè):

H0:P+=P-,H1:P+≠P_H0:P+=P-,H1:P+>P_字符型數(shù)據(jù)的符號(hào)檢驗(yàn)例.為了解顧客對(duì)咖啡、茶

在第一個(gè)檢驗(yàn)中,僅判定對(duì)二者喜好程度有無差異。由調(diào)查結(jié)果,n=14,s+=12,s-=2.P(S_≤2|n=14,p=0.5)=0.0065,雙側(cè)檢驗(yàn)概率為0.013.在0.05的水平下,拒絕前面的兩個(gè)假設(shè).在第一個(gè)檢驗(yàn)中,僅判定對(duì)二者喜好程度有無差異。中位數(shù)的置信區(qū)間由于得到的區(qū)域是以中位數(shù)對(duì)稱的,采用Neyman原則選擇最優(yōu)置信區(qū)間,首先找出置信度大于的所有區(qū)間,然后再?gòu)闹羞x擇區(qū)間長(zhǎng)度最小的一個(gè)。對(duì)于大樣本,可以用近似正態(tài)分布求置信區(qū)間。

根據(jù)順序統(tǒng)計(jì)量構(gòu)造置信區(qū)間:中位數(shù)的置信區(qū)間由于得到的區(qū)域是以中位數(shù)對(duì)稱的,根據(jù)順序統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件構(gòu)造置信度為90%的置信區(qū)間:[9.8,10.0]構(gòu)造置信度為90%的置信區(qū)間:第二節(jié)Wilcoxon符號(hào)秩檢驗(yàn)第二節(jié)Wilcoxon符號(hào)秩檢驗(yàn)基本概念及性質(zhì)

對(duì)稱分布的中心一定是中位數(shù),在非對(duì)稱分布情況下,中位數(shù)不唯一,研究對(duì)稱中心比中位數(shù)更有意義。

例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?0基本概念及性質(zhì)例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?0非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件檢驗(yàn)步驟檢驗(yàn)步驟非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件Ex.某公司為減少加工費(fèi)用,決定若鑄件重量的中位數(shù)超過25公斤,就轉(zhuǎn)包加工;若不超過25公斤則不轉(zhuǎn)包。現(xiàn)從這批鑄件中隨機(jī)抽取8件,每件的重量分別為:24.3,25.8,25.4,24.8,25.2,25.1,25.0,25.5。使用這些數(shù)據(jù),能否作出這批鑄件是否轉(zhuǎn)包的決定。Ex.某公司為減少加工費(fèi)用,決定若鑄件重量的中位數(shù)超過25公非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件第四節(jié)Cox-Stuart趨勢(shì)檢驗(yàn)

第四節(jié)Cox-Stuart趨勢(shì)檢驗(yàn)檢驗(yàn)原理:數(shù)據(jù)序列:,雙邊假設(shè)檢驗(yàn)問題:令:取數(shù)對(duì),,為正的數(shù)目,為負(fù)的數(shù)目,當(dāng)正號(hào)或者負(fù)號(hào)太多的時(shí)候,認(rèn)為數(shù)據(jù)存在趨勢(shì)。在零假設(shè)情況下Di服從二項(xiàng)分布。從而轉(zhuǎn)化為符號(hào)檢驗(yàn)問題X1,X2,…,Xn檢驗(yàn)原理:X1,X2,…,Xn非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件例某地區(qū)32年來的降雨量如下表問(1):該地區(qū)前10年來降雨量是否有變化?(2):該地區(qū)32年來降雨量是否有變化?年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210例某地區(qū)32年來的降雨量如下表年份1971非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件Ex美國(guó)國(guó)家宇航局(NASA)自1966至1984年的科研和發(fā)展經(jīng)費(fèi)按時(shí)間順序?yàn)閱枺航?jīng)費(fèi)有無上升趨勢(shì)?

5.95.44.74.33.83.43.43.33.33.33.73.94.04.24.95.26.06.77.0首先用全部19個(gè)數(shù)據(jù)檢驗(yàn):n=19,c=10,S_=5,S+=4再用1970年至1984年的15個(gè)數(shù)據(jù)檢驗(yàn):n=15,c=8,S_=7,S+=0Ex美國(guó)國(guó)家宇航局(NASA)自1966至1984年的科第五節(jié)游程檢驗(yàn)游程的概念:

第五節(jié)游程檢驗(yàn)游程的概念:隨機(jī)游程問題:一個(gè)二元0/1序列當(dāng)中,一段全由0或者全由1構(gòu)成的串成為一個(gè)游程,游程中數(shù)據(jù)的個(gè)數(shù)稱為游程長(zhǎng)度,序列中游程的個(gè)數(shù)記為R,反映0和1輪換交替的頻繁程度。在序列長(zhǎng)度N固定的時(shí)候,如果游程過少過者過多,都說明序列的隨機(jī)性不好。當(dāng)游程過多或者過少時(shí),就會(huì)懷疑序列的隨機(jī)性。

序列110000111011000011110共有8個(gè)游程隨機(jī)游程問題:檢驗(yàn)原理和計(jì)算方法

設(shè)是由0或者1組成的序列,假設(shè)檢驗(yàn)問題:

R為游程個(gè)數(shù),假設(shè)有個(gè)0,個(gè)1,,這時(shí)R取任何一個(gè)值的概率都是,R的條件分布

建立了抽樣分布之后,在零假設(shè)成立時(shí),可以計(jì)算或者的值,進(jìn)行檢驗(yàn)。

X1,X2,…,Xn檢驗(yàn)原理和計(jì)算方法

設(shè)是由0或者1組成的序列非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件隨機(jī)游程問題:

序列110000111011000011110共有8個(gè)游程

R=8,m=10,n=11查表可知,α=0.05下臨界值為c1=6,c2=17因?yàn)?<R=8<17,故認(rèn)為這些數(shù)據(jù)符合隨機(jī)性假設(shè)隨機(jī)游程問題:第二章單樣本檢驗(yàn)第二章單樣本檢驗(yàn)

假設(shè)某地的10棟房屋出售價(jià)格(由低到高排列)為56,69,85,87,90,94,96,113,118,179(單位:萬元),問該地區(qū)的平均房屋價(jià)格是否和人們相信的84萬元的水平大體一致。我們用M表示價(jià)格分布的中心(這里考慮中位數(shù)),如假設(shè)該分布對(duì)稱,則M也是均值。我們要檢驗(yàn)H0:M=84,H1:M≠84按照傳統(tǒng)的參數(shù)方法,假設(shè)房屋價(jià)格服從正態(tài)分布N(84,σ2),則檢驗(yàn)統(tǒng)計(jì)量為,其值為1.384,結(jié)論呢?假設(shè)某地的10棟房屋出售價(jià)格(由低到高排列)為第一節(jié)符號(hào)檢驗(yàn)和置信區(qū)間第一節(jié)符號(hào)檢驗(yàn)和置信區(qū)間非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件假設(shè)總體,Me是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)問題:是待檢驗(yàn)的中位數(shù)取值

定義,,,則,在零假設(shè)情況下,在顯著性水平為的拒絕域?yàn)槠渲衚是滿足上式最大的k值。

假設(shè)總體,Me是總體的中位數(shù),對(duì)于假設(shè)檢驗(yàn)結(jié)果討論結(jié)果討論結(jié)果討論結(jié)果討論非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件大樣本結(jié)論當(dāng)n較大時(shí)

雙邊:,p-值左側(cè):,p-值右側(cè):,p-值

大樣本結(jié)論當(dāng)n較大時(shí)檢驗(yàn)步驟檢驗(yàn)步驟

Ex.某國(guó)12位總統(tǒng)的壽命(歲)分別為46,57,58,60,60,63,64,67,72,78,88,90.問該國(guó)總統(tǒng)壽命的中位數(shù)是否不小于71.5歲?根據(jù)題目,要檢驗(yàn)的是H0:M0.5≥71.5,H1:M0.5<71.5顯然,當(dāng)S_太小時(shí)拒絕原假設(shè)。經(jīng)計(jì)算,K=min(S_,S+)=4P(K≤4)=?0.1938Ex.某國(guó)12位總統(tǒng)的壽命(歲)分別為46,假設(shè)總體,Mp是總體的p分位數(shù),對(duì)于假設(shè)檢驗(yàn)問題:是待檢驗(yàn)的分位數(shù)取值

定義,,,則,在零假設(shè)情況下,在顯著性水平為的拒絕域?yàn)槠渲衚是滿足上式最大的k值。

廣義符號(hào)檢驗(yàn)假設(shè)總體,Mp是總體的p分位數(shù),對(duì)于假設(shè)檢

例.5年前成年人在每日24小時(shí)中的睡眠量中位數(shù)是7.5小時(shí),每日睡眠量為6小時(shí)或少于6小時(shí)的占調(diào)查總數(shù)的5%,9小時(shí)和9小時(shí)以上的也占5%?,F(xiàn)對(duì)8個(gè)普通成年人的抽樣調(diào)查結(jié)果為:7.2,8.3,5.6,7.4,7.8,5.2,9.1,5.8.問現(xiàn)在成年人的睡眠量是否少于5年前根據(jù)5年前的數(shù)據(jù),對(duì)0.05,0.5和0.95分位數(shù),至少檢驗(yàn)一個(gè)假定。H0:M0.5=7.5,H1:M0.5<7.5H0:M0.05=6,H1:M0.05<6H0:M0.95=9,H1:M0.95<9例.5年前成年人在每日24小時(shí)中的睡眠量中位字符型數(shù)據(jù)的符號(hào)檢驗(yàn)

例.為了解顧客對(duì)咖啡、茶的喜好情況,在某商店隨機(jī)抽取15名顧客進(jìn)行調(diào)查,結(jié)果有12名顧客更喜歡茶,2名顧客更喜歡咖啡,1名對(duì)兩者同樣喜好。問顧客對(duì)咖啡和茶的喜好是否有差異?若有,是否更喜歡茶?此處的目的只是為了比較兩者中哪個(gè)更受歡迎,并無定量的數(shù)值,因而可采用符號(hào)檢驗(yàn),只要把更喜歡茶視為“成功+”,反之視為“失敗-”。故可建立如下假設(shè):

H0:P+=P-,H1:P+≠P_H0:P+=P-,H1:P+>P_字符型數(shù)據(jù)的符號(hào)檢驗(yàn)例.為了解顧客對(duì)咖啡、茶

在第一個(gè)檢驗(yàn)中,僅判定對(duì)二者喜好程度有無差異。由調(diào)查結(jié)果,n=14,s+=12,s-=2.P(S_≤2|n=14,p=0.5)=0.0065,雙側(cè)檢驗(yàn)概率為0.013.在0.05的水平下,拒絕前面的兩個(gè)假設(shè).在第一個(gè)檢驗(yàn)中,僅判定對(duì)二者喜好程度有無差異。中位數(shù)的置信區(qū)間由于得到的區(qū)域是以中位數(shù)對(duì)稱的,采用Neyman原則選擇最優(yōu)置信區(qū)間,首先找出置信度大于的所有區(qū)間,然后再?gòu)闹羞x擇區(qū)間長(zhǎng)度最小的一個(gè)。對(duì)于大樣本,可以用近似正態(tài)分布求置信區(qū)間。

根據(jù)順序統(tǒng)計(jì)量構(gòu)造置信區(qū)間:中位數(shù)的置信區(qū)間由于得到的區(qū)域是以中位數(shù)對(duì)稱的,根據(jù)順序統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件構(gòu)造置信度為90%的置信區(qū)間:[9.8,10.0]構(gòu)造置信度為90%的置信區(qū)間:第二節(jié)Wilcoxon符號(hào)秩檢驗(yàn)第二節(jié)Wilcoxon符號(hào)秩檢驗(yàn)基本概念及性質(zhì)

對(duì)稱分布的中心一定是中位數(shù),在非對(duì)稱分布情況下,中位數(shù)不唯一,研究對(duì)稱中心比中位數(shù)更有意義。

例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?0基本概念及性質(zhì)例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?0非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件檢驗(yàn)步驟檢驗(yàn)步驟非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件Ex.某公司為減少加工費(fèi)用,決定若鑄件重量的中位數(shù)超過25公斤,就轉(zhuǎn)包加工;若不超過25公斤則不轉(zhuǎn)包。現(xiàn)從這批鑄件中隨機(jī)抽取8件,每件的重量分別為:24.3,25.8,25.4,24.8,25.2,25.1,25.0,25.5。使用這些數(shù)據(jù),能否作出這批鑄件是否轉(zhuǎn)包的決定。Ex.某公司為減少加工費(fèi)用,決定若鑄件重量的中位數(shù)超過25公非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件第四節(jié)Cox-Stuart趨勢(shì)檢驗(yàn)

第四節(jié)Cox-Stuart趨勢(shì)檢驗(yàn)檢驗(yàn)原理:數(shù)據(jù)序列:,雙邊假設(shè)檢驗(yàn)問題:令:取數(shù)對(duì),,為正的數(shù)目,為負(fù)的數(shù)目,當(dāng)正號(hào)或者負(fù)號(hào)太多的時(shí)候,認(rèn)為數(shù)據(jù)存在趨勢(shì)。在零假設(shè)情況下Di服從二項(xiàng)分布。從而轉(zhuǎn)化為符號(hào)檢驗(yàn)問題X1,X2,…,Xn檢驗(yàn)原理:X1,X2,…,Xn非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件例某地區(qū)32年來的降雨量如下表問(1):該地區(qū)前10年來降雨量是否有變化?(2):該地區(qū)32年來降雨量是否有變化?年份19711972197319741975197619771978降雨量206223235264229217188204年份19791980198119821983198419851986降雨量182230223227242238207208年份19871988198919901991199219931994降雨量216233233274234227221214年份19951996199719981999200020012002降雨量226228235237243240231210例某地區(qū)32年來的降雨量如下表年份1971非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件非參數(shù)統(tǒng)計(jì)第二章-單樣本檢驗(yàn)課件Ex美國(guó)國(guó)家

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論