分布類型的檢驗(yàn)解析_第1頁(yè)
分布類型的檢驗(yàn)解析_第2頁(yè)
分布類型的檢驗(yàn)解析_第3頁(yè)
分布類型的檢驗(yàn)解析_第4頁(yè)
分布類型的檢驗(yàn)解析_第5頁(yè)
已閱讀5頁(yè),還剩42頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十二章分布類型的檢驗(yàn)分布類型的檢驗(yàn)

12.1.假設(shè)檢驗(yàn)的基本思想12.2.正態(tài)分布檢驗(yàn)12.3.二項(xiàng)分布檢驗(yàn)12.4.游程檢驗(yàn)12.5.蒙特卡羅法12.1假設(shè)檢驗(yàn)的基本思想12.1.1問(wèn)題的提出假設(shè)檢驗(yàn)的基本思想假設(shè)檢驗(yàn)的兩類錯(cuò)誤其他問(wèn)題擲骰子拋硬幣買彩票12.1.1問(wèn)題的提出假設(shè)檢驗(yàn)在作出推論估計(jì)以后,對(duì)所估計(jì)的內(nèi)容進(jìn)行檢驗(yàn),在統(tǒng)計(jì)上確定所得到的估計(jì)是否是統(tǒng)計(jì)顯著的。12.1.1問(wèn)題的提出

參數(shù)檢驗(yàn)對(duì)具體的參數(shù)進(jìn)行估計(jì)檢驗(yàn)分布檢驗(yàn)對(duì)原假設(shè)的分布進(jìn)行估計(jì)檢驗(yàn)?zāi)辰ㄖ牧显浞降目箟簭?qiáng)度俯沖正態(tài)分布,新配方后是否服從正態(tài)分布?對(duì)教學(xué)方法進(jìn)行對(duì)比研究,實(shí)驗(yàn)組互動(dòng)教學(xué),對(duì)照組傳統(tǒng)教學(xué),成績(jī)分別為:???????????,請(qǐng)問(wèn)新的教學(xué)方法是否優(yōu)越?某學(xué)校男生千米跑的成績(jī)是3分50秒,新的教練執(zhí)教后,隨機(jī)抽取10名男生測(cè)試,樣本均值為3分30秒,標(biāo)準(zhǔn)差為20秒,請(qǐng)問(wèn)新的訓(xùn)練方法是否改變了?假設(shè)檢驗(yàn)的基本思想

基本思想:“小概率反證法”原理:對(duì)于一個(gè)小概率事件而言,其對(duì)立面發(fā)生的可能性要大大高于這一小概率事件,可以認(rèn)為小概率事件在一次試驗(yàn)中不應(yīng)當(dāng)發(fā)生。因此,首先假定需要考察的假設(shè)是成立的,然后基于此進(jìn)行推導(dǎo),計(jì)算一下在該假設(shè)所代表的總體中進(jìn)行抽樣研究,得到當(dāng)前樣本的概率是多少。如果結(jié)果顯示這是一個(gè)小概率事件,則意味著如果假設(shè)成立,則在一次抽樣中竟然發(fā)生了!這顯然違背了小概率原理,則推翻假設(shè)!假設(shè)檢驗(yàn)的基本思想前提:承認(rèn)原假設(shè)小概率事件發(fā)生大概率事件發(fā)生拒絕原假設(shè)接受原假設(shè)進(jìn)行一次實(shí)驗(yàn)假設(shè)檢驗(yàn)的基本思想“一次事件中小概率事件不應(yīng)當(dāng)發(fā)生”,并不是小概率事件不可能發(fā)生。只是基于前提:只進(jìn)行一次實(shí)驗(yàn),結(jié)果應(yīng)當(dāng)不會(huì)是小概率事件。如果進(jìn)行多次,那么小概率事件肯定發(fā)生。

澄清事實(shí)假設(shè)檢驗(yàn)的標(biāo)準(zhǔn)步驟1.建立假設(shè)(原假設(shè)與對(duì)立假設(shè));2.確立檢驗(yàn)水準(zhǔn)(一般為0.05);3.進(jìn)行試驗(yàn);4.選定檢驗(yàn)方法;5.得到P值,給出推斷結(jié)論。假設(shè)檢驗(yàn)的兩類錯(cuò)誤實(shí)際情況檢驗(yàn)結(jié)果拒絕不拒絕真第一類錯(cuò)誤結(jié)論正確不真結(jié)論正確第二類錯(cuò)誤假設(shè)檢驗(yàn)的兩類錯(cuò)誤0臨界值0錯(cuò)誤接受錯(cuò)誤拒絕無(wú)法拒絕原假設(shè),但也無(wú)法確定原假設(shè)是否真實(shí)。因此,只有拒絕原假設(shè)才有統(tǒng)計(jì)意義。因此,將不希望出現(xiàn)的列為原假設(shè),將希望得到的設(shè)為備擇假設(shè),然后想盡辦法拒絕原假設(shè)。

注意假設(shè)檢驗(yàn)的兩類錯(cuò)誤計(jì)算偏度系數(shù)和峰度系數(shù)繪制直方圖、P-P圖等圖形工具各種假設(shè)檢驗(yàn):K-S單樣本檢驗(yàn)正態(tài)分布的考察方法12.2正態(tài)分布檢驗(yàn)K-S檢驗(yàn)原理Kolomogorov-Simirnov(K-S)單樣本檢驗(yàn)(Kolomogorov-SimirnovOne-sampleTest)分布擬合優(yōu)度檢驗(yàn),其方法是講一個(gè)變量的累積分布函數(shù)與特定分布進(jìn)行比較。理論分布的累積頻數(shù);樣本分布的累積頻數(shù)。檢驗(yàn)原理已知某零售商希望了解其銷售收益(Revenue)的大致分布情況,依據(jù)已有的資料,其銷售收益可能服從正態(tài)分布,為了檢驗(yàn)其假設(shè),考慮該銷售收益是否服從正態(tài)分布,收集數(shù)據(jù)sales.sav,請(qǐng)用spss分析樣本數(shù)據(jù)是否服從正態(tài)分布。分析實(shí)例1.直方圖分析實(shí)例2.K-S檢驗(yàn)Analyze-NonparametricTests-OneSampleK-S分析實(shí)例2.K-S檢驗(yàn)分析實(shí)例3.設(shè)立假設(shè):樣本來(lái)自于一個(gè)正態(tài)分布總體,理論分布與實(shí)際數(shù)據(jù)間的差異完全是由抽樣誤差決定的:樣本并非來(lái)自一個(gè)正態(tài)分布總體,理論分布與實(shí)際數(shù)據(jù)間的差異除了由由抽樣誤差造成外,確實(shí)也反映了這種偏差分析實(shí)例分析實(shí)例例:采用假設(shè)檢驗(yàn)方法對(duì)消費(fèi)者信心指數(shù)進(jìn)行分布特征的檢驗(yàn),檢驗(yàn)2007年4月的數(shù)據(jù)是否服從正態(tài)分布。H0:2007年4月的指數(shù)樣本來(lái)自于一個(gè)正態(tài)分布的總體。H1:2007年4月的指數(shù)樣本并非來(lái)自于一個(gè)正態(tài)分布總體。拒絕原假設(shè)二項(xiàng)分布檢驗(yàn)原理二項(xiàng)分布檢驗(yàn)(BinomialTest)對(duì)二分類變量的擬合優(yōu)度檢驗(yàn),它考察每個(gè)類別中觀察值的頻數(shù)與特定二項(xiàng)分布下的預(yù)期頻數(shù)間是否存在統(tǒng)計(jì)學(xué)差異。12.3二項(xiàng)分布檢驗(yàn)根據(jù)以往經(jīng)驗(yàn),新生兒染色體異常率一般為1%,現(xiàn)某醫(yī)院觀察了當(dāng)?shù)毓?00名新生兒,只發(fā)現(xiàn)一例染色體異常。請(qǐng)分析該地新生兒染色體異常率是否低于一般水平?分析實(shí)例本例假設(shè)如下:,該地新生兒染色體異常率并無(wú)異同,該地新生兒染色體異常率的確低于一般因不存在傳染性,染色體是否異常可以被認(rèn)為是服從二項(xiàng)分布的。從而可知每名新生兒出現(xiàn)異常的概率分布為:分析實(shí)例分析實(shí)例根據(jù)題意,問(wèn)題是“是否低于一般”,而樣本的異常率低于已知總體率,如果原假設(shè)成立,比當(dāng)前樣本更極端的情形只能是異常率更低的情形,在本例中就是沒(méi)有1例的情形。因此,如果原假設(shè)成立,當(dāng)前樣本中出現(xiàn)1例的累計(jì)概率為:Spss操作Analyze-NonparametricTests-Binomial分析實(shí)例分析實(shí)例分析實(shí)例由于p=0.09大于0.05,在400例中出生1名甚至沒(méi)有的情形并非小概率事件,因此不能拒絕原假設(shè),尚不能認(rèn)為異常率低于一般。SPSS中連續(xù)變量的統(tǒng)計(jì)描述例:請(qǐng)檢驗(yàn)CCSS項(xiàng)目中,2007年4月的樣本男女性別比例是否為1:1。1.頻率過(guò)程檢驗(yàn)結(jié)果H0:男女的比例為1:1。按照割點(diǎn)的“年齡”二項(xiàng)檢驗(yàn)的結(jié)果H0:年齡大于和小于35歲人數(shù)的比例為1:1。12.4游程檢驗(yàn)游程檢驗(yàn)原理

游程檢驗(yàn)(RunsTest)是對(duì)二分變量的隨機(jī)檢驗(yàn),可用于判斷觀察值的順序是否為隨機(jī)的。

對(duì)于兩個(gè)分類變量,連續(xù)數(shù)個(gè)相同取值的記錄稱為一個(gè)游程。

根據(jù)游程檢驗(yàn)的假設(shè),如果是隨機(jī)的,則游程不多也不少較適中,如果游程的數(shù)量少,則缺乏獨(dú)立性或來(lái)自不同的總體;如果多,則可能存在短期波動(dòng)影響,而非隨機(jī)。12.4游程檢驗(yàn)例如,u的序列是:001101110001001000106個(gè)0游程,其中長(zhǎng)度為1,2,3各2個(gè);5個(gè)1游程,其中3個(gè)長(zhǎng)度為1,1個(gè)長(zhǎng)度為2,1個(gè)長(zhǎng)度為3。U=1112.4游程檢驗(yàn)分析實(shí)例:某電子商務(wù)企業(yè)召開(kāi)了一批測(cè)試者來(lái)評(píng)估他們新網(wǎng)站的Beta測(cè)試版的易用性,測(cè)試者瀏覽完網(wǎng)頁(yè)后就對(duì)網(wǎng)頁(yè)進(jìn)行評(píng)分(0-20)。該企業(yè)關(guān)心的是這些測(cè)試者的評(píng)分是否與這些測(cè)試者花費(fèi)在瀏覽網(wǎng)站上的時(shí)間相關(guān)。12.4游程檢驗(yàn)解:根據(jù)上面的描述,相應(yīng)的假設(shè)為:測(cè)試者對(duì)網(wǎng)站的易用性評(píng)分的高低與他們花費(fèi)網(wǎng)站上瀏覽的時(shí)間長(zhǎng)短無(wú)關(guān)。但在游程檢驗(yàn)前,必須將連續(xù)變量轉(zhuǎn)換為二分類,及轉(zhuǎn)化為游程檢驗(yàn)的數(shù)據(jù)格式。選擇分割點(diǎn):平均值、中位數(shù)、眾數(shù),以及商業(yè)經(jīng)驗(yàn)的自定義分割點(diǎn)。Spss操作Analyze-NonparametricTests-RunTest分析實(shí)例分析實(shí)例分析實(shí)例例:請(qǐng)檢驗(yàn)CCSS項(xiàng)目中,2007年4月的樣本的采集是否為隨機(jī)的(假設(shè)ID的大小順序代表樣本進(jìn)入的順序)。游程檢驗(yàn)的結(jié)果H0:抽

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論