擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案_第1頁
擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案_第2頁
擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案_第3頁
擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案_第4頁
擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

擬合優(yōu)檢驗(yàn)的學(xué)習(xí)教案第1頁/共65頁擬合優(yōu)度檢驗(yàn)的應(yīng)用總體分布未知,從樣本數(shù)據(jù)中發(fā)現(xiàn)規(guī)律(總體分布),再利用擬合優(yōu)度檢驗(yàn)對(duì)假設(shè)的總體分布進(jìn)行驗(yàn)證。第2頁/共65頁【引例1】某地區(qū)在1500到1931年的432年間,共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下(每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個(gè)隨機(jī)變量X):戰(zhàn)爭次數(shù)X0123422314248154

發(fā)生X次戰(zhàn)爭的年數(shù)第3頁/共65頁根據(jù)我們對(duì)泊松分布產(chǎn)生的一般條件的理解,可以用一個(gè)泊松隨機(jī)變量來近似描述每年爆發(fā)戰(zhàn)爭的次數(shù)。也就是說,我們可以假設(shè)每年爆發(fā)戰(zhàn)爭次數(shù)分布X近似泊松分布?,F(xiàn)在的問題是:

上面的數(shù)據(jù)能否證實(shí)X

具有泊松分布的假設(shè)是正確的?第4頁/共65頁【引例2】某鐘表廠對(duì)生產(chǎn)的鐘進(jìn)行精確性檢查,抽取100個(gè)鐘作試驗(yàn),校準(zhǔn)24小時(shí)后進(jìn)行檢查,將每個(gè)鐘的誤差(快或慢)按秒記錄下來。問該廠生產(chǎn)的鐘的誤差是否服從正態(tài)分布?第5頁/共65頁【引例3】某工廠制造了一批骰子,聲稱它是均勻的。為檢驗(yàn)骰子是否均勻,要把骰子實(shí)地投擲若干次,統(tǒng)計(jì)各點(diǎn)出現(xiàn)的頻率與1/6的差距。問題是:得到的數(shù)據(jù)能否說明“骰子均勻”的假設(shè)是可信的?第6頁/共65頁K.皮爾遜解決這類問題的工具是英國統(tǒng)計(jì)學(xué)家K.皮爾遜在1900年發(fā)表的一篇文章中介紹了χ2檢驗(yàn)法。第7頁/共65頁擬合優(yōu)度檢驗(yàn)的工具-χ2

檢驗(yàn)χ2檢驗(yàn)法是在總體X的分布未知時(shí),根據(jù)來自總體的樣本,檢驗(yàn)關(guān)于總體分布的假設(shè)的一種檢驗(yàn)方法。

第8頁/共65頁

H0:總體X的分布函數(shù)為F(x)然后根據(jù)樣本的經(jīng)驗(yàn)分布和所假設(shè)的理論分布之間的吻合程度來決定是否接受原假設(shè)。

這種檢驗(yàn)通常稱作擬合優(yōu)度檢驗(yàn),它是一種非參數(shù)檢驗(yàn)。使用χ2檢驗(yàn)法對(duì)總體分布進(jìn)行檢驗(yàn)時(shí),先提出原假設(shè):第9頁/共65頁擬合優(yōu)度檢驗(yàn)的一般步驟將總體X的取值范圍分成k個(gè)互不重疊的小區(qū)間,記作A1,A2,…,Ak。

把落入第i個(gè)小區(qū)間Ai的樣本值的個(gè)數(shù)記作fi

,稱為實(shí)測(cè)頻數(shù);

所有實(shí)測(cè)頻數(shù)之和(f1+f2+…+fk)等于樣本容量n。根據(jù)所假設(shè)的理論分布,可以算出總體X的值落入每個(gè)Ai的概率pi,npi就是落入?yún)^(qū)間Ai的樣本值的理論頻數(shù)。第10頁/共65頁皮爾遜引進(jìn)如下統(tǒng)計(jì)量表示經(jīng)驗(yàn)分布與理論分布之間的差異:在理論分布已知的條件下,npi是常量實(shí)測(cè)頻數(shù)理論頻數(shù)觀測(cè)頻數(shù)與理論頻數(shù)比較,判斷二者不符合程度是否由于機(jī)會(huì)所造成。第11頁/共65頁統(tǒng)計(jì)量的分布是什么?皮爾遜為什么會(huì)選用這個(gè)統(tǒng)計(jì)量?兩個(gè)問題:第12頁/共65頁關(guān)于第一個(gè)問題,皮爾遜證明了如下定理:若原假設(shè)中的理論分布F(x)已經(jīng)完全給定,那么當(dāng)n→∞

時(shí),統(tǒng)計(jì)量:的分布漸近

(k-1)個(gè)自由度的分布。如果理論分布F(x)中有r

個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,那么當(dāng)n→∞時(shí),統(tǒng)計(jì)量的分布漸近(k-1-r)個(gè)自由度的分布。第13頁/共65頁皮爾遜定理的幾點(diǎn)說明統(tǒng)計(jì)量的選擇自由度的確定連續(xù)性矯正第14頁/共65頁統(tǒng)計(jì)量的選擇求

k個(gè)

Oi-Ti之和,顯然它們恒等于0求

k個(gè)(Oi-Ti)2之和,得不出相對(duì)的不符合程度Oi=9、Ti=6,Oi-Ti=3;Oi=49、Ti=46,Oi-Ti=3。前者的不符合程度遠(yuǎn)大于后者。求

k個(gè)[(Oi-Ti)/Ti]2之和,但仍有問題如:Oi=8、Ti=5以及Oi=80、Ti=50時(shí)(Oi-Ti)/Ti都等于0.6。第15頁/共65頁統(tǒng)計(jì)量的選擇為了解決上述問題,以

Ti為權(quán)求加權(quán)值第16頁/共65頁自由度的確定變量之間存在著一個(gè)制約關(guān)系:故統(tǒng)計(jì)量漸近(k-1)個(gè)自由度的分布。第17頁/共65頁

在F(x)尚未完全給定的情況下,每個(gè)未知參數(shù)用相應(yīng)的估計(jì)量代替,就相當(dāng)于增加一個(gè)制約條件,因此,自由度也隨之減少一個(gè)。若有r

個(gè)未知參數(shù)需用相應(yīng)的估計(jì)量來代替,自由度就減少r

個(gè)。故統(tǒng)計(jì)量漸近(k-1-r)個(gè)自由度的分布。第18頁/共65頁

如果根據(jù)所給的樣本值X1,X2,…,Xn算得統(tǒng)計(jì)量的實(shí)測(cè)值落入拒絕域,則拒絕原假設(shè),否則就認(rèn)為差異不顯著而接受原假設(shè)。得拒絕域:(不需估計(jì)參數(shù))(估計(jì)r

個(gè)參數(shù))根據(jù)皮爾遜定理,對(duì)給定的顯著性水平α,查分布表可得臨界值,使得第19頁/共65頁連續(xù)性矯正當(dāng)df=1時(shí)應(yīng)做連續(xù)性矯正,矯正方法如下:第20頁/共65頁

皮爾遜定理是在n無限增大時(shí)推導(dǎo)出來的,因而在使用時(shí)要注意n要足夠大,以及npi

不太小這兩個(gè)條件。

根據(jù)計(jì)算實(shí)踐,要求n不小于50,以及npi

都不小于5。否則應(yīng)適當(dāng)合并區(qū)間,使npi滿足這個(gè)要求。皮爾遜定理小結(jié)第21頁/共65頁

奧地利生物學(xué)家孟德爾進(jìn)行了長達(dá)八年之久的豌豆雜交試驗(yàn),并根據(jù)試驗(yàn)結(jié)果,運(yùn)用他的數(shù)理知識(shí),發(fā)現(xiàn)了分離規(guī)律。孟德爾

以遺傳學(xué)上的一項(xiàng)偉大發(fā)現(xiàn)為例,說明統(tǒng)計(jì)方法在研究自然界和人類社會(huì)的規(guī)律性時(shí),是起著積極的、主動(dòng)的作用。第22頁/共65頁【例1】子二代子一代…黃色純系…綠色純系他的一組觀察結(jié)果為:黃70,綠27近似為2.59:1,與理論值相近。

根據(jù)他的理論,子二代中,黃、綠之比近似為3:1,第23頁/共65頁這里,n=70+27=97,k=2,檢驗(yàn)孟德爾的3:1理論:提出假設(shè)H0:O-T=0(p1=3/4,p2=1/4)理論頻數(shù)為:

np1=72.75,np2=24.25實(shí)測(cè)頻數(shù)為70(黃),27(綠)。第24頁/共65頁自由度為2-1=1未落入拒絕域。故認(rèn)為試驗(yàn)結(jié)果符合孟德爾的3:1理論。按α

=0.05,自由度為1,查表得由于統(tǒng)計(jì)量=0.4158<3.841第25頁/共65頁【引例1】某地區(qū)在1500到1931年的432年間,共爆發(fā)了299次戰(zhàn)爭,具體數(shù)據(jù)如下(每年爆發(fā)戰(zhàn)爭的次數(shù)可以看作一個(gè)隨機(jī)變量X):戰(zhàn)爭次數(shù)X0123422314248154

發(fā)生X次戰(zhàn)爭的年數(shù)第26頁/共65頁【例2】引例1,檢驗(yàn)每年爆發(fā)戰(zhàn)爭次數(shù)分布是否服從泊松分布。

按參數(shù)λ

為0.69的泊松分布,計(jì)算事件X=i的概率pi

,pi的估計(jì)是:H0:O-T=0(X服從參數(shù)為λ的泊松分布)根據(jù)觀察結(jié)果,得參數(shù)λ

的極大似然估計(jì)為:解:將有關(guān)計(jì)算結(jié)果列表如下:第27頁/共65頁2.因H0所假設(shè)的理論分布中有一個(gè)未知參數(shù)λ,故自由度為4-1-1=2。1.將npi<5的組予以合并,即將發(fā)生3次及4次戰(zhàn)爭的組歸并為一組。第28頁/共65頁按α

=0.05,自由度為4-1-1=2,查表得:統(tǒng)計(jì)量:未落入拒絕域。故認(rèn)為每年發(fā)生戰(zhàn)爭的次數(shù)X服從參數(shù)為0.69的泊松分布。第29頁/共65頁

χ2檢驗(yàn)的另一應(yīng)用-獨(dú)立性檢驗(yàn)是指研究兩個(gè)或兩個(gè)以上的計(jì)數(shù)資料(或?qū)傩再Y料)之間是否相互獨(dú)立的假設(shè)檢驗(yàn),先假設(shè)所觀測(cè)的各屬性之間沒有關(guān)聯(lián),然后檢驗(yàn)這種無關(guān)聯(lián)的假設(shè)是否成立。方法1:列聯(lián)表χ2檢驗(yàn)第30頁/共65頁【例】下表給出不同給藥方式與給藥效果,問給藥方式與給藥效果是否有關(guān)聯(lián)。檢驗(yàn)統(tǒng)計(jì)量:?第31頁/共65頁【例】下表給出不同給藥方式與給藥效果,求證:給藥方式與給藥效果有無關(guān)聯(lián)。若事件A和事件B是相互獨(dú)立的,則P(AB)=P(A)P(B)第32頁/共65頁列聯(lián)表χ2檢驗(yàn)一般步驟提出零假設(shè):假設(shè)實(shí)測(cè)數(shù)與理論數(shù)無差異。即H0:O-T=0。計(jì)算理論數(shù):若事件

A和事件

B是相互獨(dú)立的,則

P(AB)=P(A)P(B)。例如:在給藥方式和效果之間是相互獨(dú)立的前提下,計(jì)算口服(事件B)有效(事件A)的概率

P(BA)=P(B)P(A)=(98/193)(122/193)。其理論數(shù)T1=(98/193)(122/193)193=(98)(122)/193。每個(gè)理論值用Tij表示,Tij=(i行總數(shù))(j列總數(shù))/總數(shù)。第33頁/共65頁列聯(lián)表χ2檢驗(yàn)一般步驟計(jì)算

χ2值:若

χ2<χ2α,則接受H0;若

χ2>χ2α,則拒絕H0。確定

df:因?yàn)槊恳恍械母骼碚摂?shù)受該行總數(shù)約束,每一列的各理論數(shù)受該列總數(shù)約束,所以

df=(r-1)(c-1)。給出結(jié)論。第34頁/共65頁2.計(jì)算理論數(shù):1.零假設(shè)H0:O-T=0Tij=(i行總數(shù))(j列總數(shù))/總數(shù)第35頁/共65頁3.計(jì)算

χ2值第36頁/共65頁4.確定dfdf=(r-1)(c-1)=(2-1)(2-1)=1取α

=0.05,5.給出結(jié)論:

接受H0,不同給藥方式的治療效果沒有顯著不同。注意:本例的df=1應(yīng)當(dāng)矯正,矯正后的χ2值更小,不會(huì)影響結(jié)論,可以不再矯正。第37頁/共65頁r×c列聯(lián)表χ2檢驗(yàn)r×c列聯(lián)表是2×2

表的擴(kuò)展;反之,2×2

表也可以看成是r×c列聯(lián)表的一個(gè)特例。r×c列聯(lián)表理論數(shù)的計(jì)算與2×2列聯(lián)表相同:Tij=(i行總數(shù))(j列總數(shù))/總數(shù)。df=(r-1)(c-1)。第38頁/共65頁【例】檢查魚的飼養(yǎng)方式與魚的等級(jí)是否有關(guān),設(shè)計(jì)了如下試驗(yàn):按不同方式分為三種網(wǎng)箱飼養(yǎng)類型:A、B、C,統(tǒng)計(jì)不同飼養(yǎng)方式下魚的等級(jí)情況,得如下數(shù)據(jù),試分析。等級(jí)飼養(yǎng)方式總數(shù)ABC甲22181656乙18161448丙11131438丁8111029總數(shù)595854171第39頁/共65頁等級(jí)飼養(yǎng)方式總數(shù)ABC甲22(19.32)18(18.99)16(17.68)56乙18(16.56)16(16.28)14(15.16)48丙11(13.11)13(12.89)14(12.0)38丁8(10.01)11(9.84)10(9.16)29總數(shù)5958541712.計(jì)算理論數(shù):1.零假設(shè)H0:O-T=0Tij=(i行總數(shù))(j列總數(shù))/總數(shù)第40頁/共65頁3.計(jì)算χ2值第41頁/共65頁等級(jí)飼養(yǎng)方式總數(shù)ABC甲22(19.32)18(18.99)16(17.68)56乙18(16.56)16(16.28)14(15.16)48丙11(13.11)13(12.89)14(12.0)38丁8(10.01)11(9.84)10(9.16)29總數(shù)5958541714.計(jì)算df:df=(r-1)(c-1)=(4-1)(3-1)=6第42頁/共65頁接受原假設(shè),即商品魚的規(guī)格與飼養(yǎng)方式無關(guān)。5.結(jié)論第43頁/共65頁r×c列聯(lián)表χ2檢驗(yàn)的局限性與吻合度檢驗(yàn)一樣,理論數(shù)不得小于5。第44頁/共65頁2×2

列聯(lián)表的精確檢驗(yàn)法aba+bcdc+da+cb+dN第45頁/共65頁044325369134235369224145369314055369表1表2表3表445369第46頁/共65頁044325369表145369根據(jù)組合公式,9分解為4和5,共:9分解為3和6,共:9在行間分解為4和5,在列間分解為3和6,共:根據(jù)組合公式,9分解為0,4,3和2,共:第47頁/共65頁044325369表145369出現(xiàn)表1的概率是:第48頁/共65頁044325369134235369224145369314055369表1表2表3表4各列聯(lián)表的概率:第49頁/共65頁求任一列聯(lián)表概率的通式:aba+bcdc+da+cb+dN注意:原假設(shè)是處理間不存在差異;如果P>α,接受原假設(shè);如果P<α,接受備擇假設(shè)。第50頁/共65頁飼料未增重/只增重/只總數(shù)A415B066總數(shù)4711【例1】用兩種飼料A和B飼養(yǎng)小白鼠,一周后測(cè)小白鼠增重情況(如下表)。問用不同飼料飼養(yǎng)的小白鼠體重是否存在差異?第51頁/共65頁飼料未增重/只增重/只總數(shù)A415B066總數(shù)4711解:1.原假設(shè)H0:兩種飼料的飼養(yǎng)效果相同2.計(jì)算P

值第52頁/共65頁飼料未增重/只增重/只總數(shù)A415B066總數(shù)4711解:3.結(jié)論雙側(cè)檢驗(yàn),P值與α/2比較P=0.015<0.025拒絕原假設(shè),兩種飼料的飼養(yǎng)效果不同。第53頁/共65頁【例2】檢測(cè)性別對(duì)藥物的反應(yīng),結(jié)果如下:性別有效無效總數(shù)男415女369總數(shù)7714性別有效無效總數(shù)男505女279總數(shù)7714第54頁/共65頁【例2】解:1.

原假設(shè)H0:男女對(duì)該藥物的反應(yīng)沒區(qū)別2.計(jì)算P1

值性別有效無效總數(shù)男415女369總數(shù)7714第55頁/共65頁【例2】解:性別有效無效總數(shù)男505女279總數(shù)7714計(jì)算P2

值第56頁/共65頁【例2】解:性別有效無效總數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論