版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
3.1獨立性檢驗
問題:
數(shù)學(xué)家龐加萊每天都從一家面包店買一塊1000g的面包,并記錄下買回的面包的實際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。假設(shè)“面包份量足”,則一年購買面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g;“這個平均值不大于950g”是一個與假設(shè)“面包份量足”矛盾的小概率事件;這個小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。一:假設(shè)檢驗問題的原理
假設(shè)檢驗問題由兩個互斥的假設(shè)構(gòu)成,其中一個叫做原假設(shè),用H0表示;另一個叫做備擇假設(shè),用H1表示。例如,在前面的例子中,原假設(shè)為:H0:面包份量足,備擇假設(shè)為:H1:面包份量不足。這個假設(shè)檢驗問題可以表達(dá)為:
H0:面包份量足←→H1:面包份量不足二:求解假設(shè)檢驗問題考慮假設(shè)檢驗問題:
H0:面包分量足←→H1:面包分量不足在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件;如果樣本使得這個小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。求解思路分析:本節(jié)研究的是兩個分類變量的獨立性檢驗問題。獨立性檢驗在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:例如,吸煙是否與患肺癌有關(guān)系?性別是否對于喜歡數(shù)學(xué)課程有影響?等等。例1.某醫(yī)療機(jī)構(gòu)為了了解患慢性支氣管炎與吸煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)查了339名50歲以上的人,其中吸煙者205人,不吸煙者134人.調(diào)查結(jié)果是:吸煙的205人中有43人患呼吸道疾?。ê喎Q患?。?,162人未患呼吸道疾?。ê喎Q未患?。?;不吸煙的134人中有13人患病,121人未患病.問題:根據(jù)這些數(shù)據(jù)能否斷定“患慢性支氣管炎與吸煙有關(guān)”?(1)為了研究這個問題,將上述數(shù)據(jù)用下表來表示:患病未患病合計吸煙43162205不吸煙13121134合計56283339(2)估計吸煙者與不吸煙者患病的可能性差異:在吸煙的人中,有的人患病,在不吸煙的人中,有的人患?。畣栴}:由上述結(jié)論能否得出患病與吸煙有關(guān)?把握有多大?
(1)假設(shè):患病與吸煙沒有關(guān)系.若將表中“觀測值”用字母表示,則得下列2×2列聯(lián)表:不吸煙(患病(B)未患病()合計吸煙An11n12n1+不吸煙n21n22n2+合計n+1n+2n
即n11(n21+n22)≈n21(n11+n12)n11n22-n21n12≈0,因此,|n11n22-n21n12|越小,患病與吸煙之間的關(guān)系越弱,否則,關(guān)系越強(qiáng).近似的判斷方法:設(shè)n=n11+n21+n12+n22,如果H0成立,則在吸煙的人中患病的比例與不吸煙的人中患病的比例應(yīng)差不多,由此可得,
上面的話的意思是指事件A與B獨立,這時應(yīng)該有P(AB)=P(A)P(B)成立,
我們用H0表示上式,即H0:P(AB)=P(A)P(B).并稱之為統(tǒng)計假設(shè),當(dāng)H0成立時,下面的三個式子也成立:根據(jù)概率的統(tǒng)計定義,上面提到的眾多事件的概率都可以用相應(yīng)的頻率來估計。例如P(AB)的估計為P(A)的估計為,P(B)的估計為,……于是與應(yīng)該很接近,……?;蛘哒f應(yīng)該比較小.從而也應(yīng)該比較小。(2)卡方統(tǒng)計量:為了消除樣本對上式的影響,通常用卡方統(tǒng)計量(χ2
)來進(jìn)行估計.卡方χ2統(tǒng)計量公式:用它的大小可以決定是否拒絕原來的統(tǒng)計假設(shè)H0,如果算出的χ2值較大,就拒絕H0,也就是拒絕“事件A與事件B無關(guān)”,從而就認(rèn)為它們是有關(guān)的了(3)兩個臨界值:3.841與6.635.
經(jīng)過對χ2統(tǒng)計量分布的研究,已經(jīng)得到了兩個臨界值:3.841與6.635。當(dāng)根據(jù)具體的數(shù)據(jù)算出的χ2>3.841時,有95%的把握說事件A與事件B有關(guān);當(dāng)χ2>6.635時,有99%的把握說事件A與事件B有關(guān);當(dāng)χ2<3.841時,認(rèn)為事件A與事件B無關(guān);
象以上這種用χ2統(tǒng)計量研究吸煙與患呼吸道疾病是否有關(guān)等問題的方法稱為獨立性檢驗.
對于例1,最理想的解決辦法是向所有的50歲以上的人作調(diào)查,然后對所得的數(shù)據(jù)進(jìn)行統(tǒng)計處理,但這花費的代價太大,實際上也是行不通的。339個人相對于全體50歲以上的人,只是一小部分回憶一下數(shù)學(xué)必修3中學(xué)過的總體與樣本的關(guān)系,當(dāng)用樣本平均數(shù),樣本標(biāo)準(zhǔn)差去估計總體的相應(yīng)的數(shù)字特征時,由于抽樣的隨機(jī)性,結(jié)果并不惟一?,F(xiàn)在的情況類似,我們用部分對全體作推斷,推斷可能正確,也可能錯誤,例如我們知道,不少的中老年煙民的身體很好,沒有患慢性支氣管炎;而又有很多的從不吸煙的中老年人體質(zhì)很差,患有慢性支氣管炎。如果抽取的339個調(diào)查對象中很多人來自上述兩個群體,試想會得出什么結(jié)論吧。我們說有95%(或99%)的把握說事件A與事件B有關(guān),是指推斷犯錯誤的可能性為5%(或1%),這也是常常說成是“有95%(或99%)的概率”,其含義是一樣的。解:由公式因為7.469>6.635,所以我們有99%的把握說:50歲以上的人患慢性支氣管炎與吸煙有關(guān)。Ⅱ類1類2合計Ⅰ類An11n12n1+類B
n21n22n2+合計n+1n+2n獨立性檢驗的一般步驟:一般地,對于兩個研究對象Ⅰ和Ⅱ,Ⅰ有兩類取值:類A和類B(如吸煙與不吸煙),Ⅱ也有兩類取值:類1和類2(如患呼吸道疾病與不患呼吸道疾?。玫饺缦卤硭荆侯愵?/p>
類類推斷“Ⅰ和Ⅱ有關(guān)系”的步驟為:第一步,提出假設(shè)H0:兩個分類變量Ⅰ和Ⅱ沒有關(guān)系;第二步,根據(jù)2×2列聯(lián)表和公式計算χ2統(tǒng)計量;第三步,比對兩個臨界值,作出判斷.例2:對196個接受心臟搭橋手術(shù)的病人和196個接受血管清障手術(shù)的病人進(jìn)行3年跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:又發(fā)作過心臟病未發(fā)作過心臟病合計心臟搭橋手術(shù)39157196血管清障手術(shù)29167196合計68324392
試根據(jù)上述數(shù)據(jù)比較兩種手術(shù)對病人又發(fā)作心臟病的影響有沒有差別。解:這是一個2×2列聯(lián)表的獨立性檢驗問題,由公式因為1.780<3.841,我們沒有理由說“心臟搭橋手術(shù)”與“又發(fā)生過心臟病”有關(guān),可以認(rèn)為病人又發(fā)作心臟病與否跟他做過何種手術(shù)無關(guān)。例3.某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對待企業(yè)改革態(tài)度的關(guān)系,隨機(jī)抽取了189名員工進(jìn)行調(diào)查,所得的數(shù)據(jù)如下表所示:積極支持企業(yè)改革不太贊成企業(yè)改革合計工作積極544094工作一般326395合計86103189
對于人力資源部的研究項目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?解:這是一個2×2列聯(lián)表的獨立性檢驗問題,由公式因為10.759>6.635,所以有99%的把握說:員工“工作積極”與“積極支持企業(yè)改革”是有關(guān)的??梢哉J(rèn)為企業(yè)的全體員工對待企業(yè)改革的態(tài)度與其工作積極性是有關(guān)的。例4.在一次惡劣氣候的飛行航程中調(diào)查男女乘客在機(jī)上暈機(jī)的情況如下表所示,根據(jù)此
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 測振儀使用方法培訓(xùn)課件
- 菌棒購銷合同模板
- 2026 執(zhí)業(yè)藥師備考避坑指南
- 樹人托管老師培訓(xùn)
- 活動策劃執(zhí)行教學(xué)培訓(xùn)
- 2026年通信技術(shù)中知識產(chǎn)權(quán)保護(hù)的實踐與探索試題
- 2026年托福高分必刷題庫及參考答案集
- 2026年建筑工程設(shè)計資質(zhì)考試案例分析與技術(shù)實踐
- 2026年財經(jīng)知識題庫投資理財模擬題
- 2026年專業(yè)外語翻譯水平測試詞匯語法全解集
- 婦科微創(chuàng)術(shù)后護(hù)理新進(jìn)展
- 工藝類美術(shù)課件
- 2025年小學(xué)蔬菜頒獎典禮
- MFC2000-6微機(jī)廠用電快速切換裝置說明書
- TCNAS50-2025成人吞咽障礙患者口服給藥護(hù)理學(xué)習(xí)解讀課件
- 專升本演講稿
- 2024低溫低濁水給水處理設(shè)計標(biāo)準(zhǔn)
- 門窗知識文字培訓(xùn)課件
- 《房屋市政工程生產(chǎn)安全重大事故隱患判定標(biāo)準(zhǔn)(2024版)》解讀
- 2025年國資委公務(wù)員面試熱點問題集錦及答案
- 計算機(jī)系大數(shù)據(jù)畢業(yè)論文
評論
0/150
提交評論