版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、3.2獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用,高二數(shù)學(xué) 選修2-3 第三章 統(tǒng)計(jì)案例,2020/6/22,問(wèn)題: 數(shù)學(xué)家龐加萊每天都從一家面包店買(mǎi)一塊1000g 的面包,并記錄下買(mǎi)回的面包的實(shí)際質(zhì)量。一年后,這位數(shù)學(xué)家發(fā)現(xiàn),所記錄數(shù)據(jù)的均值為950g。于是龐加萊推斷這家面包店的面包分量不足。,假設(shè)“面包份量足”,則一年購(gòu)買(mǎi)面包的質(zhì)量數(shù)據(jù)的平均值應(yīng)該不少于1000g ; “這個(gè)平均值不大于950g”是一個(gè)與假設(shè)“面包份量足”矛盾的小概率事件; 這個(gè)小概率事件的發(fā)生使龐加萊得出推斷結(jié)果。,2020/6/22,一:假設(shè)檢驗(yàn)問(wèn)題的原理,假設(shè)檢驗(yàn)問(wèn)題由兩個(gè)互斥的假設(shè)構(gòu)成,其中一個(gè)叫做原假設(shè),用H0表示;另一個(gè)
2、叫做備擇假設(shè),用H1表示。,例如,在前面的例子中, 原假設(shè)為: H0:面包份量足, 備擇假設(shè)為: H1:面包份量不足。 這個(gè)假設(shè)檢驗(yàn)問(wèn)題可以表達(dá)為: H0:面包份量足 H1:面包份量不足,2020/6/22,二:求解假設(shè)檢驗(yàn)問(wèn)題,考慮假設(shè)檢驗(yàn)問(wèn)題: H0:面包分量足 H1:面包分量不足,在H0成立的條件下,構(gòu)造與H0矛盾的小概率事件; 如果樣本使得這個(gè)小概率事件發(fā)生,就能以一定把握斷言H1成立;否則,斷言沒(méi)有發(fā)現(xiàn)樣本數(shù)據(jù)與H0相矛盾的證據(jù)。,求解思路:,2020/6/22,獨(dú)立性檢驗(yàn),本節(jié)研究的是兩個(gè)分類變量的獨(dú)立性檢驗(yàn)問(wèn)題。,在日常生活中,我們常常關(guān)心分類變量之間是否有關(guān)系:,例如,吸煙是否
3、與患肺癌有關(guān)系? 性別是否對(duì)于喜歡數(shù)學(xué)課程有影響?等等。,2020/6/22,為了調(diào)查吸煙是否對(duì)肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人),列聯(lián)表,說(shuō)明:吸煙者和不吸煙者患肺癌的可能性存在差異,吸煙者患肺癌的可能性大。,0.54%,2.28%,探究,2020/6/22,1、列聯(lián)表,2、三維柱形圖,3、二維條形圖,從三維柱形圖能清晰看出 各個(gè)頻數(shù)的相對(duì)大小。,從二維條形圖能看出,吸煙者中 患肺癌的比例高于不患肺癌的比例。,通過(guò)圖形直觀判斷兩個(gè)分類變量是否相關(guān):,2020/6/22,4、等高條形圖,等高條形圖更清晰地表達(dá)了兩種情況下患肺癌的比例。,2020/6/22,
4、上面我們通過(guò)分析數(shù)據(jù)和圖形,得到的直觀印象是吸煙和患肺癌有關(guān),那么事實(shí)是否真的如此呢?這需要用統(tǒng)計(jì)觀點(diǎn)來(lái)考察這個(gè)問(wèn)題。,現(xiàn)在想要知道能夠以多大的把握認(rèn)為“吸煙與患肺癌有關(guān)”, 為此先假設(shè),H0:吸煙與患肺癌沒(méi)有關(guān)系.,把表中的數(shù)字用字母代替,得到如下用字母表示的列聯(lián)表,用A表示不吸煙,B表示不患肺癌,則“吸煙與患肺癌沒(méi)有關(guān)系”等價(jià)于“吸煙與患肺癌獨(dú)立”,即假設(shè)H0等價(jià)于 P(AB)=P(A)P(B).,2020/6/22,因此|ad-bc|越小,說(shuō)明吸煙與患肺癌之間關(guān)系越弱; |ad-bc|越大,說(shuō)明吸煙與患肺癌之間關(guān)系越強(qiáng)。,在表中,a恰好為事件AB發(fā)生的頻數(shù);a+b和a+c恰好分別為事件A
5、和B發(fā)生的頻數(shù)。由于頻率接近于概率,所以在H0成立的條件下應(yīng)該有,2020/6/22,為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評(píng)判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個(gè)隨機(jī)變量-卡方統(tǒng)計(jì)量,(1),若 H0成立,即“吸煙與患肺癌沒(méi)有關(guān)系”,則K2應(yīng)很小。,根據(jù)表3-7中的數(shù)據(jù),利用公式(1)計(jì)算得到K2的觀測(cè)值為:,那么這個(gè)值到底能告訴我們什么呢?,(2),獨(dú)立性檢驗(yàn),2020/6/22,在H0成立的情況下,統(tǒng)計(jì)學(xué)家估算出如下的概率 即在H0成立的情況下,K2的值大于6.635的概率非常小,近似于0.01。,也就是說(shuō),在H0成立的情況下,對(duì)隨機(jī)變量K2進(jìn)行多次觀測(cè),觀測(cè)值超過(guò)6.635的頻率約為0.01。,
6、思考,答:判斷出錯(cuò)的概率為0.01。,2020/6/22,判斷 是否成立的規(guī)則,如果 ,就判斷 不成立,即認(rèn)為吸煙與患肺癌有關(guān)系;否則,就判斷 成立,即認(rèn)為吸煙與患肺癌有關(guān)系。,獨(dú)立性檢驗(yàn)的定義,上面這種利用隨機(jī)變量K2來(lái)確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法,稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn)。,在該規(guī)則下,把結(jié)論“ 成立”錯(cuò)判成“ 不成立”的概率不會(huì)差過(guò),即有99%的把握認(rèn)為 不成立。,2020/6/22,獨(dú)立性檢驗(yàn)的基本思想(類似反證法),(1)假設(shè)結(jié)論不成立,即 “兩個(gè)分類變量沒(méi)有關(guān)系”.,(2)在此假設(shè)下我們所構(gòu)造的隨機(jī)變量 K2 應(yīng)該很小,如果由觀測(cè)數(shù)據(jù)計(jì)算得到K2的觀測(cè)值
7、k很大,則在一定可信程度上說(shuō)明 不成立.即在一定可信程度上認(rèn)為“兩個(gè)分類變量有關(guān)系”;如果k的值很小,則說(shuō)明由樣本觀測(cè)數(shù)據(jù)沒(méi)有發(fā)現(xiàn)反對(duì) 的充分證據(jù)。,(3)根據(jù)隨機(jī)變量K2的含義,可以通過(guò)評(píng)價(jià)該假設(shè)不合理的程度,由實(shí)際計(jì)算出的,說(shuō)明假設(shè)合理的程度為99%,即“兩個(gè)分類變量有關(guān)系”這一結(jié)論成立的可信度為約為99%.,怎樣判斷K2的觀測(cè)值k是大還是小呢?,這僅需要確定一個(gè)正數(shù) ,當(dāng) 時(shí)就認(rèn)為K2的觀測(cè)值 k大。此時(shí)相應(yīng)于 的判斷規(guī)則為:,如果 ,就認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;否則就認(rèn)為“兩個(gè)分類變量之間沒(méi)有關(guān)系”。,-臨界值,按照上述規(guī)則,把“兩個(gè)分類變量之間有沒(méi)關(guān)系”錯(cuò)誤的判斷為“兩個(gè)分類變
8、量之間有關(guān)系”的概率為P( ).,在實(shí)際應(yīng)用中,我們把 解釋為有 的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”;把 解釋為不能以 的把握認(rèn)為“兩個(gè)分類變量之間有關(guān)系”,或者樣本觀測(cè)數(shù)據(jù)沒(méi)有提供“兩個(gè)分類變量之間有關(guān)系”的充分證據(jù)。,2020/6/22,思考: 利用上面的結(jié)論,你能從列聯(lián)表的三維柱形圖中看出兩個(gè)分類變量是否相關(guān)呢?,表1-11 2x2聯(lián)表,一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為:,2020/6/22,若要判斷的結(jié)論為:H1:“X與Y有關(guān)系”,可以按如下步驟判斷H1成立的可能性:,2、可以利用獨(dú)立性檢驗(yàn)來(lái)考察兩個(gè)分類
9、變量是否有關(guān)系,并且能較精確地給出這種判斷的可靠程度。,1、通過(guò)三維柱形圖和二維條形圖,可以粗略地判斷兩個(gè)變量是否有關(guān)系,但是這種判斷無(wú)法精確地給出所得結(jié)論的可靠程度。 (1)在三維柱形圖中, 主對(duì)角線上兩個(gè)柱形高度的乘積ad與副對(duì)角線上兩個(gè)柱形高度的乘積bc相差越大,H1成立的可能性就越大。 (2)在二維條形圖中,可以估計(jì)滿足條件X=x1的個(gè)體中具有Y=y1的個(gè)體所占的比例 ,也可以估計(jì)滿足條件X=x2 的個(gè)體中具有Y=y1的個(gè)體所占的比例 。兩個(gè)比例相差越大,H1成立的可能性就越大。,2020/6/22,在實(shí)際應(yīng)用中,要在獲取樣本數(shù)據(jù)之前通過(guò)下表確定臨界值:,具體作法是:,(1)根據(jù)實(shí)際問(wèn)題需要的可信程度確定臨界值 ; (2)利用公式(1),由觀測(cè)數(shù)據(jù)計(jì)算得到隨機(jī)變量 的觀測(cè)值; (3)如果 ,就以 的把握認(rèn)為“X與Y有關(guān)系”;否則就說(shuō)樣本觀測(cè)數(shù)據(jù)沒(méi)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025 小學(xué)三年級(jí)科學(xué)下冊(cè)對(duì)比風(fēng)媒花與蟲(chóng)媒花的特點(diǎn)課件
- 生產(chǎn)文員考試試題及答案
- 生物初一考試題目及答案
- 輔警國(guó)學(xué)培訓(xùn)課件
- 2026年深圳中考語(yǔ)文正確使用熟語(yǔ)試卷(附答案可下載)
- 2026年深圳中考英語(yǔ)題型全解全練試卷(附答案可下載)
- 危險(xiǎn)品車(chē)駕駛員培訓(xùn)課件
- 知識(shí)類題目及答案
- 2026年深圳中考數(shù)學(xué)重難點(diǎn)突破試卷(附答案可下載)
- 2026年深圳中考生物三模仿真模擬試卷(附答案可下載)
- 化工品物流樞紐項(xiàng)目運(yùn)營(yíng)管理方案
- 丈夫家暴協(xié)議書(shū)模板
- 皮帶機(jī)制作合同范本
- 糖尿病酮癥酸中毒(DKA)難治性DKA血液凈化模式選擇方案
- 基于語(yǔ)料庫(kù)的詞匯語(yǔ)法模式在大學(xué)英語(yǔ)詞匯教學(xué)中的應(yīng)用與創(chuàng)新研究
- 戶外防腐木保養(yǎng)與修復(fù)工程方案
- 2026年建筑裝飾公司應(yīng)收賬款管理管理制度
- 2025年旅游區(qū)導(dǎo)游講解服務(wù)合同協(xié)議
- 房地產(chǎn)公司財(cái)務(wù)報(bào)表編制指南
- GB/T 46210-2025項(xiàng)目成本管理指南
- 快手直播內(nèi)容分發(fā)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論