3.2獨(dú)立性檢驗(yàn) 課件高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第1頁
3.2獨(dú)立性檢驗(yàn) 課件高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第2頁
3.2獨(dú)立性檢驗(yàn) 課件高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第3頁
3.2獨(dú)立性檢驗(yàn) 課件高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第4頁
3.2獨(dú)立性檢驗(yàn) 課件高中數(shù)學(xué)人教A版(2019)選擇性必修第三冊_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、8.3列聯(lián)表與獨(dú)立性檢驗(yàn)8.3.2 獨(dú)立性檢驗(yàn)講課人:邢啟強(qiáng)2我們將下表這種形式的數(shù)據(jù)統(tǒng)計表稱為22列聯(lián)表(contingency table).復(fù)習(xí)回顧復(fù)習(xí)回顧22列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù),以下表為例,它包含了X和Y的如下信息:最后一行的前兩個數(shù)分別是事件Y=0和Y=1中樣本點(diǎn)的個數(shù);最后一列的前兩個數(shù)分別是事件X=0和X=1中樣本點(diǎn)的個數(shù);中間的四個格中的數(shù)是表格的核心部分,給出了事件X=x,Y=y(x,y=0,1)中樣本點(diǎn)的個數(shù);右下角格中的數(shù)是樣本空間中樣本點(diǎn)的總數(shù)。n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX講課人:邢啟強(qiáng)3

2、復(fù)習(xí)回顧復(fù)習(xí)回顧兩個分類變量之間關(guān)聯(lián)關(guān)系的定性分析的方法:兩個分類變量之間關(guān)聯(lián)關(guān)系的定性分析的方法:(2)圖形分析法:與表格相比,圖形更能直觀地反映出兩個分類變量間是否互相影響,常用等高堆積條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.將列聯(lián)表中的數(shù)據(jù)用高度相同的兩個條形圖表示出來,其中兩列的數(shù)據(jù)分別對應(yīng)不同的顏色,這就是等高堆積條形圖.講課人:邢啟強(qiáng)4 “兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這個結(jié)論是根據(jù)兩個頻率間存在差異推斷出來的.有可能出現(xiàn)這種情況:在隨機(jī)抽取的這個樣本中,兩個頻率間確實(shí)存在差異,但兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率實(shí)際上是沒有差別的.對于隨機(jī)樣本而言,因?yàn)轭l率具有隨機(jī)性,頻率與概率之間存在誤差,

3、所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.因此,需要找到一種更為合理的推斷方法,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.講課人:邢啟強(qiáng)5X=0與Y=0獨(dú)立;X=0與Y=1獨(dú)立;X=1與Y=0獨(dú)立;X=1與Y=1獨(dú)立。學(xué)習(xí)新知學(xué)習(xí)新知講課人:邢啟強(qiáng)6以上性質(zhì)成立,我們就稱分類變量X和Y獨(dú)立,這相當(dāng)于下面四個等式成立;P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).我們可以用概率語言,將零假設(shè)改述為H0:分類變量

4、X和Y獨(dú)立.假定我們通過簡單隨機(jī)抽樣得到了X和Y的抽樣數(shù)據(jù)列聯(lián)表,如下表所示。n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX對于隨機(jī)樣本,表中的頻數(shù)a,b,c,d 都是隨機(jī)變量,而表中的相應(yīng)數(shù)據(jù)是這些隨機(jī)變量的一次觀測結(jié)果。表是關(guān)于分類變量X和Y的抽樣數(shù)據(jù)的22列聯(lián)表:最后一行的前兩個數(shù)分別是事件Y=0和Y=1的頻數(shù);最后一列的前兩個數(shù)分別是事件X=0和X=1的頻數(shù);中間的四個數(shù)a,b,c,d是事件X=x,Y=y(x, y=0,1)的頻數(shù);右下角格中的數(shù)n是樣本容量。講課人:邢啟強(qiáng)7思考:如何基于中的四個等式及列聯(lián)表中的數(shù)據(jù),構(gòu)造適當(dāng)?shù)慕y(tǒng)計量,對成對分類

5、變量X和Y是否相互獨(dú)立作出推斷?P(X=0,Y=0)=P(X=0)P(Y=0); P(X=0,Y=1)=P(X=0)P(Y=1);P(X=1,Y=0)=P(X=1)P(Y=0); P(X=1,Y=1)=P(X=1)P(Y=1).n=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX講課人:邢啟強(qiáng)8綜合中的四個式子,如果零假設(shè)H0成立,下面四個量的取值都不應(yīng)該太大:反之,當(dāng)這些量的取值較大時,就可以推斷H0不成立。 分別考慮中的四個差的絕對值很困難,我們需要找到一個既合理又能夠計算分布的統(tǒng)計量,來推斷H0是否成立.一般來說,若頻數(shù)的期望值較大,則中相應(yīng)的差的絕對值

6、也會較大;而若頻數(shù)的期望值較小,則中相應(yīng)的差的絕對值也會較小.為了合理地平衡這種影響,我們將四個差的絕對值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計量:該表達(dá)式可化簡為講課人:邢啟強(qiáng)9講課人:邢啟強(qiáng)10獨(dú)立性檢驗(yàn)公式及定義:獨(dú)立性檢驗(yàn)公式及定義:提出零假設(shè)(原假設(shè))H0:分類變量X和Y獨(dú)立 2 =2()()()()()n adbcab cd ac bd為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),基于上述分析,我們構(gòu)造一個隨機(jī)變量學(xué)習(xí)新知學(xué)習(xí)新知2獨(dú)立性檢驗(yàn)中幾個常用的小概率值和相應(yīng)的臨界值.10.8287.8796.6353.8412.706x0.0010.0050.010.050.1n

7、=a+b+c+db+da+c合計c+ddcX=1a+bbaX=0Y=1Y=0合計YX講課人:邢啟強(qiáng)11臨界值的定義:臨界值的定義: 對于任何小概率值,可以找到相應(yīng)的正實(shí)數(shù)x,使得P(2x)=成立,我們稱x為的臨界值,這個臨界值可作為判斷2大小的標(biāo)準(zhǔn),概率值越小,臨界值x越大.2獨(dú)立性檢驗(yàn)中幾個常用的小概率值和相應(yīng)的臨界值.基于小概率值的檢驗(yàn)規(guī)則:當(dāng)2x時,我們就推斷H0不成立,即認(rèn)為X和Y不獨(dú)立,該推斷犯錯誤的概率不超過;當(dāng)2x時,我們沒有充分證據(jù)推斷H0不成立,可以認(rèn)為X和Y獨(dú)立.10.8287.8796.6353.8412.706x0.0010.0050.010.050.1 用2取值的大小

8、作為判斷零假設(shè)H0是否成立的依據(jù),當(dāng)它比較大時推斷H0不成立,否則認(rèn)為H0成立。這種利用2的取值推斷分類變量X和Y是否獨(dú)立的方法稱為2獨(dú)立性檢驗(yàn),讀作“卡方獨(dú)立性檢驗(yàn)”,簡稱獨(dú)立性檢驗(yàn).講課人:邢啟強(qiáng)12例例1:為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取為比較甲、乙兩所學(xué)校學(xué)生的數(shù)學(xué)水平,采用簡單隨機(jī)抽樣的方法抽取88名學(xué)生名學(xué)生.通過測驗(yàn)得到了如下數(shù)據(jù):甲校通過測驗(yàn)得到了如下數(shù)據(jù):甲校43名學(xué)生中有名學(xué)生中有10名數(shù)學(xué)成績優(yōu)秀;乙校名數(shù)學(xué)成績優(yōu)秀;乙校45名學(xué)生中有名學(xué)生中有7名數(shù)學(xué)成績優(yōu)秀名數(shù)學(xué)成績優(yōu)秀.試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異試分析兩校學(xué)生中數(shù)學(xué)

9、成績優(yōu)秀率之間是否存在差異.解:零假設(shè)為解:零假設(shè)為H0:分類變量:分類變量X與與Y相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異相互獨(dú)立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.學(xué)校學(xué)校數(shù)學(xué)成績數(shù)學(xué)成績合計合計不優(yōu)秀(不優(yōu)秀(Y=0)優(yōu)秀(優(yōu)秀(Y=1)甲校(甲校(X=0)331043乙乙校(校(X=1)38745合計合計711788因?yàn)橐驗(yàn)橹v課人:邢啟強(qiáng)13思考例1和例2都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說明其中的原因嗎?當(dāng)我們接受零假設(shè)H0時,也可能犯錯誤。我們不知道犯這類錯誤的概率p的大小,但是知道,若越大,則p越小講課人:邢啟強(qiáng)14解:零假設(shè)為解:零假設(shè)為H0:療法與療效獨(dú)立

10、,即兩種療法效果沒有差異:療法與療效獨(dú)立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136講課人:邢啟強(qiáng)15不影響不影響療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136療法療法療效療效合計合計未治愈未治愈治愈治愈乙乙66369甲甲155267合計合計21115136療法療法療效療效合計合計治愈治愈未治愈未治愈甲甲521567乙乙63669合計合計11521136講課人:邢啟

11、強(qiáng)16解:零假設(shè)為解:零假設(shè)為H0:療法與療效獨(dú)立,即兩種療法效果沒有差異:療法與療效獨(dú)立,即兩種療法效果沒有差異.將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,將所給數(shù)據(jù)進(jìn)行整理,得到兩種療法治療數(shù)據(jù)的列聯(lián)表,療法療法療效療效合計合計未治愈未治愈治愈治愈甲甲155267乙乙66369合計合計21115136講課人:邢啟強(qiáng)17解:解: 因此可以推斷乙種療法的效果比甲種療法好因此可以推斷乙種療法的效果比甲種療法好。講課人:邢啟強(qiáng)18例例4 4:為了調(diào)查吸煙是否對肺癌有影響,某腫瘤研究所采取有放回簡單隨機(jī)抽樣,調(diào)查了9965人,得到如下結(jié)果(單位:人)依據(jù)小概率值=0.001的獨(dú)立性檢驗(yàn),分析

12、吸煙是否會增加患肺癌的風(fēng)險。解:零假設(shè)為解:零假設(shè)為H H0 0:吸煙和患肺癌之間沒有關(guān)系根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計算的20.0019965 (7775 4942 2099)56.63210.828=7817 2148 9874 91x2 =根據(jù)小概率值=0.001的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為吸 煙與患肺癌有關(guān)聯(lián),此推斷犯錯誤的概率不大于0.001,即我們有99.9的把握認(rèn)為“吸煙與患肺癌有關(guān)系”.吸煙肺癌合計非肺癌患者肺癌患者非吸煙者7775427817吸煙者2099492148合計9874919965講課人:邢啟強(qiáng)19根據(jù)表中的數(shù)據(jù)計算不吸煙者中不患肺癌和患肺癌的頻率分別為吸煙者中不

13、患肺癌和患肺癌的評率分別為由 可見,在被調(diào)查者中,吸煙者患肺癌的頻率是不吸煙者患肺癌頻率的4倍倍以上。于是,根據(jù)頻率穩(wěn)定于概率的原理,我們可以認(rèn)為吸煙者患肺癌的概率明顯大于不吸煙者患肺癌概率,即吸煙更容易引發(fā)肺癌。427817781777750.9946,0.0054492148214820990.9772,0.02284.20.00540.0228講課人:邢啟強(qiáng)20方法總結(jié)應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個主要環(huán)節(jié):應(yīng)用獨(dú)立性檢驗(yàn)解決實(shí)際問題大致應(yīng)包括以下幾個主要環(huán)節(jié):注意注意:上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整,上述幾個環(huán)節(jié)的內(nèi)容可以根據(jù)不同情況進(jìn)行調(diào)整,例如,在有些時候

14、,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的例如,在有些時候,分類變量的抽樣數(shù)據(jù)列聯(lián)表是問題中給定的.P(2x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.828講課人:邢啟強(qiáng)21P(x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.828210.828K26.635K22.7

15、06K22.706K0.1%0.1%把握認(rèn)把握認(rèn)為為A A與與B B無關(guān)無關(guān)1%1%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)99.9%99.9%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)99%99%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)90%90%把握認(rèn)把握認(rèn)為為A A與與B B有關(guān)有關(guān)10%10%把握認(rèn)為把握認(rèn)為A A與與B B無關(guān)無關(guān)沒有充分的依據(jù)顯示沒有充分的依據(jù)顯示A A與與B B有關(guān),有關(guān),但也不能顯示但也不能顯示A A與與B B無關(guān)無關(guān)例如例如學(xué)習(xí)新知學(xué)習(xí)新知講課人:邢啟強(qiáng)22 在在500500人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們一年中的人身上試驗(yàn)?zāi)撤N血清預(yù)防感冒作用,把他們一年

16、中的感冒記錄與另外感冒記錄與另外500500名未用血清的人的感冒記錄作比較,結(jié)果如表所示。名未用血清的人的感冒記錄作比較,結(jié)果如表所示。問:該種血清能否起到預(yù)防感冒的作用?問:該種血清能否起到預(yù)防感冒的作用?未感冒未感冒感冒感冒合計合計使用血清使用血清258242500未使用血清未使用血清216284500合計合計4745261000解:設(shè)解:設(shè)H0:感冒與是否使用該血清沒有關(guān)系。:感冒與是否使用該血清沒有關(guān)系。因當(dāng)因當(dāng)H0成立時,成立時, 26.635的概率約為的概率約為0.01,故有,故有99%的把握認(rèn)為該血清能起到的把握認(rèn)為該血清能起到預(yù)防感冒的作用。預(yù)防感冒的作用。P(x0)0.500

17、.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.828典型例題典型例題講課人:邢啟強(qiáng)23P(x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.828有效有效無效無效合計合計口服口服585840409898注射注射646431319595合計合計1221227171193193解:設(shè)解:設(shè)H

18、0:藥的效果與給藥方式?jīng)]有關(guān)系。:藥的效果與給藥方式?jīng)]有關(guān)系。2.072 為研究不同的給藥方式(口服與注射)和藥的效果(有效與無效)是為研究不同的給藥方式(口服與注射)和藥的效果(有效與無效)是否有關(guān),進(jìn)行了相應(yīng)的抽樣調(diào)查,調(diào)查的結(jié)果列在表中,根據(jù)所選擇的否有關(guān),進(jìn)行了相應(yīng)的抽樣調(diào)查,調(diào)查的結(jié)果列在表中,根據(jù)所選擇的193193個病人個病人的數(shù)據(jù),能否作出藥的效果和給藥方式有關(guān)的結(jié)論?的數(shù)據(jù),能否作出藥的效果和給藥方式有關(guān)的結(jié)論?典型例題典型例題講課人:邢啟強(qiáng)24P(x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1

19、.323 2.072 2.7063.8415.024 6.635 7.879 10.828 氣管炎是一種常見的呼吸道疾病,醫(yī)藥研究人員對兩種中草藥治療慢性氣氣管炎是一種常見的呼吸道疾病,醫(yī)藥研究人員對兩種中草藥治療慢性氣管炎的療效進(jìn)行對比,所得數(shù)據(jù)如表所示,問:它們的療效有無差異?管炎的療效進(jìn)行對比,所得數(shù)據(jù)如表所示,問:它們的療效有無差異?有效有效無效無效合計合計復(fù)方江剪刀草復(fù)方江剪刀草18461245膽黃片膽黃片919100合計合計27570345解:設(shè)解:設(shè)H0:兩種中草藥的治療效果沒有差異。:兩種中草藥的治療效果沒有差異。典型例題典型例題講課人:邢啟強(qiáng)25 某校對學(xué)生的課外活動進(jìn)行調(diào)查

20、,結(jié)果整理成下表:某校對學(xué)生的課外活動進(jìn)行調(diào)查,結(jié)果整理成下表:體育體育文娛文娛總計總計男生男生212344女生女生62935總計總計275279試用你所學(xué)過的知識分析:能否在犯錯誤的概率不超過試用你所學(xué)過的知識分析:能否在犯錯誤的概率不超過0.005的前提下,認(rèn)為的前提下,認(rèn)為“喜喜歡體育還是文娛與性別有關(guān)系歡體育還是文娛與性別有關(guān)系”?鞏固練習(xí)鞏固練習(xí)講課人:邢啟強(qiáng)26a21,b23,c6,d29,n79,即我們得到的即我們得到的K2的觀測值的觀測值k8.106超過超過7.879這就意味著:這就意味著:“喜歡體育還是文娛與性別沒喜歡體育還是文娛與性別沒有關(guān)系有關(guān)系”這一結(jié)論成立的可能性小于

21、這一結(jié)論成立的可能性小于0.005,即在犯錯誤的概率不超過即在犯錯誤的概率不超過0.005的前提下認(rèn)的前提下認(rèn)為為“喜歡體育還是喜歡文娛與性別有關(guān)喜歡體育還是喜歡文娛與性別有關(guān)”P(x0)0.500.400.250.150.100.050.025 0.010 0.0050.001x00.455 0.708 1.323 2.072 2.7063.8415.024 6.635 7.879 10.828鞏固練習(xí)鞏固練習(xí)講課人:邢啟強(qiáng)27 某縣城區(qū)常見在合法的廣告牌上又貼有違法的黑廣告,城管對此進(jìn)行了清理,某縣城區(qū)常見在合法的廣告牌上又貼有違法的黑廣告,城管對此進(jìn)行了清理,并下了通告一周后,城管對某街道進(jìn)行了檢查作了如下統(tǒng)計:并下了通告一周后,城管對某街道進(jìn)行了檢查作了如下統(tǒng)計:貼有黑廣告貼有黑廣告 未貼有黑廣告未貼有黑廣告總計總計通告前通告前39157196通告后通告后29167196總

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論