2024年高中數(shù)學第8章統(tǒng)計與概率8.4列聯(lián)表獨立性分析案例講義含解析湘教版選修2-3_第1頁
2024年高中數(shù)學第8章統(tǒng)計與概率8.4列聯(lián)表獨立性分析案例講義含解析湘教版選修2-3_第2頁
2024年高中數(shù)學第8章統(tǒng)計與概率8.4列聯(lián)表獨立性分析案例講義含解析湘教版選修2-3_第3頁
2024年高中數(shù)學第8章統(tǒng)計與概率8.4列聯(lián)表獨立性分析案例講義含解析湘教版選修2-3_第4頁
2024年高中數(shù)學第8章統(tǒng)計與概率8.4列聯(lián)表獨立性分析案例講義含解析湘教版選修2-3_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

PAGEPAGE138.4列聯(lián)表獨立性分析案例[讀教材·填要點]1.列聯(lián)表一般地,對于兩個因素X和Y,X的兩個水平取值:A和eq\x\to(A)(如吸煙和不吸煙),Y也有兩個水平取值:B和eq\x\to(B)(如患肺癌和不患肺癌),我們得到下表中的抽樣數(shù)據(jù),這個表格稱為2×2列聯(lián)表.YXBeq\x\to(B)合計Aaba+beq\x\to(A)cdc+d合計a+cb+da+b+c+d2.χ2的求法公式χ2=eq\f(nad-bc2,a+bc+da+cb+d).3.獨立性檢驗的概念用隨機變量χ2探討兩變量是否有關的方法稱為獨立性檢驗.4.獨立性檢驗的步驟要推斷“X與Y有關系”,可按下面的步驟進行:(1)提出假設H0:X與Y無關;(2)依據(jù)2×2列聯(lián)表及χ2公式,計算χ2的值;(3)查對臨界值,作出推斷.其中臨界值如表所示:P(χ2≥x0)0.500.400.250.150.100.050.0250.0100.0050.001x00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828表示在H0成立的狀況下,事務“χ2≥x0”發(fā)生的概率.5.變量獨立性推斷的依據(jù)(1)假如χ2>10.828時,就有99.9%的把握認為“X與Y有關系”;(2)假如χ2>6.635時,就有99%的把握認為“X與Y有關系”;(3)假如χ2>2.706時,就有90%的把握認為“X與Y有關系”;(4)假如χ2≤2.706時,就認為沒有充分的證據(jù)顯示“X與Y有關系”,但也不能作出結論“H0成立”,即X與Y沒有關系.[小問題·大思維]1.利用χ2進行獨立性分析,估計值的精確度與樣本容量有關嗎?提示:利用χ2進行獨立性分析,可以對推斷的正確性的概率作出估計,樣本容量n越大,這個估計值越精確.假如抽取的樣本容量很小,那么利用χ2進行獨立性檢驗的結果就不具有牢靠性.2.在χ2運算后,得到χ2的值為29.78,在推斷因素相關時,P(χ2≥6.64)≈0.01和P(χ2≥7.88)≈0.005,哪種說法是正確的?提示:兩種說法均正確.P(χ2≥6.64)≈0.01的含義是在犯錯誤的概率不超過0.01的前提下認為兩因素相關;而P(χ2≥7.88)≈0.005的含義是在犯錯誤的概率不超過0.005的前提下認為兩因素相關.獨立性分析的原理[例1]打鼾不僅影響別人休息,而且可能與患某種疾病有關.下表是一次調(diào)查所得的數(shù)據(jù):患心臟病未患心臟病總計每一晚都打鼾30224254不打鼾2413551379總計5415791633依據(jù)列聯(lián)表的獨立性分析,是否有99%的把握認為每一晚都打鼾與患心臟病有關系?[解]由列聯(lián)表中的數(shù)據(jù),得χ2的值為χ2=eq\f(1633×30×1355-224×242,254×1379×54×1579)≈68.033>6.635.因此,有99%的把握認為每一晚打鼾與患心臟病有關系.解決一般的獨立性分析問題,首先由所給2×2列聯(lián)表確定a,b,c,d,a+b+c+d的值,然后代入隨機變量的計算公式求出觀測值χ2,將χ2與臨界值x0進行對比,確定有多大的把握認為兩個分類變量有關系.1.某大型企業(yè)人力資源部為了探討企業(yè)員工工作主動性和對待企業(yè)改革看法的關系,經(jīng)過調(diào)查得到如下列聯(lián)表:主動支持企業(yè)改革不太支持企業(yè)改革總計工作主動544094工作一般326395總計86103189依據(jù)列聯(lián)表的獨立性分析,是否有99%的把握認為工作看法與支持企業(yè)改革之間有關系?解:由列聯(lián)表中的數(shù)據(jù),得χ2=eq\f(189×54×63-40×322,94×95×86×103)≈10.759>6.635,∴有99%的把握認為工作看法與支持企業(yè)改革之間有關系.獨立性分析的應用[例2]下表是某地區(qū)的一種傳染病與飲用水的調(diào)查表:得病不得病合計干凈水52466518不干凈水94218312合計146684830(1)這種傳染病是否與飲用水的衛(wèi)生程度有關,請說明理由;(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人.按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關,并比較兩種樣本在反映總體時的差異.[解](1)假設H0:傳染病與飲用水無關.把表中數(shù)據(jù)代入公式,得χ2=eq\f(830×52×218-466×942,146×684×518×312)≈54.21,因為當H0成立時,χ2≥10.828的概率約為0.001,所以我們有99.9%的把握認為該地區(qū)這種傳染病與飲用不干凈水有關.(2)依題意得2×2列聯(lián)表:得病不得病合計干凈水55055不干凈水92231合計147286此時,χ2=eq\f(86×5×22-50×92,14×72×55×31)≈5.785.由于5.785>2.706,所以我們有90%的把握認為該種疾病與飲用不干凈水有關.兩個樣本都能統(tǒng)計得到傳染病與飲用不干凈水有關這一相同結論,但(1)中我們有99.9%的把握確定結論的正確性,(2)中我們只有90%的把握確定.獨立性分析的步驟:要推斷“X與Y是否有關”可按下面的步驟進行:①提出統(tǒng)計假設H0:X與Y無關;②依據(jù)2×2列聯(lián)表與χ2計算公式計算出χ2的值;③依據(jù)兩個臨界值,作出推斷.2.為了探究學生選報文、理科是否與對外語的愛好有關,某同學調(diào)查了361名高二在校學生,調(diào)查結果如下:理科對外語有愛好的有138人,無愛好的有98人,文科對外語有愛好的有73人,無愛好的有52人.是否有90%的把握認為“學生選報文、理科與對外語的愛好有關”?解:依據(jù)題目所給的數(shù)據(jù)得到如下列聯(lián)表:理科文科總計有愛好13873211無愛好9852150總計236125361依據(jù)列聯(lián)表中數(shù)據(jù)由公式計算得隨機變量χ2=eq\f(361×138×52-73×982,211×150×236×125)≈1.871×10-4.因為1.871×10-4<2.706,所以沒有90%的把握認為“學生選報文、理科與對外語的愛好有關”.獨立性分析的綜合應用[例3]為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗,將這200只家兔隨機地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗結果.(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85)頻數(shù)1025203015完成下面2×2列聯(lián)表,并回答是否有99%的把握認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.表3:皰疹面積小于70mm2皰疹面積不小于70mm2合計注射藥物Aa=b=注射藥物Bc=d=合計[解]皰疹面積小于70mm2皰疹面積不小于70mm2合計注射藥物Aa=70b=30100注射藥物Bc=35d=65100合計10595200由列聯(lián)表中的數(shù)據(jù),得χ2=eq\f(200×70×65-35×302,100×100×105×95)≈24.56>6.635.因此,有99%的把握認為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”.在繪制列聯(lián)表時,應對問題中的不同數(shù)據(jù)分成不同的類別,然后列表.要留意列聯(lián)表中各行、各列中數(shù)據(jù)的意義及書寫格式.3.已知某班n名同學的數(shù)學測試成果(單位:分,滿分100分)的頻率分布直方圖如圖所示,其中a,b,c成等差數(shù)列,且成果在[90,100]內(nèi)的有6人.(1)求n的值;(2)規(guī)定60分以下為不及格,若不及格的人中女生有4人,而及格的人中,男生比女生少4人,借助獨立性檢驗分析是否有90%的把握認為“本次測試的及格狀況與性別有關”?附:P(χ2≥k0)0.100.050.0100.005k02.7063.8416.6357.879χ2=eq\f(nad-bc2,a+bc+da+cb+d)解:(1)依題意得eq\b\lc\{\rc\(\a\vs4\al\co1(100.035+0.025+c+2b+a=1,,2b=a+c,))解得b=0.01.因為成果在[90,100]內(nèi)的有6人,所以n=eq\f(6,0.01×10)=60.(2)由于2b=a+c,而b=0.01,可得a+c=0.02,則不及格的人數(shù)為0.02×10×60=12,及格的人數(shù)為60-12=48,設及格的人中,女生有x人,則男生有x-4人,于是x+x-4=48,解得x=26,故及格的人中,女生有26人,男生有22人.于是本次測試的及格狀況與性別的2×2列聯(lián)表如下:及格不及格總計男22830女26430總計481260結合列聯(lián)表計算可得χ2=eq\f(60×22×4-8×262,30×30×48×12)=1.667<2.706,故沒有90%的把握認為“本次測試的及格狀況與性別有關”.解題高手多解題在調(diào)查的480名男人中,有38名患色盲,520名女人中,有6名患色盲.試推斷人的性別與患色盲是否有關?你所得到的結論在什么范圍內(nèi)有效?[解]由題意作2×2列聯(lián)表如下:色盲非色盲總計男38442480女6514520總計449561000法一:由列聯(lián)表中數(shù)據(jù)可知,在調(diào)查的男人中,患色盲的比例是eq\f(38,480)≈7.917%,女人中患色盲的比例為eq\f(6,520)≈1.154%,由于兩者差距較大,因而我們可以認為性別與患色盲是有關系的.法二:由列聯(lián)表中所給的數(shù)據(jù)可知,a=38,b=442,c=6,d=514,a+b=480,c+d=520,a+c=44,b+d=956,n=1000,代入公式得χ2=eq\f(1000×38×514-6×4422,480×520×44×956)≈27.1.由于χ2≈27.1>6.635,所以我們有99%的把握即在犯錯誤不超過0.01的前提下認為性別與患色盲有關系.這個結論只對所調(diào)查的480名男人和520名女人有效.1.下面是2×2列聯(lián)表:y1y2總計x1a2173x222527總計b46則表中a,b的值分別為()A.94,96 B.52,50C.52,54 D.54,52解析:選C∵a+21=73,∴a=52.又∵a+2=b,∴b=54.2.下列關于χ2的說法中正確的是()A.χ2在任何相互獨立問題中都可以用于檢驗是否相關B.χ2的值越大,兩個事務的相關性越大C.χ2是用來推斷兩個相互獨立事務相關與否的一個統(tǒng)計量,它可以用來推斷兩個事務是否相關這一類問題D.χ2=eq\f(nad-bc,a+bc+da+cb+d)答案:C3.對于因素X與Y的隨機變量χ2的值,下列說法正確的是()A.χ2越大,“X與Y有關系”的可信程度越小B.χ2越小,“X與Y有關系”的可信程度越小C.χ2越接近于0,“X與Y沒有關系”的可信程度越小D.χ2越大,“X與Y沒有關系”的可信程度越大解析:選Bχ2越大,“X與Y沒有關系”的可信程度越小,則“X與Y有關系”的可信程度越大.即χ2越小,“X與Y有關系”的可信程度越?。?.若由一個2×2列聯(lián)表中的數(shù)據(jù)計算得χ2的觀測值為4.013,那么在犯錯誤的概率不超過________的前提下,認為兩個變量之間有關系.解析:因為4.013>3.841,所以在犯錯誤的概率不超過0.05的前提下,認為兩個變量之間有關系.答案:0.055.某礦石粉廠當生產(chǎn)一種礦石粉時,在數(shù)天內(nèi)即有部分工人患職業(yè)性皮膚炎,在生產(chǎn)季節(jié)起先,隨機抽取75名車間工人穿上新防護服,其余仍穿原用的防護服,生產(chǎn)進行一個月后,檢查兩組工人的皮膚炎患病人數(shù)如下:陽性例數(shù)陰性例數(shù)合計新57075舊101828合計1588103通過數(shù)據(jù)分析,說明有________的把握認為新防護服對預防工人職業(yè)性皮炎有效.解析:χ2=eq\f(103×5×18-70×102,75×28×15×88)≈13.826>6.635.故有99%的把握說,新防護服比舊防護服對預防工人職業(yè)性皮炎有效.答案:99%6.為了解某班學生寵愛打籃球是否與性別有關,對本班50人進行了問卷調(diào)查得到了如下的列聯(lián)表:寵愛打籃球不寵愛打籃球合計男生ab=5女生c=10d合計50已知在全部50人中隨機抽取1人抽到愛打籃球的學生的概率為eq\f(3,5).(1)請將上面的列聯(lián)表補充完整;(2)是否有99%的把握認為寵愛打籃球與性別有關;請說明理由.附參考公式:χ2=eq\f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.P(χ2≥x0)0.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828解:(1)列聯(lián)表補充如下:寵愛打籃球不寵愛打籃球合計男生20525女生101525合計302050(2)∵χ2=eq\f(50×20×15-10×52,30×20×25×25)≈8.333>6.635,∴有99%的把握認為寵愛打籃球與性別有關.一、選擇題1.有兩個因素X與Y的一組數(shù)據(jù),由其列聯(lián)表計算得χ2≈4.523,則認為X與Y有關系是錯誤的可信度為()A.95% B.90%C.5% D.10%解析:選C∵χ2≥3.841.∴X與Y有關系的概率為95%,∴X與Y有關系錯誤的可信度為5%.2.通過隨機詢問110名性別不同的高校生是否愛好某項運動,得到如下的列聯(lián)表:男女總計愛好402060不愛好203050總計6050110計算得,χ2=eq\f(110×40×30-20×202,60×50×60×50)≈7.8.附表:P(χ2≥x0)0.0500.0100.001x03.8416.63510.828參照附表,得到的正確結論是()A.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”B.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”C.有99%以上的把握認為“愛好該項運動與性別有關”D.有99%以上的把握認為“愛好該項運動與性別無關”解析:選C依據(jù)獨立性分析的思想方法,正確選項為C.3.某高?!敖y(tǒng)計初步”課程的老師隨機調(diào)查了選該課的一些學生狀況,詳細數(shù)據(jù)如下表:非統(tǒng)計專業(yè)統(tǒng)計專業(yè)男1310女720為了分析主修統(tǒng)計專業(yè)是否與性別有關,依據(jù)表中的數(shù)據(jù),得到χ2=eq\f(5013×20-10×72,23×27×20×30)≈4.84,所以斷定主修統(tǒng)計專業(yè)與性別有關系,這種推斷出錯的可能性為()A.0.025 B.0.05C.0.975 D.0.95解析:選B∵χ2≈4.84>3.841,所以我們有95%的把握認為主修統(tǒng)計專業(yè)與性別無關,即推斷出錯的可能性為0.05.4.已知P(x2≥2.706)=0.10,兩個因素X和Y,取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)分別是a=10,b=21,c+d=35.若在犯錯誤的概率不超過0.1的前提下,認為X與Y有關系,則c等于()A.5 B.6C.7 D.8解析:選A經(jīng)分析,c=5.二、填空題5.班級與成果2×2列聯(lián)表:優(yōu)秀不優(yōu)秀總計甲班103545乙班738p總計mnq表中數(shù)據(jù)m,n,p,q的值應分別為________.解析:m=10+7=17,n=35+38=73,p=7+38=45,q=m+n=90.答案:17,73,45,906.在吸煙與患肺病是否相關的推斷中,有下面的說法:①若χ2>6.64,則在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系,那么在100個吸煙的人中必有99人患有肺病;②從獨立性分析可知在犯錯誤的概率不超過0.01的前提下,認為吸煙與患肺病有關系時,若某人吸煙,則他有99%的可能患有肺??;③從獨立性分析可知在犯錯誤的概率不超過0.05的前提下,認為吸煙與患肺病有關系時,是指有5%的可能性使得推斷錯誤.其中說法正確的是________.解析:χ2是檢驗吸煙與患肺病相關程度的量,是相關關系,而不是確定關系,是反映有關和無關的概率,故說法①不正確;說法②中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說明③正確.答案:③7.統(tǒng)計推斷,當________時,在犯錯誤的概率不超過0.05的前提下認為事務A與B有關;當________時,認為沒有充分的證據(jù)顯示事務A與B是有關的.解析:當k>3.841時,就有在犯錯誤的概率不超過0.05的前提下認為事務A與B有關,當k<2.706時認為沒有充分的證據(jù)顯示事務A與B是有關的.答案:k>3.841k<2.7068.某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機抽取了100名電視觀眾,相關的數(shù)據(jù)如下表所示:文藝節(jié)目新聞節(jié)目總計20至40歲 401858大于40歲152742總計5545100由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關:________(填“是”或“否”).解析:因為在20至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而大于40歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即eq\f(b,a+b)=eq\f(18,58),eq\f(d,c+d)=eq\f(27,42),兩者相差較大,所以,經(jīng)直觀分析,收看新聞節(jié)目的觀眾與年齡是有關的.答案:是三、解答題9.某市對該市一重點中學2024年高考上線狀況進行統(tǒng)計,隨機抽查得到表格:語文數(shù)學英語綜合科目上線不上線上線不上線上線不上線上線不上線總分上線201人17427178231762517526總分不上線43人3013232024192617總計2044020

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論