獨立性檢驗例題ppt課件_第1頁
獨立性檢驗例題ppt課件_第2頁
獨立性檢驗例題ppt課件_第3頁
獨立性檢驗例題ppt課件_第4頁
獨立性檢驗例題ppt課件_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、,1.判斷分類變量及其關系的方法: (1)利用數(shù)形結合思想,借助等高條形圖來判斷兩個分類變量 是否相關是判斷變量相關的常見方法. (2)一般地,在等高條形圖中, 與 相差越大,兩個 分類變量有關系的可能性就越大.,分類變量關系的分析,2.分析分類變量關系的步驟: (1)作大量的調(diào)查、研究,統(tǒng)計出結果. (2)列出列聯(lián)表利用頻率粗略估計. (3)作出等高條形圖,從直觀上進一步判斷分類變量之間的關聯(lián)關系.,通過等高條形圖可以粗略地判斷兩個分類變量是否有關系,但無法精確地給出所得結論的可靠程度.,【例1】從發(fā)生交通事故的司機中抽取2 000名司機作隨機樣本,根據(jù)他們血液中是否含有酒精以及他們是否對事

2、故負有責任將數(shù)據(jù)整理如下: 試分析血液中含有酒精與對事故負有責任是否有關系.,【審題指導】題目已給出了22列聯(lián)表,可利用等高條形圖定性分析兩個分類變量之間的相關性. 【規(guī)范解答】作等高條形圖如下,圖中陰影部分表示有酒精負責任與無酒精負責任的比例,從圖中可以看出,兩者差距較大,由此我們可以在某種程度上認為“血液中含有酒精與對事故負有責任”有關系.,【變式訓練】某學校對在校部分學生課外活動內(nèi)容進行調(diào)查,結果整理成下表: 學生喜歡課外活動的類別與性別有關系嗎?試用學過的知識進行分析.,【解析】作出等高條形圖如下: 由圖可以直觀地看出喜歡體育還是喜歡文娛,在性別上有較大差異,說明學生喜歡課外活動的類別

3、與性別在某種程度上有關系.,有關“相關性檢驗” 解決一般的獨立性檢驗問題的步驟: (1)根據(jù)實際問題的需要確定容許推斷“兩個分類變量有關系”犯錯誤概率的上界,然后查下表確定臨界值k0.,(2)根據(jù)22列聯(lián)表,利用公式 計算隨機變量K2的觀測值k. (3)如果kk0,就推斷“X與Y有關系”,這種推斷犯錯誤的 概率不超過;否則,就認為在犯錯誤的概率不超過的前 提下不能推斷“X與Y有關系”,或者在樣本數(shù)據(jù)中沒有發(fā)現(xiàn) 足夠證據(jù)支持結論“X與Y有關系”.,通常認為k10.828, 所以在犯錯誤的概率不超過0.001的前提下認為“生產(chǎn)合格品 與設備改造有關系”.,【變式訓練】為了調(diào)查患慢性氣管炎是否與吸煙

4、有關,調(diào)查了339名50歲以下的人,調(diào)查結果如下表: 根據(jù)上表分析患慢性氣管炎是否與吸煙有關?,【解析】a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56, b+d=283,n=339 代入公式得K2的觀測值: 7.468 86.635. 所以在犯錯誤的概率不超過0.01的前提下認為“患慢性氣管 炎與吸煙有關”.,【例】為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老年人,結果如下:,(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例; (2)能否在犯錯誤的概率不超過0.01的前提下認為該地區(qū)的老年人是否需要志愿

5、者提供幫助與性別有關? (3)根據(jù)(2)的結論,能否提出更好的調(diào)查方法來估計該地區(qū)的老年人中,需要志愿者提供幫助的老年人的比例?說明理由.,附: 【審題指導】解答第(2)問時,可先計算K2的值,再對照表格作出判斷.,【規(guī)范解答】(1)調(diào)查的500位老年人中有70位需要志愿者提 供幫助,因此該地區(qū)老年人中,需要志愿者提供幫助的老年 人的比例的估計值為 (2) 9.967.由于9.9676.635,所 以在犯錯誤的概率不超過0.01的前提下認為該地區(qū)的老年人 是否需要志愿者提供幫助與性別有關.,(3)由(2)的結論知,該地區(qū)的老年人是否需要志愿者提供幫助與性別有關,并且從樣本數(shù)據(jù)能看出該地區(qū)男性老

6、年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法,這比采用簡單隨機抽樣方法更好.,【變式備選】用兩種檢驗方法對某食品做沙門氏菌檢驗,結果如下表,能否在犯錯誤的概率不超過0.001的前提下認為兩種方法和陽性結果有關系?,【解題提示】由于題目要求“犯錯誤的概率不超過0.001”,故需求解K2的觀測值,再利用臨界值的大小來判斷假設是否成立.,【解析】由等高條形圖(如圖)可知,采用熒光抗體法與檢驗 結果呈陽性有關系,而通過計算可知:,查表可知,P(K210.828)0.001,而113.185遠大于 10.828,所

7、以它們之間有關系的概率大于0.999,也就是說, 在犯錯誤的概率不超過0.001的前提下認為它們之間有關系.,獨立性檢驗的綜合應用 判斷變量X與Y有無關系的三種方法: (1)22列聯(lián)表:由22列聯(lián)表中ad-bc的大小判斷. (2)等高條形圖:觀察條形圖中的陰影比例大小判斷. (3)獨立性檢驗:計算K2的觀測值k,再利用臨界值的大小判斷. 其中獨立性檢驗的方法相對較準確.,【例3】為了調(diào)查某生產(chǎn)線上質(zhì)量監(jiān)督員甲對產(chǎn)品質(zhì)量好壞有無影響,現(xiàn)統(tǒng)計數(shù)據(jù)如下:甲在生產(chǎn)現(xiàn)場時,990件產(chǎn)品中有合格品982件,次品8件;甲不在生產(chǎn)現(xiàn)場時,510件產(chǎn)品中有合格品493件,次品17件.試分別用列聯(lián)表、等高條形圖、

8、獨立性檢驗的方法分析監(jiān)督員甲對產(chǎn)品質(zhì)量好壞有無影響.能否在犯錯誤的概率不超過0.001的前提下,認為質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量有關? 【審題指導】本題要求分別用列聯(lián)表、等高條形圖、獨立性檢驗的方法分析,要注意三種方法的判斷思路.,【規(guī)范解答】(1)22列聯(lián)表如下: 由列聯(lián)表可得ad-bc|=|98217-4938|=12 750. 相差較大,可在某種程度上認為“質(zhì)量監(jiān)督員甲是否在現(xiàn)場與產(chǎn)品質(zhì)量有關系”.,(2)畫等高條形圖. 如圖可知,在某種程度上認為“質(zhì)量監(jiān)督員甲是否在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量有關系”.,(3)由22列聯(lián)表中數(shù)據(jù),計算得到K2的觀測值為 因此,在犯錯誤的概率不超過0.00

9、1的前提下,認為質(zhì)量監(jiān) 督員甲在不在生產(chǎn)現(xiàn)場與產(chǎn)品質(zhì)量好壞有關系.,【互動探究】將本題中的產(chǎn)品質(zhì)量問題改為成績優(yōu)秀問題. 某校高三年級在一次全年級的大型考試中,數(shù)學成績優(yōu)秀和非優(yōu)秀的學生中物理、化學、總分也為優(yōu)秀的人數(shù)如下表所示,則數(shù)學成績優(yōu)秀分別與物理、化學、總分也優(yōu)秀哪個關系較大? 注:該年級此次考試中數(shù)學成績優(yōu)秀的有360人,非優(yōu)秀的有880人.,【解析】(1)列出數(shù)學與物理優(yōu)秀的22列聯(lián)表 將表中數(shù)據(jù)代入公式 得觀測值k1270.114 3.,(2)列出數(shù)學與化學優(yōu)秀的22列聯(lián)表 將表中數(shù)據(jù)代入公式計算得觀測值 k2240.611 2.,(3)列出數(shù)學與總分優(yōu)秀的22列聯(lián)表: 將表中數(shù)

10、據(jù)代入公式計算得觀測值 k3486.122 5.,由上面分析可知,數(shù)學成績優(yōu)秀分別與物理、化學、總分優(yōu)秀都有關系,經(jīng)計算觀測值都大于6.635,說明在犯錯誤的概率不超過0.01的前提下,認為數(shù)學優(yōu)秀分別與物理、化學、總分優(yōu)秀都有關系,k3k1k2,與總分關系最大,物理次之.,【典例】(12分)(1)下表是某地區(qū)的一種傳染病與飲用水的 調(diào)查表: 這種傳染病是否與飲用水的衛(wèi)生程度有關,請說明理由;,(2)若飲用干凈水得病5人,不得病50人,飲用不干凈水得病9人,不得病22人.按此樣本數(shù)據(jù)分析這種疾病是否與飲用水有關,并比較兩種樣本在反映總體時的差異. 【審題指導】(1)根據(jù)表中的信息計算K2的觀測

11、值,并根據(jù)臨界值表來分析相關性的大小,對于(2)要列出22列聯(lián)表,方法同(1).,【規(guī)范解答】(1)假設H0:傳染病與飲用水無關.把表中數(shù)據(jù)代入公式得: K2的觀測值 54.21, 3分 54.2110.828,所以拒絕H0. 因此在犯錯誤的概率不超過0.001的前提下認為該地區(qū)這種傳染病與飲用不干凈水有關. 5分,(2)依題意得22列聯(lián)表: 此時,K2的觀測值 5.785. 9分 由于5.7852.706 所以在犯錯誤的概率不超過0.1的前提下認為該種疾病與飲用 不干凈水有關. 10分,兩個樣本都能統(tǒng)計得到傳染病與飲用不干凈水有關這一相同結論,但(1)中在犯錯誤的概率不超過0.001的前提下

12、肯定結論的正確性,(2)中在犯錯誤的概率不超過0.1的前提下肯定結論的正確性. 12分,【誤區(qū)警示】對解答本題時易犯錯誤具體分析如下:,【即時訓練】某高?!敖y(tǒng)計初步”課程的教師隨機調(diào)查了一些學生的專業(yè)情況,得到如下22列聯(lián)表(單位:名): 為了判斷主修統(tǒng)計專業(yè)是否與性別有關系,根據(jù)表中的數(shù)據(jù)計算得到K2的觀測值k4.84.因為k3.841,所以認為“主修統(tǒng)計專業(yè)與性別有關系”.這種判斷出錯的可能性為_.,【解析】由k4.84,可知我們有95%的把握認為“主修統(tǒng)計專業(yè)與性別有關系”,故判斷出錯的可能性為5%. 答案:5%,1.在研究吸煙與患肺癌的關系中,通過收集數(shù)據(jù)、整理分析數(shù)據(jù)得“吸煙與患肺癌

13、有關”的結論,并且在犯錯誤的概率不超過0.01的前提下認為這個結論是成立的,下列說法中正確的是( ) (A)100個吸煙者中至少有99人患有肺癌 (B)1個人吸煙,那么這個人有99%的概率患有肺癌 (C)在100個吸煙者中一定有患肺癌的人 (D)在100個吸煙者中可能一個患肺癌的人也沒有,【解析】選D.獨立性檢驗的結果與實際問題有差異,即獨立性檢驗的結論是一個數(shù)學統(tǒng)計量,它與實際問題中的確定性存在差異.,2.分類變量X和Y的列聯(lián)表如下,則( ) (A)ad-bc越小,說明X與Y的關系越弱 (B)ad-bc越大,說明X與Y的關系越強 (C)(ad-bc)2越大,說明X與Y的關系越強 (D)(ad-bc)2越接近于0,說明X與Y的關系越強,【解析】選C.由K2的計算公式可知,(ad-bc)2越大,則K2越大,故相關關系越強.,3.若由一個22列聯(lián)表中的數(shù)據(jù)計算得K24.013,則兩個變量有關系的概率為_. 【解析】因隨機變量K2的觀測值k=4.0133.841.所以在犯錯誤的概率不超過0.05的前提下,認為兩個變量有關系. 答案:0.95,4.根據(jù)下表計算k_. 【解析】根據(jù)列聯(lián)表中的數(shù)據(jù)得K2的觀測值 1.78. 答案:1.78,5.運動員參加比賽前往往做熱身運動,下表是一體育

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論