獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第1頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第2頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第3頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第4頁(yè)
獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩27頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1.2獨(dú)立性檢驗(yàn)的

基本思想及其初步應(yīng)用案例:某醫(yī)療機(jī)構(gòu)為了了解呼吸道疾病與吸煙是否有關(guān),進(jìn)行了一次抽樣調(diào)查,共調(diào)查了515個(gè)成年人,其中吸煙者220人,不吸煙者295人。調(diào)查結(jié)果:吸煙的220人中有37人患呼吸道疾病,183人未患呼吸道疾病;不吸煙的295人中有21人患病,274人未患病。根據(jù)這些數(shù)據(jù),能否斷定:患呼吸道疾病與吸煙有關(guān)?數(shù)據(jù)整理患病未患病合計(jì)吸煙不吸煙合計(jì)372158183274457220295515問(wèn)題:判斷的標(biāo)準(zhǔn)是什么?吸煙與不吸煙,患病的可能性的大小是否有差異?頻率估計(jì)概率患病未患病合計(jì)(n)吸煙16.82%83.18%100%(220)不吸煙7.12%92.88%100%(295)通過(guò)圖形直觀判斷不患病比例患病比例解決問(wèn)題:直觀方法吸煙的患病率不吸煙的患病率37/220

16.82%21/295

7.12%根據(jù)統(tǒng)計(jì)分析的思想,用頻率估計(jì)概率可知,吸煙者與不吸煙者患病的可能性存在差異。你能有多大把握認(rèn)為“患病與吸煙有關(guān)”呢?一般地,對(duì)于兩個(gè)研究對(duì)象Ⅰ和Ⅱ,Ⅰ有兩類取值,即類A和B(如吸煙與不吸煙);Ⅱ也有兩類取值,即類1和2(如患病與不患?。S谑堑玫较铝新?lián)表所示的抽樣數(shù)據(jù):

類1類2總計(jì)類Aaba+b類Bcdc+d總計(jì)a+cb+da+b+c+d=K2K

2統(tǒng)計(jì)量要推斷“Ⅰ和Ⅱ有關(guān)系”,可按下面的步驟進(jìn)行:(1)提出假設(shè)H0

:Ⅰ和Ⅱ沒(méi)有關(guān)系;(3)查對(duì)臨界值,作出判斷。(2)根據(jù)2×2列聯(lián)表與公式計(jì)算的值;0.50.40.250.150.10.050.0250.010.0050.001ko0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828卡方臨界值表:則有99.9%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;(1)若觀測(cè)值K2>10.828.(3)若觀測(cè)值K2>2.706,(4)若觀測(cè)值K2<2.706,(2)若觀測(cè)值K2>6.635,則有99%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;則有90%的把握認(rèn)為“Ⅰ與Ⅱ有關(guān)系”;則沒(méi)有充分的證據(jù)顯示“Ⅰ與Ⅱ有關(guān)系”例1:為研究不同的給藥方式(口服與注射)和藥的效果(有效和無(wú)效)是否有關(guān),進(jìn)行了相應(yīng)的抽樣調(diào)查,調(diào)查的結(jié)果列在下表中,根據(jù)所選擇的193個(gè)病人的數(shù)據(jù),能否作出藥的效果與給藥方式有關(guān)的結(jié)論?有效無(wú)效合計(jì)口服584098注射643195合計(jì)12271193解:提出假設(shè)

H0:藥的效果與給藥方式無(wú)關(guān)系。根據(jù)列聯(lián)表中的數(shù)據(jù)可以求出:即不能作出藥的效果與給藥方式有關(guān)的結(jié)論。反證法原理與假設(shè)檢驗(yàn)原理反證法原理:在一個(gè)已知假設(shè)下,如果推出一個(gè)矛盾,就證明了這個(gè)假設(shè)不成立。假設(shè)檢驗(yàn)原理:在一個(gè)已知假設(shè)下,如果推出一個(gè)小概率事件發(fā)生,則推斷這個(gè)假設(shè)不成立的可能性很大。【知識(shí)提煉】1.分類變量和列聯(lián)表(1)分類變量變量的不同“值”表示個(gè)體所屬的_________,像這樣的變量稱為分類變量.不同類別(2)列聯(lián)表①定義:列出的兩個(gè)分類變量的_______稱為列聯(lián)表.②2×2列聯(lián)表.一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為頻數(shù)表y1y2總計(jì)x1aba+bx2cdc+d總計(jì)a+cb+da+b+c+d2.等高條形圖(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否_________,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的_________.(2)觀察等高條形圖發(fā)現(xiàn)和相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.相互影響頻率特征3.獨(dú)立性檢驗(yàn)定義利用隨機(jī)變量K2來(lái)判斷“兩個(gè)分類變量有關(guān)系”的方法稱為獨(dú)立性檢驗(yàn)公式

a+b+c+d【即時(shí)小測(cè)】1.思考下列問(wèn)題(1)有人說(shuō):“在犯錯(cuò)誤的概率不超過(guò)0.01的前提下認(rèn)為吸煙和患肺癌有關(guān),是指每100個(gè)吸煙者中就會(huì)有99個(gè)患肺癌的.”你認(rèn)為這種觀點(diǎn)正確嗎?為什么?提示:觀點(diǎn)不正確.犯錯(cuò)誤的概率不超過(guò)0.01說(shuō)明的是吸煙與患肺癌有關(guān)的程度,不是患肺癌的百分?jǐn)?shù).(2)應(yīng)用獨(dú)立性檢驗(yàn)的基本思想對(duì)兩個(gè)變量間的關(guān)系作出的推斷一定是正確的嗎?提示:不一定.所有的推斷只代表一種可能性,不代表具體情況.2.下列變量中不屬于分類變量的是(

)A.性別B.吸煙C.宗教信仰D.國(guó)籍【解析】選B.“吸煙”不是分類變量,“是否吸煙”才是分類變量.故選B.3.在2×2列聯(lián)表中,兩個(gè)比值________相差越大,兩個(gè)分類變量之間的關(guān)系越強(qiáng)(

)【解析】選A.與

相差越大4.下面是2×2列聯(lián)表.y1y2總計(jì)x1332154x2a1346總計(jì)b34則表中a,b處的值應(yīng)為(

)A.33,66B.25,50C.32,67

D.43,56【解析】選A.由2×2列聯(lián)表知a+13=46,所以a=33,又b=a+33,所以b=33+33=66.5.如果在犯錯(cuò)誤的概率不超過(guò)0.05的前提下認(rèn)為事件A和B有關(guān),那么具體算出的數(shù)據(jù)滿足(

)A.K2>3.841B.K2<3.841C.K2>6.635

D.K2<6.635【解析】選A.根據(jù)獨(dú)立性檢驗(yàn)的兩個(gè)臨界值及其與K2大小關(guān)系的意義可知,在犯錯(cuò)誤的概率不超過(guò)0.05的前提下認(rèn)為事件A和B有關(guān)時(shí),統(tǒng)計(jì)量K2>3.841.2.2×2列聯(lián)表(1)2×2列聯(lián)表用于研究?jī)深愖兞恐g是否相互獨(dú)立,它適用于分析兩類變量之間的關(guān)系,是對(duì)兩類變量進(jìn)行獨(dú)立性檢驗(yàn)的基礎(chǔ).(2)表中|ad-bc|越小,兩個(gè)變量之間的關(guān)系越弱;|ad-bc|越大,兩個(gè)變量之間的關(guān)系越強(qiáng).【總結(jié)提升】獨(dú)立性檢驗(yàn)的關(guān)注點(diǎn)獨(dú)立性檢驗(yàn)類似于數(shù)學(xué)中的反證法,要確認(rèn)“兩個(gè)變量有關(guān)系”這一結(jié)論成立的可信度,首先假設(shè)結(jié)論不成立,在假設(shè)下,我們構(gòu)造的統(tǒng)計(jì)量K2應(yīng)該很小.如果由觀測(cè)數(shù)據(jù)計(jì)算得到的K2值很大,則在一定程度上說(shuō)明假設(shè)不合理,再根據(jù)不合理的程度與臨界值的關(guān)系作出判斷.【典例】(12分)(2014·安徽高考)某高校共有15000人,其中男生10500人,女生4500人,為調(diào)查該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的情況,采用分層抽樣的方法,收集300位學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的樣本數(shù)據(jù)(單位:小時(shí))(1)應(yīng)收集多少位女生樣本數(shù)據(jù)?(2)根據(jù)這300個(gè)樣本數(shù)據(jù),得到學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間的頻率分布直方圖(如圖所示),其中樣本數(shù)據(jù)分組區(qū)間為:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估計(jì)該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4個(gè)小時(shí)的概率.(3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4個(gè)小時(shí).請(qǐng)完成每周平均體育運(yùn)動(dòng)時(shí)間與性別的列聯(lián)表,并判斷是否在犯錯(cuò)誤的概率不超過(guò)0.05的前提下認(rèn)為“該校學(xué)生的每周平均體育運(yùn)動(dòng)時(shí)間與性別有關(guān)”.附:K2=P(K2≥k0)0.100.050.0100.005k02.7063.8416.6357.879【規(guī)范解答】(1)300×=90,所以應(yīng)收集90位女生的樣本數(shù)據(jù).(2)由頻率分布直方圖得:1-2×(0.100+0.025)=0.75,所以該校學(xué)生每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4小時(shí)的概率的估計(jì)值為0.75.(3)由(2)知,300為學(xué)生中有300×0.75=225人的每周平均體育運(yùn)動(dòng)時(shí)間超過(guò)4個(gè)小時(shí).75人的每周平均體育運(yùn)動(dòng)時(shí)間不超過(guò)4個(gè)小時(shí).又因?yàn)闃颖緮?shù)據(jù)中有210份是關(guān)于男生的,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論