版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.3.2獨立性檢驗
第八章
成對數(shù)據(jù)的統(tǒng)計分析
前情回顧02×2列聯(lián)表合
計合計+等高堆積條形圖因為是百分比,所以總高相等,各顏色代表的分類的頻率大小也容易比較.2×2列聯(lián)表給出了成對分類變量數(shù)據(jù)的交叉分類頻數(shù).判斷兩個分類變量之間是否具有關(guān)聯(lián)性的三種方法圖形分析法頻率分析法條件概率法學(xué)習(xí)目標123
了解2×2列聯(lián)表獨立性檢驗及其應(yīng)用.
結(jié)合具體實例,掌握隨機變量χ2的含義及其應(yīng)用.
理解獨立性檢驗的基本思想及解題步驟,并解決實際問題.0新課引入0例題回顧:例1試分析兩校學(xué)生中數(shù)學(xué)成績優(yōu)秀率之間是否存在差異?由2×2列聯(lián)表得:學(xué)校數(shù)學(xué)成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788乙校優(yōu)秀的頻率:
甲校不優(yōu)秀頻率:甲校優(yōu)秀的頻率:
乙校
不優(yōu)秀頻率:可以認為兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異,甲校學(xué)生的數(shù)學(xué)成績優(yōu)秀率比乙校學(xué)生的高.
新課引入0本節(jié)將要學(xué)習(xí)的獨立性檢驗方法為我們提供了解決這類問題的方案.思考:你認為“兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異”這一結(jié)論是否有可能是錯誤的?
這一結(jié)論有可能是錯誤的:對于隨機樣本而言,因為頻率具有隨機性,頻率與概率之間存在誤差,所以我們的推斷可能犯錯誤,而且在樣本容量較小時,犯錯誤的可能性會較大.
因此,需要找到一種更為合理的推斷方法判斷兩變量之間有無關(guān)系,同時也希望能對出現(xiàn)錯誤推斷的概率有一定的控制或估算.讀教材0閱讀課本P128-P132,5分鐘后完成下列問題:1.分類變量X與Y獨立性檢驗中的零假設(shè)H0是什么?我們一起來探究“獨立性檢驗”吧!
010302目錄1獨立性檢驗與統(tǒng)計量χ2
學(xué)習(xí)過程2題型訓(xùn)練1新知探究思考1
你知道法官是如何憑證據(jù)進行判案的嗎?先做一個無罪假設(shè)找無罪假設(shè)下不可能出現(xiàn)的物證和人證。找到了,假設(shè)不成立,嫌疑人有罪。沒找到,沒有充分證據(jù)證明假設(shè)不成立,暫且認為無罪。零假設(shè):假設(shè)X,Y相互獨立,無關(guān)聯(lián)。找零假設(shè)下不可能發(fā)生的事件。(利用小概率原理)發(fā)生了,假設(shè)不成立,X,Y不獨立,從而證明二者有關(guān)聯(lián)。沒發(fā)生,沒有充分證據(jù)證明假設(shè)不成立,暫且認為X,Y相互獨立。類比思考2
我們是否可以類比法官判案的方式去判斷兩個分類變量X,Y是否有關(guān)聯(lián)?反證法1新知探究探究1
如何從概率的角度去研究兩個分類變量X和Y是否有關(guān)?陪審團審判裁決實際情況無罪有罪無罪正確錯誤有罪錯誤正確假設(shè)檢驗就好像一場審判過程,有兩類錯誤:結(jié)論H0實際為真H0實際為假判斷接受H0正確判斷“取偽”錯誤判斷拒絕H0“棄真”錯誤正確判斷α與β呈反比關(guān)系第一類錯誤,發(fā)生概率為α第二類錯誤,發(fā)生概率為β假設(shè)檢驗可能犯錯,但犯錯概率可控,下面探究如何進行假設(shè)檢驗(獨立性檢驗)。1新知探究探究1
如何從概率的角度去研究兩個分類變量X和Y是否有關(guān)?合
計合計+零假設(shè)H0:分類變量X與Y獨立
事件{X=0},{X=1},{Y=0},{Y=1}相互獨立,即分類變量X和Y相互獨立.對于隨機樣本,表中的頻數(shù)a,b,c,d都是隨機變量,而表中的相應(yīng)數(shù)據(jù)是這些隨機變量的一次觀測結(jié)果.A與B相互獨立
P(AB)=P(A)P(B)1新知探究探究1
如何從概率的角度去研究兩個分類變量X和Y是否有關(guān)?合
計合計+1新知探究探究1
如何從概率的角度去研究兩個分類變量X和Y是否有關(guān)?
合
計合計n=+(依據(jù)頻率穩(wěn)定于概率的原理){X=0,Y=0}發(fā)生的頻數(shù)的期望值為1新知探究探究1
如何從概率的角度去研究兩個分類變量X和Y是否有關(guān)?事件觀測值期望值觀測值與期望值差X=0,Y=0aX=0,Y=1bX=1,Y=0cX=1,Y=1d殘差零假設(shè)H0:分類變量X與Y獨立如果零假設(shè)H0
成立,下面四個量的取值都不應(yīng)該太大:
反之,這些量取值較大時,就可以推斷H0不成立。1新知探究如果零假設(shè)H0
成立,下面四個量的取值都不應(yīng)該太大:反之,這些量取值較大時,就可以推斷H0不成立。顯然,分別考慮四個差的絕對值很困難;我們需要找到一個既合理又能夠計算分布的統(tǒng)計量,來推斷是否成立.一般來說,若頻數(shù)的期望值較大,則上式中相應(yīng)的差的絕對值也會較大;而若頻數(shù)的期望值較小,則上式中相應(yīng)的差的絕對值也會較?。疄榱撕侠淼仄胶膺@種影響,我們將四個差的絕對值取平方后分別除以相應(yīng)的期望值再求和,得到如下的統(tǒng)計量:1新知1--獨立性檢驗與統(tǒng)計量χ2
獨立性檢驗與統(tǒng)計量χ2
卡方統(tǒng)計量:χ2統(tǒng)計學(xué)家建議,用隨機變量
χ2取值
的大小作為判斷零假設(shè)H0是否成立的依據(jù):
合
計合計n=+1新知探究思考1
那么,究竟
χ2大到什么程度,可以推斷H0不成立呢?
P(χ2≥xα)=α
1新知探究思考2
如何根據(jù)χ2觀測值大小推斷兩個分類變量是否有關(guān)?α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
P(χ2≥xα)=α
1新知探究思考3
如何看下面的表格呢?α0.10.050.010.0050.001xα2.7063.8416.6357.87910.828
P(χ2≥xα)=α
注:χ2越小,獨立性越強,相關(guān)性越弱;χ2越大,獨立性越弱,相關(guān)性越強.
學(xué)以致用
學(xué)校數(shù)學(xué)成績合計不優(yōu)秀(Y=0)優(yōu)秀(Y=1)甲校(X=0)331043乙校(X=1)38745合計711788解:零假設(shè)為
H0:分類變量X與Y相互獨立,即兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率無差異.
對比思考例1:都是基于同一組數(shù)據(jù)的分析,但卻得出了不同的結(jié)論,你能說明其中的原因嗎?
如前所述,法一只是根據(jù)一個樣本的兩個頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異的結(jié)論,并沒有考慮由樣本隨機性可能導(dǎo)致的錯誤,所以那里的推斷依據(jù)不太充分.在法二中,我們用χ2獨立性檢驗對零假設(shè)H0進行了檢驗.通過計算,發(fā)現(xiàn)χ2≈0.837小于α=0.1所對應(yīng)的臨界值2.706,因此認為沒有充分證據(jù)推斷H0不成立,所以接受H0,推斷出校的數(shù)學(xué)成績優(yōu)秀率沒有差異的結(jié)論。這個檢驗結(jié)果意味著,抽樣數(shù)據(jù)中兩個頻率的差異很有可能是由樣本隨機性導(dǎo)致的.因此,只根據(jù)頻率的差異得出兩校學(xué)生的數(shù)學(xué)成績優(yōu)秀率存在差異的結(jié)論是不可靠的.由此可見,相對于簡單比較兩個頻率的推斷:用χ2獨立性檢驗得到的結(jié)果更理性、更全面,理論依據(jù)也更充分.學(xué)以致用例2某人寒假期間對其30位親屬的飲食習(xí)慣進行了一次調(diào)查,列出了如下2×2列聯(lián)表:年齡飲食習(xí)慣合計偏愛蔬菜偏愛肉類50歲以下481250歲以上16218合計201030則可以說其親屬的飲食習(xí)慣與年齡有關(guān)的把握為()A.95%B.99% C.99.5%D.99.9%C所以有99.5%的把握認為其親屬的飲食習(xí)慣與年齡有關(guān).學(xué)以致用例3下表是某屆某校本科志愿報名時,對其中304名學(xué)生進入高校時是否知道
想學(xué)專業(yè)的調(diào)查表:
知道想學(xué)專業(yè)不知道想學(xué)專業(yè)合計男生63117180女生4282124合計105199304則下列說法正確的是____.(填序號)①性別與知道想學(xué)專業(yè)有關(guān);②性別與知道想學(xué)專業(yè)無關(guān);③女生比男生更易知道所學(xué)專業(yè).②所以性別與知道想學(xué)專業(yè)無關(guān).
用χ2進行“相關(guān)的檢驗”步驟:學(xué)習(xí)過程
010302目錄1獨立性檢驗與統(tǒng)計量χ2
學(xué)習(xí)過程2題型訓(xùn)練2例1某校對學(xué)生課外活動進行調(diào)查,結(jié)果整理成下表:試根據(jù)小概率值α=0.005的獨立性檢驗,分析喜歡體育還是文娛與性別是否有關(guān)系?題型1--
有關(guān)“相關(guān)性的檢驗”性別喜歡合計體育文娛男生212344女生62935合計275279解:零假設(shè)為H0:喜歡體育還是喜歡文娛與性別沒有關(guān)系.∵a=21,b=23,c=6,d=29,n=79,根據(jù)小概率值α=0.005的獨立性檢驗,我們推斷H0不成立,即認為喜歡體育還是喜歡文娛與性別有關(guān).2例2某班主任對全班50名學(xué)生進行了作業(yè)量的調(diào)查,數(shù)據(jù)如下表:
題型1--
有關(guān)“相關(guān)性的檢驗”
性別作業(yè)量合計大不大男生18927女生81523合計262450則推斷“學(xué)生的性別與認為作業(yè)量大有關(guān)”這種推斷犯錯誤的概率不超過(
)A.0.01B.0.005C.0.05D.0.001C∴犯錯誤的概率不超過0.05.2例3某銷售部門為了研究具有相關(guān)大學(xué)學(xué)歷和能按時完成銷售任務(wù)的關(guān)系,對本部門200名銷售人員進行調(diào)查,所得數(shù)據(jù)如下表所示:題型1--
有關(guān)“相關(guān)性的檢驗”
能按時完成銷售任務(wù)不能按時完成銷售任務(wù)合計具有相關(guān)大學(xué)學(xué)歷574299不具有相關(guān)大學(xué)學(xué)歷3665101合計93107200根據(jù)上述數(shù)據(jù)能得出結(jié)論:有_____以上的把握認為“銷售人員具有相關(guān)大學(xué)學(xué)歷與能按時完成銷售任務(wù)是有關(guān)系的”.99%則有99%以上的把握認為:“銷售人員具有相關(guān)大學(xué)學(xué)歷與能按時完成銷售任務(wù)是有關(guān)系的”.因為9.67>6.635=x0.01,2例4某省進行高中新課程改革,為了解教師對新課程教學(xué)模式的使用情況,對某學(xué)校的教師關(guān)于新課程教學(xué)模式的使用情況進行了問卷調(diào)查,建立了一個2×2列聯(lián)表:
題型2--有關(guān)“無關(guān)的檢驗”
教師年齡對新課程教學(xué)模式合計贊同不贊同老教師101020青年教師24630合計341650根據(jù)小概率值α=0.01的獨立性檢驗,分析對新課程教學(xué)模式的贊同情況與教師年齡是否有關(guān)系?解:零假設(shè)為H0:對新課程教學(xué)模式的贊同情況與教師年齡無關(guān).根據(jù)小概率值α=0.01的獨立性檢驗,沒有充分證據(jù)推斷H0不成立,即認為對新課程教學(xué)模式的贊同情況與教師年齡無關(guān).≈4.963<6.635=x0.01,2例5考察棉花種子處理情況跟生病之間的關(guān)系得到下表數(shù)據(jù):B題型2--有關(guān)“無關(guān)的檢驗”種子種子合計處理未處理得病32101133不得病61213274合計93314407根據(jù)以上數(shù)據(jù),可得出(
)A.種子是否經(jīng)過處理跟生病有關(guān)
B.種子是否經(jīng)過處理跟生病無關(guān)C.種子是否經(jīng)過處理決定是否生
D.以上都是錯誤的即超過99%的把握認為種子是否經(jīng)過處理跟生病無關(guān).≈0.164<2.706=x0.1,2例6為考察某種藥物A對預(yù)防疾病B的效果,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)會計考核試題及答案
- 醫(yī)院護理“三基”測試題含答案
- 針灸學(xué)試題和答案文庫
- 二級建造師繼續(xù)教育試題及標準答案
- 中級職務(wù)水平能力測試(建筑施工)經(jīng)典試題及答案一
- 電信轉(zhuǎn)正考試題及答案
- 《公共營養(yǎng)師》三級練習(xí)題庫含答案
- 房地產(chǎn)經(jīng)紀業(yè)務(wù)操作《存量房房源管理考試題》模擬練習(xí)卷含答案
- 上海市徐匯區(qū)社區(qū)網(wǎng)格工作人員考試題庫及答案
- 交通標志考試試題及答案
- 基底節(jié)出血的護理查房
- 金華東陽市國有企業(yè)招聘A類工作人員筆試真題2024
- 2025年6月29日貴州省政府辦公廳遴選筆試真題及答案解析
- 管培生培訓(xùn)課件
- 送貨方案模板(3篇)
- 2025年湖南省中考數(shù)學(xué)真題試卷及答案解析
- 學(xué)前教育論文格式模板
- DB32/T 3518-2019西蘭花速凍技術(shù)規(guī)程
- 架空輸電線路建設(shè)關(guān)鍵環(huán)節(jié)的質(zhì)量控制與驗收標準
- 裝修敲打搬運合同協(xié)議書
- 《世界經(jīng)濟史學(xué)》課件
評論
0/150
提交評論