高二數(shù)學(xué)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》課件_第1頁
高二數(shù)學(xué)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》課件_第2頁
高二數(shù)學(xué)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》課件_第3頁
高二數(shù)學(xué)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》課件_第4頁
高二數(shù)學(xué)《獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用》課件_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

獨(dú)立性檢驗(yàn)的基本思想及其初步應(yīng)用高二年級數(shù)學(xué)

某地方法院判定某煙草公司向一位女士賠償236億美元.因?yàn)檫@位女士的丈夫,長期抽煙,最終36歲就因肺癌死亡.法院是依據(jù)什么對這個案件進(jìn)行的判決呢?身高溫度考試成績性別興趣商品質(zhì)量等級結(jié)合以往我們學(xué)習(xí)統(tǒng)計(jì)的經(jīng)驗(yàn),對于吸煙與患肺癌這個具體案例,首先要進(jìn)行數(shù)據(jù)搜集,根據(jù)這個問題的特點(diǎn),我們都需要搜集哪些數(shù)據(jù)呢?由吸煙與患肺癌這兩個分類變量的取值特征,我們需要得到吸煙的樣本人數(shù),患肺癌的樣本人數(shù),吸煙且患肺癌的樣本人數(shù),吸煙且沒有患肺癌的樣本人數(shù),不吸煙且患肺癌的樣本人數(shù),不吸煙且不患肺癌的樣本人數(shù)等.探究問題一對于分類變量的樣本數(shù)據(jù),根據(jù)以往處理統(tǒng)計(jì)數(shù)據(jù)的經(jīng)驗(yàn),我們要如何用表格進(jìn)行整理呢?為研究吸煙是否對患肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)

吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965那么,吸煙是否對患肺癌有影響呢?依據(jù)兩個分類變量的取值,列出的頻數(shù)分布表我們稱為2×2列聯(lián)表列分類(Y)合計(jì)未發(fā)生數(shù)(y1)發(fā)生數(shù)(y2)行分類(X)甲(x1)aba+b乙(x2)cdc+d合計(jì)a+cb+da+b+c+d為研究吸煙是否對肺癌有影響,某腫瘤研究所隨機(jī)地調(diào)查了9965人,得到如下結(jié)果(單位:人)

吸煙與肺癌列聯(lián)表不患肺癌患肺癌總計(jì)不吸煙7775427817吸煙2099492148總計(jì)9874919965在不吸煙樣本中,患肺癌的有在吸煙樣本中,患肺癌的有

吸煙群體和不吸煙群體患肺癌的可能性存在差異.等高條形圖與表格相比,圖形更能直觀的反映出兩個分類變量間是否相互影響,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征.不患肺癌患肺癌總計(jì)不吸煙1吸煙177757817≈99.46%20992148≈97.72%427817≈0.54%492148≈2.28%通過計(jì)算樣本頻率以及觀察等高條形圖,我們得到直觀判斷是“吸煙與患肺癌有關(guān)”,那么這種判斷是否可靠呢?也就是,當(dāng)把這組樣本數(shù)據(jù)的分析結(jié)果放到總體中時(shí),我們有多大的把握判斷“吸煙與患肺癌有關(guān)”呢?在利用回歸分析研究定量變量時(shí),我們通過最小二乘法構(gòu)建了回歸直線方程的系數(shù)公式,又通過構(gòu)建殘差這個統(tǒng)計(jì)量分析樣本對總體的擬合效果.探究問題二類比回歸分析,在研究吸煙是否對患肺癌有影響這個問題時(shí),我們同樣需要考慮,利用樣本數(shù)據(jù)構(gòu)建一個什么樣的統(tǒng)計(jì)量來刻畫總體的情況?我們假設(shè)吸煙與患肺癌之間沒有關(guān)系(即吸煙與患肺癌之間是相互獨(dú)立的),且用事件A表示不吸煙,事件B表示不患肺癌.

不患肺癌患肺癌總計(jì)不吸煙aba+b吸煙cdc+d總計(jì)a+cb+da+b+c+d|ad-bc|越小,說明吸煙與患肺癌之間關(guān)系越弱;|ad-bc|越大,說明吸煙與患肺癌之間關(guān)系越強(qiáng).為了能夠更清楚的說明,我們將列聯(lián)表中的數(shù)據(jù)抽象為字母,以表示隨機(jī)樣本中的頻數(shù).并假設(shè)H0:吸煙與患肺癌之間沒有關(guān)系(即吸煙與患肺癌相互獨(dú)立).成立,

化簡得在H0成立的條件下應(yīng)該有分析至此,可能你會提出這樣的問題:1.只考慮不吸煙且不患肺癌的情況,不考慮其他情況,可以嗎?2.怎樣衡量越大與越小,有沒有一個量化的標(biāo)準(zhǔn)?數(shù)學(xué)界被譽(yù)為統(tǒng)計(jì)學(xué)之父的英國數(shù)學(xué)家卡爾·皮爾遜(KarlPearson),也遇到了這些問題,怎么解決呢?解決了樣本可以估計(jì)總體了,而且這個統(tǒng)計(jì)量可以通過每個隨機(jī)樣本的數(shù)據(jù)計(jì)算出具體的值.最后我們就要解決如何利用這個值進(jìn)行推斷?探究問題三通過前面對|ad-bc|的分析,我們知道,如果H0:吸煙與患肺癌之間沒有關(guān)系成立,那么K2的取值應(yīng)該很小,通過樣本數(shù)據(jù)求得的K2觀測值k可以推斷什么呢?根據(jù)這個值如何推斷“吸煙與患肺癌有關(guān)”?P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828據(jù)此我們可以根據(jù)K2觀測值k≈56.632對這個問題給出推斷:在犯錯誤的概率不超過0.01的前提下認(rèn)為“吸煙與患肺癌有關(guān)系”.思考若取k0=10.828,你會對這個問題給出推斷嗎?在犯錯誤的概率不超過0.001的前提下認(rèn)為“吸煙與患肺癌有關(guān)系”.P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828k≈56.632用隨機(jī)變量

K2的觀測值k來判斷“兩個分類變量有關(guān)系”的方法稱為兩個分類變量的獨(dú)立性檢驗(yàn).小結(jié):回顧我們分析“吸煙對患肺癌是否有影響”這個案例的過程:我們是如何判斷兩個分類變量是否有關(guān)系?1.提出假設(shè)H0:兩個分類變量沒有關(guān)系;2.寫出2×2列聯(lián)表,并由K2的公式計(jì)算其觀測值k;3.作出推斷:確定臨界值k0,通過觀測值k與k0比較作出判斷;(1)若k≥k0,認(rèn)為k很大,推斷H0不成立,從而有[1-P(K2≥k0)]×100%的把握認(rèn)為“兩個分類變量有關(guān)系”,即:在犯錯誤的概率不超過P(K2≥k0)的前提下認(rèn)為“兩個分類變量有關(guān)系”;(2)若k<k0,認(rèn)為k很小,無法拒絕H0,即:樣本觀測數(shù)據(jù)沒有足夠證據(jù)證明“兩個分類變量有關(guān)系”.反證法獨(dú)立性檢驗(yàn)要證明結(jié)論A要確認(rèn)H1:“兩個分類變量之間有關(guān)系”成立假設(shè)A不成立的前提下進(jìn)行推理假設(shè)H0:“兩個分類變量之間沒有關(guān)系”成立的條件下進(jìn)行推理推出矛盾,意味著結(jié)論A成立推出小概率事件發(fā)生,意味著H1成立的可能性大,(且該推斷犯錯誤的概率不超過這個小概率)沒有找到矛盾,意味著不能確定A成立沒有推出小概率事件發(fā)生,意味著不能確定H1成立探究問題四反證法原理與獨(dú)立性檢驗(yàn)原理有哪些異同?探究問題五直觀判斷與獨(dú)立性檢驗(yàn)有什么異同?列分類(Y)合計(jì)未發(fā)生數(shù)(y1)發(fā)生數(shù)(y2)行分類(X)甲(x1)aba+b乙(x2)cdc+d

合計(jì)a+cb+da+b+c+d直觀判斷探究問題五直觀判斷與獨(dú)立性檢驗(yàn)有什么異同?直觀判斷獨(dú)立性檢驗(yàn)假設(shè)H0:“兩個分類變量之間沒有關(guān)系”假設(shè)H0:“兩個分類變量之間沒有關(guān)系”利用頻率判斷概率是否相等利用統(tǒng)計(jì)量的觀測值與臨界值比較利用等高條形圖直觀判斷有關(guān)系利用小概率事件發(fā)生給出“判斷有關(guān)系”犯錯誤的概率【例】在某醫(yī)院,因?yàn)榛夹呐K病而住院的665名男性病人中,有214人禿頂,而另外772名不是因?yàn)榛夹呐K病而住院的男性病人中有175人禿頂.(1)利用圖形判斷禿頂與患心臟病是否有關(guān)系;(2)能否在犯錯誤的概率不超過0.01的前提下認(rèn)為禿頂與患心臟病有關(guān)系?患心臟病患其他病總計(jì)禿頂214175389不禿頂4515971048總計(jì)6657721437解:根據(jù)已知的數(shù)據(jù)得到如下的列聯(lián)表:禿頂與患心臟病列聯(lián)表算出禿頂和不禿頂樣本中患心臟病的頻率分別和(1)直觀判斷:因此,在犯錯誤的概率不超過0.01的前提下認(rèn)為禿頂與患心臟病有關(guān)系.P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828(2)獨(dú)立性檢驗(yàn):根據(jù)列聯(lián)表的數(shù)據(jù),可得:對這個問題的結(jié)論我們需要注意以下兩點(diǎn):1.結(jié)論適用的范圍:這個問題的這組數(shù)據(jù)來源于被調(diào)查的醫(yī)院,因此這個結(jié)論只適合被調(diào)查醫(yī)院的住院病人群體;2.犯錯誤概率的含義:犯錯誤的概率不超過0.01,是指把“禿頂與患心臟病沒有關(guān)系”錯誤的推斷為“禿頂與患心臟病有關(guān)系”的概率不超過0.01.【課堂小結(jié)】獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用問題背景分析分類變量2×2列聯(lián)表等高條形圖確定統(tǒng)計(jì)量計(jì)算觀測值圖表分析假設(shè):兩個分類變量沒有關(guān)系確定臨界值統(tǒng)計(jì)推斷直觀判斷課堂練習(xí)1.為考察某種藥物對預(yù)防禽流感的效果,在四個不同的實(shí)驗(yàn)室取相同的個體進(jìn)行動物試驗(yàn),根據(jù)四個實(shí)驗(yàn)室得到的列聯(lián)表畫出如下四個等高條形圖,最能體現(xiàn)該藥物對預(yù)防禽流感有效果的圖形是()AB

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論