版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
PAGE統(tǒng)計(jì)案例復(fù)習(xí)教案一、本章知識(shí)脈絡(luò):統(tǒng)計(jì)案例統(tǒng)計(jì)案例回歸分析樣本點(diǎn)的中心隨機(jī)誤差殘差分析建立回歸模型的基本步驟回歸分析列聯(lián)表K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))判斷結(jié)論成立可能性的步驟二、本章要點(diǎn)追蹤:1.樣本點(diǎn)的中心(eq\O(x,\s\up8(-)),eq\O(y,\s\up8(-)))其中eq\O(x,\s\up8(-))=eq\f(1,n)eq\s\di(n,∑,i=1)xi,eq\O(y,\s\up8(-))=eq\s\di(n,∑,i=1)yi.2.線性回歸模型的完美表達(dá)式eq\b\lc\{(\a\vs2(y=bx+a+e,E(e)=0,D(e)=σ2))3.類比樣本方差估計(jì)總體方差的思想,可以用eq\O(σ2,\s\up8(∧))=eq\f(1,n-2)eq\s\di(n,∑,i=1)eq\O(e2,\s\up8(∧))i=eq\f(1,n-2)Q(eq\O(a,\s\up8(∧)),eq\O(b,\s\up8(∧)))(n>2)作為σ2的估計(jì)量其中eq\O(a,\s\up8(∧))=eq\O(y,\s\up8(-))-eq\O(b,\s\up8(∧))eq\O(x,\s\up8(-))eq\O(b,\s\up8(∧))=eq\f(eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))(yi-eq\O(y,\s\up8(-))),eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))2)4.我們可以用相關(guān)指數(shù)R2來(lái)刻畫回歸的效果,其計(jì)算公式是:R2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(-)))2)R2取值越大,意味著殘差平方和越小,也就是說(shuō)模型的擬合效果越好.5.建立回歸模型的基本步驟:(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量;(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等);(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+x);(4)按一定規(guī)則估計(jì)回歸方程中的參數(shù)(如最小二乘法);(5)得出結(jié)果后分析殘差圖是否有異常(個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等等),若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。6.作K2來(lái)確定結(jié)論“X與Y有關(guān)系”的可信程度.三、幾個(gè)典型例題:例1某地區(qū)10名健康兒童頭發(fā)和全血中的硒含量(1000ppm)如下,血硒74668869917366965873發(fā)硒13101311169714510(1)畫出散點(diǎn)圖;(2)求回歸方程;(3)如果某名健康兒童的血硒含量為94(1000ppm)預(yù)測(cè)他的發(fā)硒含量.解(1)散點(diǎn)圖如下圖所示:(2)利用計(jì)算器或計(jì)算機(jī),求得回歸方程:eq\O(y,\s\up8(∧))=0.2358x-6.9803(3)當(dāng)x=94時(shí),eq\O(y,\s\up8(∧))≈15.2因此,當(dāng)兒童的血硒含量為94(1000ppm)時(shí),該兒童的發(fā)硒含量約為15.2(1000ppm).某地大氣中氰化物測(cè)定結(jié)果如下:污染源距離50100150200250300400500氰化物濃度0.6870.3980.2000.1210.090.050.020.01(1)試建立氰化物濃度與距離之間的回歸方程.(2)求相關(guān)指數(shù).(3)作出殘差圖,并求殘差平方和解析(1)選取污染源距離為變量x,氰化物濃度為自因變量y作散點(diǎn)圖.從表中所給的數(shù)據(jù)可以看出,氰化物濃度與距離有負(fù)的相關(guān)關(guān)系,用非線性回歸方程來(lái)擬合,建立y關(guān)于x的指數(shù)回歸方程.eq\O(y,\s\up8(∧))=0.9293e-0.0094x(2)相關(guān)指數(shù)K2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(y,\s\up8(∧)))2)=0.9915(3)編號(hào)12345678污染源距離50100150200250300400500氰化物濃度0.6870.3980.20.1210.090.050.020.01殘差0.10618570.035-0.027-0.0210.0014-0.005-0.0020.0015殘差平方和eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2=0.0118例3某大型企業(yè)人力資源部為了研究企業(yè)員工工作積極性和對(duì)待企業(yè)改革態(tài)度的關(guān)系,隨機(jī)制取了189名員工進(jìn)行調(diào)查,所得數(shù)據(jù)如下表所示:積極支持企業(yè)改革不太造成企業(yè)改革合計(jì)工作積極544094工作一般326395合計(jì)86103189對(duì)于人力資源部的研究項(xiàng)目,根據(jù)上述數(shù)據(jù)能得出什么結(jié)論?解:根據(jù)列聯(lián)表中的數(shù)據(jù),得到K2=eq\f(189×(54×63-40×32)2,94×95×86×103)=10.76.因?yàn)?0.76>6.635,所以有99%的把握說(shuō):?jiǎn)T工“工作積極”與“積極支持企業(yè)改革”是有關(guān)的,可以認(rèn)為企業(yè)的全體員工對(duì)待企業(yè)改革的態(tài)度與其工作積極性是有關(guān)的.例4有人統(tǒng)計(jì)了同一個(gè)省的6個(gè)城市某一年的人均國(guó)內(nèi)生產(chǎn)總值(即人均GDP)和這一年各城市患白血病的兒童數(shù)量,如下表:人均GDP(萬(wàn)元)1086431患白血病的兒童數(shù)351312207175132180(1)畫出散點(diǎn)圖;(2)求對(duì)的回歸直線方程;(3)如果這個(gè)省的某一城市同時(shí)期年人均GDP為12萬(wàn)元,估計(jì)這個(gè)城市一年患白血病的兒童數(shù)目;分析:利用公式分別求出的值,即可確定回歸直線方程,然后再進(jìn)行預(yù)測(cè).16題圖解:(1)作與對(duì)應(yīng)的散點(diǎn)圖,如右圖所示;16題圖(2)計(jì)算得,∴,,∴對(duì)的回歸直線方程是;(3)將代入得,估計(jì)這個(gè)城市一年患白血病的兒童數(shù)目約為381.評(píng)注:本題涉及的是一個(gè)和我們生活息息相關(guān),也是一個(gè)愈來(lái)愈嚴(yán)峻的問(wèn)題——環(huán)保問(wèn)題.本題告訴了我們一個(gè)沉痛的事實(shí):現(xiàn)如今,一個(gè)城市愈發(fā)達(dá),這個(gè)城市患白血病的兒童愈多.原因在于,城市的經(jīng)濟(jì)發(fā)展大都以犧牲環(huán)境為代價(jià)的,經(jīng)濟(jì)發(fā)展造成了大面積的環(huán)境污染,空氣、水源中含有的大量的有害物質(zhì)是導(dǎo)致白血病患者增多的罪魁禍?zhǔn)祝?,我們一定要增?qiáng)自我保護(hù)意識(shí)和環(huán)境保護(hù)意識(shí).例5寒假中,某同學(xué)為組織一次愛(ài)心捐款,于2008年天數(shù)1234567人數(shù)711212466115325(1)作出散點(diǎn)圖,并猜測(cè)與之間的關(guān)系;(2)建立與的關(guān)系,預(yù)報(bào)回歸模型并計(jì)算殘差;(3)如果此人打算在2008年2月12日(即帖子傳播時(shí)間共10天)進(jìn)行募捐活動(dòng),根據(jù)上述回歸模型,估計(jì)可去多少人.分析:先通過(guò)散點(diǎn)圖,看二者是否具有線性相關(guān)關(guān)系,若不具有,可通過(guò)相關(guān)函數(shù)變換,轉(zhuǎn)化為線性相關(guān)關(guān)系.解:(1)散點(diǎn)圖略.從散點(diǎn)圖可以看出與不具有線性相關(guān)關(guān)系,同時(shí)可發(fā)現(xiàn)樣本點(diǎn)分布在某一個(gè)指數(shù)函數(shù)曲線的周圍,其中是參數(shù);(2)對(duì)兩邊取對(duì)數(shù),把指數(shù)關(guān)系變成線性關(guān)系.令,則變換后的樣本點(diǎn)分布在直線的周圍,這樣就可以利用線性回歸模型來(lái)建立與之間的非線性回歸方程了,數(shù)據(jù)可以轉(zhuǎn)化為:天數(shù)1234567人數(shù)1.9462.3983.0453.1784.1904.7455.784求得回歸直線方程為,∴.(3)截止到2008年2月12日,,此時(shí)(人).∴估計(jì)可去1530人.評(píng)注:現(xiàn)如今是網(wǎng)絡(luò)時(shí)代,很多同學(xué)都會(huì)通過(guò)互聯(lián)網(wǎng)發(fā)帖子,所以此類問(wèn)題為同學(xué)們司空見(jiàn)慣.但如何預(yù)測(cè)發(fā)帖后的效果,這卻是個(gè)新課題,通過(guò)本題你是否已明確.例6有人發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象,中國(guó)人的郵箱名稱里含有數(shù)字的比較多,而外國(guó)人郵箱名稱里含有數(shù)字的比較少.為了研究國(guó)籍和郵箱名稱里是否含有數(shù)字的關(guān)系,他收集了124個(gè)郵箱名稱,其中中國(guó)人的70個(gè),外國(guó)人的54個(gè),中國(guó)人的郵箱中有43個(gè)含數(shù)字,外國(guó)人的郵箱中有27個(gè)含數(shù)字.(1)根據(jù)以上數(shù)據(jù)建立一個(gè)2×2的列聯(lián)表;(2)他發(fā)現(xiàn)在這組數(shù)據(jù)中,外國(guó)人郵箱名稱里含數(shù)字的也不少,他不能斷定國(guó)籍和郵箱名稱里含有數(shù)字是否有關(guān),你能幫他判斷一下嗎?分析:按題中數(shù)據(jù)建列聯(lián)表,然后根據(jù)列聯(lián)表數(shù)據(jù)求出值,即可判定.解:(1)2×2的列聯(lián)表中國(guó)人外國(guó)人總計(jì)有數(shù)字432770無(wú)數(shù)字213354總計(jì)6460124(2)假設(shè)“國(guó)籍和郵箱名稱里是否含有數(shù)字無(wú)關(guān)”.由表中數(shù)據(jù)得,因?yàn)椋杂欣碛烧J(rèn)為假設(shè)“國(guó)籍和郵箱名稱里是否含有數(shù)字無(wú)關(guān)”是不合理的,即有的把握認(rèn)為“國(guó)籍和郵箱名稱里是否含有數(shù)字有關(guān)”.評(píng)注:獨(dú)立性檢驗(yàn)類似于反證法,其一般步驟為:第一步:首先假設(shè)兩個(gè)分類變量幾乎沒(méi)有關(guān)系(幾乎獨(dú)立);第二步:求隨機(jī)變量的值;第三步.判斷兩個(gè)分類變量有關(guān)的把握(即概率)有多大.例7針對(duì)時(shí)下的“韓劇熱”,某校團(tuán)委對(duì)“學(xué)生性別和是否喜歡韓劇是否有關(guān)”作了一次調(diào)查,其中女生人數(shù)是男生人數(shù)的,男生喜歡韓劇的人數(shù)占男生人數(shù)的,女生喜歡韓劇人數(shù)占女生人數(shù)的.(1)若有的把握認(rèn)為是否喜歡韓劇和性別有關(guān),則男生至少有多少人;(2)若沒(méi)有充分的證據(jù)顯示是否喜歡韓劇和性別有關(guān),則男生至多有多少人.分析:有的把握認(rèn)為回答結(jié)果對(duì)錯(cuò)和性別有關(guān),說(shuō)明,沒(méi)有充分的證據(jù)顯示回答結(jié)果對(duì)錯(cuò)和性別有關(guān),說(shuō)明.設(shè)出男生人數(shù),并用它分別表示各類別人數(shù),代入的計(jì)算公式,建立不等式求解即可.解:設(shè)男生人數(shù)為,依題意可得列聯(lián)表如下:喜歡韓劇不喜歡韓劇總計(jì)男生女生總計(jì) (1)若有的把握認(rèn)為回答結(jié)果的對(duì)錯(cuò)和性別有關(guān),則,由,解得,∵為整數(shù),∴若有的把握認(rèn)為回答結(jié)果的對(duì)錯(cuò)和性別有
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年內(nèi)蒙古體育職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年南京特殊教育師范學(xué)院?jiǎn)握芯C合素質(zhì)筆試參考題庫(kù)含詳細(xì)答案解析
- 2026年湘西民族職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試參考題庫(kù)含詳細(xì)答案解析
- 2026年錦州師范高等專科學(xué)校單招綜合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年南京信息職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年撫州職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026年紹興職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試參考題庫(kù)含詳細(xì)答案解析
- 2026年信陽(yáng)航空職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年九江理工職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年煙臺(tái)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考題庫(kù)及答案詳細(xì)解析
- 2025年農(nóng)村電商直播基地農(nóng)業(yè)產(chǎn)品上行解決方案報(bào)告
- 農(nóng)村承包土地合同范本
- 吉利汽車開(kāi)發(fā)流程
- 五年級(jí)數(shù)學(xué)下冊(cè) 分層訓(xùn)練 2.1 因數(shù)和倍數(shù) 同步練習(xí) (含答案)(人教版)
- 護(hù)理部主任年終述職
- 電力行業(yè)安全生產(chǎn)操作規(guī)程
- 螺桿壓縮機(jī)PSSR檢查表
- GB/T 4937.34-2024半導(dǎo)體器件機(jī)械和氣候試驗(yàn)方法第34部分:功率循環(huán)
- TCALC 003-2023 手術(shù)室患者人文關(guān)懷管理規(guī)范
- 中藥熱奄包在呼吸系統(tǒng)疾病中的應(yīng)用研究
- HACCP計(jì)劃年度評(píng)審報(bào)告
評(píng)論
0/150
提交評(píng)論