版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十一章概率與統(tǒng)計(jì)第八課時(shí)統(tǒng)計(jì)案例知識(shí)梳理一、殘差分析1.線性回歸模型y=bx+a+e中,a,b叫做模型的未知參數(shù),e叫做隨機(jī)誤差.我們可以建立回歸方程為bx+a中的估計(jì)量,由于
,所以
是e的估計(jì)量,這樣,對(duì)于樣本點(diǎn)(i=1,2,…,n)相對(duì)于它們的隨機(jī)誤差為ei=y(tǒng)i-
=y(tǒng)i-bxi-a(i=1,2,…,n),其估計(jì)值為(i=1,2,…,n),
稱為相應(yīng)于樣本點(diǎn)(i=1,2,…,n)的殘差.2.殘差平方和Q=當(dāng)Q的值越小,說明線性回歸模型的擬合效果越好.3.相關(guān)指數(shù)用相關(guān)指數(shù)R2來刻畫回歸的效果,其計(jì)算公式是:R2的值越大,說明殘差平方和越小,也就是說模型的擬合效果越好,在線性回歸模型中,R2表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸效果越好.二、獨(dú)立性檢驗(yàn)1.用變量的不同“值”表示個(gè)體所屬的不同類別,這種變量成為分類變量.例如:是否吸煙,宗教信仰,國(guó)籍等.2.列出兩個(gè)變量的頻數(shù)表,成為列聯(lián)表.3.一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別是{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為2×2列聯(lián)表K2=(其中n=a+b+c+d為樣本容量),則利用獨(dú)立性檢驗(yàn)判斷表來判斷“x與y的關(guān)系”.注意:常將k=叫做K2的觀測(cè)值.這種利用隨機(jī)變量K2(或說用K2的觀測(cè)值k)來確定在多大程度上可以認(rèn)為“兩個(gè)分類變量有關(guān)系”的方法稱為兩個(gè)分類變量的獨(dú)立性檢驗(yàn).經(jīng)過對(duì)統(tǒng)計(jì)量分布的研究,已經(jīng)得到了兩個(gè)臨界值:3.841與6.635.當(dāng)根據(jù)具體的數(shù)據(jù)算出的觀測(cè)值k>3.841時(shí),有95%的把握說事件A與B有關(guān);當(dāng)k>6.635時(shí),有99%的把握說事件A與B有關(guān);當(dāng)k≤3.841時(shí),認(rèn)為事件A與B是無關(guān)的.基礎(chǔ)自測(cè)1.用獨(dú)立性檢驗(yàn)來考察兩個(gè)變量x與y是否有關(guān)系,當(dāng)統(tǒng)計(jì)量K2的值()A.越大,“x與y是有關(guān)系的”成立可能性越小B.越大,“x與y是有關(guān)系的”成立可能性越大C.越小,“x與y是沒有關(guān)系的”成立可能性越小D.與“x與y有關(guān)系”成立的可能性無關(guān)B2.已知隨機(jī)事件A與B,經(jīng)計(jì)算得到K2的范圍是3.841<K2<6.635,則(下表是K2的臨界值表,供參考)()A.有95%把握說事件A與B有關(guān)B.有95%把握說事件A與B無關(guān)C.有99%把握說事件A與B有關(guān)D.有99%把握說事件A與B無關(guān)A3.樣本相關(guān)系數(shù)r的取值范圍是___________.[-1,1]4.若一組觀測(cè)值(x1,y1),(x2,y2),…,(xn,yn)之間滿足yi=a+bxi+ei(i=1,2,…,n),若ei=0恒成立,r為相關(guān)系數(shù),則r2=____________.1為了對(duì)2010年佛山市中考成績(jī)進(jìn)行分析,從60分以上的全體同學(xué)中隨機(jī)抽出8位,他們的數(shù)學(xué)(已折算為百分制)、物理、化學(xué)分?jǐn)?shù)對(duì)應(yīng)如下表:(1)若規(guī)定85分(包括85分)以上為優(yōu)秀,求這8位同學(xué)中數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的頻率;(2)用變量y與x、z與x的相關(guān)系數(shù)說明物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的相關(guān)程度;(3)求y與x、z與x的線性回歸方程(系數(shù)精確到0.01),并用相關(guān)指數(shù)比較所求回歸模型的效果.參考數(shù)據(jù):解析:(1)由表中可以看出,所選出的8位同學(xué)中,數(shù)學(xué)和物理分?jǐn)?shù)均為優(yōu)秀的人數(shù)是3人,其頻率是.(2)變量y與x、z與x的相關(guān)系數(shù)分別是
r=≈0.99,r′=≈0.99.可以看出,物理與數(shù)學(xué)、化學(xué)與數(shù)學(xué)的成績(jī)都是高度正相關(guān).(3)設(shè)y與x、z與x的線性回歸方程分別是根據(jù)所給的數(shù)據(jù),可以計(jì)算出
b=≈0.65,a=85-0.65×77.5=34.63,
b′=≈0.72,a′=81-0.72×77.5=25.20.所以y與x和z與x的回歸方程分別是
=0.72x+25.20.又y與x、z與x的相關(guān)指數(shù)是
R2=1-≈0.98、R′2=1-≈0.83.故回歸模型
=0.65x+34.63比回歸模型
=0.72x+25.20的擬合效果好.變式探究1.某校醫(yī)務(wù)室抽查了10名學(xué)生在高一和高二時(shí)的體重(單位:kg)如下表:(1)利用相關(guān)系數(shù)r判斷y與x是否具有相關(guān)關(guān)系?(2)若y與x具有相關(guān)關(guān)系,試估計(jì)高一體重為78kg的學(xué)生在高二時(shí)的體重.解析:(1)=71,=72.3,
=51467,10·=51333,=110,∵r>0.75,y與x具有很強(qiáng)的相關(guān)性.
(2)b=≈1.218,
a=72.3-1.218×71≈-14.178,∴回歸直線方程為:=1.218x-14.178,當(dāng)x=78時(shí),y=1.218×78-14.178≈81.即估計(jì)高一體重為78kg的學(xué)生在高二時(shí)的體重約為81kg.(2010年廣州二模)某學(xué)校課題組為了研究學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)之間的關(guān)系,隨機(jī)抽取高二年級(jí)20名學(xué)生某次考試成績(jī)(滿分100分)如下表所示:若單科成績(jī)85分以上(含85分),則該科成績(jī)?yōu)閮?yōu)秀.(1)根據(jù)上表完成下面的2×2列聯(lián)表(單位:人):(2)根據(jù)題(1)中表格的數(shù)據(jù)計(jì)算,有多大的把握,認(rèn)為學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)之間有關(guān)系?(3)若從這20個(gè)人中抽出1人來了解有關(guān)情況,求抽到的學(xué)生數(shù)學(xué)成績(jī)與物理成績(jī)至少有一門不優(yōu)秀的概率.參考數(shù)據(jù):①假設(shè)有兩個(gè)分類變量X和Y,它們的值域分別為和,其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為:則隨機(jī)變量K2=,其中n=a+b+c+d為樣本容量;②獨(dú)立檢驗(yàn)隨機(jī)變量K2的臨界值參考表:解析:(1)2×2列聯(lián)表為(單位:人):(2)提出假設(shè)H0:學(xué)生數(shù)學(xué)成績(jī)與物理成績(jī)之間沒有關(guān)系.根據(jù)列聯(lián)表可以求得K2=≈8.802>7.879.當(dāng)H0成立時(shí),P(K2>7.879)=0.005.
所以我們有99.5%的把握認(rèn)為:學(xué)生的數(shù)學(xué)成績(jī)與物理成績(jī)之間有關(guān)系.(3)由(1)可知數(shù)學(xué)成績(jī)與物理成績(jī)都優(yōu)秀的學(xué)生的人數(shù)為5人,則數(shù)學(xué)成績(jī)與物理成績(jī)至少有一門不優(yōu)秀的學(xué)生人數(shù)為15人.故從20名學(xué)生中抽出1名,抽到的學(xué)生數(shù)學(xué)成績(jī)與物理成績(jī)至少有一門不優(yōu)秀的概率為變式探究2.某校高二(1)、(2)班共100名同學(xué),在分科選擇中,一半同學(xué)(其中男生38人)選擇了物理,另一半(其中男生15人)選擇了歷史.你能否有99%的把握說選科與性別有關(guān)?解析:(1)列出2×2列聯(lián)表:
(2)提出假設(shè)
H0:選科與性別沒有關(guān)系.(3)根據(jù)列聯(lián)表中的數(shù)據(jù)計(jì)算K2的值
K2=≈21.24.(4)作出判斷因?yàn)楫?dāng)H0成立時(shí),K2≥6.635的概率約為0.01,所以我們有99%的把握說:選科與性別有關(guān).3.對(duì)196個(gè)接受心臟搭橋手術(shù)的病人和196個(gè)接受血管清障手術(shù)的病人進(jìn)行了3年的跟蹤研究,調(diào)查他們是否又發(fā)作過心臟病,調(diào)查結(jié)果如下表所示:試根據(jù)上述數(shù)據(jù)比較這兩種手術(shù)對(duì)病人又發(fā)作心臟病的影響有沒有差別.解析:由公式K2=2≈1.78,因?yàn)?.78<3.841,所以我們沒有理由說“心臟搭橋手術(shù)”與“又發(fā)作過心臟病”有關(guān),可以認(rèn)為病人又發(fā)作與否與其做過任何手術(shù)無關(guān).在對(duì)人們的休閑方式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人,女性中有43人主要的休閑方式是看電視,另外27人主要的休閑方式是運(yùn)動(dòng);男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運(yùn)動(dòng).(1)根據(jù)以上數(shù)據(jù)建立一個(gè)2×2的列聯(lián)表;(2)判斷性別與休閑方式是否有關(guān)系.解析:(1)2×2列聯(lián)表如下:(2)假設(shè)“休閑方式與性別無關(guān)”,計(jì)算K2=≈6.201.因?yàn)镵2>5.024.所以,有理由認(rèn)為假設(shè)“休閑方式與性別無關(guān)”是不合理的,即有97.5%的把握認(rèn)為“休閑方式與性別有關(guān)”.變式探究4.在一次惡劣氣候的航海過程中,調(diào)查了89位男女乘客的暈船的情況,男乘客暈船的有8人,不暈船的26人;女乘客暈船的有24人,不暈船的31人;請(qǐng)你根據(jù)所給數(shù)據(jù)判斷是否在惡劣氣候下航行,女人比男人更容易暈船?解析:(1)列聯(lián)表(2)假設(shè):“暈船與性別無關(guān)”,由公式得K2≈3.689,因?yàn)镵2>2.706,所以我們有90%的把握說暈船與性別有關(guān)(女人更容易暈船).1.雖然兩個(gè)變量的觀測(cè)數(shù)據(jù)都可以用線性回歸模型來擬合,但不能保證這種模型對(duì)數(shù)據(jù)的擬合效果最好.為更好地刻畫兩個(gè)變量之間的關(guān)系,要根據(jù)觀測(cè)數(shù)據(jù)的特點(diǎn)來選擇回歸模型.2.獨(dú)立性檢驗(yàn)的必要性:為什么不能只憑列聯(lián)表和圖形下結(jié)論?原因是列聯(lián)表中的數(shù)據(jù)是樣本數(shù)據(jù),它只是總體的代表,具有隨機(jī)性,因此需要用列聯(lián)表檢驗(yàn)這個(gè)方法來確認(rèn)所得結(jié)論在多大程度上適用于總體.3.獨(dú)立性檢驗(yàn)的思想來自于統(tǒng)計(jì)上的假設(shè)檢驗(yàn)思想,它與反證法類似.假設(shè)檢驗(yàn)和反證法都是先假設(shè)結(jié)論不成立,然后根據(jù)是否能夠
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度解析(2026)《GBT 25633-2010電火花加工機(jī)床 電磁兼容性試驗(yàn)規(guī)范》(2026年)深度解析
- 2025重慶酉陽自治縣城區(qū)事業(yè)單位公開遴選34人備考考試試題及答案解析
- 2025福建福州市鼓樓區(qū)城投集團(tuán)招聘5人參考筆試題庫附答案解析
- 2025年12月廣東深圳市大鵬新區(qū)葵涌辦事處招聘編外人員3人備考考試試題及答案解析
- 2025山東青島市市南區(qū)城市發(fā)展有限公司附全資子公司招聘10人參考筆試題庫附答案解析
- 2025湖南長(zhǎng)沙市天心區(qū)龍灣小學(xué)教師招聘2人備考考試試題及答案解析
- 2025山東陽昇甄選產(chǎn)業(yè)運(yùn)營(yíng)有限公司公開選聘工作人員(7人)備考筆試題庫及答案解析
- 《菱形的性質(zhì)與判定》數(shù)學(xué)課件教案
- “青苗筑基 浙里建證”浙江省建設(shè)投資集團(tuán)2026屆管培生招聘30人備考筆試題庫及答案解析
- 2026河南許昌市襄城縣兵役登記參考筆試題庫附答案解析
- Cuk斬波完整版本
- GB/T 3521-2023石墨化學(xué)分析方法
- 一年級(jí)數(shù)學(xué)重疊問題練習(xí)題
- 三維動(dòng)畫及特效制作智慧樹知到課后章節(jié)答案2023年下吉林電子信息職業(yè)技術(shù)學(xué)院
- 胰腺囊腫的護(hù)理查房
- 臨床醫(yī)學(xué)概論常見癥狀課件
- 知識(shí)圖譜與自然語言處理的深度融合
- 物業(yè)管理理論實(shí)務(wù)教材
- 仁川國(guó)際機(jī)場(chǎng)
- 全檢員考試試題
- 光刻和刻蝕工藝
評(píng)論
0/150
提交評(píng)論