性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn).ppt_第1頁
性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn).ppt_第2頁
性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn).ppt_第3頁
性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn).ppt_第4頁
性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn).ppt_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第三節(jié) 相關(guān)性、最小二乘估計(jì)、回歸分析與 獨(dú)立性檢驗(yàn),三年9考 高考指數(shù): 1.會(huì)作兩個(gè)有關(guān)聯(lián)變量的數(shù)據(jù)的散點(diǎn)圖,并利用散點(diǎn)圖認(rèn)識(shí)變量間的相關(guān)關(guān)系. 2.了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程(不記公式). 3.了解獨(dú)立性檢驗(yàn)的基本思想、方法及其初步應(yīng)用. 4.了解回歸分析的基本思想、方法及其簡單應(yīng)用.,1.線性回歸方程的建立及應(yīng)用和獨(dú)立性檢驗(yàn)的應(yīng)用是考查重點(diǎn); 2.題型以選擇題和填空題為主,主要是求線性回歸方程的系數(shù)或利用線性回歸方程進(jìn)行預(yù)測(cè),在給出臨界值的情況下判斷兩個(gè)變量是否有關(guān).,1.相關(guān)性 (1)散點(diǎn)圖:在考慮兩個(gè)量的關(guān)系時(shí),為了對(duì)_之間的關(guān)系 有一個(gè)

2、大致的了解,人們通常將_的點(diǎn)描出來, 這些點(diǎn)就組成了變量之間的一個(gè)圖,通常稱這種圖為變量之間 的散點(diǎn)圖. (2)曲線擬合:從散點(diǎn)圖上可以看出,如果變量之間_ _,這些點(diǎn)會(huì)有一個(gè)_的大致趨勢(shì),這種趨勢(shì)通常可 以用一條_來近似,這種近似的過程稱為曲線擬合.,變量所對(duì)應(yīng),存在著某,種關(guān)系,光滑的曲線,變量,集中,(3)線性相關(guān):若在兩個(gè)變量x和y的散點(diǎn)圖中,所有點(diǎn)看上去 都在_附近波動(dòng),則稱變量間是線性相關(guān)的.此時(shí), 我們可以用_來近似. (4)非線性相關(guān):若散點(diǎn)圖上所有點(diǎn)看上去都在_ _附近波動(dòng),則稱此相關(guān)為非線性相關(guān).此時(shí), 可以用_來擬合. (5)不相關(guān):如果所有的點(diǎn)在散點(diǎn)圖中_,則 稱變量間

3、是不相關(guān)的.,一條直線,一條直線,某條曲線,(不是一條直線),一條曲線,沒有顯示任何關(guān)系,【即時(shí)應(yīng)用】 (1)思考:相關(guān)關(guān)系與函數(shù)關(guān)系有什么異同點(diǎn)? 提示:相同點(diǎn):兩者均是指兩個(gè)變量的關(guān)系. 不同點(diǎn):函數(shù)關(guān)系是一種確定的關(guān)系,相關(guān)關(guān)系是一種非確定的關(guān)系.函數(shù)關(guān)系是一種因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.,(2)判斷下列各關(guān)系是否是相關(guān)關(guān)系.(請(qǐng)?jiān)诶ㄌ?hào)內(nèi)填“是”或“否”) 路程與時(shí)間、速度的關(guān)系; ( ) 加速度與力的關(guān)系; ( ) 產(chǎn)品成本與產(chǎn)量的關(guān)系; ( ) 圓周長與圓面積的關(guān)系; ( ) 廣告費(fèi)支出與銷售額的關(guān)系. ( ),【解析】是確定的函數(shù)關(guān)系,成本與產(chǎn)量,廣告費(fèi)

4、支出與銷售額是相關(guān)關(guān)系. 答案:否 否 是 否 是,2.回歸直線方程與相關(guān)系數(shù) (1)最小二乘法 如果有n個(gè)點(diǎn)(x1,y1),(x2,y2),(xn,yn),可以用下面的表達(dá)式來刻畫這些點(diǎn)與直線y=a+bx的接近程度: _ 使得上式達(dá)到_的直線y=a+bx就是我們所要求的直線,這種方法稱為最小二乘法.,y1-(a+bx1)2+y2-(a+bx2)2+yn-(a+bxn)2.,最小值,(2)線性回歸方程 假設(shè)樣本點(diǎn)為(x1,y1),(x2,y2),(xn,yn),則 直線方程y=a+bx稱為線性回歸方程,a、b是線性回歸方程的 _.,系數(shù),(3)相關(guān)系數(shù)r ,當(dāng)r0時(shí),稱兩個(gè)變量_. 當(dāng)r0時(shí),

5、稱兩個(gè)變量_. 當(dāng)r=0時(shí),稱兩個(gè)變量_. r的絕對(duì)值越接近于1,表明兩個(gè)變量之間的線性相關(guān)程度越 高;r的絕對(duì)值越接近于0,表明兩個(gè)變量之間的線性相關(guān)程度 越低.,正相關(guān),負(fù)相關(guān),線性不相關(guān),【即時(shí)應(yīng)用】 (1)由一組樣本數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)得到回 歸直線方程yabx,判斷下面說法是否正確.(請(qǐng)?jiān)诶ㄌ?hào)內(nèi)打 “”或“”) 任何一組觀測(cè)值都能得到具有代表意義的回歸直線方程; ( ) 直線yabx至少經(jīng)過點(diǎn)(x1,y1),(x2,y2),(xn,yn)中的一個(gè)點(diǎn); ( ),直線yabx的斜率 ( ) 直線yabx和各點(diǎn)(x1,y1),(x2,y2),(xn,yn)的偏

6、 差 是該坐標(biāo)平面上所有直線與這些點(diǎn)的偏差 中最小的. ( ) (2)已知回歸方程y4.4x838.19,則可估計(jì)x與y的增長速度 之比約為_.,【解析】(1)任何一組觀測(cè)值都能利用公式得到直線方程,但 這個(gè)方程可能無意義,不正確;回歸直線方程ybxa經(jīng)過 樣本點(diǎn)的中心 可能不經(jīng)過(x1,y1),(x2,y2), (xn,yn)中的任何一點(diǎn),這些點(diǎn)分布在這條直線附近,不正 確;正確;正確 (2)x與y的增長速度之比即約為回歸方程的斜率的倒數(shù) 答案:(1) (2),3.獨(dú)立性檢驗(yàn) (1)22列聯(lián)表 設(shè)A,B為兩個(gè)變量,每一個(gè)變量都可以取兩個(gè)值,變量A:A1, A2= ;變量B:B1,B2= 通過

7、觀察得到如表所示的數(shù)據(jù):,a,b,a+b,c,d,c+d,a+c,b+d,n=a+b+c+d,(2)獨(dú)立性判斷方法 選取統(tǒng)計(jì)量_,用它的大小來檢驗(yàn) 變量之間是否獨(dú)立. 當(dāng)2_時(shí),沒有充分的證據(jù)判定變量A,B有關(guān)聯(lián), 可以認(rèn)為變量A,B是沒有關(guān)聯(lián)的; 當(dāng)2_時(shí),有90%的把握判定變量A,B有關(guān)聯(lián); 當(dāng)2_時(shí),有95%的把握判定變量A,B有關(guān)聯(lián); 當(dāng)2_時(shí),有99%的把握判定變量A,B有關(guān)聯(lián).,2.706,2.706,3.841,6.635,【即時(shí)應(yīng)用】 (1)下面是一個(gè)22列聯(lián)表 則表中a、b處的值分別為_.,(2)在一項(xiàng)打鼾與患心臟病的調(diào)查中,共調(diào)查了1 671人,經(jīng)過計(jì)算2的觀測(cè)值為27.6

8、3,根據(jù)這一數(shù)據(jù)分析,我們有理由認(rèn)為打鼾與患心臟病是_的(填“有關(guān)”或“無關(guān)”). 【解析】(1)a+21=73,a=52. 又a+2=b,b=54. (2)27.636.635, 有99%的把握認(rèn)為“打鼾與患心臟病有關(guān)”. 答案:(1)52、54 (2)有關(guān),相關(guān)關(guān)系的判斷 【方法點(diǎn)睛】利用散點(diǎn)圖判斷相關(guān)關(guān)系的技巧 利用散點(diǎn)圖判斷兩個(gè)變量是否有相關(guān)關(guān)系是比較簡便的方法: (1)在散點(diǎn)圖中如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線上,就用該函數(shù)來描述變量之間的關(guān)系,即變量之間具有函數(shù)關(guān)系;,(2)如果所有的樣本點(diǎn)都落在某一函數(shù)的曲線附近,變量之間就有相關(guān)關(guān)系; (3)如果所有的樣本點(diǎn)都落在某一直線附

9、近,變量之間就有線性相關(guān)關(guān)系.,【例1】關(guān)于人體的脂肪含量(百分比)和年齡關(guān)系的研究中,得到如下一組數(shù)據(jù): 判斷它們是否有相關(guān)關(guān)系.,【解題指南】判斷有無相關(guān)關(guān)系,一種常用的簡便方法就是繪制散點(diǎn)圖. 【規(guī)范解答】本題涉及兩個(gè)變量:年齡與脂肪含量,可以以年齡為自變量,考查脂肪含量的變化趨勢(shì),分析相關(guān)關(guān)系通常借助散點(diǎn)圖.,以年齡作為x軸,脂肪含量作為y軸,可得相應(yīng)的散點(diǎn)圖如圖所示. 由散點(diǎn)圖可知,兩者之間具有相關(guān)關(guān)系.,【反思感悟】粗略判斷相關(guān)性,可以觀察一個(gè)變量隨另一個(gè)變量變化而變化的情況.畫出散點(diǎn)圖能夠更直觀的判斷是否相關(guān),相關(guān)時(shí)是正相關(guān)還是負(fù)相關(guān).,【變式訓(xùn)練】5個(gè)學(xué)生的數(shù)學(xué)和物理成績?nèi)缦卤?/p>

10、: 畫出散點(diǎn)圖,并判斷它們是否有相關(guān)關(guān)系,【解析】把數(shù)學(xué)成績作為橫坐標(biāo),把相應(yīng)的物理成績作為縱坐標(biāo),在直角坐標(biāo)系中描點(diǎn)(xi,yi)(i1,2,5),作出散點(diǎn)圖如圖 從圖中可以直觀地看出數(shù)學(xué)成績和物理成績具有相關(guān)關(guān)系,且當(dāng)數(shù)學(xué)成績?cè)龃髸r(shí),物理成績也在由小變大,即它們正相關(guān).,線性回歸方程及其應(yīng)用 【方法點(diǎn)睛】求樣本數(shù)據(jù)的線性回歸方程的步驟 第一步,計(jì)算平均數(shù) 第二步,求和 第三步,計(jì)算 第四步,寫出回歸方程y=bx+a.,【提醒】對(duì)于任意一組樣本數(shù)據(jù),利用上述公式都可以求得“回歸方程”,如果這組數(shù)據(jù)不具有線性相關(guān)關(guān)系,即不存在回歸直線,那么所得的“回歸方程”是沒有實(shí)際意義的.因此,對(duì)一組樣本數(shù)

11、據(jù),應(yīng)先作散點(diǎn)圖,在具有線性相關(guān)關(guān)系的前提下再求回歸方程.,【例2】(1)(2011廣東高考)某數(shù)學(xué)老師身高176 cm,他爺爺、父親和兒子的身高分別是173 cm、170 cm和182 cm.因兒子的身高與父親的身高有關(guān),該老師用線性回歸分析的方法預(yù)測(cè)他孫子的身高為_cm. (2)測(cè)得某國10對(duì)父子身高(單位:英寸)如下:,畫出散點(diǎn)圖,說明變量y與x的相關(guān)性; 如果y與x之間具有線性相關(guān)關(guān)系,求線性回歸方程. (已知: 4 490.34, =44 794, =44 941.93, =44 842.4),【解題指南】(1)求出回歸方程,代入相關(guān)數(shù)據(jù)求得; (2)根據(jù)散點(diǎn)圖判斷相關(guān)性. 根據(jù)已知

12、數(shù)據(jù)和提示的公式數(shù)據(jù)求解,寫出線性回歸方程. 【規(guī)范解答】(1)由題設(shè)知:設(shè)相對(duì)的父親的身高為x,相對(duì)的兒子的身高為y,它們對(duì)應(yīng)的取值如表所示 于是有 a=176-1731=3,得回歸方程為y=x+3,所以當(dāng)x=182時(shí),y=185. 答案:185,(2)散點(diǎn)圖如圖所示: 觀察散點(diǎn)圖中點(diǎn)的分布可以看出:這些點(diǎn)在一條直線的附近分布,所以變量y與x之間具有線性相關(guān)關(guān)系.,設(shè)回歸方程為y=bx+a. 由 =67.01-0.464 666.835.974 7. 得所求的線性回歸方程為y=0.464 6x+35.974 7.,【互動(dòng)探究】若本例(2)題干不變,如果父親的身高為73英寸,試估計(jì)兒子的身高.

13、 【解析】由本例(2)可知回歸方程為y=0.464 6x+35.974 7. 當(dāng)x=73時(shí),y=0.464 673+35.974 769.9(英寸). 所以當(dāng)父親身高為73英寸時(shí),兒子的身高約為69.9英寸.,【反思感悟】求線性回歸方程,主要是利用公式,求出回歸系數(shù)b,a,求解過程中注意計(jì)算的準(zhǔn)確性和簡便性.利用回歸方程預(yù)報(bào),就是求函數(shù)值.,【變式訓(xùn)練】一般來說,一個(gè)人腳越長,他的身高就越高現(xiàn)對(duì)10名成年人的腳長x與身高y進(jìn)行測(cè)量,得如下數(shù)據(jù)(單位:cm):,作出散點(diǎn)圖后,發(fā)現(xiàn)散點(diǎn)在一條直線附近經(jīng)計(jì)算得到一些數(shù)據(jù): 某刑偵人員在某案發(fā)現(xiàn)場(chǎng)發(fā)現(xiàn)一對(duì)裸腳印,量得每個(gè)腳印長26.5 cm,請(qǐng)你估計(jì)案

14、發(fā)嫌疑人的身高為_cm.,【解析】由已知 故y=7x. 當(dāng)x=26.5時(shí),y=185.5. 答案:185.5,獨(dú)立性檢驗(yàn)的基本思想及其應(yīng)用 【方法點(diǎn)睛】利用統(tǒng)計(jì)量2進(jìn)行獨(dú)立性檢驗(yàn)的步驟 (1)根據(jù)數(shù)據(jù)列出22列聯(lián)表; (2)根據(jù)公式計(jì)算2的值; (3)比較2與臨界值的大小關(guān)系,作出統(tǒng)計(jì)推斷.,【例3】某企業(yè)為了更好地了解設(shè)備改造前后與生產(chǎn)合格品的關(guān)系,隨機(jī)抽取了180件產(chǎn)品進(jìn)行分析,其中設(shè)備改造前的合格品有36件,不合格品有49件,設(shè)備改造后生產(chǎn)的合格品有65件,不合格品有30件根據(jù)所給數(shù)據(jù): (1)寫出22列聯(lián)表; (2)判斷產(chǎn)品是否合格與設(shè)備改造是否有關(guān) 【解題指南】列表后利用2的值進(jìn)行檢

15、驗(yàn).,【規(guī)范解答】(1)由已知數(shù)據(jù)得 (2) 12.38. 由于12.386.635,所以有99%以上的把握認(rèn)為產(chǎn)品是否合格與設(shè)備改造有關(guān),【反思感悟】準(zhǔn)確計(jì)算2的值是關(guān)鍵.能有多大的把握認(rèn)為兩個(gè)變量有關(guān),應(yīng)熟悉常用的幾個(gè)臨界值.,【變式訓(xùn)練】為研究是否喜歡飲酒與性別之間的關(guān)系,在某地區(qū)隨機(jī)抽取290人,得到如下列聯(lián)表: 利用列聯(lián)表的獨(dú)立性檢驗(yàn)判斷是否喜歡飲酒與性別是否有關(guān)?,【解析】由列聯(lián)表中的數(shù)據(jù)得 211.9536.635. 所以有99%以上的把握認(rèn)為是否喜歡飲酒與性別有關(guān).,【變式備選】有兩個(gè)分類變量X與Y,其一組觀測(cè)的22列聯(lián)表如下表其中a,15-a均為大于5的整數(shù),則a取何值時(shí)有9

16、0%以上的把握認(rèn)為X與Y之間有關(guān)系?,【解析】要有90%以上的把握認(rèn)為X與Y之間有關(guān)系,則22.706, 而2 解22.706得a7.19或a5且15a5,aZ,所以a8,9,故當(dāng)a取8或9時(shí)有90%以上的把握認(rèn)為X與Y之間有關(guān)系,【滿分指導(dǎo)】線性回歸方程解答題的規(guī)范解答 【典例】(12分)(2011安徽高考)某地最近十年糧食需求量逐年上升,下表是部分統(tǒng)計(jì)數(shù)據(jù):,(1)利用所給數(shù)據(jù)求年需求量與年份之間的回歸直線方程y=bx+a; (2)利用(1)中所求出的直線方程預(yù)測(cè)該地2012年的糧食需求量.,【解題指南】將數(shù)據(jù)進(jìn)行處理,把數(shù)據(jù)同時(shí)減去一個(gè)數(shù)代入公式計(jì)算;利用公式求回歸直線方程,并進(jìn)行預(yù)測(cè).

17、 【規(guī)范解答】(1)由所給數(shù)據(jù)看出,年需求量與年份之間是近似直線上升,下面來求回歸直線方程,先將數(shù)據(jù)預(yù)處理如下: 2分,對(duì)預(yù)處理的數(shù)據(jù),容易算得 4分 6分 由上述計(jì)算結(jié)果,知所求回歸直線方程為 y-257=b(x-2 006)+a=6.5(x-2 006)+3.2.8分 即y=6.5(x-2 006)+260.2.10分,(2)利用所求得的直線方程,可預(yù)測(cè)2012年的糧食需求量為 6.5(2 012-2 006)+260.2=6.56+260.2=299.2(萬噸). 12分,【閱卷人點(diǎn)撥】通過高考中的閱卷數(shù)據(jù)分析與總結(jié),我們可以得到以下失分警示和備考建議:,1.(2011江西高考)為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對(duì)父子身高數(shù)據(jù)如下 則y對(duì)x的線性回歸方程為( ) (A)yx1 (B)yx1 (C)y88 x (D)y176,【解析】選C.由表中數(shù)據(jù)知回歸直線是上升的,首先排除D. 由線性回歸性質(zhì)知:點(diǎn) (176,176) 一定在回歸直線上,代入各選項(xiàng)檢驗(yàn),只有C符合,故選C.,2.(2011陜西高考)設(shè)(x1,y1),(x2,y2), ,(xn,yn)是變量x和y的n個(gè)樣本點(diǎn), 直線l是由這些樣本點(diǎn)通過最小二乘法 得到的線性回歸直線(如圖),以下結(jié) 論正確的是( )

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論