8.2+一元線性回歸模型及參數(shù)的最小二乘估計+課件-2024-2025學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)+選擇性必修第三冊_第1頁
8.2+一元線性回歸模型及參數(shù)的最小二乘估計+課件-2024-2025學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)+選擇性必修第三冊_第2頁
8.2+一元線性回歸模型及參數(shù)的最小二乘估計+課件-2024-2025學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)+選擇性必修第三冊_第3頁
8.2+一元線性回歸模型及參數(shù)的最小二乘估計+課件-2024-2025學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)+選擇性必修第三冊_第4頁
8.2+一元線性回歸模型及參數(shù)的最小二乘估計+課件-2024-2025學(xué)年高二下學(xué)期數(shù)學(xué)人教A版(2019)+選擇性必修第三冊_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第1課時一元線性回歸模型及參數(shù)的最小二乘估計[學(xué)習(xí)目標(biāo)]

1.了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計意義.(數(shù)學(xué)抽象)2.了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘估計方法.(數(shù)學(xué)抽象)3.針對實際問題,會用一元線性回歸模型進(jìn)行預(yù)測.(數(shù)據(jù)分析、數(shù)學(xué)運算)1.樣本相關(guān)系數(shù):2.相關(guān)系數(shù)的性質(zhì):①當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).②|r|≤1;③當(dāng)|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強(qiáng);

當(dāng)|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱;

特別地,當(dāng)|r|=0時,成對數(shù)據(jù)的沒有線性相關(guān)關(guān)系;

當(dāng)|r|=1時,成對數(shù)據(jù)都落在一條直線上.復(fù)習(xí)回顧新課導(dǎo)入

通過前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對樣本數(shù)據(jù)的散點圖和樣本相關(guān)系數(shù),可以推斷兩個變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線性相關(guān)程度的強(qiáng)弱等.思考

是否可以能像建立函數(shù)模型刻畫兩個變量之間的確定性關(guān)系那樣,通過建立適當(dāng)?shù)慕y(tǒng)計模型來刻畫兩個變量之間的相關(guān)關(guān)系?并通過模型進(jìn)行預(yù)測?下面我們研究當(dāng)兩個變量線性相關(guān)時,如何利用成對樣本數(shù)據(jù)建立統(tǒng)計模型,并利用模型進(jìn)行預(yù)測的問題.新知探究生活經(jīng)驗告訴我們,兒子的身高與父親的身高不僅線性相關(guān),而且還是正相關(guān),即父親的身高較高時,兒子的身高通常也較高.為了進(jìn)一步研究兩者之間的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如下表所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182我們先用散點圖對上面的數(shù)據(jù)進(jìn)行分析.問題1根據(jù)上述數(shù)據(jù)畫出來的散點圖,你發(fā)現(xiàn)了什么?可以發(fā)現(xiàn),散點大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關(guān).利用統(tǒng)計軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高.新知探究問題2根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182…172…父親身高…176174…兒子身高兒子身高不是父親身高的函數(shù)…170…兒子身高…173169…父親身高父親身高不是兒子身高的函數(shù)新知探究兒子身高和父親身高之間不是函數(shù)關(guān)系,故不能用函數(shù)模型刻畫.但由于父子的身高有較強(qiáng)的線性相關(guān),因此我們可以用一次函數(shù)來刻畫父親身高對兒子身高的影響問題3

除父親身高外,還有哪些因素影響兒子的身高?隨機(jī)誤差e母親身高生活環(huán)境飲食習(xí)慣體育鍛煉

……新知探究追問

如何理解隨機(jī)誤差e對兒子身高的影響?假設(shè)沒有隨機(jī)誤差,則兒子身高Y只受父親身高x影響,則事實上,相關(guān)系數(shù),故也可以記作Y=bx+a+e隨機(jī)誤差e隨機(jī)誤差e的特征隨機(jī)誤差e是一個隨機(jī)變量①可取正或取負(fù)②有些無法測量③不可事先設(shè)定

新知探究

我們稱(1)式為Y關(guān)于x的一元線性回歸模型.其中,Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.模型中的Y也是隨機(jī)變量,其值雖然不能由變量x的值確定,但是卻能表示為bx+a與e的和(疊加),前一部分由x所確定,后一部分是隨機(jī)的.如果e=0,那么Y與x之間的關(guān)系就可用一元線性函數(shù)模型來描述.新知探究追問

為什么要假設(shè)E(e)=0,而不假設(shè)其為某個不為0的常數(shù)?因為誤差是隨機(jī)的,即取各種正負(fù)誤差的可能性一樣,所以它們均值的理想狀態(tài)應(yīng)該為0.

問題4

你能結(jié)合父親與兒子身高的實例,說明回歸模型(1)的意義?

問題5

對于父親身高為xi的某一名男大學(xué)生,他的身高yi一定是bxi+a嗎?新知探究

因變量響應(yīng)變量自變量解釋變量截距斜率e[典例講評]

1.判斷下列變量間哪些能用函數(shù)模型刻畫,哪些能用線性回歸模型刻畫?(1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平米月租金;(3)航空公司的顧客投訴次數(shù)和航班正點率;(4)某地區(qū)的人均消費水平和人均國內(nèi)生產(chǎn)總值(GDP);(5)學(xué)生期末考試成績和考前用于復(fù)習(xí)的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.(1)(2)(3)(4)(5)線性回歸模型,(6)(7)函數(shù)模型.反思領(lǐng)悟

明確一元線性回歸模型的含義是解題的關(guān)鍵,其中a和b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差.[學(xué)以致用]

1.下列變量之間的關(guān)系是函數(shù)關(guān)系的是(

)A.已知二次函數(shù)y=ax2+bx+c,其中a,c是已知常數(shù),取b為自變量,因變量為這個函數(shù)對應(yīng)方程的判別式B.光照時間和果樹畝產(chǎn)量C.降雪量和交通事故的發(fā)生率D.每畝施用肥料量和糧食畝產(chǎn)量√選項B,C,D中都是一種不確定的關(guān)系,是相關(guān)關(guān)系,而函數(shù)關(guān)系是一種確定的關(guān)系,A中判別式Δ=b2-4ac和變量b是一種確定的表達(dá)式,所以是一種函數(shù)關(guān)系.探究2最小二乘法和經(jīng)驗回歸方程探究問題2

(1)如果變量x與y線性相關(guān),那么x與y的關(guān)系可以近似地用哪個函數(shù)來刻畫?(2)一次函數(shù)的解析式是什么?要求一次函數(shù)的方程,需要求出哪些參數(shù)?(3)在一元線性回歸模型中,表達(dá)式Y(jié)=bx+a+e刻畫了變量Y與x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,確定參數(shù)a和b的原則是什么?新知探究:經(jīng)驗回歸方程問題6如何用數(shù)學(xué)的方法刻畫“從整體上看,各散點與直線最接近”?采用測量的方法,先畫出一條直線,測量出各點與它的距離,然后移動直線,到達(dá)一個使距離的和最小的位置.然后測量出此時的斜率和截距,就可得到一條直線,如圖(1)所示.方法一:新知探究:經(jīng)驗回歸方程問題6如何用數(shù)學(xué)的方法刻畫“從整體上看,各散點與直線最接近”?方法二:在圖中選擇這樣的兩點畫直線,使得直線兩側(cè)的點的個數(shù)基本相同,把這條直線作為所求直線,如圖(2)所示.新知探究:經(jīng)驗回歸方程問題6如何用數(shù)學(xué)的方法刻畫“從整體上看,各散點與直線最接近”?方法三:在散點圖中多取幾對點,確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個平均數(shù)作為所求直線的斜率和截距,如圖(3)所示.同學(xué)們不妨去實踐一下,看看這些方法是不是真的可行.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑.先進(jìn)一步明確我們面臨的任務(wù):從成對樣本數(shù)據(jù)出發(fā),用數(shù)學(xué)的方法刻畫“從整體上看,各散點與直線最接近”.新知探究:經(jīng)驗回歸方程通常,我們會想到利用點到直線y=bx+a的“距離”來刻畫散點與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.

設(shè)滿足一元線性回歸模型的兩個變量的n對樣本數(shù)據(jù)為(x1,

y1),(x2,

y2),???,(xn,

yn),設(shè)表示點到直線的距離,表示點到直線的豎直距離,表示直線的傾斜角,則,所以方法1中的點到直線的距離可以用豎直距離替換.

由yi=bxi+a+ei(i=1,2,???,n),得新知探究:經(jīng)驗回歸方程

顯然|ei|越小,表示點(xi,

yi)與點(xi,

bxi+a)的“距離”越小,即樣本數(shù)據(jù)點離直線y=bx+a的豎直距離越小,如圖所示.

特別地,當(dāng)ei=0時,表示點(xi,

yi)在這條直線上.方便計算n個豎直距離之和隨機(jī)誤差平方和刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”新知探究:經(jīng)驗回歸方程在上式中,xi,yi

(i=1,2,…,n)是已知的成對樣本數(shù)據(jù),所以Q由a和b所決定,即它是a和b的函數(shù).所以我們?nèi)∈筈達(dá)到最小的a和b值,作為截距a和斜率b的估計值.Q越小越好.

問題7

如何求a,b的值,使

最???新知探究問題7

如何求a,b的值,使

最小?新知探究:經(jīng)驗回歸方程所以當(dāng)取最小值時,取最小值0,即.此時上式是關(guān)于b的二次函數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)b的取值為綜上,當(dāng)a,b的取值為

時,Q達(dá)到最小.

人們經(jīng)過長期的實踐與研究,已經(jīng)找到了計算回歸方程的一般公式

,其中:問題7

如何求a,b的值,使

最???新知探究:經(jīng)驗回歸方程

該公式的推導(dǎo)較復(fù)雜,故不作推導(dǎo),但它的原理較為簡單:即各點到該直線的距離的平方和最小.我們將

稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.這種求經(jīng)驗回歸方程的方法叫做最小二乘法,利用該公式求得的

叫做b,a的最小二乘估計.這里的“二乘”是平方的意思.

經(jīng)驗回歸直線(2)計算公式

[典例講評]

2.隨著網(wǎng)絡(luò)的普及,網(wǎng)上購物的方式已經(jīng)受到越來越多年輕人的青睞,某家網(wǎng)絡(luò)店鋪商品的成交量x(單位:件)與店鋪的瀏覽量y(單位:次)之間的對應(yīng)數(shù)據(jù)如表所示:x/件24568y/次3040506070(1)根據(jù)表中數(shù)據(jù)畫出散點圖;(2)根據(jù)表中的數(shù)據(jù),求出y關(guān)于x的經(jīng)驗回歸方程;(3)當(dāng)這種商品的成交量突破100件(含100件)時,預(yù)測這家店鋪的瀏覽量至少為多少.

代入公式得

x/件24568y/次3040506070

[學(xué)以致用]

2.某商店為了解氣溫對某產(chǎn)品銷售量的影響,隨機(jī)記錄了該商店3月中5天的日銷售量y(單位:千克)與該地當(dāng)日最低氣溫x(單位:℃)的數(shù)據(jù),如表所示:x258911y1210887

探究3利用經(jīng)驗回歸方程進(jìn)行預(yù)測[典例講評]

3.(源自湘教版教材)一個車間為了估計加工某種新型零件所花費的時間,進(jìn)行了10次試驗,測得的數(shù)據(jù)如表所示:個數(shù)x102030405060708090100時間y/min626875818995102108115122(1)y與x之間是否具有相關(guān)關(guān)系?(2)如果y與x之間具有相關(guān)關(guān)系,求y關(guān)于x的經(jīng)驗回歸方程;(3)據(jù)此估計加工110個零件所用的時間.

r=

反思領(lǐng)悟

(1)判斷兩個變量是否線性相關(guān):可以利用經(jīng)驗,也可以畫散點圖,還可以計算樣本相關(guān)系數(shù).(2)求經(jīng)驗回歸方程,注意運算的正確性.(3)根據(jù)經(jīng)驗回歸方程進(jìn)行預(yù)測估計:估計值不是實際值,兩者會有一定的誤差.[學(xué)以致用]3.某研究機(jī)構(gòu)對高三學(xué)生的記憶力x和判斷力y進(jìn)行統(tǒng)計分析,得如表數(shù)據(jù):x681012y2356

(3)試根據(jù)求出的經(jīng)驗回歸方程,預(yù)測記憶力為9的同學(xué)的判斷力.參考公式:

243題號1應(yīng)用遷移√因為經(jīng)驗回歸直線的斜率為80,所以x每增加1,y平均增加80,即勞動生產(chǎn)率提高1000元時,工人工資平均提高80元.23題號14

23題號41√

243題號1

0.8回顧本節(jié)知識,自主完成以下問題:1.經(jīng)驗回歸直線一定過哪個點?

2.y與x正、負(fù)相關(guān)的充要條件各是什么?

閱讀材料“回歸”一詞的由來統(tǒng)計學(xué)中的“回歸”一詞,是統(tǒng)計學(xué)家高爾頓引入的.早在19世紀(jì)80年代,高爾頓就開始了親代與子代(即父母親與子女)之間相似特征(身高、性格等)的研究.他收集了一些親代的身高x與子代的身高y的成對數(shù)據(jù),并作出了散點圖,發(fā)現(xiàn)y與x的關(guān)系可以借助一次函數(shù)來近似表示,而且總體上親代的身高增加時,子代的身高

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論