版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一元線性回歸模型新課程標(biāo)準(zhǔn)解讀核心素養(yǎng)1.結(jié)合具體實(shí)例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)計(jì)意義.2.了解最小二乘原理,掌握求一元線性回歸模型參數(shù)的最小二乘估計(jì),會(huì)使用相關(guān)的統(tǒng)計(jì)軟件,針對(duì)實(shí)際問(wèn)題,會(huì)用一元線性回歸模型進(jìn)行預(yù)測(cè).1.數(shù)學(xué)抽象:一元線性回歸模型.2.?dāng)?shù)學(xué)建模、數(shù)學(xué)運(yùn)算:一元線性回歸模型參數(shù)的最小二乘估計(jì).
情
境
導(dǎo)
入
通過(guò)前面的學(xué)習(xí)我們已經(jīng)知道,根據(jù)成對(duì)樣本數(shù)據(jù)的散點(diǎn)圖和相關(guān)系數(shù),可以判斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線性相關(guān)程度的強(qiáng)弱等.
思考:是否可以通過(guò)建立適當(dāng)?shù)慕y(tǒng)計(jì)模型來(lái)刻畫(huà)兩個(gè)變量之間的相關(guān)關(guān)系?
身高與體重具有正相關(guān)的關(guān)系,為了進(jìn)一步研究?jī)烧咧g的關(guān)系,有人從某大學(xué)中隨機(jī)選出8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表:編號(hào)12345678身高165165157170175165155170體重4857505464614359以橫軸表示身高、縱軸表示體重建立直角坐標(biāo)系,再將表中的成對(duì)樣本數(shù)據(jù)表示為散點(diǎn)圖.可以發(fā)現(xiàn),散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明身高和體重線性相關(guān).利用統(tǒng)計(jì)軟件,求得樣本相關(guān)系數(shù)為r,且相關(guān)程度強(qiáng).和15015516016517017518040455055606570身高/cm體重/kg從散點(diǎn)圖還看到,樣本點(diǎn)散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a描述它們關(guān)系。1.一元線性回歸模型如果用x表示女大學(xué)生身高,Y表示女大學(xué)生的體重,用e表示各種其他隨機(jī)因素影響之和,稱e為隨機(jī)誤差,假定隨機(jī)誤差e的均值為0,方差與身高無(wú)關(guān)的定值σ2,則它們之間的關(guān)系可以表示為稱為Y關(guān)于x的一元線性回歸模型其中Y稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量,a,b為模型的未知參數(shù),a稱為截距參數(shù),b稱為斜率參數(shù);e是Y與bx+a之間的隨機(jī)誤差思考:為什么E(e)=0?產(chǎn)生隨機(jī)誤差e的原因有哪些?隨機(jī)誤差e的來(lái)源(可以推廣到一般):1、忽略了其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習(xí)慣、生長(zhǎng)環(huán)境等因素;2、用線性回歸模型近似真實(shí)模型所引起的誤差;3、身高y
的觀測(cè)誤差。以上三項(xiàng)誤差越小,說(shuō)明我們的回歸模型的擬合效果越好。
線性回歸模型y=bx+a+e增加了隨機(jī)誤差項(xiàng)e,因變量y的值由自變量x和隨機(jī)誤差項(xiàng)e共同確定,即自變量x只能解釋部分y的變化。2.隨機(jī)誤差平方和15015516016517017518040455055606570身高/cm體重/kg(1)滿足一元線性回歸模型的兩個(gè)變量的n對(duì)樣本數(shù)據(jù)(x1,y1),(x2y2),…,(xn,yn),知|ei|=|yi-(bxi+a)|
,其中,|ei|越小,表示點(diǎn)(xi,yi)與點(diǎn)(xi,bxi+a)的距離越?。?dāng)ei=0時(shí),表示點(diǎn)(xi,yi)在直線y=bx+a上.=|y1-bx1-a|+|y2-bx2-a|+…+|yn-bxn-a|由于絕對(duì)值不易計(jì)算,就改用平方,即=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2(2)通過(guò)用各散點(diǎn)到直線的豎直距離的平方和Q=
來(lái)
刻畫(huà)“整體接近程度”,其中Q還可以表示為
,即它是隨機(jī)誤差的平方和.(yi-bxi-a)2Σni=1Σe2ini=1即要使Q=(y1-bx1-a)2+(y2-bx2-a)2+…+(yn-bxn-a)2最小,a,b
應(yīng)取什么值?這種使樣本數(shù)據(jù)各點(diǎn)到回歸直線的距離的平方和最小來(lái)得到回歸直線的方法叫做最小二乘法.求出a,b
的值,就得到回歸方程經(jīng)驗(yàn)回歸方程也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線經(jīng)驗(yàn)回歸直線一定過(guò)樣本點(diǎn)的中心3.觀測(cè)值、預(yù)測(cè)值、殘差對(duì)于響應(yīng)變量Y,通過(guò)觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值,通過(guò)經(jīng)驗(yàn)回歸方程得到的預(yù)測(cè)值,觀測(cè)值減去預(yù)測(cè)值稱為殘差.殘差表編號(hào)12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382問(wèn)題數(shù)據(jù)越窄越好殘差圖4.決定系數(shù)R2我們可以用決定系數(shù)R2來(lái)刻畫(huà)回歸的效果,其計(jì)算公式是R2的范圍:[0,1];R2越大,模型的擬合效果越好;R2越小,模型的擬合效果越差;在線性回歸模型中,R2表示解釋變量對(duì)于預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸的效果越好.探究點(diǎn)1經(jīng)驗(yàn)回歸方程例1.在某種產(chǎn)品表面進(jìn)行腐蝕刻線試驗(yàn),得到腐蝕深度y(μm)與腐蝕時(shí)間x(s)之間的一組觀察值如表.x(s)5101520304050607090120y(μm)610101316171923252946(1)畫(huà)出散點(diǎn)圖;(2)求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)利用經(jīng)驗(yàn)回歸方程預(yù)測(cè)時(shí)間為100s時(shí)腐蝕深度為多少(1)散點(diǎn)圖如圖所示,2040608010012001020304050yx(2)從散點(diǎn)圖中,我們可以看出樣本點(diǎn)分布在一條直線附近,因而求經(jīng)驗(yàn)回歸方程有意義.=5×6+10×10+15×10+…+120×46=13910,Σx
iyi11i=1=52+102+152+…+1202=36750,Σx2i11i=1Σxiyi-11xy11i=1Σxi2
-11x2
11i=1≈腐蝕時(shí)間為100s時(shí)腐蝕深度為約35.76μm.年份x20162017201820192020儲(chǔ)蓄存款額y/千億元567810為了計(jì)算方便,工作人員將上表的數(shù)據(jù)進(jìn)行了處理,令t=x-2015,z=y(tǒng)-5,得到下表.t12345z01235(1)求z關(guān)于t的經(jīng)驗(yàn)回歸方程;(2)通過(guò)(1)中的方程,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)用所求經(jīng)驗(yàn)回歸方程預(yù)測(cè)到2022年年底,該地此銀行儲(chǔ)蓄存款額可達(dá)到多少?Σi=15Σi=15代入t=x-2015,z=y(tǒng)-5,探究點(diǎn)2線性回歸分析對(duì)一個(gè)問(wèn)題的回歸模型,怎樣刻畫(huà)回歸的效果?有三種方式刻畫(huà)回歸效果:(1)殘差圖法;(2)殘差平方和法;(3)決定系數(shù)R2.
例2.為研究質(zhì)量x(單位:g)對(duì)彈簧長(zhǎng)度y(單位:cm)的影響,對(duì)不同質(zhì)量的6個(gè)物體進(jìn)行測(cè)量,數(shù)據(jù)如表所示:x51015202530y7.258.128.959.9010.911.8(1)作出散點(diǎn)圖,并求經(jīng)驗(yàn)回歸方程;(2)求出R2;(3)進(jìn)行殘差分析.510152025300246810yx1235+20+25+30)=17.5,9.90+10.9+11.8)≈9.487,Σxi2
=2275,
i=16Σxiyi=1076.2,i=16所以所求經(jīng)驗(yàn)回歸方程為(2)列表如下:,0.050.005-0.08-0.0450.040.025-2.24-1.37-0.540.411.412.31Σi=16()2≈0.01318,i=16Σ(yi-y)2=14.684,(3)由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤,如果有的話,需要糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在不超過(guò)的狹窄的水平帶狀區(qū)域中,說(shuō)明選用的回歸模型的精度較高,由以上分析可知,彈簧長(zhǎng)度與質(zhì)量成線性關(guān)系.(1)殘差平方和越小,模型的擬合效果越好.(2)決定系數(shù)R2越大,說(shuō)明模型的擬合效果越好.探究點(diǎn)3非線性回歸分析可通過(guò)散點(diǎn)圖選擇適當(dāng)類型的擬合函數(shù),通過(guò)對(duì)變量的變換轉(zhuǎn)化成線性回歸模型解決.常見(jiàn)的擬合函數(shù)有(1)指數(shù)型函數(shù):y=ebx+a類;(2)對(duì)數(shù)型函數(shù):y=blnx+a類;(3)冪函數(shù)型:y=bxα+a類.2102022024681012年研發(fā)費(fèi)用x千萬(wàn)元年銷售量y/千萬(wàn)件(1)利用散點(diǎn)圖判斷y=a+bx和y=c·xd(其中c,d均為大于0的常數(shù))哪一個(gè)更適合作為年銷售量y和年研發(fā)費(fèi)用x的回歸方程類型(只要給出判斷即可,不必說(shuō)明理由);(2)對(duì)數(shù)據(jù)作出如下處理,令ui=ln
xi,vi=ln
yi,得到相關(guān)統(tǒng)計(jì)量的值如下表.根據(jù)第(1)問(wèn)的判斷結(jié)果及表中數(shù)據(jù),求y關(guān)于x的回歸方程Σvi
i=110Σui
i=11010i=1Σ(ui-u)(vi-v)Σ(ui-u)210i=1151528.2556.54681214161824(1)由散點(diǎn)圖可知,選擇回歸類型得lny=ln
c+dln
x,Σui
i=110=Σvi
i=11010i=1Σ(ui-u)(vi-v)Σ(ui-u)210i=1所以年銷售量y與年研發(fā)費(fèi)用x的非線性經(jīng)驗(yàn)回歸方程為解決非線性回歸問(wèn)題的步驟畫(huà)散點(diǎn)圖
選擬合函數(shù)變換求解變換還原根據(jù)原始數(shù)據(jù)(x,y)畫(huà)散點(diǎn)圖根據(jù)散點(diǎn)圖,選擇恰當(dāng)?shù)臄M合函數(shù)進(jìn)行恰當(dāng)?shù)淖儞Q,轉(zhuǎn)化成線性函數(shù),求經(jīng)驗(yàn)回歸方程通過(guò)相應(yīng)的變換,即可得非線性經(jīng)驗(yàn)回歸方程相關(guān)結(jié)論1.樣本相關(guān)系數(shù)r用來(lái)衡量?jī)蓚€(gè)變量之間線性相關(guān)程度的強(qiáng)弱,|r|越接近于1,相關(guān)程度越強(qiáng)3.隨機(jī)誤差e滿足E(e)=0,其方差D(e)的大小用來(lái)衡量預(yù)測(cè)的精確度4.決定系數(shù)R2用來(lái)刻畫(huà)回歸模型的擬合效果,R2越大,說(shuō)明模型的擬合效果越好2.(2021·重慶高二期末)若某地財(cái)政收入x與支出y滿足一元線性回歸模型y=bx+a+e(單元:億元
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026云南省教育廳招募基礎(chǔ)教育銀齡教師760人備考題庫(kù)(含答案詳解)
- 2025山東臨沂市河?xùn)|區(qū)教育和體育局部分學(xué)校引進(jìn)緊缺學(xué)科教師34人備考題庫(kù)(含答案詳解)
- 2026年馬鞍山市交通運(yùn)輸綜合行政執(zhí)法支隊(duì)公開(kāi)選調(diào)工作人員14名備考題庫(kù)有答案詳解
- 2026年自然資源部海島研究中心專業(yè)技術(shù)人員招聘?jìng)淇碱}庫(kù)及一套參考答案詳解
- 2026云南曲靖富源縣公安局情指中心招聘警務(wù)輔助人員1名備考題庫(kù)及答案詳解1套
- 2026年生物科技在醫(yī)藥研發(fā)中的創(chuàng)新報(bào)告
- 2026年公共管理考試題庫(kù)政策分析與執(zhí)行
- 2026年建筑設(shè)計(jì)工程力學(xué)安全標(biāo)準(zhǔn)工程知識(shí)題庫(kù)
- 2026江西南昌某軍隊(duì)院校幼兒園社會(huì)招聘3人備考題庫(kù)完整參考答案詳解
- 2026吉林富維股份內(nèi)部招聘16人備考題庫(kù)及一套完整答案詳解
- 醫(yī)療行業(yè)知識(shí)產(chǎn)權(quán)教育的必要性
- 2024-2025學(xué)年滬教版(五四學(xué)制)(2024)初中英語(yǔ)六年級(jí)下冊(cè)(全冊(cè))知識(shí)點(diǎn)歸納
- 五年級(jí)數(shù)學(xué)下冊(cè)寒假作業(yè)每日一練
- 傳染病院感防控課件
- 寒假生活有計(jì)劃主題班會(huì)
- 羅馬機(jī)場(chǎng)地圖
- 實(shí)習(xí)生醫(yī)德醫(yī)風(fēng)培訓(xùn)
- 橫穿公路管道施工方案
- 快樂(lè)讀書(shū)吧:非洲民間故事(專項(xiàng)訓(xùn)練)-2023-2024學(xué)年五年級(jí)語(yǔ)文上冊(cè)(統(tǒng)編版)
- GB/T 19609-2024卷煙用常規(guī)分析用吸煙機(jī)測(cè)定總粒相物和焦油
- 公路工程標(biāo)準(zhǔn)施工招標(biāo)文件(2018年版)
評(píng)論
0/150
提交評(píng)論