版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第02講8.2一元線性回歸模型及其應(yīng)用
(8.2.1一元線性回歸模型+822—元線性回歸模型參數(shù)的最小二乘法
估計(jì))
學(xué)習(xí)目標(biāo)
課程標(biāo)準(zhǔn)學(xué)習(xí)目標(biāo)
①了解一元線性回歸模型的含義,理解兩
個(gè)變量之間隨機(jī)關(guān)系的一元線性回歸模型
的作用與意義。
②了解殘差在線性回歸與非線性回歸問
題的作用及意義。通過本節(jié)課的學(xué)習(xí),要求會(huì)求一元線性回歸方程,會(huì)進(jìn)
③了解一元線性回歸模型參數(shù)與最小二行殘差分析,能判斷回歸模型的擬合效果,能利用樣本
乘估計(jì)的推導(dǎo)過程,理解最小二乘估計(jì)的原數(shù)據(jù)建立統(tǒng)計(jì)模型并能進(jìn)行預(yù)測
理。
④會(huì)結(jié)合題意求一元線性回歸方程。
⑤會(huì)用相關(guān)指數(shù)進(jìn)行分析模型擬合的效
果情況
思維導(dǎo)圖
知識清單
知識點(diǎn)1:一元線性回歸模型
(1)一元線性回歸模型
我們稱:現(xiàn)6Y)=b0x,0+(a6+)二e
(72
為y關(guān)于%的一元線性回歸模型,其中y稱為因變量或響應(yīng)變量,不稱為自變量或解釋變量;。和〃為
模型的未知參數(shù),。稱為截距參數(shù),〃稱為斜率參數(shù);e是y與云+。之間的隨機(jī)誤差.
(2)隨機(jī)誤差
在線性回歸模型y="+a+e中,。和〃為模型的未知參數(shù),e是丫與公:+。之間的誤差,通常e為隨
機(jī)變量,稱為隨機(jī)誤差.它的均值EQ)=O,方程Z)(e)=b2>0.
Y=hx+a+e
線性回歸模型的完整表達(dá)式為《在此模型中,隨機(jī)誤差e的方差er?越小,用
石⑷=0,。,)=
/猶+。預(yù)報(bào)真實(shí)值的精度越高.
知識點(diǎn)2:一元線性回歸模型參數(shù)的最小二乘法
(1)經(jīng)驗(yàn)回歸方程的求解法:最小二乘法
回歸直線方程過樣本點(diǎn)的中心(;,]),是回歸直線方程最常佳的一個(gè)特征;
我們將§,=良+々稱為y關(guān)于工的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)
回回直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的/;,后,叫做〃,。的最小二乘估計(jì),其
中分稱為回歸系數(shù),它實(shí)際上也就是經(jīng)驗(yàn)回歸直線的斜率,G為截距.
》(芭T(X-y)£-心
3________________=^i____________
其中ZU-)2儲(chǔ)
1=11=1
a=y-bx
【即學(xué)即練1】(2024上?全國?高三專題練習(xí))某校數(shù)學(xué)建模學(xué)生社團(tuán)進(jìn)行了一項(xiàng)實(shí)驗(yàn)研究,采集了x、.V的
一組數(shù)據(jù)如下表所示:
X23456-7
y52.54540302517.5
該社團(tuán)對上述數(shù)據(jù)進(jìn)行了分析,發(fā)現(xiàn)丁與1之間具有線性相關(guān)關(guān)系.
⑴畫出表中數(shù)據(jù)的散點(diǎn)圖,并指出)'與x之間的相關(guān)系數(shù)「是止還是負(fù);
(2)求出),關(guān)于x的線性回歸方程,并寫出當(dāng)x=9時(shí),預(yù)測數(shù)據(jù)『的值.
附:在線性回歸方程?=2+加中,B=f---------,a=y-bx,其中;,亍為樣本平均值.
*升〃⑴2
r-l
【答案】(1)散點(diǎn)圖見解析,負(fù)
(2)y=66.5-7x,y=3.5
【詳解】(1)由題意得散點(diǎn)圖如圖所示:
由圖可知)'與x之間成負(fù)相關(guān)關(guān)系,所以廣是負(fù).
.E£2+3+4+5+6+7--52.5+45+40+30+25+17.5?
(Z2)因?yàn)閤=----------------=4.5,y=-------------------------=35,
66
之.=882.5,次#=139,
i=l/-I
822.5-6x4.5x35
所以6二母---------=-7,力一應(yīng)=35—(—7)x45=66.5,
I39-6x4.52
X^-6x2
i=\
???關(guān)于”線性回歸方程為?=66.5-7工,
所以當(dāng)x=9時(shí),y=3.5.
(2)求經(jīng)驗(yàn)回歸方程的步驟
①作出散點(diǎn)圖,判斷兩變量是否具有線性相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可求其經(jīng)驗(yàn)I可歸方程;
②列表求出的值;
③利用公式先計(jì)算/,,再根據(jù)經(jīng)驗(yàn)回歸直線過樣本點(diǎn)的中心丘;)計(jì)算.;
④寫出經(jīng)驗(yàn)回歸方程y=hx+a-
求經(jīng)驗(yàn)回歸方程,關(guān)鍵在于正確求出系數(shù)由于計(jì)算量較大,所以計(jì)算時(shí)要仔細(xì)謹(jǐn)慎、分層進(jìn)行,避免
因計(jì)算產(chǎn)生錯(cuò)誤要特別注意,只有兩個(gè)變量呈線性相關(guān)關(guān)系時(shí),求出的經(jīng)驗(yàn)回歸方程才有意義.
(3)經(jīng)驗(yàn)回歸方程的性質(zhì)
①經(jīng)驗(yàn)回歸直線一定過點(diǎn)丘,?。?,點(diǎn)丘,?。┩ǔ7Q為樣本點(diǎn)的中心;
②一次函數(shù)),=法+〃的單調(diào)性由〃的符號決定,函數(shù)遞增的充要條件是方>0;函數(shù)遞減的充要條件是
〃<0.這說明:)'與X正相關(guān)的充要條件是〃〉0;)'與X負(fù)相關(guān)的充要條件是〃<().
③在經(jīng)驗(yàn)回歸方程),=法+〃中,〃是經(jīng)驗(yàn)回歸直線的斜率,〃是截距.一般地,當(dāng)回歸系數(shù)匕〉0時(shí),說
明兩個(gè)變量呈正相關(guān)關(guān)系,它的意義是當(dāng)x每增大一個(gè)單位時(shí),),平均增大。個(gè)單位;當(dāng)〃時(shí),說明兩
個(gè)變量呈負(fù)相關(guān)關(guān)系,它的意義是當(dāng)x每增大一個(gè)單位時(shí),),平均減小|加個(gè)單位.
知識點(diǎn)3:殘差
(1)殘差
對于響應(yīng)變量y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的?稱為預(yù)測值,觀測值
減去預(yù)測值稱為殘差.
(2)殘差圖
作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù)、或體重估計(jì)值等,這樣作出的圖形稱為殘
差圖.若殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說明擬合效果越好.
(3)殘差分析
殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是
否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.其步驟為:計(jì)算殘差一化殘差圖-在殘差圖中分析殘
差特性.
【即學(xué)即練2】(2024?全國?高三專題練習(xí))對于一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù)(冷丫)(,=12,〃),其樣
本中心為(反司,回歸方程為¥=1+》,則相應(yīng)于樣本點(diǎn)(.y)的殘差為()
A.y-yB.y-y.
C.y-佃+〃)D.低+a)-%
【答案】C
【詳解煙為殘差是實(shí)際觀察值與估計(jì)值(擬合值)之間的差,所以相應(yīng)于樣本點(diǎn)(七,%)的殘差為K-伽+。卜
故選:C.
知識點(diǎn)4;決定系數(shù)R2
(1)殘差平方和
n2
殘差平方和2(£-色),殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.
1=1
(2)決定系數(shù)R2
決定系數(shù)R是度量模型擬合效果的一種指標(biāo),在線性模型中,它代表解釋變量客戶預(yù)報(bào)變量的能力.
Z(y-'『
甯=1一號一——,2越大,即擬合效果越好,R?越小,模型擬合效果越差.
?MT
1=1
【即學(xué)即練3](2023下?青海西寧?高二校考階段練習(xí))甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸
模型時(shí).,分別選擇了4種不同模型,計(jì)算可得它們的相關(guān)指數(shù)82分別如下表:
甲乙丙T
R20.980.780.500.85
建立的回歸模型擬合效果最好的同學(xué)是.
【答案】選甲相關(guān)指數(shù)W越大,表示回歸模型擬合效果越好.
【詳解】相關(guān)指數(shù)/越大,相關(guān)性越強(qiáng),回歸模型擬合效果越好,所以效果最好的是甲.
(3)決定系數(shù)配與相關(guān)系數(shù)廠的聯(lián)系與區(qū)別
①相關(guān)系數(shù)一反映兩個(gè)變量的相關(guān)關(guān)系的強(qiáng)弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)R?反映回歸模型的擬合效果.
②在含有一個(gè)解釋變量的線性模型中,決定系數(shù)R2的數(shù)值是相關(guān)系數(shù)r的平方,其變化范圍為[0/1,而相
關(guān)系數(shù)的變化范圍為
③當(dāng)相關(guān)系數(shù)|川接近于1時(shí),說明兩變量的相關(guān)性較強(qiáng),當(dāng)接近于。時(shí),說明兩變量的相關(guān)性較弱;
而當(dāng)后接近于1時(shí),說明經(jīng)驗(yàn)回歸方程的擬合效果較好.
題型精講
題型01由散點(diǎn)圖判斷是否線性相關(guān)
【典例1](2023下?河南南陽?高二唐河縣第一高級中學(xué)??茧A段練習(xí))2003年春季,我國部分地區(qū)SARS
流行,黨和政府采取果斷措施,防治結(jié)合,很快使病情得到控制,下表是某同學(xué)記載的5月1口至5月12
日每天北京市SARS治愈者數(shù)據(jù),以及根據(jù)這些數(shù)據(jù)繪制出的散點(diǎn)圖
日期5.15.25.35.45.55.65.75.85.95.105.115.12
人數(shù)100109115118121134141152168175186203
下列說法:①根據(jù)此散點(diǎn)圖,可以判斷日期與人數(shù)具有線性相關(guān)關(guān)系;②根據(jù)此散點(diǎn)圖,可以判斷日期與
人數(shù)具有一次函數(shù)關(guān)系.其中正確的個(gè)數(shù)為()
A.0個(gè)B.1個(gè)C.2個(gè)D.以上都不對
【答案】B
【詳解】由題意,
做出散點(diǎn)圖如下圖所示,
24人數(shù)
250
1OCI
15CI
OCI
5O0
12345678910111213日期編號
由圖可知,
日期與人數(shù)具有線性相關(guān)關(guān)系,但不是一次函數(shù)關(guān)系,
①正確,②錯(cuò)誤,
故選:B.
【典例2】(2023?全國?高二專題練習(xí))某個(gè)男孩的年齡與身高的統(tǒng)計(jì)數(shù)據(jù)如下表所示:
年齡X(歲)123456
身高),(cm)788798108115120
⑴畫出散點(diǎn)圖;
⑵判斷y與x是否具有線性相關(guān)關(guān)系,如果相關(guān),是正相關(guān)還是負(fù)相關(guān).
【答案】(1)答案見解析
(2)、與x具有線性相關(guān)關(guān)系,且是正相關(guān)關(guān)系.
【洋解】(1)散點(diǎn)圖如圖所示:
(2)由圖知,所有數(shù)據(jù)點(diǎn)接近一條直線排列,因此,認(rèn)為y與x具有線性相關(guān)關(guān)系,且是正相關(guān)關(guān)系.
【答案】D
【詳解】由圖可知,②④中的點(diǎn)集中在一條直線的附近,所以圖②④中的兩個(gè)變量具有線性相關(guān)關(guān)系,
故選:D.
題型02求回歸直線方程
【典例1】(2024上?江西贛州?高二統(tǒng)考期末)大氣污染物PM%(直徑不大于2.5〃m的顆粒物)的濃度超
過一定限度會(huì)影響人的身體健康.為研究PM/濃度),(單位:/g/n?)與汽車流量x(單位:干輛)的線
性關(guān)系,研究人員選定了10個(gè)城市,在每個(gè)城市建立交通監(jiān)測點(diǎn),統(tǒng)計(jì)了24h內(nèi)過往的汽車流量以及同時(shí)
段空氣中的PM”濃度,得到如下數(shù)據(jù):
城市編號12345678910總和
X1.3001.4440.7861.6521.7561.7541.2001.5001.2000.90813.5
y667621170156120721201001291030
101010
并計(jì)算得=19.225,2^=124434,2中廣1479.5.
i=l
⑴求變量關(guān)于X的線性回歸方程;
⑵根據(jù)24/?內(nèi)PM?5濃度確定空氣質(zhì)量等級,PM2.5濃度在。?35〃g/m3為優(yōu),35?75〃g/m,為良,75?115
為輕度污染,"5?150〃g/m'為中度污染,150?250〃g/m3為重度污染,已知某城市24〃內(nèi)過往的
汽車流量為1360輛,判斷該城市的空氣質(zhì)量等級.
s,
參考公式:線性回歸方程為),=A+a,其中以?=J-----------=『
/=1/=1
【答案】⑴y=89x—1775
⑵輕度污染
【詳解】(1)由題意得;=轉(zhuǎn)=1.35,不=甯=103
1010
又因?yàn)?479.5,?>;=19.225
r=lM
10___
所以八針一m)’J479.5T0xL35xK)3=89
2
^%2_10-219.225-10xl.35
/=!
所以〃=亍一位=103—89x1.35=—17.15
所以變量y關(guān)于x的線性回歸方程為y=89x-17.15.
(2)當(dāng)%=1360輛=1.36千輛時(shí),可得y=89xl.36-17.15=103.89〃g/m3
因?yàn)?03.89e(75/15)
所以該城市的空氣質(zhì)量等級為輕度污染.
【典例2】(2024上?重慶沙坪壩高三重慶八中校考階段練習(xí))在入室盜竊類案件中,出現(xiàn)頻率最高的痕跡
物iEt一就是足跡.負(fù)重行走對足跡步伐特征影響的規(guī)律強(qiáng),而且較為穩(wěn)定.正在行走的人在負(fù)重的同
時(shí),步長變短,步寬變大,步角變大.因此,以身高分別為"Ocm,175cm,180cm的人員各20名作
為實(shí)驗(yàn)對象,讓他們采取雙手胸前持重物的負(fù)重方式行走,得到實(shí)驗(yàn)對象在負(fù)重0kg,5kg,10kg,15kg,
20kg狀態(tài)下相對穩(wěn)定的步長數(shù)據(jù)平均值.并在不同身高情況下,建立足跡步長s(單位:cm)關(guān)于負(fù)重耳單
位:kg)的三個(gè)經(jīng)驗(yàn)回歸方程.根據(jù)身高170cm組數(shù)據(jù)建立線性回歸方程①:5,=-0.402x455.728;根
據(jù)身高175cm組數(shù)據(jù)建立線性回歸方程②:£=-0.497x+64.404;根據(jù)身高180cm組數(shù)據(jù)建立線性回歸
方程③:=bx+a.
⑴根據(jù)身高180cm組的統(tǒng)計(jì)數(shù)據(jù),求4,-的值,并解釋參數(shù)£的含義;
身高180cm不同負(fù)重情況下的步長數(shù)據(jù)平均值
負(fù)重x/kg05101520
足跡步長s/cm74.3573.5071.8068.6065.75
⑵在一起盜竊案中,被盜竊物品重為9kg,在現(xiàn)場勘杳過程中,測量得犯罪嫌疑人往返時(shí)足跡步長的差值為
4.464cm,推測該名嫌疑人的身高,并說明理由.
附:s=hx+a,為回歸方程,a=s-bx,豆=354,£衲=34295
ZM為一,狀-i-i曰
【答案】⑴4=75.22,/;=T).442,參數(shù)/;的含義詳見解析
(2)嫌疑人身高為175cm,理由詳見解析
/?I
【詳解】(1)由題意可知:?=°+5+1(;+15+20=]0,+X;+X;+X:+*=750.-=Pi=708
555
-欣不3429.5-354x10八(口.
所以〃=-^-4~~—=……=-0.442,a=s-bx=70.S+0.442x10=75.22;
x~-fix'750-5x100
5的含義表示,負(fù)重每增加1kg足跡步長減少0.442cm.
(2)設(shè)被盜竊物品重為9kg時(shí),身高170cm的步長誤差為人』,高175cm的步長誤差為心?,高180cm的
步長誤差為腐3,
由題意可得,A*=3.618cm,=4.476cm,A.v3=3.987cm,
因?yàn)?4.476cm與測量得犯罪嫌疑人往返時(shí)足跡步長的差值乙.464cm最接近,
所以犯罪嫌疑人身高為175cm.
【典例3】(2024上?全國,高三專題練習(xí))某種產(chǎn)品的廣告費(fèi)支出x(單位:萬元)與銷售額y(萬元)之間
有如下一組數(shù)據(jù):
廣告費(fèi)支出X24568
銷售額y3040605070
⑴求出樣本點(diǎn)中心
(2)求回歸直線方程(其中“=弋£-%--:-一--〃-----,a=y-bx)
r-1
【答案】(1)(5,50)
(2)y=6.5x+17.5
151
【詳解】(1)由題意可得:T=產(chǎn)±(2+4+5+6+8)=5,
3/=i3
y==-(30+40+60+50+70)=50,
5i=i5
所以樣本點(diǎn)中心為(5,50).
5
(2)由題意可得:=2x30+4x40+5x60+6x50+8x70=1380,
J=l
£x;=22+42+52+62+82=145,
r-l
g01380-5x5x50130“〃,
所以人=----------;—=—=6.5,4=50—6.5x5=17.5,
145—5x5?20
所以回歸直線方程為),=6,5x+17.5?
【變式1](2024上?黑龍江牡丹江?高三牡丹江市第二高級中學(xué)校聯(lián)考期末)近期,一些地方中小學(xué)生〃課
間10分鐘"問題受到社會(huì)廣泛關(guān)注,國家號召中小學(xué)要增加學(xué)生的室外活動(dòng)時(shí)間.但是進(jìn)入12月后,天氣
漸冷,很多學(xué)生因氣溫低而減少了外出活動(dòng)次數(shù).為了解本班情況,一位同學(xué)統(tǒng)計(jì)了一周(5天)的氣溫變
化和某一固定課間該班級的學(xué)生出樓人數(shù),得到如下數(shù)據(jù):
溫度看(零下C)710111517
出樓人數(shù)匕201617107
⑴利用最小二乘法,求變量X,+,之間的線性回歸方程;
nn__
Z(N-初凹一列Zw-w
附:用最小二乘法求線性回歸方程$,=立+力的系數(shù):方=J-----------=號---------a='y-bi
1=11=1
⑵預(yù)測當(dāng)溫度為-8℃時(shí),該班級在本節(jié)課間的出樓人數(shù)(人數(shù):四舍五入取整數(shù)).
⑶為了號召學(xué)生能夠增加室外活動(dòng)時(shí)間,學(xué)校舉行拔河比賽,采取3局2勝制(無平局).在甲、乙兩班
3
的較量中,甲班每局獲勝的概率均為《,設(shè)隨機(jī)變量X表示甲班獲勝的局?jǐn)?shù),求X的分布列和期望.
2111Q
【答案】⑴R-成+7
(2)19
⑶分布列見解析;期望為黑
1
-1—1
【詳解】(1)x=-(7+10+11+15+17)=12,j=-(20+16+17+10+7)=14,
55
5_
一可(凹=(7-12)(20-14)+(10-12)(16-14)+(11-12)(17-14)+(15-12)(10-14)
+(17-12)(7-14)=-84,
以七一和=25+4+1+9+25=64,
幺,人“派=14-xl2=l^
元(七-年16I164
J=l
21119
回歸直線方程為加一江一二
21I19
⑵當(dāng)E時(shí),>飛X8+T,I9(A),
16
所以,預(yù)測當(dāng)溫度為-8℃時(shí),該班級在本節(jié)課間的出樓人數(shù)為19人.
(3)隨機(jī)變量X可取0,1,2.
224
p(X=0)=-x-=—
5525
P(X=1)=3X2X2+2X3X2=24
555555125
3332323381
P(X=2)=-x—+—x—x—+—x—x—=---,
55555555125
所以X的分布列為:
X012
42481
P
25125125
所以X的數(shù)學(xué)期望為E(X)=0x4+lx常+2、黑=黑
/J14J14J14J
【變式2](2024上?全國?高三專題練習(xí))下面給出了根據(jù)我國2012年2018年水果人均占有量?。▎挝?
kg)和年份代碼x繪制的散點(diǎn)圖(2012年2018年的年份代碼x分別為1~7).
我國2012年?2018年水果人均占有錄取點(diǎn)圖
80
70
60
50
40
30
20
234567
年份代碼x
⑴根據(jù)散點(diǎn)圖分析y與x之間的相關(guān)關(guān)系;
(2)根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得=1074,\>身=4517,求y關(guān)于X的線性回歸方程.(精確到().()1)
1=11=1
附:回歸方程?=〃+力中斜率和棧距的最小二乘估計(jì)公式分別為:
J
AEU-)(.Vr-y)
------,a=y-bx
£(為-了『
i=l
【答案】(1))'與x之間是正相關(guān)關(guān)系
(2)y=7.89x4-121.86
【詳解】(1)由散點(diǎn)圖可以看出,散點(diǎn)大致分布在某一直線的附近,且當(dāng)x由小變大時(shí),丁也由小變大,
???y與%之間是正相關(guān)關(guān)系.
(2)由表格數(shù)據(jù)得:x=1(l+2-3+4+5+6+7)=4,予=;、1074=與
°7f34517-7x1x1074x4
221
:.b=i-l7。7.89,
22222222
^x2_1-2I+2+3+4+5+6+7-7x428
1=1
A
Aj1074221/853…。/
a=y-bx--------------x4=—=121.86,
7287
??)'關(guān)于x的線性回歸方程為y=7.89X+12L86.
【變式3](2024?全國?高三專題練習(xí))在一次抽樣調(diào)查中測得5個(gè)樣本點(diǎn),得到下表及散點(diǎn)性.
X0.250.5124
y1612521
16
14
12
10
8⑴根據(jù)散點(diǎn)圖判斷丁=〃+/*與曠=。+八£|哪一個(gè)適宜作為y關(guān)于x的回歸方程;
6
4
2
O1234x
(給出判斷即可,不必說明理由)
⑵根據(jù)(1)的判斷結(jié)果試建立y與X的回歸方程;(計(jì)算結(jié)果保留整數(shù))
£x.y.-/?Xy£(七一?。ā暌涣耍?/p>
參考公式:〃——1=1,&=y-bx
Z(x.-J)2
t=i1=1
【答案】(1)丁=。+人]7
4
(2)y=-+i
x
【詳解】(1)由題中散點(diǎn)圖可以判斷,),=。+人,「適宜作為y關(guān)于x的回歸方程;
(2)令r=%T,則一+>,原數(shù)據(jù)變?yōu)?/p>
t4210.50.25
y1612521
4+2+1+0.5+0.25,“
由表可知)'與f近似具有線性相關(guān)關(guān)系,計(jì)算得7=---------------------------=1.55,
5
16+12+5+2+1「
--------------=7.2,
5
,4x16+2x12+1x5+0.5x2+0.25x1—5x1.55x7.238.45
k?4,
42+22+12+0.52+0.252-5xl.5529.3
所以,|=了一方=7.2—4x1.55=1,則亍=4/+1.
4
所以y關(guān)于X的回歸方程是y=—\.
X
題型03求樣本中心(根據(jù)樣本中心求參數(shù))
【典例1】(2024上?全國?高三專題練習(xí))具有線性相關(guān)關(guān)系的變最X,)'的一組數(shù)據(jù)如下:
X0i23
y-5-4.5-4.2-3.5
其線性回歸直線方程為鳥=晟+機(jī)則何歸直線經(jīng)過()
A.第一、二、三象限B.第二、三、四象限
C.第一、二、四象限D(zhuǎn).第一、三、四象限
【答案】D
【詳解】解:由圖表中的數(shù)據(jù)知:-y呈正相關(guān),
所以>>0,
1—1
Xx=_(O+1+2+3)=1.5,y=-(-5-4.5-4.2-3,5)=-4.3,
則樣本中心為(15-4.3),在第四象限,
所以回歸直線經(jīng)過第一、三、四象限,
故選:D
【典例2】(2024下?全國?高二隨堂練習(xí))已知蒼》取表中的數(shù)值,若X。具有線性相關(guān)關(guān)系,線性回歸方
程為》=0.95x+2.6,則。=()
X0134
ya4.34.86.7
A.2.2B.2.4C.2.5D.2.6
【答案】A
【詳解.】由題意可如〃必產(chǎn)=2,。+4.3+4.8+6.7_a+15.8
所以樣本中心(兀乃為(2,空手
代人回歸方程有:空詈=0.95x2+2.6,解得叫22
根據(jù)上表可得到回歸直線方程》=0.75x+a,據(jù)此估計(jì),該公司7月份這種型號產(chǎn)品的銷售額為()
A.18.85萬元B.19.3萬元C.19.25萬元D.19.05萬元
【答案】D
_1_1
【詳解】由表中數(shù)據(jù)可得x=1(2+3+4+5+6)=4,>'=-(15.1+16.3+17+17.2+18.4)=16.8,
因?yàn)榛貧w直線過樣本點(diǎn)的中心,所以16.8=0.75x4+〃,解得4=13.8,
所以回歸直線方程為9=O.75X+13.8,
則該公司7月份這種型號產(chǎn)品的銷售額為^=0.75x7+13.8=19.05萬兀.
故選:D
【典例4】(多選)(2024上?浙江寧波?高三統(tǒng)考期末)某電商平臺為了對某一產(chǎn)品進(jìn)行合理定價(jià),采用不
同的單價(jià)在平臺試銷,得到的數(shù)據(jù)如下表所示:
單價(jià)加無88.599.510
銷量W萬件8985807868
根據(jù)以上數(shù)據(jù)得到》與工具有較強(qiáng)的線性關(guān)系,若用最小二乘估計(jì)得到經(jīng)驗(yàn)回歸方程為》=-I9.8X+4,則
()
A.相關(guān)系數(shù)廠>。B.點(diǎn)(9,80)一定在經(jīng)驗(yàn)回歸直線上
C.4=258.2D.x=9.5時(shí),對應(yīng)銷量的殘差為-7.9
【答案】BC
8+8.5+9+9.5+10八一89+85+80+78+68
【詳解】由表中數(shù)據(jù)可得;二=9,),=----------------------------=80
—
所以樣本中心為(9,80),故(9,80)在經(jīng)驗(yàn)回歸更線上,B正確,
由?=-19.8X+2可得了與x具負(fù)相關(guān),故A錯(cuò)誤,
將(9.80)代入£,=-19.8X+4可得80=—19.8x9+&,解得3=258.2,(:正確,
當(dāng)工=9.5時(shí),£=-19.8x9.5+258.2=70.1,所以殘差為78—70.1=7.9,D錯(cuò)誤,
故選:BC
【變式1](2024上?四川綿陽?高二綿陽南山中學(xué)實(shí)驗(yàn)學(xué)校??计谀┮阎獂與y之間的一組數(shù)據(jù):
則y與x的線性回歸方程為¥=加+》必過點(diǎn)()
A.(2,2)B.(1.5,0)
C.(1.5,4)D.(1,2)
【答案】C
■H■1—1L-U+1+Z+.9.尸1+3+5+7
【詳解】由己知X=-^=1.5,
)'=~4~
所以回歸直線一定過中心點(diǎn)(154).
故選:C.
【變式2](2024上?重慶?高三重慶巴蜀中學(xué)??计谥秀柚兞啃〕示€性相關(guān)關(guān)系,回歸方程為處-x+〃,
且變量小丁的樣本數(shù)據(jù)如下表所示
X-2-1012
y54m21
據(jù)此計(jì)算出在工=3時(shí),預(yù)測值為-0.2,則m的值為()
A.3B.2.8C.2D.1
【答案】C
【詳解】由題意知回歸方程為>r+a過點(diǎn)(3,-0.2),則q=2.8,
即y=-x+2.8;
_I11
又工二^、(-2-1+0+1+2)=0,y=-(5+4+/77+2+l)=-(12+A70,
由于回歸方程為》=—+a必過樣本中心點(diǎn)點(diǎn)J),
rfe-(12+m)=-0+2.8,/.m=2,
故選:C
【變式3](2024下?全國?高二隨堂練習(xí))變量-),的數(shù)據(jù)如下所示:
X54321
y21.5110.5
回歸直線恒過點(diǎn)
【答案】(3,1.2)
【詳解】變量X的平均值為牛―5+4+;+2+1—3,變量y的平均值為卞―2+1.5+;+1+0.5_[2,
故回歸直線恒過點(diǎn)(3,1.2).
故答案為:(3,1.2).
【變式4](2024上?全國?高三專題練習(xí))某地建立了農(nóng)業(yè)科技圖書館,供農(nóng)民免費(fèi)借閱,收集了近5年的
借閱數(shù)據(jù)如下表:
年份20192020202120222023
年份代碼x12345
年借閱量W萬冊4.95.15.55.75.8
根據(jù)上表,可得V關(guān)于%的線性叵歸方程為),=0.24x+a.則
【答案】4.68
【詳解】根據(jù)表格可知,
-1+2+3+4+5c-4.94-5.1+5.5+5.74-5.8
5-
代入),=0.24%+。,可得〃=4.68.
故答案為:4.68
題型04根據(jù)回歸直線方程估計(jì)數(shù)據(jù)
【典例1】(2024上?黑龍江齊齊哈爾?高三校聯(lián)考期末)已知在特定的時(shí)期內(nèi)某人在一個(gè)月內(nèi)每天投入的體
育鍛煉時(shí)間”(分鐘)與一個(gè)月內(nèi)減輕的休重(斤)的一組數(shù)據(jù)如表所示:
X3040506070
y1.11.93.244.8
一個(gè)月內(nèi)減輕的體重與每天投入的體育鍛煉時(shí)間x之間具有較強(qiáng)的線性相關(guān)關(guān)系,其線性回歸直線方程是
y=0.095x+a,據(jù)此模型估計(jì)當(dāng)此人在一個(gè)月內(nèi)每天投入的體育鍛煉時(shí)間為90分鐘時(shí),該月內(nèi)減輕的體重
約為()
A.6.8斤B.6.9斤C.7.0斤D.7.1斤
【答案】A
【詳解】由表中數(shù)據(jù)可得
-30+4()+50+60+70”
x=-------------------=50,
-1.1+1.9+3.2+4+4.8.
),=-------------------=3,
將(50,3)代入),=0.095.r+a得3=().()95乂50+a,解得〃=一1.75,
即y=0.095.1.75,
貝IJ當(dāng)x=90時(shí),y=0.095x90-1.75=6.8.
故選:A.
【典例2】(2024下?全國?高二隨堂練習(xí))某科學(xué)興趣小組的同學(xué)認(rèn)為生物都是由蛋白質(zhì)構(gòu)成的,高溫可以
使蛋白質(zhì)變性失活、于是想初步探究某微生物的成活率與溫度的關(guān)系,微生物數(shù)量》(個(gè))與溫度x(C)的
部分?jǐn)?shù)據(jù)如下表:
溫度MC)481018
微生物數(shù)量y(個(gè))30221814
由表中數(shù)據(jù)算得回歸方程為卞=-1+方,預(yù)測當(dāng)溫度為22c時(shí),微生物數(shù)量為個(gè).
【答案】9
【詳解】由表格數(shù)據(jù)可知,工=;x(4+8+10+18)=l。,y=lx(30+22+I8+14)=2l,
因?yàn)辄c(diǎn)(元強(qiáng)在直線5=-x+a上,所以占=2i+io=3i,
即j=-x+31,故當(dāng)x=22時(shí),?=-22+31=9,
即預(yù)測當(dāng)溫度為22c時(shí),微生物數(shù)量為9個(gè).
故答案為:9
【變式1](2024上?全國?高三專題練習(xí))如果在一次實(shí)驗(yàn)中,測得(%),)的五組數(shù)值如下表所示,經(jīng)計(jì)算
知,y對x的線性回歸方程是y=6.5x+“,預(yù)測當(dāng)x=10時(shí),y=()
X01234
y1015203035
A.73.5B.74C.74.5D.75
【答案】B
【詳解】由題意可得:嚏=:(0+1+2+3+4)=2,亍=((10+15+20+30+35)=22,
即樣本中心點(diǎn)為(2,22),則22=65x2+4,解得。=9.
所以y=6.5x+9,
令工=10時(shí),>'=6.5x10+9=74,
預(yù)測當(dāng)x=10時(shí),J=74.
故迄B
【變式2](2024上?全國?高三專題練習(xí))牛膝是范科多年生藥用草本植物,具有活血通經(jīng)、補(bǔ)肝腎、強(qiáng)筋
骨等功效,可用于治療腰膝酸痛等癥狀.某農(nóng)戶種植牛膝的時(shí)間x(單位:天)和牛膝的根部直徑?。▎挝唬?/p>
mm)的統(tǒng)計(jì)表如下:
X2030405060
y0.81.32.23.34.5
由上表可得經(jīng)驗(yàn)回歸方程為5=。.094+。,若此農(nóng)戶準(zhǔn)備在y=9mm時(shí)采收牛膝,據(jù)此模型預(yù)測,此批牛
滕采收時(shí)間預(yù)計(jì)是第天.
【答案】110
…4”-20+30+40+50+60,八-0.8+1.3+2.2+3.3+4.5-
[詳解]x=-----------------=40,y=--------------------=2.42,
又》=0.094工+&過點(diǎn)(40,2.42),所以4=_|.34,即5,=0.094x7.34,
當(dāng)?=9時(shí),x=H0,所以此批牛膝采收時(shí)間預(yù)計(jì)是第110天.
故答案為:110
題型05殘差計(jì)算
【典例1】(2024?全國?高三專題練習(xí))己知?組樣本數(shù)據(jù)(4打),(電,/),,(/,)'”),根據(jù)這組數(shù)據(jù)的
散點(diǎn)圖分析X與y之間的線性相關(guān)關(guān)系,若求得其線性回歸方程為5=-30.4+13.5%則在樣本點(diǎn)(9,53)處的
殘差為()
A.38.1B.22.6C.-38.1D.91.1
【答案】C
【詳解】因?yàn)橛^測值減去預(yù)測值稱為殘差,
所以當(dāng)x=9時(shí),^=-30.4+13.5x9=91.1,
月7以殘差為53—91.1一一38.1.
故選:C.
【典例2】(2024?云南楚雄?云南省楚雄彝族自治州民族中學(xué)??家荒#哂芯€性相關(guān)關(guān)系的變量乂丁有
一組觀測數(shù)據(jù)(XQ)(i=12…,10),其經(jīng)驗(yàn)回典方程為§,=-3.2尤+力,且[=10,亍=8,則相應(yīng)于點(diǎn)(1057)
的殘差為.
3
【答案】^/0.6
【詳解】??經(jīng)驗(yàn)回歸直線》=-3.2x+G過樣本點(diǎn)的中心(10,8),8=—3.2xl0+&,力二40,
???經(jīng)驗(yàn)I可歸方程為a=-3.2%+40.當(dāng)x=10.5時(shí),9=-3.2xl0.5+40=6.4,.?.殘差為7—64=0.6.
故答案為:0.6.
【典例3】(2023,全國?高二專題練習(xí))隨機(jī)選取變量x和變量y的5對觀測數(shù)據(jù),選取的第《=123,4,5)對
觀測數(shù)據(jù)記為(七,州),其數(shù)值對應(yīng)如下表所示:
編號i12345
七98765
%7595110135150
-15_155_25-25
2
計(jì)算得:x=-^xi=l,y=-^y.=\\3,^x;-5x=10,£>\-5y=3630,=3765.
〉1=13i=li=li=\r-l
⑴求變量”和變量y的樣本相關(guān)系數(shù)(小數(shù)點(diǎn)后保留4位),判斷這兩個(gè)變量是正相關(guān)還是負(fù)相關(guān),并推斷
它們的線性相關(guān)程度;
Y=bx+a+e
⑵假設(shè)變量Y關(guān)于x的一元線性回歸模型為|石⑻二0Q,)=£.
(i)求y關(guān)于X的經(jīng)驗(yàn)回歸方程,并預(yù)測當(dāng)X=1O時(shí)y的值;
(ii)設(shè)4為x=%(i=l,2,3,4,5)時(shí)該回歸模型的殘差,求q、e2、%、、分的方差.
“T("八B-y\
/一A-
參考公式:,a=y-bx?
【答案】(1)答案見解析
⑵①答案見解析;②4
蹤船―,
【詳解】(1)解:r5,
1=1
所以,這兩個(gè)變量負(fù)相關(guān),且具有較強(qiáng)的線性相關(guān)性.
.石go__
(2)解:@b=^-------=——=-\9則。=),一法=113-19x7=246,
土一2|Ut
七-5x
/-I
所以.V關(guān)干X的經(jīng)驗(yàn)同歸方程為y=-19.V+246.
當(dāng)x=10時(shí),則),=-19xlO+246=56,
所以,當(dāng)x=10時(shí),y的預(yù)測值為56;
②由《=);.-£=£+19內(nèi)-246,計(jì)算得該回歸模型的殘差如下表所示:
巷98765
01-33-1
所以,殘差的方差為『=+3、(-I1=4.
5
【變式1](2024?全國?高三專題練習(xí))根據(jù)一組樣本數(shù)據(jù)(為,匕),(叼兒),匕,(七,然)的散點(diǎn)圖分析x
與y之間是否存在線性相關(guān)關(guān)系,求得其線性回歸方程為20.851-85.7,則在樣本點(diǎn)(165,57)處的殘差為
()
A.54.55B.2.45C.3.45D.111.55
【答案】B
【詳解】把x=165代入?=0.851一85.7,得亍=0.85x165-85.7=54.55,
所以在樣本點(diǎn)(165,57)處的殘差2=k9=57-54.55=2.45.
故選:B.
【變式2](2024?全國?高三專題練習(xí))從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高單位:cm)與體重
y(單位:kg)數(shù)據(jù)如下表:
X165165157170175165155170
y4857505464614359
若已知),與X的線性回歸方程為),=0.8x-80,設(shè)殘差記為觀測值與預(yù)測值之間的差(即殘差=廣),)那么
選取的女大學(xué)生身高為175cm時(shí),相應(yīng)的殘差為.
【答案】4
【詳解】已知y與x的線性同歸方程為5=0.8£-80
當(dāng)工=175時(shí):),=60,相應(yīng)的殘差為:64-60=4
故答案為:4
【變式3](2023?高二課時(shí)練習(xí))高中女學(xué)生的身高預(yù)報(bào)體重的回歸方程是),=0.75x-75.5(其中工,y的
單位分別是cm,kg),則此方程在樣本點(diǎn)(160,46)處的殘差是.
【答案】1.5
【詳解】由樣本數(shù)據(jù)得到,女大學(xué)生的身高預(yù)報(bào)體重的回歸方程是y=0.75x-75.5,
當(dāng)H=160時(shí),y=0.75x160-75.5=44.5,
此方程在樣本(160,46)處殘差為:46-44.5=1.5.
故答案為:15
題型06相關(guān)指數(shù)計(jì)算
【典例1】(2024上?全國?高三期末)2021年6月17日9時(shí)22分,我國酒泉衛(wèi)星發(fā)射中心用長征2尸遙十
二運(yùn)載火笳,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太
空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號
的重要零件,該材料應(yīng)用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 深度解析(2026)《GBT 19203-2003復(fù)混肥料中鈣、鎂、硫含量的測定》
- 大連萬達(dá)集團(tuán)采購經(jīng)理考試題目
- 企業(yè)資產(chǎn)管理員筆試題及答案
- 塑料螺釘項(xiàng)目可行性分析報(bào)告范文
- 特殊藥物(如抗凝藥)相關(guān)上消化道出血內(nèi)鏡處理
- 深度解析(2026)GBT 18942.2-2003高聚物多孔彈性材料 壓縮應(yīng)力應(yīng)變特性的測定 第2部分 高密度材料
- 深度解析(2026)《GBT 18916.1-2021取水定額 第1部分:火力發(fā)電》
- 深度解析(2026)《GBT 18829.6-2002纖維粗度的測定》
- 華為公司招聘銷售部經(jīng)理面試題及答案
- 蒸煮設(shè)備項(xiàng)目可行性研究報(bào)告(總投資20000萬元)(84畝)
- 2024年通用直升機(jī)相關(guān)項(xiàng)目運(yùn)營指導(dǎo)方案
- 《臺式香腸烤制方法》課件
- 常用計(jì)量值控制圖系數(shù)表
- 馬克思主義經(jīng)典著作選讀智慧樹知到課后章節(jié)答案2023年下四川大學(xué)
- 慢性阻塞性肺疾病急性加重期機(jī)械通氣
- 傳染病學(xué)智慧樹知到課后章節(jié)答案2023年下溫州醫(yī)科大學(xué)
- 濕熱滅菌驗(yàn)證方案及報(bào)告
- 工業(yè)區(qū)位因素及其變化高一地理人教版(2019)必修二
- 2022年5月CATTI英語三級口譯實(shí)務(wù)真題(最全回憶版)
- 畫法幾何知到章節(jié)答案智慧樹2023年浙江大學(xué)
- 少年宮剪紙社團(tuán)活動(dòng)記錄
評論
0/150
提交評論