第02講 8.2 一元線性回歸模型及其應(yīng)用821一元線性回歸模型+822一元線性回歸模型參數(shù)的最小二乘高中數(shù)學(xué)同步講義(人教A版選擇性必修三)_第1頁
第02講 8.2 一元線性回歸模型及其應(yīng)用821一元線性回歸模型+822一元線性回歸模型參數(shù)的最小二乘高中數(shù)學(xué)同步講義(人教A版選擇性必修三)_第2頁
第02講 8.2 一元線性回歸模型及其應(yīng)用821一元線性回歸模型+822一元線性回歸模型參數(shù)的最小二乘高中數(shù)學(xué)同步講義(人教A版選擇性必修三)_第3頁
第02講 8.2 一元線性回歸模型及其應(yīng)用821一元線性回歸模型+822一元線性回歸模型參數(shù)的最小二乘高中數(shù)學(xué)同步講義(人教A版選擇性必修三)_第4頁
第02講 8.2 一元線性回歸模型及其應(yīng)用821一元線性回歸模型+822一元線性回歸模型參數(shù)的最小二乘高中數(shù)學(xué)同步講義(人教A版選擇性必修三)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第02講8.2一元線性回歸模型及其應(yīng)用

(8.2.1一元線性回歸模型+822—元線性回歸模型參數(shù)的最小二乘法

估計(jì))

學(xué)習(xí)目標(biāo)

課程標(biāo)準(zhǔn)學(xué)習(xí)目標(biāo)

①了解一元線性回歸模型的含義,理解兩

個(gè)變量之間隨機(jī)關(guān)系的一元線性回歸模型

的作用與意義。

②了解殘差在線性回歸與非線性回歸問

題的作用及意義。通過本節(jié)課的學(xué)習(xí),要求會(huì)求一元線性回歸方程,會(huì)進(jìn)

③了解一元線性回歸模型參數(shù)與最小二行殘差分析,能判斷回歸模型的擬合效果,能利用樣本

乘估計(jì)的推導(dǎo)過程,理解最小二乘估計(jì)的原數(shù)據(jù)建立統(tǒng)計(jì)模型并能進(jìn)行預(yù)測

理。

④會(huì)結(jié)合題意求一元線性回歸方程。

⑤會(huì)用相關(guān)指數(shù)進(jìn)行分析模型擬合的效

果情況

思維導(dǎo)圖

知識清單

知識點(diǎn)1:一元線性回歸模型

(1)一元線性回歸模型

我們稱:現(xiàn)6Y)=b0x,0+(a6+)二e

(72

為y關(guān)于%的一元線性回歸模型,其中y稱為因變量或響應(yīng)變量,不稱為自變量或解釋變量;。和〃為

模型的未知參數(shù),。稱為截距參數(shù),〃稱為斜率參數(shù);e是y與云+。之間的隨機(jī)誤差.

(2)隨機(jī)誤差

在線性回歸模型y="+a+e中,。和〃為模型的未知參數(shù),e是丫與公:+。之間的誤差,通常e為隨

機(jī)變量,稱為隨機(jī)誤差.它的均值EQ)=O,方程Z)(e)=b2>0.

Y=hx+a+e

線性回歸模型的完整表達(dá)式為《在此模型中,隨機(jī)誤差e的方差er?越小,用

石⑷=0,。,)=

/猶+。預(yù)報(bào)真實(shí)值的精度越高.

知識點(diǎn)2:一元線性回歸模型參數(shù)的最小二乘法

(1)經(jīng)驗(yàn)回歸方程的求解法:最小二乘法

回歸直線方程過樣本點(diǎn)的中心(;,]),是回歸直線方程最常佳的一個(gè)特征;

我們將§,=良+々稱為y關(guān)于工的線性回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)

回回直線。這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的/;,后,叫做〃,。的最小二乘估計(jì),其

中分稱為回歸系數(shù),它實(shí)際上也就是經(jīng)驗(yàn)回歸直線的斜率,G為截距.

》(芭T(X-y)£-心

3________________=^i____________

其中ZU-)2儲(chǔ)

1=11=1

a=y-bx

【即學(xué)即練1】(2024上?全國?高三專題練習(xí))某校數(shù)學(xué)建模學(xué)生社團(tuán)進(jìn)行了一項(xiàng)實(shí)驗(yàn)研究,采集了x、.V的

一組數(shù)據(jù)如下表所示:

X23456-7

y52.54540302517.5

該社團(tuán)對上述數(shù)據(jù)進(jìn)行了分析,發(fā)現(xiàn)丁與1之間具有線性相關(guān)關(guān)系.

⑴畫出表中數(shù)據(jù)的散點(diǎn)圖,并指出)'與x之間的相關(guān)系數(shù)「是止還是負(fù);

(2)求出),關(guān)于x的線性回歸方程,并寫出當(dāng)x=9時(shí),預(yù)測數(shù)據(jù)『的值.

附:在線性回歸方程?=2+加中,B=f---------,a=y-bx,其中;,亍為樣本平均值.

*升〃⑴2

r-l

【答案】(1)散點(diǎn)圖見解析,負(fù)

(2)y=66.5-7x,y=3.5

【詳解】(1)由題意得散點(diǎn)圖如圖所示:

由圖可知)'與x之間成負(fù)相關(guān)關(guān)系,所以廣是負(fù).

.E£2+3+4+5+6+7--52.5+45+40+30+25+17.5?

(Z2)因?yàn)閤=----------------=4.5,y=-------------------------=35,

66

之.=882.5,次#=139,

i=l/-I

822.5-6x4.5x35

所以6二母---------=-7,力一應(yīng)=35—(—7)x45=66.5,

I39-6x4.52

X^-6x2

i=\

???關(guān)于”線性回歸方程為?=66.5-7工,

所以當(dāng)x=9時(shí),y=3.5.

(2)求經(jīng)驗(yàn)回歸方程的步驟

①作出散點(diǎn)圖,判斷兩變量是否具有線性相關(guān)關(guān)系,若具有線性相關(guān)關(guān)系,則可求其經(jīng)驗(yàn)I可歸方程;

②列表求出的值;

③利用公式先計(jì)算/,,再根據(jù)經(jīng)驗(yàn)回歸直線過樣本點(diǎn)的中心丘;)計(jì)算.;

④寫出經(jīng)驗(yàn)回歸方程y=hx+a-

求經(jīng)驗(yàn)回歸方程,關(guān)鍵在于正確求出系數(shù)由于計(jì)算量較大,所以計(jì)算時(shí)要仔細(xì)謹(jǐn)慎、分層進(jìn)行,避免

因計(jì)算產(chǎn)生錯(cuò)誤要特別注意,只有兩個(gè)變量呈線性相關(guān)關(guān)系時(shí),求出的經(jīng)驗(yàn)回歸方程才有意義.

(3)經(jīng)驗(yàn)回歸方程的性質(zhì)

①經(jīng)驗(yàn)回歸直線一定過點(diǎn)丘,?。?,點(diǎn)丘,?。┩ǔ7Q為樣本點(diǎn)的中心;

②一次函數(shù)),=法+〃的單調(diào)性由〃的符號決定,函數(shù)遞增的充要條件是方>0;函數(shù)遞減的充要條件是

〃<0.這說明:)'與X正相關(guān)的充要條件是〃〉0;)'與X負(fù)相關(guān)的充要條件是〃<().

③在經(jīng)驗(yàn)回歸方程),=法+〃中,〃是經(jīng)驗(yàn)回歸直線的斜率,〃是截距.一般地,當(dāng)回歸系數(shù)匕〉0時(shí),說

明兩個(gè)變量呈正相關(guān)關(guān)系,它的意義是當(dāng)x每增大一個(gè)單位時(shí),),平均增大。個(gè)單位;當(dāng)〃時(shí),說明兩

個(gè)變量呈負(fù)相關(guān)關(guān)系,它的意義是當(dāng)x每增大一個(gè)單位時(shí),),平均減小|加個(gè)單位.

知識點(diǎn)3:殘差

(1)殘差

對于響應(yīng)變量y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的?稱為預(yù)測值,觀測值

減去預(yù)測值稱為殘差.

(2)殘差圖

作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù)、或體重估計(jì)值等,這樣作出的圖形稱為殘

差圖.若殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),帶狀區(qū)域越窄,則說明擬合效果越好.

(3)殘差分析

殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是

否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.其步驟為:計(jì)算殘差一化殘差圖-在殘差圖中分析殘

差特性.

【即學(xué)即練2】(2024?全國?高三專題練習(xí))對于一組具有線性相關(guān)關(guān)系的樣本數(shù)據(jù)(冷丫)(,=12,〃),其樣

本中心為(反司,回歸方程為¥=1+》,則相應(yīng)于樣本點(diǎn)(.y)的殘差為()

A.y-yB.y-y.

C.y-佃+〃)D.低+a)-%

【答案】C

【詳解煙為殘差是實(shí)際觀察值與估計(jì)值(擬合值)之間的差,所以相應(yīng)于樣本點(diǎn)(七,%)的殘差為K-伽+。卜

故選:C.

知識點(diǎn)4;決定系數(shù)R2

(1)殘差平方和

n2

殘差平方和2(£-色),殘差平方和越小,模型擬合效果越好,殘差平方和越大,模型擬合效果越差.

1=1

(2)決定系數(shù)R2

決定系數(shù)R是度量模型擬合效果的一種指標(biāo),在線性模型中,它代表解釋變量客戶預(yù)報(bào)變量的能力.

Z(y-'『

甯=1一號一——,2越大,即擬合效果越好,R?越小,模型擬合效果越差.

?MT

1=1

【即學(xué)即練3](2023下?青海西寧?高二校考階段練習(xí))甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸

模型時(shí).,分別選擇了4種不同模型,計(jì)算可得它們的相關(guān)指數(shù)82分別如下表:

甲乙丙T

R20.980.780.500.85

建立的回歸模型擬合效果最好的同學(xué)是.

【答案】選甲相關(guān)指數(shù)W越大,表示回歸模型擬合效果越好.

【詳解】相關(guān)指數(shù)/越大,相關(guān)性越強(qiáng),回歸模型擬合效果越好,所以效果最好的是甲.

(3)決定系數(shù)配與相關(guān)系數(shù)廠的聯(lián)系與區(qū)別

①相關(guān)系數(shù)一反映兩個(gè)變量的相關(guān)關(guān)系的強(qiáng)弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)R?反映回歸模型的擬合效果.

②在含有一個(gè)解釋變量的線性模型中,決定系數(shù)R2的數(shù)值是相關(guān)系數(shù)r的平方,其變化范圍為[0/1,而相

關(guān)系數(shù)的變化范圍為

③當(dāng)相關(guān)系數(shù)|川接近于1時(shí),說明兩變量的相關(guān)性較強(qiáng),當(dāng)接近于。時(shí),說明兩變量的相關(guān)性較弱;

而當(dāng)后接近于1時(shí),說明經(jīng)驗(yàn)回歸方程的擬合效果較好.

題型精講

題型01由散點(diǎn)圖判斷是否線性相關(guān)

【典例1](2023下?河南南陽?高二唐河縣第一高級中學(xué)??茧A段練習(xí))2003年春季,我國部分地區(qū)SARS

流行,黨和政府采取果斷措施,防治結(jié)合,很快使病情得到控制,下表是某同學(xué)記載的5月1口至5月12

日每天北京市SARS治愈者數(shù)據(jù),以及根據(jù)這些數(shù)據(jù)繪制出的散點(diǎn)圖

日期5.15.25.35.45.55.65.75.85.95.105.115.12

人數(shù)100109115118121134141152168175186203

下列說法:①根據(jù)此散點(diǎn)圖,可以判斷日期與人數(shù)具有線性相關(guān)關(guān)系;②根據(jù)此散點(diǎn)圖,可以判斷日期與

人數(shù)具有一次函數(shù)關(guān)系.其中正確的個(gè)數(shù)為()

A.0個(gè)B.1個(gè)C.2個(gè)D.以上都不對

【答案】B

【詳解】由題意,

做出散點(diǎn)圖如下圖所示,

24人數(shù)

250

1OCI

15CI

OCI

5O0

12345678910111213日期編號

由圖可知,

日期與人數(shù)具有線性相關(guān)關(guān)系,但不是一次函數(shù)關(guān)系,

①正確,②錯(cuò)誤,

故選:B.

【典例2】(2023?全國?高二專題練習(xí))某個(gè)男孩的年齡與身高的統(tǒng)計(jì)數(shù)據(jù)如下表所示:

年齡X(歲)123456

身高),(cm)788798108115120

⑴畫出散點(diǎn)圖;

⑵判斷y與x是否具有線性相關(guān)關(guān)系,如果相關(guān),是正相關(guān)還是負(fù)相關(guān).

【答案】(1)答案見解析

(2)、與x具有線性相關(guān)關(guān)系,且是正相關(guān)關(guān)系.

【洋解】(1)散點(diǎn)圖如圖所示:

(2)由圖知,所有數(shù)據(jù)點(diǎn)接近一條直線排列,因此,認(rèn)為y與x具有線性相關(guān)關(guān)系,且是正相關(guān)關(guān)系.

【答案】D

【詳解】由圖可知,②④中的點(diǎn)集中在一條直線的附近,所以圖②④中的兩個(gè)變量具有線性相關(guān)關(guān)系,

故選:D.

題型02求回歸直線方程

【典例1】(2024上?江西贛州?高二統(tǒng)考期末)大氣污染物PM%(直徑不大于2.5〃m的顆粒物)的濃度超

過一定限度會(huì)影響人的身體健康.為研究PM/濃度),(單位:/g/n?)與汽車流量x(單位:干輛)的線

性關(guān)系,研究人員選定了10個(gè)城市,在每個(gè)城市建立交通監(jiān)測點(diǎn),統(tǒng)計(jì)了24h內(nèi)過往的汽車流量以及同時(shí)

段空氣中的PM”濃度,得到如下數(shù)據(jù):

城市編號12345678910總和

X1.3001.4440.7861.6521.7561.7541.2001.5001.2000.90813.5

y667621170156120721201001291030

101010

并計(jì)算得=19.225,2^=124434,2中廣1479.5.

i=l

⑴求變量關(guān)于X的線性回歸方程;

⑵根據(jù)24/?內(nèi)PM?5濃度確定空氣質(zhì)量等級,PM2.5濃度在。?35〃g/m3為優(yōu),35?75〃g/m,為良,75?115

為輕度污染,"5?150〃g/m'為中度污染,150?250〃g/m3為重度污染,已知某城市24〃內(nèi)過往的

汽車流量為1360輛,判斷該城市的空氣質(zhì)量等級.

s,

參考公式:線性回歸方程為),=A+a,其中以?=J-----------=『

/=1/=1

【答案】⑴y=89x—1775

⑵輕度污染

【詳解】(1)由題意得;=轉(zhuǎn)=1.35,不=甯=103

1010

又因?yàn)?479.5,?>;=19.225

r=lM

10___

所以八針一m)’J479.5T0xL35xK)3=89

2

^%2_10-219.225-10xl.35

/=!

所以〃=亍一位=103—89x1.35=—17.15

所以變量y關(guān)于x的線性回歸方程為y=89x-17.15.

(2)當(dāng)%=1360輛=1.36千輛時(shí),可得y=89xl.36-17.15=103.89〃g/m3

因?yàn)?03.89e(75/15)

所以該城市的空氣質(zhì)量等級為輕度污染.

【典例2】(2024上?重慶沙坪壩高三重慶八中校考階段練習(xí))在入室盜竊類案件中,出現(xiàn)頻率最高的痕跡

物iEt一就是足跡.負(fù)重行走對足跡步伐特征影響的規(guī)律強(qiáng),而且較為穩(wěn)定.正在行走的人在負(fù)重的同

時(shí),步長變短,步寬變大,步角變大.因此,以身高分別為"Ocm,175cm,180cm的人員各20名作

為實(shí)驗(yàn)對象,讓他們采取雙手胸前持重物的負(fù)重方式行走,得到實(shí)驗(yàn)對象在負(fù)重0kg,5kg,10kg,15kg,

20kg狀態(tài)下相對穩(wěn)定的步長數(shù)據(jù)平均值.并在不同身高情況下,建立足跡步長s(單位:cm)關(guān)于負(fù)重耳單

位:kg)的三個(gè)經(jīng)驗(yàn)回歸方程.根據(jù)身高170cm組數(shù)據(jù)建立線性回歸方程①:5,=-0.402x455.728;根

據(jù)身高175cm組數(shù)據(jù)建立線性回歸方程②:£=-0.497x+64.404;根據(jù)身高180cm組數(shù)據(jù)建立線性回歸

方程③:=bx+a.

⑴根據(jù)身高180cm組的統(tǒng)計(jì)數(shù)據(jù),求4,-的值,并解釋參數(shù)£的含義;

身高180cm不同負(fù)重情況下的步長數(shù)據(jù)平均值

負(fù)重x/kg05101520

足跡步長s/cm74.3573.5071.8068.6065.75

⑵在一起盜竊案中,被盜竊物品重為9kg,在現(xiàn)場勘杳過程中,測量得犯罪嫌疑人往返時(shí)足跡步長的差值為

4.464cm,推測該名嫌疑人的身高,并說明理由.

附:s=hx+a,為回歸方程,a=s-bx,豆=354,£衲=34295

ZM為一,狀-i-i曰

【答案】⑴4=75.22,/;=T).442,參數(shù)/;的含義詳見解析

(2)嫌疑人身高為175cm,理由詳見解析

/?I

【詳解】(1)由題意可知:?=°+5+1(;+15+20=]0,+X;+X;+X:+*=750.-=Pi=708

555

-欣不3429.5-354x10八(口.

所以〃=-^-4~~—=……=-0.442,a=s-bx=70.S+0.442x10=75.22;

x~-fix'750-5x100

5的含義表示,負(fù)重每增加1kg足跡步長減少0.442cm.

(2)設(shè)被盜竊物品重為9kg時(shí),身高170cm的步長誤差為人』,高175cm的步長誤差為心?,高180cm的

步長誤差為腐3,

由題意可得,A*=3.618cm,=4.476cm,A.v3=3.987cm,

因?yàn)?4.476cm與測量得犯罪嫌疑人往返時(shí)足跡步長的差值乙.464cm最接近,

所以犯罪嫌疑人身高為175cm.

【典例3】(2024上?全國,高三專題練習(xí))某種產(chǎn)品的廣告費(fèi)支出x(單位:萬元)與銷售額y(萬元)之間

有如下一組數(shù)據(jù):

廣告費(fèi)支出X24568

銷售額y3040605070

⑴求出樣本點(diǎn)中心

(2)求回歸直線方程(其中“=弋£-%--:-一--〃-----,a=y-bx)

r-1

【答案】(1)(5,50)

(2)y=6.5x+17.5

151

【詳解】(1)由題意可得:T=產(chǎn)±(2+4+5+6+8)=5,

3/=i3

y==-(30+40+60+50+70)=50,

5i=i5

所以樣本點(diǎn)中心為(5,50).

5

(2)由題意可得:=2x30+4x40+5x60+6x50+8x70=1380,

J=l

£x;=22+42+52+62+82=145,

r-l

g01380-5x5x50130“〃,

所以人=----------;—=—=6.5,4=50—6.5x5=17.5,

145—5x5?20

所以回歸直線方程為),=6,5x+17.5?

【變式1](2024上?黑龍江牡丹江?高三牡丹江市第二高級中學(xué)校聯(lián)考期末)近期,一些地方中小學(xué)生〃課

間10分鐘"問題受到社會(huì)廣泛關(guān)注,國家號召中小學(xué)要增加學(xué)生的室外活動(dòng)時(shí)間.但是進(jìn)入12月后,天氣

漸冷,很多學(xué)生因氣溫低而減少了外出活動(dòng)次數(shù).為了解本班情況,一位同學(xué)統(tǒng)計(jì)了一周(5天)的氣溫變

化和某一固定課間該班級的學(xué)生出樓人數(shù),得到如下數(shù)據(jù):

溫度看(零下C)710111517

出樓人數(shù)匕201617107

⑴利用最小二乘法,求變量X,+,之間的線性回歸方程;

nn__

Z(N-初凹一列Zw-w

附:用最小二乘法求線性回歸方程$,=立+力的系數(shù):方=J-----------=號---------a='y-bi

1=11=1

⑵預(yù)測當(dāng)溫度為-8℃時(shí),該班級在本節(jié)課間的出樓人數(shù)(人數(shù):四舍五入取整數(shù)).

⑶為了號召學(xué)生能夠增加室外活動(dòng)時(shí)間,學(xué)校舉行拔河比賽,采取3局2勝制(無平局).在甲、乙兩班

3

的較量中,甲班每局獲勝的概率均為《,設(shè)隨機(jī)變量X表示甲班獲勝的局?jǐn)?shù),求X的分布列和期望.

2111Q

【答案】⑴R-成+7

(2)19

⑶分布列見解析;期望為黑

1

-1—1

【詳解】(1)x=-(7+10+11+15+17)=12,j=-(20+16+17+10+7)=14,

55

5_

一可(凹=(7-12)(20-14)+(10-12)(16-14)+(11-12)(17-14)+(15-12)(10-14)

+(17-12)(7-14)=-84,

以七一和=25+4+1+9+25=64,

幺,人“派=14-xl2=l^

元(七-年16I164

J=l

21119

回歸直線方程為加一江一二

21I19

⑵當(dāng)E時(shí),>飛X8+T,I9(A),

16

所以,預(yù)測當(dāng)溫度為-8℃時(shí),該班級在本節(jié)課間的出樓人數(shù)為19人.

(3)隨機(jī)變量X可取0,1,2.

224

p(X=0)=-x-=—

5525

P(X=1)=3X2X2+2X3X2=24

555555125

3332323381

P(X=2)=-x—+—x—x—+—x—x—=---,

55555555125

所以X的分布列為:

X012

42481

P

25125125

所以X的數(shù)學(xué)期望為E(X)=0x4+lx常+2、黑=黑

/J14J14J14J

【變式2](2024上?全國?高三專題練習(xí))下面給出了根據(jù)我國2012年2018年水果人均占有量?。▎挝?

kg)和年份代碼x繪制的散點(diǎn)圖(2012年2018年的年份代碼x分別為1~7).

我國2012年?2018年水果人均占有錄取點(diǎn)圖

80

70

60

50

40

30

20

234567

年份代碼x

⑴根據(jù)散點(diǎn)圖分析y與x之間的相關(guān)關(guān)系;

(2)根據(jù)散點(diǎn)圖相應(yīng)數(shù)據(jù)計(jì)算得=1074,\>身=4517,求y關(guān)于X的線性回歸方程.(精確到().()1)

1=11=1

附:回歸方程?=〃+力中斜率和棧距的最小二乘估計(jì)公式分別為:

J

AEU-)(.Vr-y)

------,a=y-bx

£(為-了『

i=l

【答案】(1))'與x之間是正相關(guān)關(guān)系

(2)y=7.89x4-121.86

【詳解】(1)由散點(diǎn)圖可以看出,散點(diǎn)大致分布在某一直線的附近,且當(dāng)x由小變大時(shí),丁也由小變大,

???y與%之間是正相關(guān)關(guān)系.

(2)由表格數(shù)據(jù)得:x=1(l+2-3+4+5+6+7)=4,予=;、1074=與

°7f34517-7x1x1074x4

221

:.b=i-l7。7.89,

22222222

^x2_1-2I+2+3+4+5+6+7-7x428

1=1

A

Aj1074221/853…。/

a=y-bx--------------x4=—=121.86,

7287

??)'關(guān)于x的線性回歸方程為y=7.89X+12L86.

【變式3](2024?全國?高三專題練習(xí))在一次抽樣調(diào)查中測得5個(gè)樣本點(diǎn),得到下表及散點(diǎn)性.

X0.250.5124

y1612521

16

14

12

10

8⑴根據(jù)散點(diǎn)圖判斷丁=〃+/*與曠=。+八£|哪一個(gè)適宜作為y關(guān)于x的回歸方程;

6

4

2

O1234x

(給出判斷即可,不必說明理由)

⑵根據(jù)(1)的判斷結(jié)果試建立y與X的回歸方程;(計(jì)算結(jié)果保留整數(shù))

£x.y.-/?Xy£(七一?。ā暌涣耍?/p>

參考公式:〃——1=1,&=y-bx

Z(x.-J)2

t=i1=1

【答案】(1)丁=。+人]7

4

(2)y=-+i

x

【詳解】(1)由題中散點(diǎn)圖可以判斷,),=。+人,「適宜作為y關(guān)于x的回歸方程;

(2)令r=%T,則一+>,原數(shù)據(jù)變?yōu)?/p>

t4210.50.25

y1612521

4+2+1+0.5+0.25,“

由表可知)'與f近似具有線性相關(guān)關(guān)系,計(jì)算得7=---------------------------=1.55,

5

16+12+5+2+1「

--------------=7.2,

5

,4x16+2x12+1x5+0.5x2+0.25x1—5x1.55x7.238.45

k?4,

42+22+12+0.52+0.252-5xl.5529.3

所以,|=了一方=7.2—4x1.55=1,則亍=4/+1.

4

所以y關(guān)于X的回歸方程是y=—\.

X

題型03求樣本中心(根據(jù)樣本中心求參數(shù))

【典例1】(2024上?全國?高三專題練習(xí))具有線性相關(guān)關(guān)系的變最X,)'的一組數(shù)據(jù)如下:

X0i23

y-5-4.5-4.2-3.5

其線性回歸直線方程為鳥=晟+機(jī)則何歸直線經(jīng)過()

A.第一、二、三象限B.第二、三、四象限

C.第一、二、四象限D(zhuǎn).第一、三、四象限

【答案】D

【詳解】解:由圖表中的數(shù)據(jù)知:-y呈正相關(guān),

所以>>0,

1—1

Xx=_(O+1+2+3)=1.5,y=-(-5-4.5-4.2-3,5)=-4.3,

則樣本中心為(15-4.3),在第四象限,

所以回歸直線經(jīng)過第一、三、四象限,

故選:D

【典例2】(2024下?全國?高二隨堂練習(xí))已知蒼》取表中的數(shù)值,若X。具有線性相關(guān)關(guān)系,線性回歸方

程為》=0.95x+2.6,則。=()

X0134

ya4.34.86.7

A.2.2B.2.4C.2.5D.2.6

【答案】A

【詳解.】由題意可如〃必產(chǎn)=2,。+4.3+4.8+6.7_a+15.8

所以樣本中心(兀乃為(2,空手

代人回歸方程有:空詈=0.95x2+2.6,解得叫22

根據(jù)上表可得到回歸直線方程》=0.75x+a,據(jù)此估計(jì),該公司7月份這種型號產(chǎn)品的銷售額為()

A.18.85萬元B.19.3萬元C.19.25萬元D.19.05萬元

【答案】D

_1_1

【詳解】由表中數(shù)據(jù)可得x=1(2+3+4+5+6)=4,>'=-(15.1+16.3+17+17.2+18.4)=16.8,

因?yàn)榛貧w直線過樣本點(diǎn)的中心,所以16.8=0.75x4+〃,解得4=13.8,

所以回歸直線方程為9=O.75X+13.8,

則該公司7月份這種型號產(chǎn)品的銷售額為^=0.75x7+13.8=19.05萬兀.

故選:D

【典例4】(多選)(2024上?浙江寧波?高三統(tǒng)考期末)某電商平臺為了對某一產(chǎn)品進(jìn)行合理定價(jià),采用不

同的單價(jià)在平臺試銷,得到的數(shù)據(jù)如下表所示:

單價(jià)加無88.599.510

銷量W萬件8985807868

根據(jù)以上數(shù)據(jù)得到》與工具有較強(qiáng)的線性關(guān)系,若用最小二乘估計(jì)得到經(jīng)驗(yàn)回歸方程為》=-I9.8X+4,則

()

A.相關(guān)系數(shù)廠>。B.點(diǎn)(9,80)一定在經(jīng)驗(yàn)回歸直線上

C.4=258.2D.x=9.5時(shí),對應(yīng)銷量的殘差為-7.9

【答案】BC

8+8.5+9+9.5+10八一89+85+80+78+68

【詳解】由表中數(shù)據(jù)可得;二=9,),=----------------------------=80

所以樣本中心為(9,80),故(9,80)在經(jīng)驗(yàn)回歸更線上,B正確,

由?=-19.8X+2可得了與x具負(fù)相關(guān),故A錯(cuò)誤,

將(9.80)代入£,=-19.8X+4可得80=—19.8x9+&,解得3=258.2,(:正確,

當(dāng)工=9.5時(shí),£=-19.8x9.5+258.2=70.1,所以殘差為78—70.1=7.9,D錯(cuò)誤,

故選:BC

【變式1](2024上?四川綿陽?高二綿陽南山中學(xué)實(shí)驗(yàn)學(xué)校??计谀┮阎獂與y之間的一組數(shù)據(jù):

則y與x的線性回歸方程為¥=加+》必過點(diǎn)()

A.(2,2)B.(1.5,0)

C.(1.5,4)D.(1,2)

【答案】C

■H■1—1L-U+1+Z+.9.尸1+3+5+7

【詳解】由己知X=-^=1.5,

)'=~4~

所以回歸直線一定過中心點(diǎn)(154).

故選:C.

【變式2](2024上?重慶?高三重慶巴蜀中學(xué)??计谥秀柚兞啃〕示€性相關(guān)關(guān)系,回歸方程為處-x+〃,

且變量小丁的樣本數(shù)據(jù)如下表所示

X-2-1012

y54m21

據(jù)此計(jì)算出在工=3時(shí),預(yù)測值為-0.2,則m的值為()

A.3B.2.8C.2D.1

【答案】C

【詳解】由題意知回歸方程為>r+a過點(diǎn)(3,-0.2),則q=2.8,

即y=-x+2.8;

_I11

又工二^、(-2-1+0+1+2)=0,y=-(5+4+/77+2+l)=-(12+A70,

由于回歸方程為》=—+a必過樣本中心點(diǎn)點(diǎn)J),

rfe-(12+m)=-0+2.8,/.m=2,

故選:C

【變式3](2024下?全國?高二隨堂練習(xí))變量-),的數(shù)據(jù)如下所示:

X54321

y21.5110.5

回歸直線恒過點(diǎn)

【答案】(3,1.2)

【詳解】變量X的平均值為牛―5+4+;+2+1—3,變量y的平均值為卞―2+1.5+;+1+0.5_[2,

故回歸直線恒過點(diǎn)(3,1.2).

故答案為:(3,1.2).

【變式4](2024上?全國?高三專題練習(xí))某地建立了農(nóng)業(yè)科技圖書館,供農(nóng)民免費(fèi)借閱,收集了近5年的

借閱數(shù)據(jù)如下表:

年份20192020202120222023

年份代碼x12345

年借閱量W萬冊4.95.15.55.75.8

根據(jù)上表,可得V關(guān)于%的線性叵歸方程為),=0.24x+a.則

【答案】4.68

【詳解】根據(jù)表格可知,

-1+2+3+4+5c-4.94-5.1+5.5+5.74-5.8

5-

代入),=0.24%+。,可得〃=4.68.

故答案為:4.68

題型04根據(jù)回歸直線方程估計(jì)數(shù)據(jù)

【典例1】(2024上?黑龍江齊齊哈爾?高三校聯(lián)考期末)已知在特定的時(shí)期內(nèi)某人在一個(gè)月內(nèi)每天投入的體

育鍛煉時(shí)間”(分鐘)與一個(gè)月內(nèi)減輕的休重(斤)的一組數(shù)據(jù)如表所示:

X3040506070

y1.11.93.244.8

一個(gè)月內(nèi)減輕的體重與每天投入的體育鍛煉時(shí)間x之間具有較強(qiáng)的線性相關(guān)關(guān)系,其線性回歸直線方程是

y=0.095x+a,據(jù)此模型估計(jì)當(dāng)此人在一個(gè)月內(nèi)每天投入的體育鍛煉時(shí)間為90分鐘時(shí),該月內(nèi)減輕的體重

約為()

A.6.8斤B.6.9斤C.7.0斤D.7.1斤

【答案】A

【詳解】由表中數(shù)據(jù)可得

-30+4()+50+60+70”

x=-------------------=50,

-1.1+1.9+3.2+4+4.8.

),=-------------------=3,

將(50,3)代入),=0.095.r+a得3=().()95乂50+a,解得〃=一1.75,

即y=0.095.1.75,

貝IJ當(dāng)x=90時(shí),y=0.095x90-1.75=6.8.

故選:A.

【典例2】(2024下?全國?高二隨堂練習(xí))某科學(xué)興趣小組的同學(xué)認(rèn)為生物都是由蛋白質(zhì)構(gòu)成的,高溫可以

使蛋白質(zhì)變性失活、于是想初步探究某微生物的成活率與溫度的關(guān)系,微生物數(shù)量》(個(gè))與溫度x(C)的

部分?jǐn)?shù)據(jù)如下表:

溫度MC)481018

微生物數(shù)量y(個(gè))30221814

由表中數(shù)據(jù)算得回歸方程為卞=-1+方,預(yù)測當(dāng)溫度為22c時(shí),微生物數(shù)量為個(gè).

【答案】9

【詳解】由表格數(shù)據(jù)可知,工=;x(4+8+10+18)=l。,y=lx(30+22+I8+14)=2l,

因?yàn)辄c(diǎn)(元強(qiáng)在直線5=-x+a上,所以占=2i+io=3i,

即j=-x+31,故當(dāng)x=22時(shí),?=-22+31=9,

即預(yù)測當(dāng)溫度為22c時(shí),微生物數(shù)量為9個(gè).

故答案為:9

【變式1](2024上?全國?高三專題練習(xí))如果在一次實(shí)驗(yàn)中,測得(%),)的五組數(shù)值如下表所示,經(jīng)計(jì)算

知,y對x的線性回歸方程是y=6.5x+“,預(yù)測當(dāng)x=10時(shí),y=()

X01234

y1015203035

A.73.5B.74C.74.5D.75

【答案】B

【詳解】由題意可得:嚏=:(0+1+2+3+4)=2,亍=((10+15+20+30+35)=22,

即樣本中心點(diǎn)為(2,22),則22=65x2+4,解得。=9.

所以y=6.5x+9,

令工=10時(shí),>'=6.5x10+9=74,

預(yù)測當(dāng)x=10時(shí),J=74.

故迄B

【變式2](2024上?全國?高三專題練習(xí))牛膝是范科多年生藥用草本植物,具有活血通經(jīng)、補(bǔ)肝腎、強(qiáng)筋

骨等功效,可用于治療腰膝酸痛等癥狀.某農(nóng)戶種植牛膝的時(shí)間x(單位:天)和牛膝的根部直徑?。▎挝唬?/p>

mm)的統(tǒng)計(jì)表如下:

X2030405060

y0.81.32.23.34.5

由上表可得經(jīng)驗(yàn)回歸方程為5=。.094+。,若此農(nóng)戶準(zhǔn)備在y=9mm時(shí)采收牛膝,據(jù)此模型預(yù)測,此批牛

滕采收時(shí)間預(yù)計(jì)是第天.

【答案】110

…4”-20+30+40+50+60,八-0.8+1.3+2.2+3.3+4.5-

[詳解]x=-----------------=40,y=--------------------=2.42,

又》=0.094工+&過點(diǎn)(40,2.42),所以4=_|.34,即5,=0.094x7.34,

當(dāng)?=9時(shí),x=H0,所以此批牛膝采收時(shí)間預(yù)計(jì)是第110天.

故答案為:110

題型05殘差計(jì)算

【典例1】(2024?全國?高三專題練習(xí))己知?組樣本數(shù)據(jù)(4打),(電,/),,(/,)'”),根據(jù)這組數(shù)據(jù)的

散點(diǎn)圖分析X與y之間的線性相關(guān)關(guān)系,若求得其線性回歸方程為5=-30.4+13.5%則在樣本點(diǎn)(9,53)處的

殘差為()

A.38.1B.22.6C.-38.1D.91.1

【答案】C

【詳解】因?yàn)橛^測值減去預(yù)測值稱為殘差,

所以當(dāng)x=9時(shí),^=-30.4+13.5x9=91.1,

月7以殘差為53—91.1一一38.1.

故選:C.

【典例2】(2024?云南楚雄?云南省楚雄彝族自治州民族中學(xué)??家荒#哂芯€性相關(guān)關(guān)系的變量乂丁有

一組觀測數(shù)據(jù)(XQ)(i=12…,10),其經(jīng)驗(yàn)回典方程為§,=-3.2尤+力,且[=10,亍=8,則相應(yīng)于點(diǎn)(1057)

的殘差為.

3

【答案】^/0.6

【詳解】??經(jīng)驗(yàn)回歸直線》=-3.2x+G過樣本點(diǎn)的中心(10,8),8=—3.2xl0+&,力二40,

???經(jīng)驗(yàn)I可歸方程為a=-3.2%+40.當(dāng)x=10.5時(shí),9=-3.2xl0.5+40=6.4,.?.殘差為7—64=0.6.

故答案為:0.6.

【典例3】(2023,全國?高二專題練習(xí))隨機(jī)選取變量x和變量y的5對觀測數(shù)據(jù),選取的第《=123,4,5)對

觀測數(shù)據(jù)記為(七,州),其數(shù)值對應(yīng)如下表所示:

編號i12345

七98765

%7595110135150

-15_155_25-25

2

計(jì)算得:x=-^xi=l,y=-^y.=\\3,^x;-5x=10,£>\-5y=3630,=3765.

〉1=13i=li=li=\r-l

⑴求變量”和變量y的樣本相關(guān)系數(shù)(小數(shù)點(diǎn)后保留4位),判斷這兩個(gè)變量是正相關(guān)還是負(fù)相關(guān),并推斷

它們的線性相關(guān)程度;

Y=bx+a+e

⑵假設(shè)變量Y關(guān)于x的一元線性回歸模型為|石⑻二0Q,)=£.

(i)求y關(guān)于X的經(jīng)驗(yàn)回歸方程,并預(yù)測當(dāng)X=1O時(shí)y的值;

(ii)設(shè)4為x=%(i=l,2,3,4,5)時(shí)該回歸模型的殘差,求q、e2、%、、分的方差.

“T("八B-y\

/一A-

參考公式:,a=y-bx?

【答案】(1)答案見解析

⑵①答案見解析;②4

蹤船―,

【詳解】(1)解:r5,

1=1

所以,這兩個(gè)變量負(fù)相關(guān),且具有較強(qiáng)的線性相關(guān)性.

.石go__

(2)解:@b=^-------=——=-\9則。=),一法=113-19x7=246,

土一2|Ut

七-5x

/-I

所以.V關(guān)干X的經(jīng)驗(yàn)同歸方程為y=-19.V+246.

當(dāng)x=10時(shí),則),=-19xlO+246=56,

所以,當(dāng)x=10時(shí),y的預(yù)測值為56;

②由《=);.-£=£+19內(nèi)-246,計(jì)算得該回歸模型的殘差如下表所示:

巷98765

01-33-1

所以,殘差的方差為『=+3、(-I1=4.

5

【變式1](2024?全國?高三專題練習(xí))根據(jù)一組樣本數(shù)據(jù)(為,匕),(叼兒),匕,(七,然)的散點(diǎn)圖分析x

與y之間是否存在線性相關(guān)關(guān)系,求得其線性回歸方程為20.851-85.7,則在樣本點(diǎn)(165,57)處的殘差為

()

A.54.55B.2.45C.3.45D.111.55

【答案】B

【詳解】把x=165代入?=0.851一85.7,得亍=0.85x165-85.7=54.55,

所以在樣本點(diǎn)(165,57)處的殘差2=k9=57-54.55=2.45.

故選:B.

【變式2](2024?全國?高三專題練習(xí))從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高單位:cm)與體重

y(單位:kg)數(shù)據(jù)如下表:

X165165157170175165155170

y4857505464614359

若已知),與X的線性回歸方程為),=0.8x-80,設(shè)殘差記為觀測值與預(yù)測值之間的差(即殘差=廣),)那么

選取的女大學(xué)生身高為175cm時(shí),相應(yīng)的殘差為.

【答案】4

【詳解】已知y與x的線性同歸方程為5=0.8£-80

當(dāng)工=175時(shí):),=60,相應(yīng)的殘差為:64-60=4

故答案為:4

【變式3](2023?高二課時(shí)練習(xí))高中女學(xué)生的身高預(yù)報(bào)體重的回歸方程是),=0.75x-75.5(其中工,y的

單位分別是cm,kg),則此方程在樣本點(diǎn)(160,46)處的殘差是.

【答案】1.5

【詳解】由樣本數(shù)據(jù)得到,女大學(xué)生的身高預(yù)報(bào)體重的回歸方程是y=0.75x-75.5,

當(dāng)H=160時(shí),y=0.75x160-75.5=44.5,

此方程在樣本(160,46)處殘差為:46-44.5=1.5.

故答案為:15

題型06相關(guān)指數(shù)計(jì)算

【典例1】(2024上?全國?高三期末)2021年6月17日9時(shí)22分,我國酒泉衛(wèi)星發(fā)射中心用長征2尸遙十

二運(yùn)載火笳,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太

空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號

的重要零件,該材料應(yīng)用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論