第三節(jié) 變量間的相關關系及回歸模型-2026版高考數(shù)學一輪總復習_第1頁
第三節(jié) 變量間的相關關系及回歸模型-2026版高考數(shù)學一輪總復習_第2頁
第三節(jié) 變量間的相關關系及回歸模型-2026版高考數(shù)學一輪總復習_第3頁
第三節(jié) 變量間的相關關系及回歸模型-2026版高考數(shù)學一輪總復習_第4頁
第三節(jié) 變量間的相關關系及回歸模型-2026版高考數(shù)學一輪總復習_第5頁
已閱讀5頁,還剩78頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

第三節(jié)變量間的相關關系及回歸模型高中總復習·數(shù)學課標要求1.

結(jié)合實例,了解樣本相關系數(shù)的統(tǒng)計含義,了解樣本相關系數(shù)與標準化

數(shù)據(jù)向量夾角的關系.2.

結(jié)合實例,會通過相關系數(shù)比較多組成對數(shù)據(jù)的相關性.3.

結(jié)合具體實例,了解一元線性回歸模型的含義,了解模型參數(shù)的統(tǒng)

計意義,了解最小二乘原理,掌握一元線性回歸模型參數(shù)的最小二乘

估計方法.4.

針對實際問題,會用一元線性回歸模型進行預測.目錄CONTENTS知識·逐點夯實01.考點·分類突破02.課時·跟蹤檢測03.PART01知識·逐點夯實必備知識|課前自修

1.

變量的相關關系(1)相關關系:若兩個變量有關系,但又沒有確切到可由其中的一個去

精確地決定另一個的程度,這種關系稱為相關關系;(2)相關關系的分類:①從整體上看,當一個變量的值增加時,另一個

變量的相應值也呈現(xiàn)增加的趨勢,就稱這兩個變量

?;②當一個變量的值增加時,另一個變量的相應值呈現(xiàn)減小的趨勢,則稱這

兩個變量

?;提醒

注意相關關系與函數(shù)關系的區(qū)別:函數(shù)關系是一種確定的關系,

而相關關系是一種非確定的關系.(3)線性相關:如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在

附近,就稱這兩個變量線性相關.正相關

負相關

一條直線

2.

樣本相關系數(shù)對于變量x和變量y,設經(jīng)過隨機抽樣獲得的成對樣本數(shù)據(jù)為(x1,y1),

(x2,y2),…,(xn,yn),若x與y存在線性相關關系,可用樣本相關

系數(shù)r定量分析它們的相關程度的強弱.

①當r>0時,稱成對樣本數(shù)據(jù)

相關;當r<0時,稱成對樣本數(shù)

據(jù)

相關;當r=0時,稱成對樣本數(shù)據(jù)間沒有線性相關關系;②樣本相關系數(shù)r的取值范圍為

.當|r|越接近1時,成對樣

本數(shù)據(jù)的線性相關程度越

;當|r|越接近0時,成對樣本數(shù)據(jù)的線

性相關程度越

?.正

[-1,1]

(2)樣本相關系數(shù)r的性質(zhì)

4.

判斷回歸模型的擬合效果

(1)殘差分析法②殘差分析:(ⅰ)定型分析:殘差點比較均勻地落在水平的帶狀區(qū)域中,

說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精

度越高,經(jīng)驗回歸方程的預報精度越高.(ⅱ)定量分析:利用殘差平方

和,殘差平方和越小,模型的擬合效果越好.①作殘差圖:作圖時縱坐標為

,橫坐標可以選為樣本編號,或xi

數(shù)據(jù),或yi數(shù)據(jù),這樣作出的圖形稱為殘差圖;殘差

1.

判斷正誤.(正確的畫“√”,錯誤的畫“×”)(1)“名師出高徒”可以解釋為教師的教學水平與學生的水平成正相關

關系.

)(2)散點圖是判斷兩個變量相關關系的一種重要方法和手段.

(4)樣本相關系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關程度越

強.

)√√×√2.

(人A選三P103習題1題改編)兩個變量的相關關系有①正相關,②負

相關,③不相關,則下列散點圖從左到右反映的變量間的相關關系分別是

)A.

①②③B.

②③①C.

②①③D.

①③②解析:

第一個散點圖中的點是從左下角區(qū)域分布到右上角區(qū)域,則是

正相關;第三個散點圖中的點是從左上角區(qū)域分布到右下角區(qū)域,則是負

相關;第二個散點圖中的點的分布沒有什么規(guī)律,則是不相關,所以應該

是①③②.√3.

對于x,y兩變量,有四組成對樣本數(shù)據(jù),分別算出它們的樣本相關系

數(shù)r如下,則線性相關性最強的是(

)A.

-0.82B.0.78C.

-0.69D.

-0.87解析:

由樣本相關系數(shù)的絕對值越大,變量間的線性相關性越強知,

各選項中r=-0.87的絕對值最大.√4.

(人A選三P113例題改編)在對兩個變量x,y進行回歸分析時有下列步

驟:①對所求出的經(jīng)驗回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=

1,2,…,n;③求經(jīng)驗回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點圖.則下

列操作順序正確的是(

)A.

①②④③B.

③②④①C.

②③①④D.

②④③①解析:

根據(jù)回歸分析的思想,可知對兩個變量x,y進行回歸分析時,

應先收集數(shù)據(jù)(xi,yi),然后繪制散點圖,再求經(jīng)驗回歸方程,最后對

所求的經(jīng)驗回歸方程作出解釋.√

x0134y2.24.34.86.7

2.6PART02考點·分類突破精選考點|課堂演練

成對數(shù)據(jù)的相關性(師生共研過關)

(2022·全國乙卷理19題)某地經(jīng)過多年的環(huán)境治理,已將荒山改造

成了綠水青山.為估計一林區(qū)某種樹木的總材積量,隨機選取了10棵這種

樹木,測量每棵樹的根部橫截面積(單位:m2)和材積量(單位:m3),

得到如下數(shù)據(jù):樣本號i12345678910總和根部橫截面積xi0.040.060.040.080.080.050.050.070.070.060.6材積量yi0.250.400.220.540.510.340.360.460.420.403.9

(1)估計該林區(qū)這種樹木平均一棵的根部橫截面積與平均一棵的材積量;

(2)求該林區(qū)這種樹木的根部橫截面積與材積量的樣本相關系數(shù)(精確

到0.01);

解題技法樣本相關系數(shù)r的統(tǒng)計含義及應用(1)由r的正、負可判斷成對樣本數(shù)據(jù)中兩相關變量是正相關還是負

相關;(2)可根據(jù)|r|的大小從量的角度判斷成對樣本數(shù)據(jù)是否具有線性相關

性,進而可知能否用經(jīng)驗回歸方程進行分析和預測;(3)當|r|≤0.25時,即便求得了經(jīng)驗回歸方程也沒有任何統(tǒng)計意義.

A.

x與y正相關,x與z負相關B.

x與y正相關,x與z正相關C.

x與y負相關,x與z負相關D.

x與y負相關,x與z正相關

√2.

對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其樣本相關系數(shù)的

比較,正確的是(

)A.

r2<r4<0<r3<r1B.

r4<r2<0<r1<r3C.

r4<r2<0<r3<r1D.

r2<r4<0<r1<r3√解析:

由散點圖知圖1與圖3是正相關,故r1>0,r3>0,圖2與圖4是負

相關,故r2<0,r4<0,且圖1與圖2的樣本點集中在一條直線附近,因此

r2<r4<0<r3<r1.回歸模型(定向精析突破)考向1

線性回歸分析

(2025·鄭州第三次質(zhì)量檢測)按照《中華人民共和國環(huán)境保護法》

的規(guī)定,每年生態(tài)環(huán)境部都會會同國家發(fā)展改革委等部門共同編制《中國

生態(tài)環(huán)境狀況公報》,并向社會公開發(fā)布.下表是2018~2022年五年《中

國生態(tài)環(huán)境狀況公報》中酸雨區(qū)面積約占國土面積的百分比(yi%):年份2018年2019年2020年2021年2022年年份代碼xi12345yi6.45.55.04.83.8(1)求2018~2022年年份代碼xi與yi的樣本相關系數(shù)(精確到0.01);

-2-10121.30.4-0.1-0.3-1.3

(2)請用樣本相關系數(shù)說明該組數(shù)據(jù)中y與x之間的關系可用一元線性回

歸模型進行描述,并求出y關于x的經(jīng)驗回歸方程;

考向2

非線性回歸分析

(2024·溫州二模)紅旗淀粉廠2025年之前只生產(chǎn)食品淀粉,下表為

年投入資金x(萬元)與年收益y(萬元)的8組數(shù)據(jù):x1020304050607080y12.816.51920.921.521.92325.4(1)用y=bln

x+a模擬生產(chǎn)食品淀粉年收益y與年投入資金x的關系,

求出回歸方程;

(2)為響應國家“加快調(diào)整產(chǎn)業(yè)結(jié)構(gòu)”的號召,該企業(yè)又自主研發(fā)出一

種藥用淀粉,預計其收益為投入的10%.2025年該企業(yè)計劃投入200萬元用

于生產(chǎn)兩種淀粉,求年收益的最大值.(精確到0.1萬元)附:1612920

400109603ln

2≈0.7,ln

5≈1.6.

解題技法

有些非線性回歸分析問題并不給出經(jīng)驗公式,這時我們可以畫出已知

數(shù)據(jù)的散點圖,把它與學過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)

等)的圖象進行比較,挑選一種跟這些散點擬合得最好的函數(shù),用適當?shù)?/p>

變量進行變換,如通過換元或取對數(shù)等方法,把問題化為線性回歸分析問

題,使之得到解決.

“綠水青山就是金山銀山”的理念推動了新能源汽車產(chǎn)業(yè)的迅速發(fā)展.以

下表格和散點圖反映了近幾年某新能源汽車的年銷售量情況.年份20202021202220232024年份代碼x12345某新能源汽車年銷售量y/萬輛1.55.917.732.955.6(1)請根據(jù)散點圖判斷,y=bx+a與y=cx2+d中哪一個更適宜作為年

銷售量y關于年份代碼x的回歸方程類型;(給出判斷即可,不必說明

理由)解:

根據(jù)散點圖可知,y=cx2+d更適宜作為年銷售量y關于年份代碼x的回歸方程類型.(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關于x的經(jīng)驗回歸方程,并

預測2025年該新能源汽車的年銷售量.(精確到0.1)

故預測2025年該新能源汽車的年銷售量為79.7萬輛.刻畫擬合效果(師生共研過關)

假定小麥基本苗數(shù)x與成熟期有效穗y之間存在相關關系,今測得5組

數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2

(1)計算各組殘差,并計算殘差平方和;

(2)求R2,并說明回歸模型擬合效果的好壞.

解題技法刻畫擬合效果的三種方法(1)殘差圖法:殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi)說明選用的模

型比較合適;

1.

在一元線性回歸模型Y=bx+a+e

中,下列說法正確的是(

)A.

Y=bx+a+e

是一次函數(shù)B.

響應變量Y是由解釋變量x唯一確定的C.

響應變量Y除了受解釋變量x的影響外,可能還受到其他因素的影響,

這些因素會導致隨機誤差e的產(chǎn)生D.

隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e

的產(chǎn)生√解析:

對于A,一元線性回歸模型Y=bx+a+e

中,方程表示的不是

確定性關系,因此不是一次函數(shù),所以A錯誤;對于B,響應變量Y不是由

解釋變量x唯一確定的,所以B錯誤;對于C,響應變量Y除了受解釋變量

x的影響外,可能還受到其他因素的影響,這些因素會導致隨機誤差e的產(chǎn)

生,所以C正確;對于D,隨機誤差是不能避免的,只能將誤差縮小,所以

D錯誤.2.

現(xiàn)代物流成為繼勞動力、自然資源外影響企業(yè)生產(chǎn)成本及利潤的重要因

素.某企業(yè)去年前八個月的物流成本和企業(yè)利潤的數(shù)據(jù)(單位:萬元)如

下表所示:月份1234物流成本x8383.58086.5利潤y1141161061220.20.61.8-3月份5678物流成本x8984.57986.5利潤y132114m132-1-4.6-1

(3)通過殘差分析,懷疑殘差絕對值最大的那組數(shù)據(jù)有誤,經(jīng)再次核實

后發(fā)現(xiàn)其真正利潤應該為116萬元.請重新根據(jù)最小二乘法的思想與公式,

求出新的經(jīng)驗回歸方程.

PART03課時·跟蹤檢測關鍵能力|課后練習

1.

根據(jù)如表樣本數(shù)據(jù):x23456y42.5-0.5-2-3

√12345678910111213141516171819202022232425

2.

甲、乙、丙、丁四位同學各自對A,B兩個變量的線性相關性做試驗,

并用回歸分析方法分別求得樣本相關系數(shù)r與殘差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103則哪位同學的試驗結(jié)果體現(xiàn)A,B兩個變量有更強的線性相關性(

)A.

甲B.

乙C.

丙D.

丁解析:

r的絕對值越接近1,m越小,線性相關性越強.√3.

〔多選〕(2024·武昌質(zhì)量檢測)下列說法正確的是(

)A.

將一組數(shù)據(jù)的每一個數(shù)減去同一個數(shù)后,新數(shù)據(jù)的方差與原數(shù)據(jù)方差

相同C.

樣本相關系數(shù)r越大,兩個變量的線性相關性越強D.

在殘差的散點圖中,殘差分布的水平帶狀區(qū)域的寬度越窄,其模型的

擬合效果越好√√√

4.

〔多選〕(2025·唐山一模)為研究光照時長x(小時)和種子發(fā)芽數(shù)量

y(顆)之間的關系,某課題研究小組采集了10組數(shù)據(jù),繪制散點圖如圖

所示,并進行線性回歸分析,若去掉點P后,下列說法正確的是(

)A.

樣本相關系數(shù)r變小B.

經(jīng)驗回歸方程斜率變大C.

殘差平方和變小D.

決定系數(shù)R2變小√√解析:

由圖可知:P較其他的點偏離直線最大,所以去掉點P后,回

歸效果更好.對于A,樣本相關系數(shù)|r|越接近于1,線性相關性越強,因

為散點圖是遞增的趨勢,所以去掉點P后,樣本相關系數(shù)r變大,故A錯

誤;對于B,由經(jīng)驗回歸方程的實際意義,要使殘差平方和最小,去掉點

P后,回歸直線靠近y軸位置需要向下移動,但靠近最右側(cè)兩個點的位置變

化不大,經(jīng)驗回歸方程斜率變大,故B正確;對于C,殘差平方和越大,擬

合效果越差,所以去掉點P后,殘差平方和變小,故C正確;對于D,決定

系數(shù)R2越接近于1,擬合效果越好,所以去掉點P后,決定系數(shù)R2變大,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論