成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)原卷版-2025年高考數(shù)學(xué)一輪復(fù)習(xí)_第1頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)原卷版-2025年高考數(shù)學(xué)一輪復(fù)習(xí)_第2頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)原卷版-2025年高考數(shù)學(xué)一輪復(fù)習(xí)_第3頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)原卷版-2025年高考數(shù)學(xué)一輪復(fù)習(xí)_第4頁
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析(五大題型)(講義)原卷版-2025年高考數(shù)學(xué)一輪復(fù)習(xí)_第5頁
已閱讀5頁,還剩25頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第02講成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

目錄

01考情透視?目標(biāo)導(dǎo)航............................................................2

02知識(shí)導(dǎo)圖?思維引航............................................................3

03考點(diǎn)突破題型探究............................................................4

知識(shí)點(diǎn)1:變量間的相關(guān)關(guān)系......................................................4

知識(shí)點(diǎn)2:線性回歸..............................................................5

知識(shí)點(diǎn)3:非線性回歸............................................................6

知識(shí)點(diǎn)4:獨(dú)立性檢驗(yàn)............................................................7

解題方法總結(jié)...................................................................9

題型一:變量間的相關(guān)關(guān)系.......................................................9

題型二:一元線性回歸模型......................................................11

題型三:非線性回歸............................................................14

題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)....................................................18

題型五:誤差分析..............................................................21

04真題練習(xí)?命題洞見............................................................24

05課本典例高考素材............................................................25

06易錯(cuò)分析?答題模板............................................................28

易錯(cuò)點(diǎn):對(duì)回歸直線的性質(zhì)理解不深刻............................................28

答題模板:獨(dú)立性檢驗(yàn)..........................................................28

考情透視.目標(biāo)導(dǎo)航

考點(diǎn)要求考題統(tǒng)計(jì)考情分析

從近五年的全國(guó)卷的考查情況來看,

本節(jié)是高考的熱點(diǎn),主要以解答題形式出

2024年甲卷(理)第17題,12分

(1)變量的相關(guān)關(guān)系現(xiàn),經(jīng)常與概率綜合出題,一般難度為中

2023年上海卷第14題,4分

(2)樣本相關(guān)系數(shù)等.也可能以選擇題、填空題形式出現(xiàn),

2023年天津卷第7題,5分

(3)一元線性回歸模型難度不大.主要以應(yīng)用題的方式出現(xiàn),多

2023年甲卷(文)第19題,12分

(4)列聯(lián)表與獨(dú)立性檢驗(yàn)與經(jīng)濟(jì)、生活實(shí)際相聯(lián)系,需要在復(fù)雜的

2022年I卷第20題,12分

題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模

型,并且運(yùn)用數(shù)學(xué)模型解決實(shí)際問題.

復(fù)習(xí)目標(biāo):

(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.

(2)理解一元線性回歸模型和2x2列聯(lián)表,會(huì)運(yùn)用這些方法解決簡(jiǎn)單的實(shí)際問題.

(3)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.

匐2

〃二知識(shí)導(dǎo)圖?思維引航\\

變置之間的相關(guān)關(guān)系

成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析

老占突硒?力理慳宙

-----

知識(shí)JJ

知識(shí)點(diǎn)1:變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點(diǎn)圖

將樣本中的?個(gè)數(shù)據(jù)點(diǎn)(X,.,y)(7=1,2,)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖

中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.

(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為正相關(guān),如圖(1)所示;

(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將

它稱為負(fù)相關(guān),如圖(2)所小.

(1)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量%的取值毛,變量y的觀測(cè)值為必。<注"),則變量1與y的相關(guān)系數(shù)

〃__n_

2(%-幻(%-y)一nxy

r=「=丁年i---------=,通常用「來衡量'與y之間的線性關(guān)系的強(qiáng)弱,廠

Yi=li=\Vi=lVi=l

的范圍為-lArWl.

(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).

(2)3越接近i,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);團(tuán)越接近o,表示兩個(gè)變量間幾乎不存在線性

相關(guān)關(guān)系.當(dāng)上i=i時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.

(3)通常當(dāng)上|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.

【診斷自測(cè)】如圖,為某組數(shù)據(jù)的散點(diǎn)圖,由最小二乘法計(jì)算得到回歸直線4的方程為9=相關(guān)

系數(shù)為々,決定系數(shù)為若經(jīng)過殘差分析后去掉點(diǎn)P,剩余的點(diǎn)重新計(jì)算得到回歸直線4的方程為

.則下列結(jié)論一定正確的是(

D.4>o,々<。

C.<b2

知識(shí)點(diǎn)2:線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(X1,%),(&,竺),…,(斯,加),其回歸方程)=加+4的求法為

?__n__

Z(a-x)(y.-y)EXJ.-nxy

3=上1r----------=-4----------

Z=14=1

a=y-bx

其中,x=-Yx;,y=-y\yi-(,y)稱為樣本點(diǎn)的中心.

n,=in,=1

2、殘差分析

對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值》,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減

去預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(4%)的殘差,即有《.=%-%.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)

殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差

分析.

(1)殘差圖

通過殘差分析,殘差點(diǎn)?后)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這

樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和Q=g;(y_%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

i=\

反之,不合適.

(3)相關(guān)指數(shù)

£(%-獷

用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=1一上」__

――)2

1=1

尺2越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

【診斷自測(cè)】將某保護(hù)區(qū)分為面積大小相近的多個(gè)區(qū)域,用簡(jiǎn)單隨機(jī)抽樣的方法抽取其中6個(gè)區(qū)域,統(tǒng)計(jì)

這些區(qū)域內(nèi)的某種水源指標(biāo)%和某植物分布的數(shù)量X(力=1,2….,6),得到樣本(4y),且其相關(guān)系數(shù)r=與,

16

記y關(guān)于X的線性回歸方程為y=a+bx.經(jīng)計(jì)算可知:元=9,£>;=550,之(y-y)2=256,則.=.

Z=1Z=1

八-元)(%-刃f(%-T)(y-y)

參考公式:2-----------;—,,=「.

畢T)Jm也(iy

1=1Vi=iVi=i

知識(shí)點(diǎn)3:非線性回歸

解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;

(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、

二次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、塞函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

【診斷自測(cè)】某人新房剛裝修完,為了監(jiān)測(cè)房屋內(nèi)空氣質(zhì)量的情況,每天在固定的時(shí)間測(cè)一次甲醛濃度

(單位:mg/m3),連續(xù)測(cè)量了10天,所得數(shù)據(jù)繪制成散點(diǎn)圖如下:用y,表示第,…,10)天測(cè)得的甲

101010

醛濃度,令z,=ln%,經(jīng)計(jì)算得£z,=12.8,£產(chǎn)=385,£氏=60.

?=1i=li=l

7上甲醛濃度Mmg/n?)

6

5

4

3

2

1

IIIIIII]]II_____

°12345678910天數(shù)

(1)由散點(diǎn)圖可知,丫與i可用指數(shù)型回歸模型進(jìn)行擬合,請(qǐng)利用所給條件求出回歸方程;(系數(shù)精確到o.oi)

(2)已知房屋內(nèi)空氣中的甲醛濃度的安全范圍是低于0.08mg/nP,則根據(jù)(1)中所得回歸模型,該新房裝

修完第幾天開始達(dá)到此標(biāo)準(zhǔn)?(參考數(shù)據(jù):ln0.08a-2.53)

a'(%一元Xy-歹)^x^.-nxy

附:,=~n=三,a=y-bx.

方(%-元)2,片_衣2

i=li=\

知識(shí)點(diǎn)4:獨(dú)立性檢驗(yàn)

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{芍,三}和{乂,%},其樣本頻數(shù)列聯(lián)表

(稱為2義2列聯(lián)表)為

X%總計(jì)

不aba+b

九2Cdc+d

總計(jì)a+cb+dn=a+b+c+d

從2x2列表中,依據(jù),^與,二的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),一與^相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.

a+bc+d

3、獨(dú)立性檢驗(yàn)

計(jì)算隨機(jī)變量/=-----Ead-bcY-------利用爐的取值推斷分類變量X和¥是否獨(dú)立的方法稱為

(a+b)(c+d)(a+c)(Z?+d)

Z2獨(dú)立性檢驗(yàn).

oc0.100.050.0100.0050.001

Xa2.7063.8416.6357.87910.828

【診斷自測(cè)】近年中國(guó)新能源汽車進(jìn)入高速發(fā)展時(shí)期.專家預(yù)測(cè)2024年中國(guó)汽車總銷售量將超過3100萬輛,

繼續(xù)領(lǐng)跑全球.為了了解廣大消費(fèi)者購買新能源汽車意向與年齡是否具有相關(guān)性,某汽車APP采用問卷調(diào)

查形式對(duì)400名消費(fèi)者進(jìn)行調(diào)查,數(shù)據(jù)顯示這400人中中老年人共有150人,且愿意購買新能源車的人數(shù)

是愿意購買燃油車的2倍;青年中愿意購買新能源車的人數(shù)是愿意購買燃油車的4倍.

購車意向

年齡段合計(jì)

愿意購買新能源車愿意購買燃油車

青年

中老年

合計(jì)

(1)完善2x2列聯(lián)表,請(qǐng)根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),分析消費(fèi)者對(duì)新能源車和燃油車的意向購買

與年齡是否有關(guān);

(2)采用分層隨機(jī)抽樣從愿意購買新能源車的消費(fèi)者中抽取9人,再從這9人中隨機(jī)抽取4人,求這4人中

青年人數(shù)的期望.

附:4______Mad-bcf______

(〃+Z?)(c+d)(〃+c)3+d)

a0.050.010.001

%3.8416.63510.828

解題方法總結(jié)

常見的非線性回歸模型

(1)指數(shù)函數(shù)型_y=ca"(。>0且C>0)

兩邊取自然對(duì)數(shù),lny=ln(c〃x),即Iny=lnc+xlna,

令]、一原方程變?yōu)?/=lnc+x,lno,然后按線性回歸模型求出Ina,Inc.

[x=x

(2)對(duì)數(shù)函數(shù)型y=bln%+a

令11一:,原方程變?yōu)榱?法,+0,然后按線性回歸模型求出在,a.

[x=lnx

(3)籍函數(shù)型丁="〃

兩邊取常用對(duì)數(shù),lgy=lg(?〃),即Igy=〃lgx+lga,

y'Tgy

令,I,原方程變?yōu)閂=n/+lga,然后按線性回歸模型求出八,Iga.

x=lgx

(4)二次函數(shù)型丁=-2+.

令],原方程變?yōu)閥'=fo/+a,然后按線性回歸模型求出ma.

[x=x

b

(5)反比例函數(shù)型y=a+<型

x

y,=y

令1,原方程變?yōu)閂=-a,然后按線性回歸模型求出心a?

%'=—

、%

題型洞察

題型一:變量間的相關(guān)關(guān)系

【典例1-1】已知5個(gè)成對(duì)數(shù)據(jù)(x,y)的散點(diǎn)圖如下,若去掉點(diǎn)z>(4,3),則下列說法正確的是()

/(1,4)

,.5(2,3.5)

.?£>(4,3)

C(3,2.5)

_______________

Ox

A.變量x與變量y呈正相關(guān)B.變量x與變量y的相關(guān)性變強(qiáng)

C.殘差平方和變大D.樣本相關(guān)系數(shù)r變大

【典例1-2】已知々表示變量無與y之間的相關(guān)系數(shù),4表示變量〃與v之間的相關(guān)系數(shù),且4=。836,

=-0.958,貝U()

A.變量x與y之間呈正相關(guān)關(guān)系,且無與y之間的相關(guān)性強(qiáng)于a與v之間的相關(guān)性

B.變量尤與y之間呈負(fù)相關(guān)關(guān)系,且x與y之間的相關(guān)性強(qiáng)于“與v之間的相關(guān)性

C.變量〃與v之間呈負(fù)相關(guān)關(guān)系,且尤與y之間的相關(guān)性弱于a與v之間的相關(guān)性

D.變量a與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于〃與v之間的相關(guān)性

【方法技巧】

判定兩個(gè)變量相關(guān)性的方法

(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)

變量負(fù)相關(guān).

(2)樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)K0時(shí),負(fù)相關(guān);川越接近于1,相關(guān)性越強(qiáng).

(3)經(jīng)驗(yàn)回歸方程:當(dāng)g>0時(shí),正相關(guān);當(dāng)信0時(shí),負(fù)相關(guān).

【變式1-1】某校學(xué)生科研興趣小組為了解1~12歲兒童的體質(zhì)健康情況,隨機(jī)調(diào)查了20名兒童的相關(guān)數(shù)

據(jù),分別制作了肺活量、視力、肢體柔韌度、BMI指數(shù)和身高之間的散點(diǎn)圖,則與身高之間具有正相關(guān)關(guān)

系的是()

O高

肢BK/

指a

數(shù)

柔I

O)身高O*身高

A.肺活量B.視力C.肢體柔韌度D.BMI指數(shù)

【變式1-2]對(duì)變量尤,y由觀測(cè)數(shù)據(jù)得散點(diǎn)圖1;對(duì)變量",v由觀測(cè)數(shù)據(jù)(%匕)(ieN*)得散

點(diǎn)圖2.4表示變量無,y之間的線性相關(guān)系數(shù),4表示變量",v之間的線性相關(guān)系數(shù),則下列說法正確的

是()

A.變量x與y呈現(xiàn)正相關(guān),且團(tuán)>閆B.變量x與y呈現(xiàn)負(fù)相關(guān),且閆

C.變量〃與v呈現(xiàn)正相關(guān),且田〉⑻D.變量M與v呈現(xiàn)負(fù)相關(guān),且值|〈人|

【變式1-3](2024.江西南昌?三模)如圖對(duì)兩組數(shù)據(jù)x,>和","分別進(jìn)行回歸分析,得到散點(diǎn)圖如圖,

并求得線性回歸方程分別是>=偽工+q和"=%>,+/,并對(duì)變量盯>進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,

對(duì)變量V,"進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,則下列判斷正確的是()

A.仇>0B.&v。C.|川〈歸D.4+馬vO

【變式1-4](2024.遼寧葫蘆島.一模)已知變量%與、的回歸直線方程為y=3x-1,變量y與z負(fù)相關(guān),則

A.x與'負(fù)相關(guān),%與2負(fù)相關(guān)B.%與、正相關(guān),%與z正相關(guān)

C.%與,負(fù)相關(guān),1與z正相關(guān)D.%與丁正相關(guān),'與z負(fù)相關(guān)

題型二:一元線性回歸模型

【典例2-1】(2024?四川成都?模擬預(yù)測(cè))已知關(guān)于x的一組數(shù)據(jù):

X1m345

y0.50.6n1.31.4

根據(jù)表中數(shù)據(jù)得到的線性回歸直線方程為9=0.28X+0.16,則n-028m的值

【典例2-2】(2024?四川綿陽?三模)根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量了(百千克)與某種液體

肥料每畝的使用量x(千克)之間的對(duì)應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示.

本”百千克

7

6

5

4

3

024568x/千克

(1)從散點(diǎn)圖可以看出,可用線性回歸方程擬合》與X的關(guān)系,請(qǐng)計(jì)算樣本相關(guān)系數(shù)r并判斷它們的相關(guān)程

度;

(2)求>關(guān)于X的線性回歸方程夕=治+近,并預(yù)測(cè)液體肥料每畝的使用量為12千克時(shí)西紅柿畝產(chǎn)量的增加

量.

£(%-可(V-刃,^(x;-J)(y,.-y),

附.爪=.[*1=g=3-------------------------,a=y-bx

.向…臥FMH.

【方法技巧】

求經(jīng)驗(yàn)回歸方程的步驟

I---------------1

f步驟一,甘算出Q勃,",必或士(%-初%-歹),i

悟鏟的值j

(步驟二H利用公式計(jì)算系數(shù)

0二二二二二二二二二二

(步驟三H寫出經(jīng)驗(yàn)回歸方程9=菽+4

【變式2-1】某中醫(yī)藥企業(yè)根據(jù)市場(chǎng)調(diào)研與模擬,得到研發(fā)投入x(億元)與產(chǎn)品收益,(億元)的數(shù)據(jù)統(tǒng)

計(jì)如下:

研發(fā)投入X(億元)12345

產(chǎn)品收益》(億元)3791011

(1)計(jì)算x,y的相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若

0.3<|r|<0.75,則線性相關(guān)程度一般;若⑺>0.75,則線性相關(guān)程度較高)

(2)求出了關(guān)于x的線性回歸方程,并預(yù)測(cè)若想收益超過20(億元),則需研發(fā)投入至少多少億元?(結(jié)果保

留一位小數(shù))

£(七一元)(必一歹)

參考公式:回歸直線的斜率和截距的最小二乘法估計(jì)公式,相關(guān)系數(shù)一的公式分別為B=J--------------

方(項(xiàng)-行

i=i

X(x,「才)(%-歹)

a=y—bx,

柩(%-刃2

參考數(shù)據(jù):2(龍廠對(duì)=1°,£(?-刃J40,2(%-元)(%-衿=19.

1=11=1Z=1

【變式2-2](2024.河南周口.模擬預(yù)測(cè))直播帶貨是扶貧助農(nóng)的一種新模式,這種模式是利用主流媒體的

公信力,聚合銷售主播的力量助力打通農(nóng)產(chǎn)品產(chǎn)銷鏈條,切實(shí)助力農(nóng)民增收.我國(guó)南方某蜜桔種植縣通過

網(wǎng)絡(luò)平臺(tái)直播銷售蜜桔,其中每箱蜜桔重5千克,單價(jià)為40元/箱,己知最近5天單日直播總時(shí)長(zhǎng)尤(即所

有主播的直播時(shí)長(zhǎng)之和,單位:小時(shí))與蜜桔的單目銷售量y(單位:百箱)之間的統(tǒng)計(jì)數(shù)據(jù)如下表:

直播總時(shí)長(zhǎng)工89111215

單日銷售量y6763808085

可用線性回歸模型擬合y與x之間的關(guān)系.

(1)試求變量y與尤的線性回歸方程夕=放+近;

(2)若每位主播每天直播的時(shí)間不超過4小時(shí),要使每天直播帶貨銷售蜜桔的總金額超過60萬元,則至少

要請(qǐng)幾位主播進(jìn)行直播?

(3)直播帶貨大大提升銷量的同時(shí),也增加了壞果賠付的成本.該蜜桔平均每箱按80個(gè)計(jì)算,若客戶在收

到貨時(shí)有壞果,則每個(gè)壞果要賠付1元.現(xiàn)有甲、乙兩款包裝箱,若采用甲款包裝箱,成本為r(lM,V5)

元/箱,且每箱壞果的個(gè)數(shù)X服從尸(X=i)=<,i=l,2,3,4,5;若采用乙款包裝箱,成本為7元/箱,且

0,i=6,…,80

每箱壞果的個(gè)數(shù)y服從“y加,i=i,2,3.請(qǐng)運(yùn)用概率統(tǒng)計(jì)的相關(guān)知識(shí)分析,選擇哪款包裝箱獲

得的利潤(rùn)更大?

2(士-君(%-歹)

附:b=J-1,a=y-bx,Z玉M=4218,=635.

£(%-行

i-1

【變式2-3](2024.全國(guó)?模擬預(yù)測(cè))氮氧化物是一種常見的大氣污染物,它是由氮和氧兩種元素組成的化

合物,有多種不同的形式.下圖為我國(guó)2014年至2022年氮氧化物排放量(單位:萬噸)的折線圖,其中,

年份代碼1?9分別對(duì)應(yīng)年份2014—2022.

年氮氧化物排放量y

(1)是否可用線性回歸模型擬合>與/的關(guān)系?請(qǐng)用折線圖和相關(guān)系數(shù)加以說明;

(2)是否可用題中數(shù)據(jù)擬合得到的線性回歸模型預(yù)測(cè)2023年和2033年的氮氧化物排放量?請(qǐng)說明理由.

如--9)

附:相關(guān)系數(shù)廠二十^1---------------,5/15?3.87.

2(—)七(%-于

z=li=l

題型三:非線性回歸

【典例3-1](多選題)(2024?湖北武漢?二模)在對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩個(gè)變量

不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利

用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散

點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

,x+c,

A.y=qx+c2xB.y=-------

x+c2

C.y=q+ln(x+C2)D.尸肝8

【典例3-2]已知變量x和〉之間的關(guān)系可以用模型y=來擬合.設(shè)z=lny,若根據(jù)樣本數(shù)據(jù)計(jì)算可得

1=3.5工=0.9,且X與Z的線性回歸方程為z=0.6x+a,則%=__.(參考數(shù)據(jù):

ln0.3--1.2,ln0.25~-1.4)

【方法技巧】

換元法變成一元線性回歸模型

【變式3-1】紅蜘蛛是柚子的主要害蟲之一,能對(duì)柚子樹造成嚴(yán)重傷害,每只紅蜘蛛的平均產(chǎn)卵數(shù)>(個(gè))

和平均溫度無(℃)有關(guān),現(xiàn)收集了以往某地的7組數(shù)據(jù),得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.

個(gè)產(chǎn)卵數(shù)

400-

350-?

300-

250-

200-

150-

100-?

50-■?

*

c人J?:~1~1~1~1~1~

0202224262830323436溫度

參考數(shù)據(jù)(z=lny)

777

I町ZwXyz

i=li=li=l

5215177137142781.33.6

dx

⑴根據(jù)散點(diǎn)圖判斷,y=bx+a^y=ce(其中e=2.718…為自然對(duì)數(shù)的底數(shù))哪一個(gè)更適合作為平均產(chǎn)

卵數(shù)》(個(gè))關(guān)于平均溫度x(°C)的回歸方程類型?(給出判斷即可,不必說明理由)

(2)由(1)的判斷結(jié)果及表中數(shù)據(jù),求出了關(guān)于x的回歸方程.(計(jì)算結(jié)果精確到0.1)

.,E(玉-?。ǎ?9)?*一運(yùn).

附:回歸方程中y=i>x+a,b=-^—;i-----------=號(hào)---------,a=y-bx

豆(尤「可2立2-戒2

Z=1Z=1

【變式3-2】設(shè)某幼苗從觀察之日起,第x天的高度為*m,測(cè)得的一些數(shù)據(jù)如下表所示:

第X/p>

高度*m0479111213

作出這組數(shù)據(jù)的散點(diǎn)圖發(fā)現(xiàn):y(cm)與x(天)之間近似滿足頭系式>=》?+〃,其中。,匕均為大于。的

常數(shù).

(1)試借助一元線性回歸模型,根據(jù)所給數(shù)據(jù),用最小二乘法對(duì)。,匕作出估計(jì),并求出>關(guān)于,的經(jīng)驗(yàn)回歸

方程;

(2)在作出的這組數(shù)據(jù)的散點(diǎn)圖中,甲同學(xué)隨機(jī)圈取了其中的4個(gè)點(diǎn),記這4個(gè)點(diǎn)中幼苗的高度大于亍的點(diǎn)

的個(gè)數(shù)為3其中亍為表格中所給的幼苗高度的平均數(shù),試求隨機(jī)變量4的分布列和數(shù)學(xué)期望.

附:對(duì)于一組數(shù)據(jù)(、,〃1),(眩,月?,…,(匕,4),其回歸直線方程2=a+Av的斜率和截距的最小二乘

估計(jì)分別為灑上匕------一,&2刖.

Ei

Z=1

【變式3-3】紅鈴蟲(Pectinophoragossypiella)是棉花的主要害蟲之一,其產(chǎn)卵數(shù)與溫度有關(guān).現(xiàn)收集到

一只紅鈴蟲的產(chǎn)卵數(shù)》(個(gè))和溫度x(℃)的8組觀測(cè)數(shù)據(jù),制成圖1所示的散點(diǎn)圖.現(xiàn)用兩種模型①

>=eto+\②y="2+d分別進(jìn)行擬合,由此得到相應(yīng)的回歸方程并進(jìn)行殘差分析,進(jìn)一步得到圖2所示的

殘差圖.

產(chǎn)卵數(shù)”個(gè)

1殘差

140

2030

0020

8010

7——?--->

601至20萬、巡26近,&Z2_34就度

40-10

20-20'O

。???1??1?1A-3O

182022242628303234溫度x/C

一模型①9-模型②

圖1產(chǎn)卵數(shù)散點(diǎn)圖

圖2兩種模型的殘差圖

根據(jù)收集到的數(shù)據(jù),計(jì)算得到如下值:

88o88

之(匕-元)-(「)(七-)豆(y-刃&-?。?/p>

XZ1)Zzzx

1=1i=\i=\i=l

252.964616842268850.470308

_18_18

表中%=Iny,;z=gZz:;f,.=xf;t=q>工

°<=1°i=l

(D根據(jù)殘差圖,比較模型①、②的擬合效果,哪種模型比較合適?

(2)根據(jù)(1)中所選擇的模型,求出了關(guān)于£的回歸方程.

附:對(duì)于一組數(shù)據(jù)(②,匕),3,匕),…(。”,匕),其回歸直線。+的斜率和截距的最小二乘估計(jì)分別為,

^(<y;-?)(v,.-v)

/=J=H;-------------,a=v-pa>

一方

Z=1

【變式3-4](2024.福建南平.模擬預(yù)測(cè))某大型商場(chǎng)的所有飲料自動(dòng)售賣機(jī)在一天中某種飲料的銷售量》

(單位:瓶)與天氣溫度,(單位:℃)有很強(qiáng)的相關(guān)關(guān)系,為能及時(shí)給飲料自動(dòng)售賣機(jī)添加該種飲料,

該商場(chǎng)對(duì)天氣溫度x和飲料的銷售量了進(jìn)行了數(shù)據(jù)收集,得到下面的表格:

X10152025303540

y41664256204840968192

經(jīng)分析,可以用>人作為》關(guān)于x的經(jīng)驗(yàn)回歸方程.

(1)根據(jù)表中數(shù)據(jù),求》關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果保留兩位小數(shù));

(2)若飲料自動(dòng)售賣機(jī)在一天中不需添加飲料的記1分,需添加飲料的記2分,每臺(tái)飲料自動(dòng)售賣機(jī)在一天

中需添加飲料的概率均為;,在商場(chǎng)的所有飲料自動(dòng)售賣機(jī)中隨機(jī)抽取3臺(tái),記總得分為隨機(jī)變量X,求

X的分布列與數(shù)學(xué)期望.

參考公式及數(shù)據(jù):對(duì)于一組數(shù)據(jù)(玉,Y),(聲,色),…,(£,?,),經(jīng)驗(yàn)回歸方程夕=晟+&的斜率和截距的最小

二乘估計(jì)公式分別為A=J----------------,a=y-bx-,x=25,^(x,.-x)2=700

1=1

【變式3-5]在國(guó)家積極推動(dòng)美麗鄉(xiāng)村建設(shè)的政策背景下,各地根據(jù)當(dāng)?shù)厣鷳B(tài)資源打造了眾多特色紛呈的

鄉(xiāng)村旅游勝地.某人意圖將自己位于鄉(xiāng)村旅游勝地的房子改造成民宿用于出租,在旅游淡季隨機(jī)選取100

天,對(duì)當(dāng)?shù)匾延械牧g不同價(jià)位的民宿進(jìn)行跟蹤,統(tǒng)計(jì)其出租率y1l0°天中北,的天數(shù)),設(shè)民宿租金為X

(單位:元/日),得到如圖的數(shù)據(jù)散點(diǎn)圖.

卜出租率

1

9

8-.(88,0.91)

7

6二.(128,072)

5

4->(188,0.51)

3_.(288,0.32)

2

1-.(388,0.2)

-*(488,0.16)

100200300400500600租金

(1)若用“出租率”近似估計(jì)旅游淡季民宿每天租出去的概率,求租金為388元的那間民宿在淡季內(nèi)的3天中

至少有2天閑置的概率.

⑵⑴根據(jù)散點(diǎn)圖判斷,了=6尤+。與〉=。欣+4哪個(gè)更適合此模型(給出判斷即可,不必說明理由)?根

據(jù)判斷結(jié)果求經(jīng)驗(yàn)回歸方程.

(ii)若該地一年中旅游淡季約為280天,在此期間無論民宿是否出租,每天都要付出9.9%r的固定成本,

若民宿出租,則每天需要再付出10%x的日常支出成本.試用(i)中模型進(jìn)行分析,旅游淡季民宿租金定

為多少元時(shí),該民宿在這280天的收益W達(dá)到最大.

n

附:記z,=lnx,,261.3,?=0.47,z=5.4,22(^,.-x)(y;-y)?-221,

1=1

55152

次(々一寸。121333.3,^(Zi-z)(x-y)?-0.99,茨廠小2.2,e?148,e?164,e?181.

i=li=li=l

【變式3-6](2024?全國(guó)?模擬預(yù)測(cè))近三年的新冠肺炎疫情對(duì)我們的生活產(chǎn)生了很大的影響,當(dāng)然也影響

著我們的旅游習(xí)慣,鄉(xiāng)村游、近郊游、周邊游熱鬧了許多,甚至出現(xiàn)“微度假”的概念.在國(guó)家有條不紊的

防疫政策下,旅游又重新回到了老百姓的日常生活中.某鄉(xiāng)村抓住機(jī)遇,依托良好的生態(tài)環(huán)境、厚重的民

族文化,開展鄉(xiāng)村旅游.通過文旅度假項(xiàng)目考察,該村推出了多款套票文旅產(chǎn)品,得到消費(fèi)者的積極回

應(yīng).該村推出了六條鄉(xiāng)村旅游經(jīng)典線路,對(duì)應(yīng)六款不同價(jià)位的旅游套票,相應(yīng)的價(jià)格x與購買人數(shù)y的數(shù)

據(jù)如下表.

旅游線路奇山秀水游古村落游慢生活游親子游采摘游舌尖之旅

套票型號(hào)ABCDEF

價(jià)格力元394958677786

經(jīng)數(shù)據(jù)分析、描點(diǎn)繪圖,發(fā)現(xiàn)價(jià)格元與購買人數(shù)y近似滿足關(guān)系式、=*(,>。力>0),即

lny=blnx+lna(q>0,b>0),對(duì)上述數(shù)據(jù)進(jìn)行初步處理,其中匕=ln^,wz.=In,j=l,2,…,6.

6666

附:①可能用到的數(shù)據(jù):2>叱=75.3,$>=24.6,£叱=18.3,^^=1014.

z=li=li=\1=1

②對(duì)于一組數(shù)據(jù)(匕,叫),(彩,叱),…,”“,"),其回歸直線6=薪+2的斜率和截距的最小二乘估計(jì)值分

nn

Z(匕一")(叱一日)£ViWi一〃麗

另()為g=——-=號(hào),a=w-bv.

£(匕-琢支匕2-標(biāo)2

z=li=l

⑴根據(jù)所給數(shù)據(jù),求,關(guān)于X的回歸方程.

⑵按照相關(guān)部門的指標(biāo)測(cè)定,當(dāng)套票價(jià)格XC[49,81]時(shí),該套票受消費(fèi)者的歡迎程度更高,可以被認(rèn)定為

“熱門套票”.現(xiàn)有三位游客,每人從以上六款套票中購買一款旅游,購買任意一款的可能性相等.若三人

買的套票各不相同,記三人中購買“熱門套票''的人數(shù)為X,求隨機(jī)變量X的分布列和期望.

題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)

【典例44】觀察下圖的等高條形圖,其中最有把握認(rèn)為兩個(gè)分類變量%,,之間沒有關(guān)系的是()

A.%2B.%2

C.D.X?

【典例4?2】(2024.上海金山.二模)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下圖所示

列聯(lián)表:

疾病

藥物合計(jì)

未患病患病

服用m50-m50

未服用80-mm-3050

合計(jì)8020100

取顯著性水平a=0.05,若本次考察結(jié)果支持“藥物對(duì)疾病預(yù)防有顯著效果”,則〃,(根N40,〃zeN)的最小

值為_____

n(ad—be)2

(參考公式:/=;參考值:P(Z23.841)?0.05)

(a+b){c+d)(a+c)(b+d)

【方法技巧】

獨(dú)立性檢驗(yàn)的一般步驟

(1)根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表.

(2)根據(jù)公式/=------n(ad-be?-------計(jì)算.

(a+Z?)(c+d)(a+c)(b+d)

(3)比較/與臨界值的大小關(guān)系,作統(tǒng)計(jì)推斷.

【變式4-1](2024?四川成都?模擬預(yù)測(cè))在學(xué)校食堂就餐成為了很多學(xué)生的就餐選擇.學(xué)校為了解學(xué)生食

堂就餐情況,在校內(nèi)隨機(jī)抽取了100名學(xué)生,其中男生和女生人數(shù)之比為1:1,現(xiàn)將一周內(nèi)在食堂就餐超過

8次的學(xué)生認(rèn)定為“喜歡食堂就餐”,不超過8次的學(xué)生認(rèn)定為“不喜歡食堂就餐”.“喜歡食堂就餐”的人數(shù)比

“不喜歡食堂就餐”人數(shù)多20人,“不喜歡食堂就餐”的男生只有10人.

男生女生合計(jì)

喜歡食堂就餐

不喜歡食堂就餐10

合計(jì)100

(1)將上面的列聯(lián)表補(bǔ)充完整,并依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),分析學(xué)生喜歡食堂就餐是否與性別

有關(guān):

(2)用頻率估計(jì)概率,從該校學(xué)生中隨機(jī)抽取10名,記其中“喜歡食堂就餐”的人數(shù)為X.事件“X=k”的概

率為P(X=Q,求隨機(jī)變量X的期望和方差.

n(ad-be)2

參考公式:/=其中“=a+6+c+d.

(a+b)(c+d)(a+c)(b+d)

a0.10.050.010.0050.001

Xa2.7063.8416.6357.87910.828

【變式4-2](2024.高三.河南焦作.開學(xué)考試)交通強(qiáng)國(guó),鐵路先行,每年我國(guó)鐵路部門都會(huì)根據(jù)運(yùn)輸需求

進(jìn)行鐵路調(diào)圖,一鐵路線/上有自東向西依次編號(hào)為1,2,21的21個(gè)車站.

(1)為調(diào)查乘客對(duì)調(diào)圖的滿意度,在編號(hào)為10和11兩個(gè)站點(diǎn)多次乘坐列車尸的旅客中,隨機(jī)抽取100名旅

客,得出數(shù)據(jù)(不完整)如下表所示:

車站編號(hào)滿意不滿意合計(jì)

102840

113

合計(jì)85

完善表格數(shù)據(jù)并計(jì)算分析:依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),在這兩個(gè)車站中,能否認(rèn)為旅客滿意程

度與車站編號(hào)有關(guān)聯(lián)?

(2)根據(jù)以往調(diào)圖經(jīng)驗(yàn),列車尸在編號(hào)為8至14的終到站每次調(diào)圖時(shí)有;的概率改為當(dāng)前終到站的西側(cè)一站,

2

有]的概率改為當(dāng)前終到站的東側(cè)一站,每次調(diào)圖之間相互獨(dú)立.已知原定終到站編號(hào)為11的列車尸經(jīng)歷

了3次調(diào)圖,第3次調(diào)圖后的終到站編號(hào)記為X,求X的分布列及均值.

2n(ad-bc)一

附:”(a+b)(c+1)(a+c)(b+d)'其中n=a+b+c+d.

a0.10.010.001

Xa2.7066.63510.828

【變式4-3]2024年7月26日,第33屆夏季奧林匹克運(yùn)動(dòng)會(huì)在法國(guó)巴黎正式開幕.人們?cè)谟^看奧運(yùn)比賽的

同時(shí),開始投入健身的行列.某興趣小組為了解成都市

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論