版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第02講成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
目錄
01考情透視?目標(biāo)導(dǎo)航............................................................2
02知識(shí)導(dǎo)圖?思維引航............................................................3
03考點(diǎn)突破題型探究............................................................4
知識(shí)點(diǎn)1:變量間的相關(guān)關(guān)系......................................................4
知識(shí)點(diǎn)2:線性回歸..............................................................5
知識(shí)點(diǎn)3:非線性回歸............................................................6
知識(shí)點(diǎn)4:獨(dú)立性檢驗(yàn)............................................................7
解題方法總結(jié)...................................................................9
題型一:變量間的相關(guān)關(guān)系.......................................................9
題型二:一元線性回歸模型......................................................11
題型三:非線性回歸............................................................14
題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)....................................................18
題型五:誤差分析..............................................................21
04真題練習(xí)?命題洞見............................................................24
05課本典例高考素材............................................................25
06易錯(cuò)分析?答題模板............................................................28
易錯(cuò)點(diǎn):對(duì)回歸直線的性質(zhì)理解不深刻............................................28
答題模板:獨(dú)立性檢驗(yàn)..........................................................28
考情透視.目標(biāo)導(dǎo)航
考點(diǎn)要求考題統(tǒng)計(jì)考情分析
從近五年的全國(guó)卷的考查情況來看,
本節(jié)是高考的熱點(diǎn),主要以解答題形式出
2024年甲卷(理)第17題,12分
(1)變量的相關(guān)關(guān)系現(xiàn),經(jīng)常與概率綜合出題,一般難度為中
2023年上海卷第14題,4分
(2)樣本相關(guān)系數(shù)等.也可能以選擇題、填空題形式出現(xiàn),
2023年天津卷第7題,5分
(3)一元線性回歸模型難度不大.主要以應(yīng)用題的方式出現(xiàn),多
2023年甲卷(文)第19題,12分
(4)列聯(lián)表與獨(dú)立性檢驗(yàn)與經(jīng)濟(jì)、生活實(shí)際相聯(lián)系,需要在復(fù)雜的
2022年I卷第20題,12分
題目描述中找出數(shù)量關(guān)系,建立數(shù)學(xué)模
型,并且運(yùn)用數(shù)學(xué)模型解決實(shí)際問題.
復(fù)習(xí)目標(biāo):
(1)了解樣本相關(guān)系數(shù)的統(tǒng)計(jì)含義.
(2)理解一元線性回歸模型和2x2列聯(lián)表,會(huì)運(yùn)用這些方法解決簡(jiǎn)單的實(shí)際問題.
(3)會(huì)利用統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)分析.
匐2
〃二知識(shí)導(dǎo)圖?思維引航\\
變置之間的相關(guān)關(guān)系
成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析
老占突硒?力理慳宙
-----
知識(shí)JJ
知識(shí)點(diǎn)1:變量間的相關(guān)關(guān)系
1、變量之間的相關(guān)關(guān)系
當(dāng)自變量取值一定時(shí),因變量的取值帶有一定的隨機(jī)性,則這兩個(gè)變量之間的關(guān)系叫相關(guān)關(guān)系.由于
相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計(jì)發(fā)揮著非常重要的作用.我們可以通過收
集大量的數(shù)據(jù),在對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對(duì)它們的關(guān)系作出判斷.
注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,
而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.
2、散點(diǎn)圖
將樣本中的?個(gè)數(shù)據(jù)點(diǎn)(X,.,y)(7=1,2,)描在平面直角坐標(biāo)系中,所得圖形叫做散點(diǎn)圖.根據(jù)散點(diǎn)圖
中點(diǎn)的分布可以直觀地判斷兩個(gè)變量之間的關(guān)系.
(1)如果散點(diǎn)圖中的點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將
它稱為正相關(guān),如圖(1)所示;
(2)如果散點(diǎn)圖中的點(diǎn)散布在從左上角到右下角的區(qū)域內(nèi),對(duì)于兩個(gè)變量的這種相關(guān)關(guān)系,我們將
它稱為負(fù)相關(guān),如圖(2)所小.
(1)(2)
3、相關(guān)系數(shù)
若相應(yīng)于變量%的取值毛,變量y的觀測(cè)值為必。<注"),則變量1與y的相關(guān)系數(shù)
〃__n_
2(%-幻(%-y)一nxy
r=「=丁年i---------=,通常用「來衡量'與y之間的線性關(guān)系的強(qiáng)弱,廠
Yi=li=\Vi=lVi=l
的范圍為-lArWl.
(1)當(dāng)r>0時(shí),表示兩個(gè)變量正相關(guān);當(dāng)r<0時(shí),表示兩個(gè)變量負(fù)相關(guān).
(2)3越接近i,表示兩個(gè)變量的線性相關(guān)性越強(qiáng);團(tuán)越接近o,表示兩個(gè)變量間幾乎不存在線性
相關(guān)關(guān)系.當(dāng)上i=i時(shí),所有數(shù)據(jù)點(diǎn)都在一條直線上.
(3)通常當(dāng)上|>0.75時(shí),認(rèn)為兩個(gè)變量具有很強(qiáng)的線性相關(guān)關(guān)系.
【診斷自測(cè)】如圖,為某組數(shù)據(jù)的散點(diǎn)圖,由最小二乘法計(jì)算得到回歸直線4的方程為9=相關(guān)
系數(shù)為々,決定系數(shù)為若經(jīng)過殘差分析后去掉點(diǎn)P,剩余的點(diǎn)重新計(jì)算得到回歸直線4的方程為
.則下列結(jié)論一定正確的是(
D.4>o,々<。
C.<b2
知識(shí)點(diǎn)2:線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法.
對(duì)于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(X1,%),(&,竺),…,(斯,加),其回歸方程)=加+4的求法為
?__n__
Z(a-x)(y.-y)EXJ.-nxy
3=上1r----------=-4----------
Z=14=1
a=y-bx
其中,x=-Yx;,y=-y\yi-(,y)稱為樣本點(diǎn)的中心.
n,=in,=1
2、殘差分析
對(duì)于預(yù)報(bào)變量y,通過觀測(cè)得到的數(shù)據(jù)稱為觀測(cè)值》,通過回歸方程得到的y稱為預(yù)測(cè)值,觀測(cè)值減
去預(yù)測(cè)值等于殘差,自稱為相應(yīng)于點(diǎn)(4%)的殘差,即有《.=%-%.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對(duì)
殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差
分析.
(1)殘差圖
通過殘差分析,殘差點(diǎn)?后)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這
樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.
(2)通過殘差平方和Q=g;(y_%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;
i=\
反之,不合適.
(3)相關(guān)指數(shù)
£(%-獷
用相關(guān)指數(shù)來刻畫回歸的效果,其計(jì)算公式是:R2=1一上」__
――)2
1=1
尺2越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
【診斷自測(cè)】將某保護(hù)區(qū)分為面積大小相近的多個(gè)區(qū)域,用簡(jiǎn)單隨機(jī)抽樣的方法抽取其中6個(gè)區(qū)域,統(tǒng)計(jì)
這些區(qū)域內(nèi)的某種水源指標(biāo)%和某植物分布的數(shù)量X(力=1,2….,6),得到樣本(4y),且其相關(guān)系數(shù)r=與,
16
記y關(guān)于X的線性回歸方程為y=a+bx.經(jīng)計(jì)算可知:元=9,£>;=550,之(y-y)2=256,則.=.
Z=1Z=1
八-元)(%-刃f(%-T)(y-y)
參考公式:2-----------;—,,=「.
畢T)Jm也(iy
1=1Vi=iVi=i
知識(shí)點(diǎn)3:非線性回歸
解答非線性擬合問題,要先根據(jù)散點(diǎn)圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線
性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.
求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計(jì)算方法計(jì)算變換后的線性回歸方程系數(shù),還原
后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報(bào)預(yù)測(cè),注意計(jì)算要細(xì)心,避免計(jì)算錯(cuò)誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是預(yù)報(bào)變量;
(2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);
(3)由經(jīng)驗(yàn)確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、
二次函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、塞函數(shù)模型等);
(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;
(5)按照公式計(jì)算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.
【診斷自測(cè)】某人新房剛裝修完,為了監(jiān)測(cè)房屋內(nèi)空氣質(zhì)量的情況,每天在固定的時(shí)間測(cè)一次甲醛濃度
(單位:mg/m3),連續(xù)測(cè)量了10天,所得數(shù)據(jù)繪制成散點(diǎn)圖如下:用y,表示第,…,10)天測(cè)得的甲
101010
醛濃度,令z,=ln%,經(jīng)計(jì)算得£z,=12.8,£產(chǎn)=385,£氏=60.
?=1i=li=l
7上甲醛濃度Mmg/n?)
6
5
4
3
2
1
IIIIIII]]II_____
°12345678910天數(shù)
(1)由散點(diǎn)圖可知,丫與i可用指數(shù)型回歸模型進(jìn)行擬合,請(qǐng)利用所給條件求出回歸方程;(系數(shù)精確到o.oi)
(2)已知房屋內(nèi)空氣中的甲醛濃度的安全范圍是低于0.08mg/nP,則根據(jù)(1)中所得回歸模型,該新房裝
修完第幾天開始達(dá)到此標(biāo)準(zhǔn)?(參考數(shù)據(jù):ln0.08a-2.53)
a'(%一元Xy-歹)^x^.-nxy
附:,=~n=三,a=y-bx.
方(%-元)2,片_衣2
i=li=\
知識(shí)點(diǎn)4:獨(dú)立性檢驗(yàn)
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個(gè)體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
①定義:列出的兩個(gè)分類變量的頻數(shù)表稱為列聯(lián)表.
②2x2列聯(lián)表.
一般地,假設(shè)有兩個(gè)分類變量X和Y,它們的取值分別為{芍,三}和{乂,%},其樣本頻數(shù)列聯(lián)表
(稱為2義2列聯(lián)表)為
X%總計(jì)
不aba+b
九2Cdc+d
總計(jì)a+cb+dn=a+b+c+d
從2x2列表中,依據(jù),^與,二的值可直觀得出結(jié)論:兩個(gè)變量是否有關(guān)系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個(gè)分類變量間是否相互影響,常用等高條形圖表示
列聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),一與^相差很大,就判斷兩個(gè)分類變量之間有關(guān)系.
a+bc+d
3、獨(dú)立性檢驗(yàn)
計(jì)算隨機(jī)變量/=-----Ead-bcY-------利用爐的取值推斷分類變量X和¥是否獨(dú)立的方法稱為
(a+b)(c+d)(a+c)(Z?+d)
Z2獨(dú)立性檢驗(yàn).
oc0.100.050.0100.0050.001
Xa2.7063.8416.6357.87910.828
【診斷自測(cè)】近年中國(guó)新能源汽車進(jìn)入高速發(fā)展時(shí)期.專家預(yù)測(cè)2024年中國(guó)汽車總銷售量將超過3100萬輛,
繼續(xù)領(lǐng)跑全球.為了了解廣大消費(fèi)者購買新能源汽車意向與年齡是否具有相關(guān)性,某汽車APP采用問卷調(diào)
查形式對(duì)400名消費(fèi)者進(jìn)行調(diào)查,數(shù)據(jù)顯示這400人中中老年人共有150人,且愿意購買新能源車的人數(shù)
是愿意購買燃油車的2倍;青年中愿意購買新能源車的人數(shù)是愿意購買燃油車的4倍.
購車意向
年齡段合計(jì)
愿意購買新能源車愿意購買燃油車
青年
中老年
合計(jì)
(1)完善2x2列聯(lián)表,請(qǐng)根據(jù)小概率值a=0.01的獨(dú)立性檢驗(yàn),分析消費(fèi)者對(duì)新能源車和燃油車的意向購買
與年齡是否有關(guān);
(2)采用分層隨機(jī)抽樣從愿意購買新能源車的消費(fèi)者中抽取9人,再從這9人中隨機(jī)抽取4人,求這4人中
青年人數(shù)的期望.
附:4______Mad-bcf______
(〃+Z?)(c+d)(〃+c)3+d)
a0.050.010.001
%3.8416.63510.828
解題方法總結(jié)
常見的非線性回歸模型
(1)指數(shù)函數(shù)型_y=ca"(。>0且C>0)
兩邊取自然對(duì)數(shù),lny=ln(c〃x),即Iny=lnc+xlna,
令]、一原方程變?yōu)?/=lnc+x,lno,然后按線性回歸模型求出Ina,Inc.
[x=x
(2)對(duì)數(shù)函數(shù)型y=bln%+a
令11一:,原方程變?yōu)榱?法,+0,然后按線性回歸模型求出在,a.
[x=lnx
(3)籍函數(shù)型丁="〃
兩邊取常用對(duì)數(shù),lgy=lg(?〃),即Igy=〃lgx+lga,
y'Tgy
令,I,原方程變?yōu)閂=n/+lga,然后按線性回歸模型求出八,Iga.
x=lgx
(4)二次函數(shù)型丁=-2+.
令],原方程變?yōu)閥'=fo/+a,然后按線性回歸模型求出ma.
[x=x
b
(5)反比例函數(shù)型y=a+<型
x
y,=y
令1,原方程變?yōu)閂=-a,然后按線性回歸模型求出心a?
%'=—
、%
題型洞察
題型一:變量間的相關(guān)關(guān)系
【典例1-1】已知5個(gè)成對(duì)數(shù)據(jù)(x,y)的散點(diǎn)圖如下,若去掉點(diǎn)z>(4,3),則下列說法正確的是()
/(1,4)
,.5(2,3.5)
.?£>(4,3)
C(3,2.5)
_______________
Ox
A.變量x與變量y呈正相關(guān)B.變量x與變量y的相關(guān)性變強(qiáng)
C.殘差平方和變大D.樣本相關(guān)系數(shù)r變大
【典例1-2】已知々表示變量無與y之間的相關(guān)系數(shù),4表示變量〃與v之間的相關(guān)系數(shù),且4=。836,
=-0.958,貝U()
A.變量x與y之間呈正相關(guān)關(guān)系,且無與y之間的相關(guān)性強(qiáng)于a與v之間的相關(guān)性
B.變量尤與y之間呈負(fù)相關(guān)關(guān)系,且x與y之間的相關(guān)性強(qiáng)于“與v之間的相關(guān)性
C.變量〃與v之間呈負(fù)相關(guān)關(guān)系,且尤與y之間的相關(guān)性弱于a與v之間的相關(guān)性
D.變量a與v之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性弱于〃與v之間的相關(guān)性
【方法技巧】
判定兩個(gè)變量相關(guān)性的方法
(1)畫散點(diǎn)圖:點(diǎn)的分布從左下角到右上角,兩個(gè)變量正相關(guān);點(diǎn)的分布從左上角到右下角,兩個(gè)
變量負(fù)相關(guān).
(2)樣本相關(guān)系數(shù):當(dāng)廠>0時(shí),正相關(guān);當(dāng)K0時(shí),負(fù)相關(guān);川越接近于1,相關(guān)性越強(qiáng).
(3)經(jīng)驗(yàn)回歸方程:當(dāng)g>0時(shí),正相關(guān);當(dāng)信0時(shí),負(fù)相關(guān).
【變式1-1】某校學(xué)生科研興趣小組為了解1~12歲兒童的體質(zhì)健康情況,隨機(jī)調(diào)查了20名兒童的相關(guān)數(shù)
據(jù),分別制作了肺活量、視力、肢體柔韌度、BMI指數(shù)和身高之間的散點(diǎn)圖,則與身高之間具有正相關(guān)關(guān)
系的是()
視
力
身
O高
⑷
肢BK/
指a
體
數(shù)
柔I
韌
度
O)身高O*身高
A.肺活量B.視力C.肢體柔韌度D.BMI指數(shù)
【變式1-2]對(duì)變量尤,y由觀測(cè)數(shù)據(jù)得散點(diǎn)圖1;對(duì)變量",v由觀測(cè)數(shù)據(jù)(%匕)(ieN*)得散
點(diǎn)圖2.4表示變量無,y之間的線性相關(guān)系數(shù),4表示變量",v之間的線性相關(guān)系數(shù),則下列說法正確的
是()
A.變量x與y呈現(xiàn)正相關(guān),且團(tuán)>閆B.變量x與y呈現(xiàn)負(fù)相關(guān),且閆
C.變量〃與v呈現(xiàn)正相關(guān),且田〉⑻D.變量M與v呈現(xiàn)負(fù)相關(guān),且值|〈人|
【變式1-3](2024.江西南昌?三模)如圖對(duì)兩組數(shù)據(jù)x,>和","分別進(jìn)行回歸分析,得到散點(diǎn)圖如圖,
并求得線性回歸方程分別是>=偽工+q和"=%>,+/,并對(duì)變量盯>進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,
對(duì)變量V,"進(jìn)行線性相關(guān)檢驗(yàn),得到相關(guān)系數(shù)4,則下列判斷正確的是()
A.仇>0B.&v。C.|川〈歸D.4+馬vO
【變式1-4](2024.遼寧葫蘆島.一模)已知變量%與、的回歸直線方程為y=3x-1,變量y與z負(fù)相關(guān),則
A.x與'負(fù)相關(guān),%與2負(fù)相關(guān)B.%與、正相關(guān),%與z正相關(guān)
C.%與,負(fù)相關(guān),1與z正相關(guān)D.%與丁正相關(guān),'與z負(fù)相關(guān)
題型二:一元線性回歸模型
【典例2-1】(2024?四川成都?模擬預(yù)測(cè))已知關(guān)于x的一組數(shù)據(jù):
X1m345
y0.50.6n1.31.4
根據(jù)表中數(shù)據(jù)得到的線性回歸直線方程為9=0.28X+0.16,則n-028m的值
【典例2-2】(2024?四川綿陽?三模)根據(jù)統(tǒng)計(jì),某蔬菜基地西紅柿畝產(chǎn)量的增加量了(百千克)與某種液體
肥料每畝的使用量x(千克)之間的對(duì)應(yīng)數(shù)據(jù)的散點(diǎn)圖如圖所示.
本”百千克
7
6
5
4
3
024568x/千克
(1)從散點(diǎn)圖可以看出,可用線性回歸方程擬合》與X的關(guān)系,請(qǐng)計(jì)算樣本相關(guān)系數(shù)r并判斷它們的相關(guān)程
度;
(2)求>關(guān)于X的線性回歸方程夕=治+近,并預(yù)測(cè)液體肥料每畝的使用量為12千克時(shí)西紅柿畝產(chǎn)量的增加
量.
£(%-可(V-刃,^(x;-J)(y,.-y),
附.爪=.[*1=g=3-------------------------,a=y-bx
.向…臥FMH.
【方法技巧】
求經(jīng)驗(yàn)回歸方程的步驟
I---------------1
f步驟一,甘算出Q勃,",必或士(%-初%-歹),i
悟鏟的值j
(步驟二H利用公式計(jì)算系數(shù)
0二二二二二二二二二二
(步驟三H寫出經(jīng)驗(yàn)回歸方程9=菽+4
【變式2-1】某中醫(yī)藥企業(yè)根據(jù)市場(chǎng)調(diào)研與模擬,得到研發(fā)投入x(億元)與產(chǎn)品收益,(億元)的數(shù)據(jù)統(tǒng)
計(jì)如下:
研發(fā)投入X(億元)12345
產(chǎn)品收益》(億元)3791011
(1)計(jì)算x,y的相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若
0.3<|r|<0.75,則線性相關(guān)程度一般;若⑺>0.75,則線性相關(guān)程度較高)
(2)求出了關(guān)于x的線性回歸方程,并預(yù)測(cè)若想收益超過20(億元),則需研發(fā)投入至少多少億元?(結(jié)果保
留一位小數(shù))
£(七一元)(必一歹)
參考公式:回歸直線的斜率和截距的最小二乘法估計(jì)公式,相關(guān)系數(shù)一的公式分別為B=J--------------
方(項(xiàng)-行
i=i
X(x,「才)(%-歹)
a=y—bx,
柩(%-刃2
參考數(shù)據(jù):2(龍廠對(duì)=1°,£(?-刃J40,2(%-元)(%-衿=19.
1=11=1Z=1
【變式2-2](2024.河南周口.模擬預(yù)測(cè))直播帶貨是扶貧助農(nóng)的一種新模式,這種模式是利用主流媒體的
公信力,聚合銷售主播的力量助力打通農(nóng)產(chǎn)品產(chǎn)銷鏈條,切實(shí)助力農(nóng)民增收.我國(guó)南方某蜜桔種植縣通過
網(wǎng)絡(luò)平臺(tái)直播銷售蜜桔,其中每箱蜜桔重5千克,單價(jià)為40元/箱,己知最近5天單日直播總時(shí)長(zhǎng)尤(即所
有主播的直播時(shí)長(zhǎng)之和,單位:小時(shí))與蜜桔的單目銷售量y(單位:百箱)之間的統(tǒng)計(jì)數(shù)據(jù)如下表:
直播總時(shí)長(zhǎng)工89111215
單日銷售量y6763808085
可用線性回歸模型擬合y與x之間的關(guān)系.
(1)試求變量y與尤的線性回歸方程夕=放+近;
(2)若每位主播每天直播的時(shí)間不超過4小時(shí),要使每天直播帶貨銷售蜜桔的總金額超過60萬元,則至少
要請(qǐng)幾位主播進(jìn)行直播?
(3)直播帶貨大大提升銷量的同時(shí),也增加了壞果賠付的成本.該蜜桔平均每箱按80個(gè)計(jì)算,若客戶在收
到貨時(shí)有壞果,則每個(gè)壞果要賠付1元.現(xiàn)有甲、乙兩款包裝箱,若采用甲款包裝箱,成本為r(lM,V5)
元/箱,且每箱壞果的個(gè)數(shù)X服從尸(X=i)=<,i=l,2,3,4,5;若采用乙款包裝箱,成本為7元/箱,且
0,i=6,…,80
每箱壞果的個(gè)數(shù)y服從“y加,i=i,2,3.請(qǐng)運(yùn)用概率統(tǒng)計(jì)的相關(guān)知識(shí)分析,選擇哪款包裝箱獲
得的利潤(rùn)更大?
2(士-君(%-歹)
附:b=J-1,a=y-bx,Z玉M=4218,=635.
£(%-行
i-1
【變式2-3](2024.全國(guó)?模擬預(yù)測(cè))氮氧化物是一種常見的大氣污染物,它是由氮和氧兩種元素組成的化
合物,有多種不同的形式.下圖為我國(guó)2014年至2022年氮氧化物排放量(單位:萬噸)的折線圖,其中,
年份代碼1?9分別對(duì)應(yīng)年份2014—2022.
年氮氧化物排放量y
(1)是否可用線性回歸模型擬合>與/的關(guān)系?請(qǐng)用折線圖和相關(guān)系數(shù)加以說明;
(2)是否可用題中數(shù)據(jù)擬合得到的線性回歸模型預(yù)測(cè)2023年和2033年的氮氧化物排放量?請(qǐng)說明理由.
如--9)
附:相關(guān)系數(shù)廠二十^1---------------,5/15?3.87.
2(—)七(%-于
z=li=l
題型三:非線性回歸
【典例3-1](多選題)(2024?湖北武漢?二模)在對(duì)具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行回歸分析時(shí),若兩個(gè)變量
不呈線性相關(guān)關(guān)系,可以建立含兩個(gè)待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利
用最小二乘法進(jìn)行線性回歸分析.下列選項(xiàng)為四個(gè)同學(xué)根據(jù)自己所得數(shù)據(jù)的散點(diǎn)圖建立的非線性模型,且散
點(diǎn)圖的樣本點(diǎn)均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()
,x+c,
A.y=qx+c2xB.y=-------
x+c2
C.y=q+ln(x+C2)D.尸肝8
【典例3-2]已知變量x和〉之間的關(guān)系可以用模型y=來擬合.設(shè)z=lny,若根據(jù)樣本數(shù)據(jù)計(jì)算可得
1=3.5工=0.9,且X與Z的線性回歸方程為z=0.6x+a,則%=__.(參考數(shù)據(jù):
ln0.3--1.2,ln0.25~-1.4)
【方法技巧】
換元法變成一元線性回歸模型
【變式3-1】紅蜘蛛是柚子的主要害蟲之一,能對(duì)柚子樹造成嚴(yán)重傷害,每只紅蜘蛛的平均產(chǎn)卵數(shù)>(個(gè))
和平均溫度無(℃)有關(guān),現(xiàn)收集了以往某地的7組數(shù)據(jù),得到下面的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.
個(gè)產(chǎn)卵數(shù)
400-
350-?
300-
250-
200-
150-
100-?
50-■?
*
c人J?:~1~1~1~1~1~
0202224262830323436溫度
參考數(shù)據(jù)(z=lny)
777
I町ZwXyz
i=li=li=l
5215177137142781.33.6
dx
⑴根據(jù)散點(diǎn)圖判斷,y=bx+a^y=ce(其中e=2.718…為自然對(duì)數(shù)的底數(shù))哪一個(gè)更適合作為平均產(chǎn)
卵數(shù)》(個(gè))關(guān)于平均溫度x(°C)的回歸方程類型?(給出判斷即可,不必說明理由)
(2)由(1)的判斷結(jié)果及表中數(shù)據(jù),求出了關(guān)于x的回歸方程.(計(jì)算結(jié)果精確到0.1)
.,E(玉-?。ǎ?9)?*一運(yùn).
附:回歸方程中y=i>x+a,b=-^—;i-----------=號(hào)---------,a=y-bx
豆(尤「可2立2-戒2
Z=1Z=1
【變式3-2】設(shè)某幼苗從觀察之日起,第x天的高度為*m,測(cè)得的一些數(shù)據(jù)如下表所示:
第X/p>
高度*m0479111213
作出這組數(shù)據(jù)的散點(diǎn)圖發(fā)現(xiàn):y(cm)與x(天)之間近似滿足頭系式>=》?+〃,其中。,匕均為大于。的
常數(shù).
(1)試借助一元線性回歸模型,根據(jù)所給數(shù)據(jù),用最小二乘法對(duì)。,匕作出估計(jì),并求出>關(guān)于,的經(jīng)驗(yàn)回歸
方程;
(2)在作出的這組數(shù)據(jù)的散點(diǎn)圖中,甲同學(xué)隨機(jī)圈取了其中的4個(gè)點(diǎn),記這4個(gè)點(diǎn)中幼苗的高度大于亍的點(diǎn)
的個(gè)數(shù)為3其中亍為表格中所給的幼苗高度的平均數(shù),試求隨機(jī)變量4的分布列和數(shù)學(xué)期望.
附:對(duì)于一組數(shù)據(jù)(、,〃1),(眩,月?,…,(匕,4),其回歸直線方程2=a+Av的斜率和截距的最小二乘
估計(jì)分別為灑上匕------一,&2刖.
Ei
Z=1
【變式3-3】紅鈴蟲(Pectinophoragossypiella)是棉花的主要害蟲之一,其產(chǎn)卵數(shù)與溫度有關(guān).現(xiàn)收集到
一只紅鈴蟲的產(chǎn)卵數(shù)》(個(gè))和溫度x(℃)的8組觀測(cè)數(shù)據(jù),制成圖1所示的散點(diǎn)圖.現(xiàn)用兩種模型①
>=eto+\②y="2+d分別進(jìn)行擬合,由此得到相應(yīng)的回歸方程并進(jìn)行殘差分析,進(jìn)一步得到圖2所示的
殘差圖.
產(chǎn)卵數(shù)”個(gè)
1殘差
140
2030
0020
8010
7——?--->
601至20萬、巡26近,&Z2_34就度
40-10
20-20'O
。???1??1?1A-3O
182022242628303234溫度x/C
一模型①9-模型②
圖1產(chǎn)卵數(shù)散點(diǎn)圖
圖2兩種模型的殘差圖
根據(jù)收集到的數(shù)據(jù),計(jì)算得到如下值:
88o88
之(匕-元)-(「)(七-)豆(y-刃&-?。?/p>
XZ1)Zzzx
1=1i=\i=\i=l
252.964616842268850.470308
_18_18
表中%=Iny,;z=gZz:;f,.=xf;t=q>工
°<=1°i=l
(D根據(jù)殘差圖,比較模型①、②的擬合效果,哪種模型比較合適?
(2)根據(jù)(1)中所選擇的模型,求出了關(guān)于£的回歸方程.
附:對(duì)于一組數(shù)據(jù)(②,匕),3,匕),…(。”,匕),其回歸直線。+的斜率和截距的最小二乘估計(jì)分別為,
^(<y;-?)(v,.-v)
/=J=H;-------------,a=v-pa>
一方
Z=1
【變式3-4](2024.福建南平.模擬預(yù)測(cè))某大型商場(chǎng)的所有飲料自動(dòng)售賣機(jī)在一天中某種飲料的銷售量》
(單位:瓶)與天氣溫度,(單位:℃)有很強(qiáng)的相關(guān)關(guān)系,為能及時(shí)給飲料自動(dòng)售賣機(jī)添加該種飲料,
該商場(chǎng)對(duì)天氣溫度x和飲料的銷售量了進(jìn)行了數(shù)據(jù)收集,得到下面的表格:
X10152025303540
y41664256204840968192
經(jīng)分析,可以用>人作為》關(guān)于x的經(jīng)驗(yàn)回歸方程.
(1)根據(jù)表中數(shù)據(jù),求》關(guān)于x的經(jīng)驗(yàn)回歸方程(結(jié)果保留兩位小數(shù));
(2)若飲料自動(dòng)售賣機(jī)在一天中不需添加飲料的記1分,需添加飲料的記2分,每臺(tái)飲料自動(dòng)售賣機(jī)在一天
中需添加飲料的概率均為;,在商場(chǎng)的所有飲料自動(dòng)售賣機(jī)中隨機(jī)抽取3臺(tái),記總得分為隨機(jī)變量X,求
X的分布列與數(shù)學(xué)期望.
參考公式及數(shù)據(jù):對(duì)于一組數(shù)據(jù)(玉,Y),(聲,色),…,(£,?,),經(jīng)驗(yàn)回歸方程夕=晟+&的斜率和截距的最小
二乘估計(jì)公式分別為A=J----------------,a=y-bx-,x=25,^(x,.-x)2=700
1=1
【變式3-5]在國(guó)家積極推動(dòng)美麗鄉(xiāng)村建設(shè)的政策背景下,各地根據(jù)當(dāng)?shù)厣鷳B(tài)資源打造了眾多特色紛呈的
鄉(xiāng)村旅游勝地.某人意圖將自己位于鄉(xiāng)村旅游勝地的房子改造成民宿用于出租,在旅游淡季隨機(jī)選取100
天,對(duì)當(dāng)?shù)匾延械牧g不同價(jià)位的民宿進(jìn)行跟蹤,統(tǒng)計(jì)其出租率y1l0°天中北,的天數(shù)),設(shè)民宿租金為X
(單位:元/日),得到如圖的數(shù)據(jù)散點(diǎn)圖.
卜出租率
1
9
8-.(88,0.91)
7
6二.(128,072)
5
4->(188,0.51)
3_.(288,0.32)
2
1-.(388,0.2)
-*(488,0.16)
100200300400500600租金
(1)若用“出租率”近似估計(jì)旅游淡季民宿每天租出去的概率,求租金為388元的那間民宿在淡季內(nèi)的3天中
至少有2天閑置的概率.
⑵⑴根據(jù)散點(diǎn)圖判斷,了=6尤+。與〉=。欣+4哪個(gè)更適合此模型(給出判斷即可,不必說明理由)?根
據(jù)判斷結(jié)果求經(jīng)驗(yàn)回歸方程.
(ii)若該地一年中旅游淡季約為280天,在此期間無論民宿是否出租,每天都要付出9.9%r的固定成本,
若民宿出租,則每天需要再付出10%x的日常支出成本.試用(i)中模型進(jìn)行分析,旅游淡季民宿租金定
為多少元時(shí),該民宿在這280天的收益W達(dá)到最大.
n
附:記z,=lnx,,261.3,?=0.47,z=5.4,22(^,.-x)(y;-y)?-221,
1=1
55152
次(々一寸。121333.3,^(Zi-z)(x-y)?-0.99,茨廠小2.2,e?148,e?164,e?181.
i=li=li=l
【變式3-6](2024?全國(guó)?模擬預(yù)測(cè))近三年的新冠肺炎疫情對(duì)我們的生活產(chǎn)生了很大的影響,當(dāng)然也影響
著我們的旅游習(xí)慣,鄉(xiāng)村游、近郊游、周邊游熱鬧了許多,甚至出現(xiàn)“微度假”的概念.在國(guó)家有條不紊的
防疫政策下,旅游又重新回到了老百姓的日常生活中.某鄉(xiāng)村抓住機(jī)遇,依托良好的生態(tài)環(huán)境、厚重的民
族文化,開展鄉(xiāng)村旅游.通過文旅度假項(xiàng)目考察,該村推出了多款套票文旅產(chǎn)品,得到消費(fèi)者的積極回
應(yīng).該村推出了六條鄉(xiāng)村旅游經(jīng)典線路,對(duì)應(yīng)六款不同價(jià)位的旅游套票,相應(yīng)的價(jià)格x與購買人數(shù)y的數(shù)
據(jù)如下表.
旅游線路奇山秀水游古村落游慢生活游親子游采摘游舌尖之旅
套票型號(hào)ABCDEF
價(jià)格力元394958677786
經(jīng)數(shù)據(jù)分析、描點(diǎn)繪圖,發(fā)現(xiàn)價(jià)格元與購買人數(shù)y近似滿足關(guān)系式、=*(,>。力>0),即
lny=blnx+lna(q>0,b>0),對(duì)上述數(shù)據(jù)進(jìn)行初步處理,其中匕=ln^,wz.=In,j=l,2,…,6.
6666
附:①可能用到的數(shù)據(jù):2>叱=75.3,$>=24.6,£叱=18.3,^^=1014.
z=li=li=\1=1
②對(duì)于一組數(shù)據(jù)(匕,叫),(彩,叱),…,”“,"),其回歸直線6=薪+2的斜率和截距的最小二乘估計(jì)值分
nn
Z(匕一")(叱一日)£ViWi一〃麗
另()為g=——-=號(hào),a=w-bv.
£(匕-琢支匕2-標(biāo)2
z=li=l
⑴根據(jù)所給數(shù)據(jù),求,關(guān)于X的回歸方程.
⑵按照相關(guān)部門的指標(biāo)測(cè)定,當(dāng)套票價(jià)格XC[49,81]時(shí),該套票受消費(fèi)者的歡迎程度更高,可以被認(rèn)定為
“熱門套票”.現(xiàn)有三位游客,每人從以上六款套票中購買一款旅游,購買任意一款的可能性相等.若三人
買的套票各不相同,記三人中購買“熱門套票''的人數(shù)為X,求隨機(jī)變量X的分布列和期望.
題型四:列聯(lián)表與獨(dú)立性檢驗(yàn)
【典例44】觀察下圖的等高條形圖,其中最有把握認(rèn)為兩個(gè)分類變量%,,之間沒有關(guān)系的是()
A.%2B.%2
C.D.X?
【典例4?2】(2024.上海金山.二模)為了考察某種藥物預(yù)防疾病的效果,進(jìn)行動(dòng)物試驗(yàn),得到如下圖所示
列聯(lián)表:
疾病
藥物合計(jì)
未患病患病
服用m50-m50
未服用80-mm-3050
合計(jì)8020100
取顯著性水平a=0.05,若本次考察結(jié)果支持“藥物對(duì)疾病預(yù)防有顯著效果”,則〃,(根N40,〃zeN)的最小
值為_____
n(ad—be)2
(參考公式:/=;參考值:P(Z23.841)?0.05)
(a+b){c+d)(a+c)(b+d)
【方法技巧】
獨(dú)立性檢驗(yàn)的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表.
(2)根據(jù)公式/=------n(ad-be?-------計(jì)算.
(a+Z?)(c+d)(a+c)(b+d)
(3)比較/與臨界值的大小關(guān)系,作統(tǒng)計(jì)推斷.
【變式4-1](2024?四川成都?模擬預(yù)測(cè))在學(xué)校食堂就餐成為了很多學(xué)生的就餐選擇.學(xué)校為了解學(xué)生食
堂就餐情況,在校內(nèi)隨機(jī)抽取了100名學(xué)生,其中男生和女生人數(shù)之比為1:1,現(xiàn)將一周內(nèi)在食堂就餐超過
8次的學(xué)生認(rèn)定為“喜歡食堂就餐”,不超過8次的學(xué)生認(rèn)定為“不喜歡食堂就餐”.“喜歡食堂就餐”的人數(shù)比
“不喜歡食堂就餐”人數(shù)多20人,“不喜歡食堂就餐”的男生只有10人.
男生女生合計(jì)
喜歡食堂就餐
不喜歡食堂就餐10
合計(jì)100
(1)將上面的列聯(lián)表補(bǔ)充完整,并依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),分析學(xué)生喜歡食堂就餐是否與性別
有關(guān):
(2)用頻率估計(jì)概率,從該校學(xué)生中隨機(jī)抽取10名,記其中“喜歡食堂就餐”的人數(shù)為X.事件“X=k”的概
率為P(X=Q,求隨機(jī)變量X的期望和方差.
n(ad-be)2
參考公式:/=其中“=a+6+c+d.
(a+b)(c+d)(a+c)(b+d)
a0.10.050.010.0050.001
Xa2.7063.8416.6357.87910.828
【變式4-2](2024.高三.河南焦作.開學(xué)考試)交通強(qiáng)國(guó),鐵路先行,每年我國(guó)鐵路部門都會(huì)根據(jù)運(yùn)輸需求
進(jìn)行鐵路調(diào)圖,一鐵路線/上有自東向西依次編號(hào)為1,2,21的21個(gè)車站.
(1)為調(diào)查乘客對(duì)調(diào)圖的滿意度,在編號(hào)為10和11兩個(gè)站點(diǎn)多次乘坐列車尸的旅客中,隨機(jī)抽取100名旅
客,得出數(shù)據(jù)(不完整)如下表所示:
車站編號(hào)滿意不滿意合計(jì)
102840
113
合計(jì)85
完善表格數(shù)據(jù)并計(jì)算分析:依據(jù)小概率值a=0.001的獨(dú)立性檢驗(yàn),在這兩個(gè)車站中,能否認(rèn)為旅客滿意程
度與車站編號(hào)有關(guān)聯(lián)?
(2)根據(jù)以往調(diào)圖經(jīng)驗(yàn),列車尸在編號(hào)為8至14的終到站每次調(diào)圖時(shí)有;的概率改為當(dāng)前終到站的西側(cè)一站,
2
有]的概率改為當(dāng)前終到站的東側(cè)一站,每次調(diào)圖之間相互獨(dú)立.已知原定終到站編號(hào)為11的列車尸經(jīng)歷
了3次調(diào)圖,第3次調(diào)圖后的終到站編號(hào)記為X,求X的分布列及均值.
2n(ad-bc)一
附:”(a+b)(c+1)(a+c)(b+d)'其中n=a+b+c+d.
a0.10.010.001
Xa2.7066.63510.828
【變式4-3]2024年7月26日,第33屆夏季奧林匹克運(yùn)動(dòng)會(huì)在法國(guó)巴黎正式開幕.人們?cè)谟^看奧運(yùn)比賽的
同時(shí),開始投入健身的行列.某興趣小組為了解成都市
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年青海高等職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年甘肅衛(wèi)生職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫含詳細(xì)答案解析
- 2026年安徽城市管理職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫含詳細(xì)答案解析
- 2026年湖南汽車工程職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年鄭州工業(yè)安全職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年鄭州軌道工程職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫含詳細(xì)答案解析
- 2026年棗莊科技職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年甘肅財(cái)貿(mào)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年江西現(xiàn)代職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年新疆科技職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- DBJ51-T 040-2021 四川省工程建設(shè)項(xiàng)目招標(biāo)代理操作規(guī)程
- 青鳥消防JBF62E-T1型測(cè)溫式電氣火災(zāi)監(jiān)控探測(cè)器使用說明書
- 武漢市江岸區(qū)2022-2023學(xué)年七年級(jí)上學(xué)期期末地理試題【帶答案】
- 自動(dòng)駕駛系統(tǒng)關(guān)鍵技術(shù)
- 完整工資表模板(帶公式)
- 奇瑞汽車QC小組成果匯報(bào)材料
- 英語四級(jí)詞匯表
- 社區(qū)春節(jié)活動(dòng)方案
- CTT2000LM用戶手冊(cè)(維護(hù)分冊(cè))
- 川2020J146-TJ 建筑用輕質(zhì)隔墻條板構(gòu)造圖集
- 新員工入職申請(qǐng)表模板
評(píng)論
0/150
提交評(píng)論