版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第57講成對數(shù)據(jù)的統(tǒng)計分析
[課程標準11.了解樣本相關系數(shù)的統(tǒng)計含義,了解樣本相關系數(shù)與標準化數(shù)據(jù)
向量夾角的關系.2.會通過相關系數(shù)比較多組成對數(shù)據(jù)的相關性.3.了解一元線性回
歸模型的含義,了解模型參數(shù)的統(tǒng)計意義,了解最小二乘原理,掌握一元線性回
歸模型參數(shù)的最小二乘估計方法,會使用相關的統(tǒng)計軟件4會用一元線性回歸模
型進行預測5理解2x2列聯(lián)表的統(tǒng)計意義.6.了解2x2列聯(lián)表獨立性檢驗及其應
用.
基礎知識整合
>知識梳理
1.相關關系
兩個變量有關系,但沒有確切到可由其中一個去精確地決定另一個的程度,
這種關系稱為相關關系.
2.相關關系的分類
(1)按變量間的增減性分為畫歪相關和國負相關.
①正相關:當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)畫增加的
趨勢.
②負相關:當一個變量的值增加時,另一個變量的相應值呈現(xiàn)畫減少的趨
勢.
(2)按變量間是否有線性特征分為畫線性相關或畫韭線性相關(曲線相關).
①線性相關:如果兩個變量的取值呈現(xiàn)正相關或負相關,而且散點落在國二
條直線附近,我們就稱這兩個變量線性相關.
②非線性相關或曲線相關:如果兩個變量具有相關性,但不是闞線性相關,
我們就稱這兩個變量非線性相關或曲線相關.
3.相關關系的刻畫
(1)散點圖:為了直觀描述成對樣本數(shù)據(jù)的特征,把每對成對數(shù)據(jù)都用直角坐
標系中的點表示出來,由這些點組成的統(tǒng)計圖,叫做散點圖.
⑵樣本相關系數(shù)
①我們常用樣本相關系數(shù)r來確切地反映成對樣本數(shù)據(jù)(劉,刈的相關程度,
其中r=
n__
f.Ji(Xi-x)(yi-y)
(XL1)T方GL3)2
②樣本相關系數(shù)r的取值范圍為畫1-1,1L
當,>0時,成對樣本數(shù)據(jù)回正相關;當云0時,成對樣本數(shù)據(jù)回負相關;
當I”越接近回L時,成對樣本數(shù)據(jù)的線性相關程度越強;當仍越接近回。時,成
對樣本數(shù)據(jù)的線性相關程度越弱.
4.一元線性回歸模型
Y=bx+a+e,.——.
稱./、八八/、、為y關于X的一元線性回歸模型.其中y稱為回
E(e)=0,D(e)=(r
因變量或同響應變量,x稱為固自變量或固膽釋變量,回色稱為截距參數(shù),
回女稱為斜率參數(shù);e是網(wǎng)上與畫bx+a之間的隨機誤差,如果6=畫。,那
么丫與龍之間的關系就可以用一元線性函數(shù)模型來描述.
5.最小二乘法
將£二源+2稱為y關于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公
式,其圖形稱為經(jīng)驗回歸直線,這種求經(jīng)驗回歸方程的方法叫做最小二乘法,求
AAA(?")(y—)_.
得的仇。叫做〃,。的最小二乘估計,其中------———,。A二回r
£(Xi-X)2
_A_
6.殘差與殘差分析
(1)殘差
對于響應變量Y,通過觀測得到的數(shù)據(jù)稱為由觀測值,通過經(jīng)驗回歸方程得
到的褊為函]預測值,團觀測值減去因預測值稱為殘差.
(2)殘差分析
國殘差是隨機誤差的估計結(jié)果,通過對畫殘差的分析可以判斷模型刻畫數(shù)
據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
7.對模型刻畫數(shù)據(jù)效果的分析
(1)殘差圖法
在殘差圖中,如果殘差比較均勻地集中在畫以橫軸為對稱軸的水平帶狀區(qū)
域內(nèi),則說明經(jīng)驗回歸方程較好地刻畫了兩個變量的關系.
(2)殘差平方和法
殘差平方和回£_(?-箭2越小,模型的擬合效果越好.
<=.1
(3)決定系數(shù)R2法
£2
可以用決定系數(shù)一彳----------來比較兩個模型的擬合效果,A?越
3d)2
國大,模型擬合效果越好,R2越國小,模型擬合效果越差.
8.列聯(lián)表與獨立性檢瞼
(1)2x2列聯(lián)表
①2X2列聯(lián)表給出了成對分類變量數(shù)據(jù)的回交叉分類頻數(shù).
②定義一對分類變量X和匕我們整理數(shù)據(jù)如下表所示:
Y
X合計
y=oY=1
x=oClba+b
X=1cdc+d
合計a+cb+dn=a+b+c+d
像這種形式的數(shù)據(jù)統(tǒng)計表稱為2x2列聯(lián)表.
(2)獨立性檢驗
①定義:利用Z2的取值推斷分類變量X和瘡是查獨立的方法稱為Z2獨立
性檢驗,讀作“卡方獨立性檢驗”.簡稱獨立性檢驗.
?—In{ad-be)2
(2)/2=36——:~:777丁,其中"=Q+/?+C+d.
人1~1(a+7)(c+d)(a+c)(〃+a)
(3)獨立性檢驗解決實際問題的主要環(huán)節(jié)
①提出零假設H。:X和y相互獨立,并給出在問題中的解釋.
②根據(jù)抽樣數(shù)據(jù)整理出2X2列聯(lián)表,計算Z2的值,并與臨界值均比較.
③根據(jù)檢驗規(guī)則得出推斷結(jié)論.
④在x和丫不獨立的情況下,根據(jù)需要,通過比較相應的頻率,分析x和丫
間的影響規(guī)律.
?知識拓展
1.相關關系與函數(shù)關系的異同
共同點:二者都是指兩個變量間的關系;
不同點:函數(shù)關系是一種確定性關系,體現(xiàn)的是因果關系,而相關關系是一
種非確定性關系,體現(xiàn)的不一定是因果關系,也可能是伴隨關系.
AAA,__
2.經(jīng)驗回歸直線):=/?+er-定過點(x,),).
>雙基自測
1.(人教A選擇性必修第三冊習題8.1Ti改編)下列四個散點圖中,變量x與
y之間具有負線性相關關系的是()
B
答案D
解析觀察散點圖可知,只有D中的散點圖表示的是變量x與,,之間具有負
線性相關關系.故選D.
2.甲、乙、丙、丁四位同學各自對4,8兩個變量的線性相關性做了試驗,
并用回歸分析方法分別求得相關系數(shù)/*與殘差平方和相,如下表:
X甲乙丙丁
r0.820.780.690.85
m106115124103
則哪位同學的試驗結(jié)果體現(xiàn)的A,B兩變量有更強的線性相關性()
A.甲B.乙
C.丙D.丁
答案D
解析M越接近1,"Z越小,線性相關性越強,故選D.
3.已知相關變量x和),滿足關系-0.以+1,相關變量),與z負相關,則
下列結(jié)論中正確的是()
A.尤與y正相關,x與z負相關
B.x與),正相關,x與z正相關
C.工與y負相關,x與z負相關
D.4與y負相關,x與z正相關
答案D
解析由£=-0.丘+1可得x與y負相關.因為),與z負相關,可設2二以十
AAAAAAAA
a,b<0,JllJz=/?(-0.1J+\)+a=-0Abx+b+a,故x與z正相關.
4.(多選)(人教B選擇性必修第二冊432例1改編)為了解閱讀量多少與幸福
感強弱之間的關系,一個調(diào)查機構根據(jù)所得到的數(shù)據(jù),繪制了如下所示的2x2列
聯(lián)表(個別數(shù)據(jù)暫用字母表示):
幸福感
閱讀量合計
強弱
多m1872
少36n78
合計906015()
計算得到/力2.981,參照下表:
a0.100.050.0250.0100.0050.001
Xa2.7063.8415.0246.6357.87910.828
則下列結(jié)論正確的是()
A.根據(jù)小概率值a=0.010的獨立性檢驗,可以認為“閱讀量多少與幸福感強
弱無關”
B.w=54
C.n=52
D.根據(jù)小概率值以=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%
的前提下認為“閱讀量多少與幸福感強弱有關”
答案BD
解析?.?/R2.981>7.879>6.635,/.根據(jù)小概率值a=0.010的獨立性檢驗,
可以在犯錯誤的概率不超過1%的前提下認為“閱讀量多少與幸福感強弱有關”,根
據(jù)小概率值?=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下
認為“閱讀量多少與幸福感強弱有關",?..A錯誤,D正確;?.■〃2+36=90,18+〃
=60,.,.m-54,〃=42,「.B正確,C錯誤.
答案65.5
_4+2+3+5_49+26+39+54
解析由表可得/=----4-------=3.5,y=-----------4----------=42,因為點
AAAAAA
(3.5,42)在經(jīng)驗回歸直線),二云+〃上,且〃=9.4,所以42=94x3.5+。,解得。二
9.1.故經(jīng)驗回歸方程為£=9.4工+9.1.令x=6,得.=65.5.故預測廣告費用為6萬元
時銷售額約為65.5萬元.
核心考向突破
多角度探究突破
考向一兩個變量的相關性
-康1相關關系的判斷
例1(1)某商家今年上半年各月的人均銷售額(單位:千元)與利潤率統(tǒng)計表
如下:
月份123456
人均銷售額658347
18.
利潤率(%)12.610.43.08.116.3
5
根據(jù)表中數(shù)據(jù),下列說法正確的是()
A.利潤率與人均銷售額成正相關關系
B.利潤率與人均銷售額成負相關關系
C.利潤率與人均銷售額成正比例函數(shù)關系
D.利潤率與人均銷售額成反比例函數(shù)關系
答案A
解析由統(tǒng)計表可得利潤率與人均銷售額不是正比例關系,也不是反比例關
系,排除C,D;其屬于正相關關系,A正確,B錯誤.故選A.
(2)在以下4幅散點圖中,圖________中的y和x之間存在相關關系(將正確答
案的序號填在橫線上).
答案②③④
解析圖②③中的點成帶狀區(qū)域分布在某一直線附近,④中的點分布在某一
曲線附近,故②③④存在相關關系.
角度2相關系數(shù)的計算及意義
例2(1)(多選)某同學將收集到的六對數(shù)據(jù)制作成散點圖一
如右,得到其經(jīng)驗回歸方程為八:f=0.68x+Z,計算其相關系.它
*c{)
數(shù)為n,決定系數(shù)為即經(jīng)過分析確定點F為“離群點”,把它去—上______,
0\x
A
掉后,再利用剩下的五對數(shù)據(jù)計算得到經(jīng)驗回歸方程為,2:),=
源+0.68,相關系數(shù)為,2,決定系數(shù)為R幺下列結(jié)論正確的是()
A.n>ri>0B.Ri>Ri
C.0<Z?<0.68D力>0.68
答案AC
解析由圖可知兩變量呈正相關,故n>0,m>0,去掉"離群點''后,相關
性更強,所以「V廢,故此v咫,故A正確,B錯誤;根據(jù)圖象,當去掉尸點后,
直線基本在4,B,C,D,E附近的那條直線上,直線的傾斜程度會略向x軸偏
向,故斜率會變小,因此0<分<0.68,故C正確:D錯誤.故選AC.
(2)某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有所增加.為
調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊
中用簡單隨機抽樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)5,??)(,=1,
2,…,20),其中H和"分別表示第,個樣區(qū)的植物覆蓋面積(單位:公頃)和這種
2()2020-20_、
野生動物的數(shù)量,并計算得£即=60,Z?=1200,Z8-1)2=80,£(>7-y)2
/=1/=1/=1/=1
20__
=9(X)0,E(Xi-x)('?-),)=800.
,=!
①求該地區(qū)這種野生動物數(shù)量的估計值(這種野生動物數(shù)量的估計值等于樣
區(qū)這種野生動物數(shù)量的平均數(shù)乘以地塊數(shù));
②求樣本(孫2,…,20)的相關系數(shù)(精確到0.01).
n
2U-x)(yi-y)
附:相關系數(shù),二一---------:-------------,/R.414.
、Z(r-X)2E(V-y)2
V口?i='
1201
解①每個樣區(qū)野生動物數(shù)量的平均數(shù)為疝=而xl20()=6(),地塊數(shù)為
1=1
200,所以該地區(qū)這種野生動物數(shù)量的估計值為200x60=12000.
②樣本6,V)的相關系數(shù)為
20__
_g—Lx)(p—y)__________8002迫
r==
^(y;-7)r^=3??
「觸類旁通I判定兩個變量相關性的方法
若點的分布從左下角到右上角,則兩個變量正相關;若點的分
畫散點圖
布從左上角到右下角,則兩個變量負相關
當廠>0時,正相關;當X。時,負相關;M越接近1,線性相關
樣本相關系數(shù)
程度越強
AA
經(jīng)驗回歸方程當比>0時,正相關;當8Vo時,負相關
r即時訓練1.(2024?薊州開學考試)對兩個變量x,y進行線性相關檢驗,得
線性相關系數(shù)門=0.8995,對兩個變量%-進行線性相關檢驗,得線性相關系數(shù)
相二-0.9568,則下列判斷正確的是()
A.變量x與丁正相關,變量〃與u負相關,變量x與丁的線性相關性較強
B.變量x與y負相關,變量〃與口正相關,變量無與),的線性相關性較強
C.變量x與),正相關,變量〃與口負相關,變量〃與口的線性相關性較強
D.變量x與),負相關,變量〃與u正相關,變量〃與u的線性相關性較強
答案C
解析因為線性相關系數(shù)門二0.8995X),所以二y正相關,因為線性相關系
數(shù)旌=-0.9568<0,所以〃,>,負相關,又因為|川<四,所以變量〃,?的線性相關
性比心的線性相關性強,故A,B,D錯誤,C正確.故選C.
2.為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30min從該生
產(chǎn)線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內(nèi)依
次抽取的16個零件的尺寸:
抽取次序12345678
零件尺寸9.9510.129.969.9610.019.929.9810.04
抽取次序910111213141516
零件尺寸10.269.9110.1310.029.2210.0410.059.95
116/I16
經(jīng)計算得x=石£一二9.97,s='/諱Z)2=
([?-16£2)=0.212,8.5)2-8.439,£(劉_I)*8.5)=-
2.78,其中方為抽取的第,個零件的尺寸,,.=1,2,…,16.
(1)求(8,/)(/=1,2,16)的相關系數(shù)人并回答是否可以認為這一天生產(chǎn)
的零件尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小(若I/K0.25,則可以認為零件
的尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小);
(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(1-3s,1+3s)之外的零件,就
認為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當天的生產(chǎn)過程
進行檢查.
①從這一天抽檢的結(jié)果看,是否需對當天的生產(chǎn)過程進行檢查?
②在(1-35,工+3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)
線當天生產(chǎn)的零件尺寸的均值與標準差(精確到0.01).
附:樣本(孫,?)(,=1,2,〃)的相關系數(shù)
參考數(shù)據(jù):^0.008-0.09.
解(1)由樣本數(shù)據(jù),得但,i)(i=1,2,…,16)的相關系數(shù)r
16
-2.78
-------F=-------=-()18
0.212x716x18.439
由于仍<0.25,因此可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進行而系
統(tǒng)地變大或變小.
(2)①由于工二9.97,s=0.212,因此由樣本數(shù)據(jù)可以看出抽取的第13個零件
的尺寸在(1-3s,1+3s)以外,因此需對當天的生產(chǎn)過程進行檢查.
②剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為tX(16X9.97-9.22)=
10.02,
這條生產(chǎn)線當天生產(chǎn)的零件尺寸的均值的估計值為10.02.
16
£^^16X0.2122416x9.972=1591.134,
/=1
剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為tx(1591.134-9.222-
15x10.022戶0.008,
這條生產(chǎn)線當天生產(chǎn)的零件尺寸的標準差的估計值為M麗巾.09.
多角度探究突破
考向二回歸分析
角度1線性回歸模型
例3(2024.濟南開學考試)隨著科技的發(fā)展,網(wǎng)購成了人們購物的重要選擇,
并對實體經(jīng)濟產(chǎn)生了一定影響.為了解實體經(jīng)濟的現(xiàn)狀,某研究機構統(tǒng)計了一個
大商場2019—2023年的線下銷售額如下:
年份編號X12345
年份20192020202120222023
銷售額y
1513146512021060860
(單位:萬元)
(1)由表中數(shù)據(jù)可以看出,可用線性回歸模型擬合銷售額),與年份編號工的關
系,請用相關系數(shù)加以說明;
⑵建立關于久?的經(jīng)驗回歸方程,并預測2024年該商場的線下銷售額.
參考公式及數(shù)據(jù):
n__
^Xiyi-nxy
nxy
A,A_A_
b=,a=y-bx,
x2
=1736.
5
斗
解(1)由已知數(shù)據(jù)可得,X=3,y=—=^=1220,
5
所以£卬,-5Ty=16589-5x3x1220=-1711,
,卒以一5g
所以〃二J75"5")~浦在-0.9856.
因為M非常接近1,所以可用線性回歸模型擬合銷售額),與年份編號x的關系.
(2)由已知數(shù)據(jù)可得,2>-?=12+22+32+42+52=55,
/=i
5
孕C
Ay16589-5x3x1220
所以。二當者5“=——=-171.1,
DD-
a=y-bx=1220-(-171.1)x3=1733.3,
所以>關于x的經(jīng)驗回歸方程為5二-171.我+1733.3.
令x=6,
5!ljy=-171.1x6+1733.3=706.7(萬元).
所以預測2024年該商場的線下銷售額為706.7萬元.
角度2非線性回歸模型
例4某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費工(單
位:千元)對年銷售量)(單位:。和年利潤z(單位:千元)的影響.對近8年的年宣
傳費H和年銷售量)&二1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一
些統(tǒng)計量的值.
年銷售址
620
600...
580..
560?
540.
520
500.?
4801AA.
34363840424446485()525456
年宜傳費/千元
88_8
£(歷-》(Xi-X).(??X(m-
Xy卬yj(無一IF
記)2-y)vv)-(>v-y)
46.65636.8289.81.61469108.8
表中Wi=yfxi,w=Wi.
⑴根據(jù)散點圖判斷,),二。+bx與尸c+小「哪一個適宜作為年銷售量y關于
年宣傳費X的經(jīng)驗回歸方程類型?(給出判斷即可,不必說明理由)
(2)根據(jù)⑴的判斷結(jié)果及表中數(shù)據(jù),建立y關于支的經(jīng)驗回歸方程;
(3)已知這種產(chǎn)品的年利潤z與x,y的關系為z=().2y-x.根據(jù)⑵的結(jié)果回答
下列問題:
①年宣傳費工二49時,年銷售量及年利潤的預測值是多少?
②年宣傳費x為何值時,年利潤的預測值最大?
附:對于一組數(shù)據(jù)("I,Vl),(U2,V2),???,(4,v?),其經(jīng)驗回歸直線^A二aA+/A
AZ/)(V/-V)AA_
〃的斜率和截距的最小二乘估計分別為"~~-----------------,?=v-Pu.
X〃)2
解(1)由散點圖可以判斷,y=c+M適宜作為年銷售量y關于年宣傳費x
的經(jīng)驗回歸方程類型.
(2)令w=先建立y關于卬的經(jīng)驗回歸方程.
8
八(Wi-(yi-y)
108.8
由于"二'68,
8_1.6
R(Wi~W)2
A_A_,一____
c=y-dvv=563-68x6.8=100.6,
A
所以y關于卬的經(jīng)驗回歸方程為y=100.6+68iv,
因此y關于x的經(jīng)驗回歸方程為£=100.6+68G.
(3)①由(2)知,當戶49時,年銷售量),的預測值為£=100.6+6隊用=576.6
千元,
年利潤z的預測值為1=576.6x0.2-49=66.32千元.
②根據(jù)⑵的結(jié)果知,年利潤z的預測值
z=0.2(100.6+68^)-x=-x+13.6^+20.12.
所以當5:號=6.8,即x=46.24時,2取得最大值.
故年宣傳費為46.24千元時,年利潤的預測值最大.
I觸類旁通I求經(jīng)驗回歸方程的步驟
提醒:對非線性回歸分析問題,可通過適當?shù)膿Q元轉(zhuǎn)化為線性回歸分析問題
求解.
.即時訓練1.(2023?廈門二模)移動物聯(lián)網(wǎng)廣泛應用皿億戶
25?
于生產(chǎn)制造、公共服務、個人消費等領域.截至2022年底,20.
我國移動物聯(lián)網(wǎng)連接數(shù)達18.45億戶,成為全球主要經(jīng)濟體!??
°OI2345/
中首個實現(xiàn)''物超人''的國家.如圖是2018?2()22年移動物
聯(lián)網(wǎng)連接數(shù)卬與年份代碼/的散點圖,其中年份2()18?2022對應的1分別為1?
5.
(1)根據(jù)散點圖推斷兩個變量是否線性相關.計算樣本相關系數(shù)(精確到0.01),
并推斷它們的相關程度;
(2)①假設變量x與變量丫的〃對觀測數(shù)據(jù)為(xi,yi),(X2,聞,…,g泗),
Y=bx+e
兩個變量滿足一元線性回歸模型口二、:八/、式隨機誤差
E(e)=0,D(e)-(T
bxi).請推導:當隨機誤差平方和。二£區(qū)取得最小值時,參數(shù)的最小二乘估計;
/=!
②令變量x=/-7,y=卬-6,則變量x與變量y滿足一元線性回歸模型
(Y=bx+e
1,、:n/、,利用①中結(jié)論求y關于X的經(jīng)驗回歸方程,并預測2024
年移動物聯(lián)網(wǎng)連接數(shù).
內(nèi)
S(0-f)(w—w)
.1_f____________________
附:樣本相關系數(shù)r="£(%.一而",
2
S(w,-w)=76.9,S(/,-f)(w,-w)=27.2,Sw,=6081網(wǎng)之277
解(1)由散點圖可以看出樣本點都集中在一條直線附近,由此推斷兩個變量
線性相關.
因為7=-x(l+2+3+4+5)=3,
5
所以ZS-7)2=(1-3)2+(2-3)2+(3-3)2+(4-3)2+(5-3)2=10,
i=I
Z(6-7)(W7-HO
_/7.2_27.227.2
二[10x76.9=V769^27-7
=0.98,
所以這兩個變量正線性相關,且相關程度很強.
(2)①Q(mào)二E4=E(%—丘i)2=E(貨―2。了以
=b2N乂
21___
要使Q取得最小值,當且僅當人二,4肛,
'?r’y;X!(/,—f)(w,—w)
r-i_?-l
②由①知金二.5S(/,-f)2_272_
—1o一乙?乙,
所以丫關于x的經(jīng)驗回歸方程為£=2.72x,
5
之卬i
又6二一5一=號3=12.16,所以當/=7時,
貝IJx=7-3=4,w=y+b=2.72x4+12.16=23.04,
所以預測2024年移動物聯(lián)網(wǎng)連接數(shù)為23.04億戶.
2.(2023?遼寧名校聯(lián)盟期末)紅鈴蟲是棉花的主要害蟲之一,也侵害木棉、錦
葵等植物.為了防治蟲害,從根源上抑制害蟲數(shù)量.現(xiàn)研究紅鈴蟲的產(chǎn)卵數(shù)和溫
度的關系,收集到7組溫度工和產(chǎn)卵數(shù)y的觀測數(shù)據(jù)于表I中.根據(jù)繪制的散點
圖決定從回歸模型①),=oeclr與回歸模型②.v=+C4中選擇一個來進行擬合.
表【
溫度x/℃20222527293135
產(chǎn)卵數(shù)w個711212465114325
(1)請借助表n中的數(shù)據(jù),求出回歸模型①的方程(精確到().01);
表11(注:表中Zi=lny)
7777_7_
X(Xi-x)2
工(V-5)2
18956725.2716278106
7£y>(ti
zli(力-居8-,S(無一
2
7)工)?(》-y)x)-(A-7)-7)
11.06304041.86825.09
(2)類似地,可以得到回歸模型②的方程為>=0.361-202.54,試求兩種模型
下溫度為20℃時的殘差;
(3)若求得回歸模型①的決定系數(shù)R2=0.95,回歸模型②的決定系數(shù)R2=0.81,
請結(jié)合(2)說明哪個模型的擬合效果更好.
參考數(shù)據(jù):e-3⑷=o.o3,e026?1.30,e,79?5.99,e52O?181.27.
附:經(jīng)驗回歸方程9=加+1中
n__
"(船一x)(y-y)
AA_A_
?Z~7,a-y-px.
£{Xi-X)2
解⑴由y=ciec2r,fliny=\nc\+ax,
令,=Iny,b=a,a=Inci,得,=+a,
由表H數(shù)據(jù)可得,
7
41.86
7-0.26,
£(Xi-X)2162
A_A_25.27八r,189
a-i-bx~~~-0.26x-=-3o.41,
A
所以f=0.26x—3.41,
所以所求經(jīng)驗回歸方程為Q=e°.-3⑷(或Q=o.O3eO26v).
⑵由題意可知,模型①在x=20時殘差為yi-yi=7-e°-26x20-3-41?1.01,
模型②在x=20時殘差為yi-yi=7-(0.36x202-202.54)=65.54.
(3)因為0.95>0.81,即模型①的決定系數(shù)大于模型②的決定系數(shù),由決定系
數(shù)公式知,模型①的殘差平方和小于模型②的殘差平方和,因此模型①得到的數(shù)
據(jù)更接近真實數(shù)據(jù),所以模型①的擬合效果更好.
考向三獨立性檢驗
例5(2023?棗莊三中期末)某中學為調(diào)查本校學生“保
護動物意識的強弱與性別是否有關“,采用簡單隨機抽樣的
方法,從該校分別抽取了男生和女生各50名作為樣本,經(jīng)
統(tǒng)計,得到如圖所示的等高堆積條形圖.
(1)根據(jù)已知條件,將下面2x2列聯(lián)表補充完整:II保護動物意隊強
II保護動物意隊弱
保護動物意識合計
性別
強弱
男生50
女生50
合計100
(2)根據(jù)(1)表中數(shù)據(jù),依據(jù)小概率值a=0.005的獨立性檢驗,分析該校學生
保護動物意識的強弱與性別是否有關.
,n(ad-be)2
附.(〃+/?)(c+d)(a+c)(b+d),n=a+b+c+d.
a0.100.050.010.005
Xa2.7063.8416.6357.879
解(1)由等高堆積條形圖知,男生保護動物意識強的有50x0.7=35人,女生
保護動物意識強的有50x0.4=20人,于是補充2x2列聯(lián)表如下:
保護動物意識合計
性別
強弱
男生351550
女生203050
合計5545100
(2)零假設為"0:該校學生保護動物意識的強弱與性別無關,根據(jù)列聯(lián)表中的
數(shù)據(jù),得
、100x(35x30-15x20)2100
/=-50X50X55X45-二,9.091>7.879=xo.oo5,
根據(jù)小概率值a=0.005的獨立性檢驗,我們推斷“0不成立,即認為該校學
生保護動物意識的強弱與性別有關,此推斷犯錯誤的概率不大于0.005.
I觸類旁通I
1.比較幾個分類變量有關聯(lián)的可能性大小的方法
(1)通過計算Z2的大小判斷:Z2越大,兩變量有關聯(lián)的可能性越大.
(2)通過計算|〃-慶|的大小判斷:|〃-曲|越大,兩變量有關聯(lián)的可能性越大.
(3)通過計算備與力的大小判斷:相差越大,兩變量有關聯(lián)的可能性越大.
V*Iexv*IV*
2.獨立性檢驗的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2x2列聯(lián)表.
.n(ad-be)2.
⑵根據(jù)公式r=("份(,+d)(a+c)g+計算/的值,
(3)比較/與臨界值打的大小關系,作統(tǒng)計推斷.
r即時訓練(2024.貴州黔東南州從江縣高三期中檢測)某學?,F(xiàn)有1000名學
生,為調(diào)查該校學生一周使用手機上網(wǎng)時間的情況,收集了〃名學生某周使用手
機上網(wǎng)時間的樣本數(shù)據(jù)(單位:小時).將數(shù)據(jù)分為6組:[0,2],(2,4J,(4,6J,
(6,8],(8,10],(1(),12],并整理得到如下的頻率分布直方圖:
(1)估計該校學生一周平均使用手機上網(wǎng)時間(每組數(shù)據(jù)以該組中點值為代
表);
(2)將一周使用手機上網(wǎng)時間在(4,12]內(nèi)定義為“長時間使用手機上網(wǎng)“;一周
使用手機上網(wǎng)時間在(0,4]內(nèi)定義為“不長時間使用手機上網(wǎng)”,在樣本數(shù)據(jù)中,
有().25〃名學生不近視.
①請補充完成該周使用手機上網(wǎng)時間與近視程度的列聯(lián)表;
②若〃為100,那么在犯錯誤的概率不超過0.001的前提下是否能認為該校學
生一周使用手機上網(wǎng)時間與近視程度有關?
一周使用手機近視程度
合計
上網(wǎng)時間近視不近視
長時間使用手機
不長時間使用手機0.15/?
合計0.25〃
n(ad-be)2
附:1“)(c+d)…(〃+"),其中,…+b+c+&
a0.10.050.0100.0050.001
2.7063.8416.6357.87910.828
解(1)根據(jù)頻率分布直方圖可估計該校學生一周平均使用手機上網(wǎng)時間為
x=1x0.025x2+3x0.100x2+5x0.150x2+7x0.125x2+9x0.075x2+11x0.025x2=
5.8(小時).
(2)①由頻率分布直方圖可得,上網(wǎng)時間在(0,4]內(nèi)和(4,12]內(nèi)的比例為0.25:
0.75=1:3,
故可得列聯(lián)表如下:
近視程度
一周使用手機上網(wǎng)時間合計
近視不近視
長時間使用手磯0.65〃0.1On0.75〃
不長時間使用手機0.10〃0.15/?0.25〃
合計0.75〃0.25〃n
100x(65x15-10x10)2
②若〃為100,則茬=—乂—?21.78>10.828,故在犯錯誤
的概率不超過0.001的前提下能認為該校學生一周使用手機上網(wǎng)時間與近視程度
有關.
課時作業(yè)
一、單項選擇題
1.根據(jù)分類變量X與>的成對樣本數(shù)據(jù),計算得到犬二6.147.依據(jù)a=0.01
的獨立性檢驗(xo.oi=6.635),結(jié)論為()
A.變量犬與y不獨立
B.變量犬與),不獨立,這個結(jié)論犯錯誤的概率不超過0.01
C.變量x與),獨立
D.變量x與y獨立,這個結(jié)論犯錯誤的概率不超過0.01
答案C
解析依據(jù)a=0。的獨立性檢驗,當/=6.147<6.635時,可以認為變量x
與)獨立.故選C
2.(2023?天津高考)調(diào)查某種群花萼長度和花瓣長度,所得數(shù)據(jù)如圖所示.其
中相關系數(shù)一二0.8245,下列說法正確的是()
花萼氏度
A.花瓣長度和花萼長度沒有相關性
B.花瓣長度和花萼長度呈負相關
C.花瓣長度和花萼長度呈正相關
D.若從樣本中抽取一部分,則這部分的相關系數(shù)一定是0.8245
答案C
解析因為相關系數(shù)r=0,8245>0.75,所以花瓣長度和花萼長度的相關性較
強,并且呈正相關,所以A,B錯誤,C正確;因為相關系數(shù)與樣本的數(shù)據(jù)有關,
所以當樣本發(fā)生變化時,相關系數(shù)也可能會發(fā)生變化,所以D錯誤.故選C.
3.(2024.青島開學考試)已知某設備的使用年限x(單位:年)與年維護費用),(單
位:千元)的對應數(shù)據(jù)如下表:
X24568
y34.56.57.59
由所給數(shù)據(jù)分析可知,x與),之間具有線性相關關系,且y關于x的經(jīng)驗回
AAA
歸方程為L05x+a,則。=()
A.0.75B.0.85
C.0.95D.1.05
答案B
_2+4+5+6+8_3+4.5+6.5+7.5+9
解析由已知可得,x==5,y==6.1,
AA
因為經(jīng)驗回歸直線過樣本點的中心(5,6.1),所以6.1=1.05x5+。,解得4=0.85.
故選B.
4.用模型西"to>0)擬合一組數(shù)據(jù)時,令z=lny,將其變換后得到經(jīng)驗
回歸方程z=2x+a,則4=()
A.eB."
e
C.1D.2
答案D
解析對y=a/”(。>0)兩邊同時取對數(shù),則析y=ln3ax+】)=ln〃+加+兀
b=2,b=2,b
令z=lny,貝ljz=切;+】n〃+1,所以,解得g,所以片2.故選D.
a=\na+1,
5.下圖是某地區(qū)20()3年至2023年環(huán)境保護建設投資額(單位:萬元)的折線
圖.
投濟商/萬元
3
35()
2<M)
25()
1ix)
15o
lx)
5(o)
尋群弱舞龔需麴羔翳急髭懶
根據(jù)該折線圖判斷,下列結(jié)論正確的是()
A.為預測該地2024年的環(huán)境保護建設投資額,應用2003年至2023年的數(shù)
據(jù)建立回歸模型更可靠
B.為預測該地2024年的環(huán)境保護建設投資額,應用2012年至2023年的數(shù)
據(jù)建立回歸模型更可靠
C.投資額與年份負相關
D.投資額與年份的相關系數(shù)廠<()
答案B
解析因為2011年之前與2012年之后投資額變化較大,故為預測該地2024
年的環(huán)境保護建設投資額,應用2012年至2023年的數(shù)據(jù)建立回歸模型更可靠,
所以A錯誤,B正確;隨年份的增長,投資額總體上在增長,所以投資額與年份
正相關,r>0,故C,D錯誤.故選B.
6.根據(jù)如下樣本數(shù)據(jù):
X345678
y4.02.50.50.50.40.1
AAA
得到經(jīng)驗回歸方程為),=尿+。,貝IJ()
AAAA
A.〃>0,b>0Bzz>0,b<0
AAAA
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 交警沒開協(xié)議書
- 交通私聊協(xié)議書
- 會員合作協(xié)議書
- 產(chǎn)品鑒定協(xié)議書
- 黨員管理協(xié)議書
- 保險兼職協(xié)議書
- 物業(yè)與寬帶協(xié)議書
- 清潔臨時工2025年紙板環(huán)保補貼協(xié)議
- 老房子并購協(xié)議書
- 約合作經(jīng)營協(xié)議書
- 設計公司生產(chǎn)管理辦法
- 企業(yè)管理綠色管理制度
- 2025年人工智能訓練師(三級)職業(yè)技能鑒定理論考試題庫(含答案)
- 2025北京八年級(上)期末語文匯編:名著閱讀
- 小學美術教育活動設計
- 蜜雪冰城轉(zhuǎn)讓店協(xié)議合同
- 貸款項目代理協(xié)議書范本
- 低分子肝素鈉抗凝治療
- 重慶城市科技學院《電路分析基礎》2023-2024學年第二學期期末試卷
- 乳腺癌全程、全方位管理乳腺癌患者依從性及心理健康管理幻燈
- 2024-2025學年福建省三明市高二上冊12月月考數(shù)學檢測試題(附解析)
評論
0/150
提交評論