版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
成對數(shù)據(jù)的統(tǒng)計分析
【考試要求】1.了解樣本相關(guān)系數(shù)的統(tǒng)計含義.2.理解一元線性回歸模型和2X2列聯(lián)表.會運
用這些方法解決簡單的實際問題.3.會利用統(tǒng)計軟件進(jìn)行數(shù)據(jù)分析.
■落實主干知識
【知識梳
1.變量的相關(guān)關(guān)系
(1)相關(guān)關(guān)系:兩個變量有去蜜,但又沒有確切到可由其中的一個去精確地決定另一個的程度,
這種關(guān)系稱為相關(guān)關(guān)系.
(2)相關(guān)關(guān)系的分類:正柱關(guān)和負(fù)相關(guān).
(3)線性相關(guān):一般地,如果兩個變最的取值呈現(xiàn)正相關(guān)或負(fù)相關(guān),而且散點落在一條直線附
近,我們稱這兩個變量線性相關(guān).
2.樣本相關(guān)系數(shù)
/="1X-xy>—y
(1)r=//■:
y二埼一二、二匕-72
(2)當(dāng)力0時,稱成對樣本數(shù)據(jù)陰聯(lián);當(dāng)*0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).
(3))|W1;當(dāng)|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)行越接近0時,成對
樣本數(shù)據(jù)的線性相關(guān)程度越嵬.
3.一元線性回歸模型
⑴我們將尸嘛為F關(guān)于x的經(jīng)驗回歸方程,
,——
-z:.XLX匕一y
b=~2,
其中1工%一X
a=y-bx.
(2)殘差:觀測值減去預(yù)測值,稱為殘差.
4.列聯(lián)表與獨立性檢驗
⑴關(guān)于分類變最才和V的抽樣數(shù)據(jù)的2X2列聯(lián)表:
Y合計
K=0r=i
/=3aba+b
X=\cdc+d
合計a+cb+d〃=a+6+c+d
⑵計算隨機(jī)變量/=a+b第Fb+d,利用力的取值推斷分類變量X
和了是否獨立的方法稱為一獨立性檢驗.
a0.100.050.0100.0050.001
x?2.7063.8416.6357.87910.828
【常用結(jié)論】
1.經(jīng)驗回歸直線過點(;,7).
n____
〃xy
2.求方時,常用公式5=-----------.
n_
十22
工Xi-nx
7-i
3.回歸分析和獨立性檢驗都是基于成對樣本觀測數(shù)據(jù)進(jìn)行估計或推斷,得出的結(jié)論都可能犯
錯誤.
【思考沙析】
判斷下列結(jié)論是否正確(請在括號中打“J”或“X”)
(1)散點圖是判斷兩個變量相關(guān)關(guān)系的一種重要方法和手段.(J)
⑵經(jīng)驗回歸直線y=8*+a至少經(jīng)過點(乂,y),(照,㈤,…,(乂,卜)中的一個點.(X)
(3)樣本相關(guān)系數(shù)的絕對值越接近1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng).(J)
(4)若分類變量XV關(guān)系越密切,則由觀測數(shù)據(jù)計算得到的八二的觀測值越小.(X)
【教材改編題】
1.實驗測得四組(必力的值為(1,2),(2,3),(3,4),(4,5),則y與x之間的經(jīng)驗回歸方程
為()
A.y=x+lB.y=x+2
C.y=2x+1D.y=x~1
答案A
—
解析由已知可得X=-X(14-24-3+4)=2.5,
一1
y=-X(2+3+4+5)=3.5,
所以經(jīng)驗回歸直線過點(2.5,3.5),
所以把點⑵5,3.5)代入四個選項中驗證,可得只有y=x+l成立.
2.(多選)下列關(guān)于成對樣本數(shù)據(jù)的統(tǒng)計分析的判斷中正確的有()
A.若樣本相關(guān)系數(shù)r=0,則說明成對樣本數(shù)據(jù)沒有相關(guān)性
B.樣本相關(guān)系數(shù)「越大,成對樣本數(shù)據(jù)的線性相關(guān)性越強(qiáng)
C.用最小二乘法求得的一元線性回歸模型的殘差和一定是0
D,決定系數(shù)〃越大,殘差平方和越小,模型的擬合效果越好
答案CD
解析對于A,當(dāng)時.只表明成對樣本數(shù)據(jù)間沒有線性相關(guān)關(guān)系,但是不排除它們之間
有其他相關(guān)關(guān)系,故A錯誤;
對于B,樣本相關(guān)系數(shù)r|越大,成對樣木數(shù)據(jù)的線性相關(guān)性越強(qiáng),故B錯誤;
對于C,殘差和為
n
"(%—%)=£[力—(6為+。)]
/=1/=.
n*n
=£匕-/%一
i=li=\/"1
=ny-nbx-na
=n(y—bx—a)=0,故C正確;
對于一D,決定系數(shù)〃越大,表示殘差平方和越小,即模型的擬合效果越好,故D正確.
3.(多選)為了解閱讀量多少與幸福感強(qiáng)弱之間的關(guān)系,一個調(diào)查機(jī)構(gòu)根據(jù)所得到的數(shù)據(jù),繪
制了如下所示的2X2列聯(lián)表(個別數(shù)據(jù)暫用字母表示):
幸福感強(qiáng)幸福感弱合計
閱讀量多m1872
閱袤量少36n78
合計9060150
計算得:/比12.981,參照下表:
U0.100.050.0250.0100.0050.001
X。2.7G63.8415.0246.6357.87910.828
對于下面的選項,正確的為()
A.根據(jù)小概率值。=0.010的獨立性檢驗,可以認(rèn)為“閱讀量多少與幸福感強(qiáng)弱無關(guān)”
B.力=54
C.根據(jù)小概率值。=().()05的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下認(rèn)為
“閱讀量多少與幸福感強(qiáng)弱有關(guān)”
D.〃=52
答案BC
解析V八一981>7.879>6.635,
,根據(jù)小概率值。=0.01。的獨立性檢驗,可以在犯錯誤的概率不超過戰(zhàn)的前提下認(rèn)為“閱
讀量多少與幸福感強(qiáng)弱有關(guān)”,
根據(jù)小概率值。=0.005的獨立性檢驗,可以在犯錯誤的概率不超過0.5%的前提下認(rèn)為“閱
讀量多少與幸福感強(qiáng)弱有關(guān)”,
;?A錯,C對,
??5+36=90,18+77=60,
??m—549〃=42,
,B對,D錯.
■探究核心題型
題型一成對數(shù)據(jù)的相關(guān)性
例1(1)對變量X,y有觀測數(shù)據(jù)(%,y>)(7=1,2,10),得散點圖如圖1,對變量u,/
有觀測數(shù)據(jù)(a,KZ)(7-1,2,…,10),得散點圖如圖2.由這兩個散點圖可以判斷()
v
5()
40
3()
10,
°01234567
圖1圖2
A.變量x與y正相關(guān),〃與『正相關(guān)
B.變量x與y正相關(guān),〃與/負(fù)相關(guān)
C.變量x與y負(fù)相關(guān),〃與『正相關(guān)
D.變最x與y負(fù)相關(guān),〃與P負(fù)相關(guān)
答案C
解析由題圖可得兩組數(shù)據(jù)均線性相關(guān),且圖1的經(jīng)驗回歸直線的斜率為負(fù),圖2的經(jīng)驗回
歸直線的斜率為正,則由散點圖可判斷變量x與y負(fù)相關(guān),u與口正相關(guān).
(2)(多選)下列有關(guān)經(jīng)驗回歸分析的說法中正確的有()
A.經(jīng)驗回歸直線必過點(x,y)
B.經(jīng)驗回歸直線就是散點圖中經(jīng)過樣本數(shù)據(jù)點最多的那條直線
C.當(dāng)樣本相關(guān)系數(shù)力0時,兩個變最正相關(guān)
D.如果兩個變量的相關(guān)性越弱,則|r|就越接近于0
答案ACD
解析對于A,經(jīng)驗回歸直線必過點(二,7),故A正確;
對于B,經(jīng)驗回歸直線在散點圖中可能不經(jīng)過任一樣本數(shù)據(jù)點,故B不正確;
對于C,當(dāng)樣本相關(guān)系數(shù)時,則兩個變量正相關(guān),故C正確;
對于D,如果兩個變量的相關(guān)性越弱,則|川就越接近于0,故D正確.
【教師備選】
1.在一組樣本數(shù)據(jù)(汨,兄,(如㈤,…,(X”%)(〃22,小,才2,…,也不全相等)的散點
圖中,若所有樣本點(必,匕)(了=1,2,…,〃)都在直線尸上,則這組樣本數(shù)據(jù)的樣
本相關(guān)系數(shù)為()
A.-IB.0C.1D.1
答案I)
解析所有樣本點均在同一條斜率為正數(shù)的直線.匕則樣本相關(guān)系數(shù)最大,為1.
2.(多選)下列選項中正確的是()
A.經(jīng)驗回歸分析中,川的值越大,說明殘差平方和越小
B.若一組觀測數(shù)據(jù)(加,必),(而,》),…,(Xn,%)滿足■=-[+a+d(/=1,2,…,〃),
若&恒為0,則〃=1
C.經(jīng)驗回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法
D.畫殘差圖時,縱坐標(biāo)為殘差,橫坐標(biāo)一定是編號
答案ABC
解析對于A,經(jīng)驗回歸分析中,川的值越大,說明模型的擬合效果越好,則殘差平方和越
小,A對;
對于B,若一組觀測數(shù)據(jù)(小,y),(而,㈤,…,(無,后)滿足卜=魴+々+8(了=1,2一??,
〃),若8恒為0,則川=1,B對;
對于C,經(jīng)驗回歸分析是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的一種常用方法,C對;
對于D,殘差圖中橫坐標(biāo)可以是樣本編號,也可以是身高數(shù)據(jù),還可以是體重的估計值等,D
錯.
思維升華判定兩個變量相關(guān)性的方法
(D畫散點圖:點的分布從左下角到右上角,兩個變量正相關(guān);點的分布從左上角到右下角,
兩個變量負(fù)相關(guān).
(2)樣本相關(guān)系數(shù):當(dāng)上0時,正相關(guān);當(dāng)*0時,負(fù)相關(guān):1/'越接近于1,相關(guān)性越強(qiáng).
(3)經(jīng)驗回歸方程:當(dāng)力0時,正相關(guān);當(dāng)從0時,負(fù)相關(guān).
跟蹤訓(xùn)練1(1)己知變量x和y滿足關(guān)系尸一0.1%+1,變量y與z正相關(guān).下列結(jié)論中正
確的是()
A.x與y正相關(guān),x與z負(fù)相關(guān)B.x與y正相關(guān),x與z正相關(guān)
C.x與y負(fù)相關(guān),A■與z負(fù)相關(guān)D.x與/負(fù)相關(guān),x與ziE相關(guān)
答案C
解析因為y=-0.1%+1的斜率小于0,故*與y負(fù)相關(guān).因為y與z正相關(guān),可設(shè)
+&6>0,則z=0y+a=—0.">+〃+$故x與/負(fù)相關(guān).
⑵對四組數(shù)據(jù)進(jìn)行統(tǒng)計,獲得如圖所示的散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確的是
()
樣本相關(guān)系數(shù)為。樣本相關(guān)系數(shù)為心
(1)(2)
樣本相關(guān)系數(shù)為G樣本相關(guān)系數(shù)為小
(4)
A.z^<ri<0<r3<?'iB.z:i<^<0<ri<?'3
C.n<72<0<r3<riD.Z2<rt<0<ri<n
答案A
解析由散點圖知圖⑴與圖⑶是正相關(guān),故八>0,r3>C,圖(2)與圖⑷是負(fù)相關(guān),故及(0,
水0,且圖⑴與圖⑵的樣本點集中在一條直線附近,因此水水0<水工
題型二回歸模型
命題點1一元線性回歸模型
例2(2022?廣州模擬)2021年2月25日,在全國脫貧攻堅總結(jié)表彰大會上,習(xí)近平總書記
莊嚴(yán)宣告:我國脫貧攻堅戰(zhàn)取得全面勝利.目前,河南省53個貧困縣已經(jīng)全部脫貧摘帽,退
出貧困縣序列.2016年起,我省某貧困地區(qū)創(chuàng)新開展產(chǎn)業(yè)扶貧,響應(yīng)第三產(chǎn)業(yè)的扶貧攻堅政
策,經(jīng)濟(jì)收入逐年增加.該地的經(jīng)濟(jì)收入變化及構(gòu)成比例如圖所示:
年份2016年2017年2018年2019年2020年
年份代號X12345
經(jīng)濟(jì)收入y(單位:百萬元)59141720
2020年經(jīng)濟(jì)收入構(gòu)成比例
(1)根據(jù)以上圖表,試分析:與2016年相比,2020年第三產(chǎn)業(yè)與種植業(yè)收入變化情況;
(2)求經(jīng)濟(jì)收入y關(guān)于x的經(jīng)驗回歸方程,并預(yù)測2025年該地區(qū)的經(jīng)濟(jì)收入.
解(1)①與2016年相比,2020年第三產(chǎn)業(yè)的收入占比大幅度增加;
②201G年第三產(chǎn)業(yè)的收入為0.3百萬元,2020年第三產(chǎn)業(yè)的收入為G百萬元,收入大幅度增
加;
③與2016年相比,種植業(yè)收入占比減少,但種植業(yè)收入依然保持增長.
(2)由表格中的數(shù)據(jù)可知,
-1+2+3+4+5
x-z=3,
5
—5+9+14+17+20
-------5-------=⑶
X^=12+224-32+424-52=55,
Zx,y=lX5+2X9+3><14+4X17+5X20=233,
5____
5£*,匕-5xy
-/=1XLXy>—y
則加=---------
5x
233-5X3X13
=-55-5X3」-=3*8,
所以a=y~bx=1.6,
故經(jīng)濟(jì)收入y關(guān)于x的經(jīng)驗回歸方程為
y=3.8x+l.6,
當(dāng)x=10時,y=39.6,貝!預(yù)測2025年該地區(qū)的經(jīng)濟(jì)收入為39.6百萬元.
命題點2非線性回歸模型
例3(2022?吉林模擬)全球化時代,中國企業(yè)靠什么在激烈的競爭中成為世界一流企業(yè)
呢?由人民日報社指導(dǎo),《中國經(jīng)濟(jì)周刊》主辦的第十八屆中國經(jīng)濟(jì)論壇在人民FI報社舉行,
就中國企業(yè)如何提升全球行業(yè)競爭力進(jìn)行了研討.數(shù)據(jù)顯示,某企業(yè)近年加大了科技研發(fā)資
金的投入,其科技投入*(百萬元)與收益y(百萬元)的數(shù)據(jù)統(tǒng)計如下:
科技投入X1234567
收益y19202231405070
根據(jù)數(shù)據(jù)特點,甲認(rèn)為樣本點分布在指數(shù)型曲線尸的周圍,據(jù)此他勸數(shù)據(jù)進(jìn)行了一些
初步處理.如下表:
7
9%匕*-7)2
7ExiZi/=1
/=!/=17=1
514012391492134130
其中Zi=log2y>,z
?:一1
(1)請根據(jù)表中數(shù)據(jù),建立y關(guān)于/的經(jīng)驗回歸方程(系數(shù)精確到0.1);
(2)①乙認(rèn)為樣本點分布在直線尸m的周圍,并計算得經(jīng)驗回歸方程為y=8.25x+3,以
及該回歸模型的決定系數(shù)應(yīng)=0.893,試比較甲、乙兩人所建立的模型,誰的擬合效果更好?
②由①所得的結(jié)論,計算該企業(yè)欲使收益達(dá)到1億元,科技投入的費用至少要多少百萬元?
(精確到0.1)
V-Vi
附:決定系數(shù):〃=1
參考數(shù)據(jù):1。?5弋2.3.
解(1)將y=2"L"兩邊取對數(shù)得log2_r=bx+a,令z=log2y?
^Az=bx+a,
???彳二%???根據(jù)最小二乘估計可知,
7____
£xiZi—7xz
*7-
J-1
:.a=~z-bx=5-0.32X4=3.72^3.7,
,經(jīng)驗回歸方程為z=0.3、+3.7,即尸2。".
(2)①甲建立的回歸模型的
^=1-7777^0.939>必.=0.893.
,甲建立的回歸模型擬合效果更好.
②由①知,甲建立的問歸模型擬合效果更好.
設(shè)203*37-100,
解得0.3^+3.7^1ogJ00=2+21og>5,
解得x29.7.
???科技投入的費用至少要9.7百萬元,下一年的收益才能達(dá)到1億元.
【教師備選】
1.(2022?湖北九師聯(lián)盟聯(lián)考)下表是關(guān)于某設(shè)備的使用年限x(單位:年)和所支出的維修費
用y(單位:萬元)的統(tǒng)計表.
X23456
y3.44.25.15.56.8
由上表可得經(jīng)驗回歸方程尸0.81x+a,若規(guī)定:維修費用y不超過10萬元,一旦大于10
萬元時,該設(shè)備必須報廢.據(jù)此模型預(yù)測,該設(shè)備使用年限的最大值約為()
A.7B.8C.91).10
答案D
解析由表格,得
--1
X=TX(2+3+4+5+6)=4,
□
—1
y=rX(3.4+4.2+5.1+5.5+6.8)=5,
b
因為經(jīng)驗回歸直線恒過點匚7,7),
巨斤以5=0,RIX4+/?,
解得石=1.76,
所以經(jīng)驗回歸方程為y=0.81『H.76,
由j<10,得0.8期+1.76《10,
824
解得r^-rr-^lO.17,
O1
由于x£N\所以據(jù)此模型預(yù)測,該設(shè)備使用年限的最大值約為10.
2.用模型尸典""擬合一組數(shù)據(jù)時,為了求出經(jīng)驗回歸方程,設(shè)z=lny,其變換后得到經(jīng)驗
回歸方程為z=0.5>+2,則c等于()
A.0.5B.e05C.2D.e2
答案D
解析因為兩邊取對數(shù)得,
Iny=ln(ce4')=lnc+lneAv=kx+Inc,
則z=A*+lnc,而z=0.5x+2,
于是得lnc=2,BPc=e2.
思維升華求經(jīng)驗回歸方程的步驟
L-------------------------------------------------------------r
(步驟一:計算出x,y,取與次或\<)(.V,T)J
―4£*,-1)2的值\
(步.二卜[利用公式計算系數(shù)工時
(步金三卜!寫出經(jīng)臉回歸方程y=Bx+aj
跟蹤訓(xùn)練2為實施鄉(xiāng)村振興,科技興農(nóng),某村建起了日園綜合體,并從省城請來專家進(jìn)行
技術(shù)指導(dǎo).根據(jù)統(tǒng)計,該田園綜合體西紅柿畝產(chǎn)量的增加量爪千克)與某種液體肥料每畝使
用量x(千克)之間的對應(yīng)數(shù)據(jù)如下.
*千克)24568
八千克)300400400400500
(1)由上表數(shù)據(jù)可知,可用經(jīng)驗回歸模型擬合y與x的關(guān)系,請計算樣本相關(guān)系數(shù)r并加以說
明(若|r|>0.75,則線性把關(guān)程度很高,可用經(jīng)驗回歸模型擬合);
(2)求y關(guān)于x的經(jīng)驗回歸方程,并預(yù)測當(dāng)液體肥料每畝使用量為15千克時,西紅柿畝產(chǎn)量
的增加量約為多少千克?
參考數(shù)據(jù):寸歷-3.16.
解(1)由已知數(shù)據(jù)可得
—2+4+54-6+8廠
x=u=5,
□
—300+400+400+400+500
y=-------------------;-------------------=400,
o
所以5(為一:)(%一7)=(—3)X(-100)+(-1)X0+0X0+1X0+3X100=600,
/=!
3xT2=y1-32+-124-02+12+32=2^,
222222
,二(y-~=yj-100+04-04-0+100=]0(胞,
y--y
6003
所以樣本相關(guān)系數(shù)「2小X10研一皿~°,9d
x-x小%一7
因為|廣|〉0.75,所以可用經(jīng)驗回歸模型擬合y與4的關(guān)系.
5x—xy-y
*/=!600
⑵Q-----------------^―
Io-=30,a=400-5X30=250,
5Xi-x-
/=i
所以經(jīng)驗回歸方程為y=30x+250.
當(dāng)x=15時,7=30X15+250=700,
即當(dāng)液體肥料每畝使用量為15千克時,西紅柿畝產(chǎn)量的增加量約為700千克.
題型三列聯(lián)表與獨立性檢驗
例4(2021?全國甲卷改編)甲、乙兩臺機(jī)床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質(zhì)量分為一級品和二級
品,為了比較兩臺機(jī)床產(chǎn)品的質(zhì)量,分別用兩臺機(jī)床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質(zhì)量情況
統(tǒng)計如下表:
一級品二級品合計
甲機(jī)床15050200
乙機(jī)床12080200
合計270130400
(1)甲機(jī)床、乙機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?
(2)依據(jù)小概率值。=0.01的獨立性檢驗,能否以此推斷甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品
質(zhì)量有差異?
15()
解(1)根據(jù)題表中數(shù)據(jù)知,甲機(jī)床生產(chǎn)的產(chǎn)品中一級品的頻率是麗=0.75,乙機(jī)床生產(chǎn)的
產(chǎn)品中-?級品的頻率是麗=0.6.
(2)零假設(shè)為〃:甲機(jī)床的產(chǎn)品質(zhì)量與乙機(jī)床的產(chǎn)品質(zhì)量無差異.根據(jù)2X2列聯(lián)表,可得
22
x2------------n---a-d---b-e-------------=-4-0-0-X----1-5-0--X-8-0---5--0-X--1-2-0--
a+bc+da+cb+d270X130X200X200
Q10.256>6.635=Ab.oi.
根據(jù)小概率值。=().01的獨立性檢驗,我們推斷笈不成立,即認(rèn)為甲機(jī)床的產(chǎn)品質(zhì)量與乙
機(jī)床的產(chǎn)品質(zhì)量有差異.
【教師備選】
1.為了解某大學(xué)的學(xué)生是否愛好體育鍛煉,用簡單隨機(jī)抽樣方法在校園內(nèi)遍宜了12()位學(xué)生,
得到如下2義2列聯(lián)表:
男女合計
愛好ab73
不愛好C25
合計74
則a—6一。等于()
A.7B.8C.9D.10
答案C
解析根據(jù)題意,可得。=120—73—25=22,日=74—22=52,6=73—52=21,
:.a—b—c=52—21—22=9.
2.(多選)某醫(yī)療研究機(jī)構(gòu)為了了解免疫與注射疫苗的關(guān)系,進(jìn)行一次抽樣調(diào)查,得到數(shù)據(jù)如
表1.
免疫不免投合計
注射疫苗101020
未注射疫苗63440
合計164460
俵1)
70.100.0500.0100.001
2.7063.8416.63510.828
(表2)
則下列說法中正確的是()
A.爐Q8.35
B.P(X2^6.635)^0.001
C.依據(jù)小概率值。=0.01的獨立性檢驗,我們認(rèn)為免疫與注射疫苗有關(guān)系
D.依據(jù)小概率值。=0.0D1的獨立性檢驗,我們認(rèn)為免疫與注射疫苗有關(guān)系
答案AC
解析由表中數(shù)據(jù),
260X10X34—6X10?
得x=20X40X16X44
28.352*8.35,所以A正確;
因為尸(1》6.635)-0.01,所以B錯誤;
x'%8.352>6.635=Ab.oi,
依據(jù)小概率值。=0.01的獨立性檢驗,我們認(rèn)為免疫與注射疫苗有關(guān)系,所以C正確;
352<10.828—Ao.ooi>
依據(jù)小概率值。=0.001的獨立性檢驗,我們認(rèn)為免疫與注射疫苗沒有關(guān)系,故D錯誤.
思維升華獨立性檢驗的一般步驟
(1)根據(jù)樣本數(shù)據(jù)制成2X2列聯(lián)表.
⑵根據(jù)公式/=——_〃-:-——--ifM.
a+ba+cb-\-dc+d
(3)比較x?與臨界值的大小關(guān)系,作統(tǒng)計推斷.
跟蹤訓(xùn)練3(2022?太原模擬)為進(jìn)一步保護(hù)環(huán)境,加強(qiáng)治理空氣污染,某市環(huán)保監(jiān)測部門
對市區(qū)空氣質(zhì)量進(jìn)行調(diào)研,隨機(jī)抽查了市區(qū)100天的空氣質(zhì)量等級與當(dāng)天空氣中sofn濃度
(單位:Pg/m3),整理數(shù)據(jù)得到下表:
SO2的濃度
空氣質(zhì)量凝[0,50](50,150](150,475]
1(優(yōu))2862
2(良)578
3(輕度污染)389
4(中度污染)11211
若某天的空氣質(zhì)量等級為1或2,則稱這天“空氣質(zhì)量好”;若某天的空氣質(zhì)量等級為3或4,
則稱這天“空氣質(zhì)量不好”,根據(jù)上述數(shù)據(jù),回答以下問題.
(1)估計事件“該市一天的空氣質(zhì)量好,且S0?的濃度不超過150”的概率;
⑵完成下面的2X2列聯(lián)表,
S02的濃度
空氣質(zhì)鼠[0,150](150,475]合計
空氣質(zhì)量好
空氣質(zhì)量不好
合計
(3)根據(jù)(2)中的列聯(lián)表,依據(jù)小概率值。=0.01的獨立性檢驗,能否據(jù)此推斷該市一天的空
氣質(zhì)量與當(dāng)天SO」的濃度有關(guān)?
解(1)由表格可知,該市一天的空氣質(zhì)量好,且S0?的濃度不超過150的天數(shù)為28+6+5
46
+7=46,則“該市一天的空氣質(zhì)量好,且S0:的濃度不超過150”的概率Q礪=0.46.
(2)由表格數(shù)據(jù)可得列聯(lián)表如下,
SO?的濃度
空氣質(zhì)鼠[0,150](150,475]合計
空氣質(zhì)量好461056
空氣質(zhì)量不好242044
合計7030100
(3)零假設(shè)為打:該市一天的空氣質(zhì)量與當(dāng)天S0?的濃度無關(guān).
-C、*2100X46X20-24X102
由⑵知『=-70X30X5(5X44—
亡8.936>6.635=加0,
根據(jù)小概率值。=().()1的獨立性檢驗,我們推斷笈不成立,即認(rèn)為該市一天的空氣質(zhì)量與
當(dāng)天Sth的濃度有關(guān).
課時精練
立基礎(chǔ)保分練
1.如表是2X2列聯(lián)表,則表中的a,。的值分別為()
7172合計
X\a835
X2113445
合計b4280
A.27,38B.28,38C.27,37D.28,37
答案A
解析a=35-8=27.力=#+11=27+11=38.
2.(2022?湘豫名校模擬)根據(jù)如表樣本數(shù)據(jù):
X23456
y42.5—0.5-2-3
得到的經(jīng)驗I可歸方程為y="+a,貝N)
A.GO,£>0B.a>0,灰0C.水0,a0D.a<0,ZXO
答案B
解析由表中的數(shù)據(jù)可得,變量y隨著x的增大而減小,則叢0,
—24-3+4+5+6
x=------;------=4,
□
—4+2.5-0.5-2-3…
y=5=02
又經(jīng)驗回歸方程bx-\r逐過點(4,0.2),可得&>0.
3.某種產(chǎn)品的廣告費支出x與銷售額近單位:萬元)之間的關(guān)系如表:
X24568
y3040605070
y與x的經(jīng)驗回歸方程為尸6.5x+17.5,當(dāng)廣告支出6萬元時,隨機(jī)誤差的殘差為()
A.—5B.—5.5
C.-6D.-6.5
答案D
解析由題意結(jié)合經(jīng)驗回歸方程的預(yù)測作用可得,當(dāng)x=6時,7=6.5X6+17.5=56.5,則
隨機(jī)誤差的殘差為50-56.5=-6.5.
4.(2022?泉州模擬)蟋蟀鳴叫可以說是大自然優(yōu)美、和諧的音樂,殊不知蟋蟀鳴叫的頻率
火每分鐘鳴叫的次數(shù))與氣溫y(單位:°C)存在著較強(qiáng)的線性相關(guān)關(guān)系.某地觀測人員根據(jù)如
表的觀測數(shù)據(jù),建立了y關(guān)于x的經(jīng)驗回歸方程y=0.25《+A,則下列說法不正確的是()
X(次數(shù)/分鐘)2030405060
7(℃)2527.52932.536
A.4的值是20
B.變量x,y呈正相關(guān)關(guān)系
C.若/的值增加1,則y的值約增加0.25
D.當(dāng)蟋蟀52次/分鳴叫時,該地當(dāng)時的氣溫預(yù)測值為33.5℃
答案D
解析由題意,得
--1
x=TX(20+30+40+50+60)=40,
□
—1
y(25+27.5+29+32.5+36)=30,
=ToX
則a=7-0.25:=30-0.25X40=20,
故A正確;
由經(jīng)驗回歸方程可知,b=0.25X),
變量x,y呈正相關(guān)關(guān)系,故B正確;
若x的值增加1,則p的值約增加0.25,
故C正確;
當(dāng)>=52時.,y=0.25X52+20=33,
故D不正確.
5.(多選)下列說法正確的是()
A.設(shè)有一個經(jīng)驗回歸方程尸3—5x,變量x增加一個單位時,y平均增加5個單位
B.若兩個具有線性相關(guān)關(guān)系的變量的相關(guān)性越強(qiáng),則樣本相關(guān)系數(shù)r的值越接近于1
C.在殘差圖中,殘差點分布的水平帶狀區(qū)域越窄,說明模型的擬合精度越高
D.在一元線性回歸模型中,決定系數(shù)〃越接近于1,說明回歸的效果越好
答案CD
解析A選項,因為尸3—5筋所以變量x增加一個單位時,y平均減少5個單位,故A錯誤;
B選項,線性相關(guān)性具有正負(fù),相關(guān)性越強(qiáng),則樣本相關(guān)系數(shù)1?的絕對值越接近于1,故B
錯誤;
C選項,在殘差圖中,殘差點分布的水平帶狀區(qū)域越窄,說明波動越小,即模型的擬合精度
越高,故C正確;
I)選項,在一元線性回歸模型中,決定系數(shù)片越接近于1,說明模型擬合的精度越高,即回
歸的效果越好,故D正確.
6.(多選)2021年5月18□,《佛山市第七次全國人口普杳公報》發(fā)布.公報顯示,傷山市
常住人口為9498863人.為了進(jìn)一步分析數(shù)據(jù)特征,某數(shù)學(xué)興趣小組先將近五次人口普查數(shù)
據(jù)作出散點圖(橫坐標(biāo)為人口普查的序號,第三次普查記為1,…,第七次普查記為5,縱坐
標(biāo)為當(dāng)次人口普杳佛山市人口數(shù)(單位:萬人),再利用不同的函數(shù)模型作出回歸分析,如圖,
以下說法正確的是()
12(N)
()123456
A.佛山市人口數(shù)與普查序號呈正相關(guān)關(guān)系
B.散點的分布呈現(xiàn)出很強(qiáng)的線性相關(guān)特征
C.經(jīng)驗回歸方程2的擬合效果更好
D.應(yīng)用經(jīng)驗回歸方程1可以預(yù)測第八次人口普查時佛山市人口會超過1400萬人
答案AC
解析對于A,散點圖中的點的分布從左下方至右上方,故呈正相關(guān)關(guān)系,故A正確;
對于B,利用模型1,樣本點基本分布在直線的兩側(cè),故具有較強(qiáng)的線性相關(guān)特征,故B錯誤;
對于C,因為0.9794>0.9726,所以經(jīng)驗回歸方程2的擬合效果更好,故C正確:
對于D,利用模型1,當(dāng)k6時,y=183.5X6-1.7=1099.3<1400,故D錯誤.
7.(2022?廣州模擬)某車間為了提高工作效率,需要測試加工零件所花費的時間,為此進(jìn)行
了5次試驗,這5次試驗的數(shù)據(jù)如下表:
零件數(shù)x(個)1020304050
加工時間y(min)62a758189
若用最小二乘法求得經(jīng)驗回歸方程為y=0.67x+54.9,則a的值為—
答案68
10+20+30+40+50M
解析由已知才=r—30,
—62+^+75+81+89…,2+a
y=5=6i+=,
2+a
所以61+「r^=0.67X30+54.9,解得a=68.
D
8.(2022?青島模擬)某駕駛員培訓(xùn)學(xué)校為對比了解“科Fl二”的培訓(xùn)過程采用大密度集中培
訓(xùn)與周末分散培訓(xùn)兩種方式的效果,調(diào)查了105名學(xué)員,統(tǒng)計結(jié)果為:接受大密度集中培訓(xùn)
的55個學(xué)員中有45名學(xué)員一次考試通過,接受周末分散培訓(xùn)的學(xué)員一次考試通過的有30
個.根據(jù)統(tǒng)計結(jié)果,認(rèn)為“能否一次考試通過與是否集中培訓(xùn)有關(guān)”犯錯誤的概率不超過
附:一:t+c一汴廠’其中〃=a+6+c+d;
70.050.0250.0100.001
Xa3.8415.0246.63510.828
答案0.025
解析由題意可得列聯(lián)表如下,
集中培訓(xùn)分散培訓(xùn)合計
一次考過453075
一次未考過102030
合計5550105
105X45X20—10X30
~6.109>5.024=A(I,(I25.
55X50X75X30
9.(2022?河南九師聯(lián)盟聯(lián)考)機(jī)動車行經(jīng)人行橫道時,應(yīng)當(dāng)減速慢行:遇行人正在通過人行
橫道,應(yīng)當(dāng)停車讓行,俗稱“禮讓行人”.如表是某市一主干路口監(jiān)控設(shè)備所抓拍的1-5
月份駕駛員不“禮讓行人”行為統(tǒng)計數(shù)據(jù):
月份12345
違章駕駛員人數(shù)1201051009580
(1)請利用所給數(shù)據(jù)求違章人數(shù)P與月份x之間的經(jīng)驗回歸方程并預(yù)測該路口10
月份的不“禮讓行人”違章駕駛員人數(shù);
(2)交警從這5個月內(nèi)通過該路口的駕駛員中隨機(jī)抽查70人,調(diào)查駕駛員不“禮讓行人”行
為與駕齡的關(guān)系,如表所示:
不禮讓行人禮讓行人
駕齡不超過1年2416
駕齡1年以上1614
依據(jù)小概率值。=().1的獨立性檢驗,能否據(jù)此判斷“禮計行人”行為與駕齡有關(guān)?
解(1)由表中的數(shù)據(jù)可知,:=1+2+?+1+5=3,
—120+105+100+95+80
y=-----------:-----------------=100,
□
£必必一5xy
1410—1500
所以8=------------------―55-45-
匯4一5x
/=!
故a=7-//7=100—(-9)X3=127,
所以所求的經(jīng)驗回歸方程為尸一9刀+127;
令x=10,則尸一9X10+127=37.
(2)零假設(shè)為屈“禮讓行人”行為與駕齡無關(guān),
由表中的數(shù)據(jù)可得
70X24X14-16X16214
x2=------------------------=一
40X30X40X3045
^0.311<2.706=Ab.i,
根據(jù)小概率值。=0.1的獨立性檢驗,沒有充分證據(jù)推斷〃不成立,因此可以認(rèn)為4成立,
即依據(jù)小概率值。=0.1的獨立性檢驗,不能判斷“禮讓行人”行為與駕齡有關(guān).
10.現(xiàn)代物流成為繼勞動力、自然資源外影響企業(yè)生產(chǎn)成本及利潤的重要因素.某企業(yè)去年
前八個月的物流成本和企業(yè)利潤的數(shù)據(jù)(單位:萬元)如表所示:
月份12345678
物流成本X8383.58086.58984.57986.5
利潤y114116106122132114m132
殘差e二%一切0.20.61.8-3-1—4.6-1
根據(jù)最小二乘法估計公式求得經(jīng)驗回歸方程為尸3.2x-151.8.
(1)求加的值,并利用己知的經(jīng)驗回歸方程求出8月份對應(yīng)的殘差值爾
(2)請先求出一元線性回歸模型y=3.2x—151.8的決定系數(shù)〃(精確到0.0001);若根據(jù)非線
性回歸模型y=267.761nz-1069.2求得解釋變量(物流成本)對于響應(yīng)變量(利潤)的決定系
數(shù)席=0.9057,請說明以上兩種模型哪種模型擬合效果更好?
(3)通過殘差分析,懷疑殘差絕對值最大的那組數(shù)據(jù)有誤,經(jīng)再次核實后發(fā)現(xiàn)其真正利潤應(yīng)該
為116萬元.請重新根據(jù)最小二乘法的思想與公式,求日新的經(jīng)驗回歸方程.
附(修正前的參考數(shù)據(jù)):£第凹=78880,
Z舅=56528,x=84,"=904.
解(1)因為y—3.2*—151.8,x-84,
所以7=3.2X84-151.8=117,
114+116+106+122+132+114+/H-132
=117X8,
解得/戶10(),
所以8月份對應(yīng)的殘差值
③=132—3.2X86.5+151.8=7.
(2)由已知公式得8(匕一%)2=022+0.62+1.82+(-3)2+(-1)2+(-4.6)2+(-1)2+72=
/=!
84.8,
!y-y>~
_/=,84.8,,
『=1一------=—=1——^0.9062〉芯,
,8y2904
所以一元線性回歸模型y=3.2X-151.8擬合效果更好.
(3)第八組數(shù)據(jù)的利潤應(yīng)為116萬元,
此時1>沙=78880-86.5X16=77496,
8__
又£片=56528,x=84,
y=117--=115,
o
8xy
-7=1
所以0:--------------
gW—8x2
/=i
77496—8X84X115-
56528-8X842=z'7,
a=115—2.7X84=—111.8,所以重新采集數(shù)據(jù)后,經(jīng)驗回歸方程為尸2.7x—111.8.
立技能提升練
11.某中學(xué)調(diào)查了高一年級學(xué)生的選科傾向,隨機(jī)抽取300人,其中選考物理的有22。人,
選考?xì)v史的有80人,統(tǒng)計各選科人數(shù)如表,則下列說法正確的是()
選擇科目
思想政治地理化學(xué)生物
選考類別
物理類80100145115
歷史類50453035
a0.100.050.0250.0100.0050.001
Xa2.7063.8415.0246.6357.87910.828
A.物理類的學(xué)生中選擇政治的比例比歷史類的學(xué)生中選擇政治的比例高
B.物理類的學(xué)生中選擇地理的比例比歷史類的學(xué)生中選擇地理的比例高
C.根據(jù)小概率值。=0.1的獨立性檢驗,我們認(rèn)為選擇生物與選考類別無關(guān)
D.根據(jù)小概率值。=0.1的獨立性檢驗,我們認(rèn)為選擇生物與選考類別有關(guān)
答案C
解析對丁A,物理類的學(xué)生中選擇政治的比例為黑=1,
歷史類的學(xué)生中選擇政治的比例為u=l,
舄5
因8-故選項A不正確;
對于B,物理類的學(xué)生中選擇地理的比例為
1005
礪=TT
歷史類的學(xué)生中選擇地理的比例為4S就=七Q
oU10
因為(■〈卷,故選項B不正確;
對于C和D,零假設(shè)為及:選擇生物與選考類別無關(guān).
根據(jù)已知數(shù)據(jù)可得2X2列聯(lián)表如表:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 地下停車場安全導(dǎo)向系統(tǒng)設(shè)計標(biāo)準(zhǔn)
- 行政部門年度工作目標(biāo)與任務(wù)分解
- 中考數(shù)學(xué)幾何題解題技巧總結(jié)
- 中小學(xué)語文課后輔導(dǎo)方案設(shè)計
- 小學(xué)楷體字帖練習(xí)指導(dǎo)方案
- 公司員工健身活動組織實施方案范例
- 2025上海市同濟(jì)口腔醫(yī)院(同濟(jì)大學(xué)附屬口腔醫(yī)院)實驗技術(shù)員招聘1人備考題庫及1套完整答案詳解
- 2026新疆天潤唐王城乳品有限公司招聘6人備考題庫完整參考答案詳解
- 家具行業(yè)廢水治理環(huán)保實施方案
- 機(jī)械現(xiàn)場技術(shù)服務(wù)方案設(shè)計實例
- TOC基本課程講義學(xué)員版-王仕斌
- T-GDWCA 0035-2018 HDMI 連接線標(biāo)準(zhǔn)規(guī)范
- 面板堆石壩面板滑模結(jié)構(gòu)設(shè)計
- 初中語文新課程標(biāo)準(zhǔn)與解讀課件
- 無人機(jī)裝調(diào)檢修工培訓(xùn)計劃及大綱
- 中建通風(fēng)與空調(diào)施工方案
- 高考語言運用題型之長短句變換 學(xué)案(含答案)
- 春よ、來い(春天來了)高木綾子演奏長笛曲譜鋼琴伴奏
- ARJ21機(jī)型理論知識考試題庫(匯總版)
- 2023年婁底市建設(shè)系統(tǒng)事業(yè)單位招聘考試筆試模擬試題及答案解析
- GB/T 4623-2014環(huán)形混凝土電桿
評論
0/150
提交評論