統(tǒng)計案例(原卷版)_第1頁
統(tǒng)計案例(原卷版)_第2頁
統(tǒng)計案例(原卷版)_第3頁
統(tǒng)計案例(原卷版)_第4頁
統(tǒng)計案例(原卷版)_第5頁
已閱讀5頁,還剩33頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

專題52統(tǒng)計案例

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二:線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【考點預(yù)測】

知識點一、變量間的相關(guān)關(guān)系

1、變量之間的相關(guān)關(guān)系

當(dāng)自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關(guān)系叫相關(guān)關(guān)系.由于

相關(guān)關(guān)系的不確定性,在尋找變量之間相關(guān)關(guān)系的過程中,統(tǒng)計發(fā)揮著非常重要的作用.我們可以通過收

集大量的數(shù)據(jù),在對數(shù)據(jù)進(jìn)行統(tǒng)計分析的基礎(chǔ)上,發(fā)現(xiàn)其中的規(guī)律,對它們的關(guān)系作出判斷.

注意:相關(guān)關(guān)系與函數(shù)關(guān)系是不同的,相關(guān)關(guān)系是一種非確定的關(guān)系,函數(shù)關(guān)系是一種確定的關(guān)系,

而且函數(shù)關(guān)系是一種因果關(guān)系,但相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

2、散點圖

將樣本中的n個數(shù)據(jù)點(x,,%)(i=1,2,)描在平面直角坐標(biāo)系中,所得圖形叫做散點圖.根據(jù)散點圖

中點的分布可以直觀地判斷兩個變量之間的關(guān)系.

(1)如果散點圖中的點散布在從左下角到右上角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它

稱為正相關(guān),如圖(1)所小;

(2)如果散點圖中的點散布在從左上角到右下角的區(qū)域內(nèi),對于兩個變量的這種相關(guān)關(guān)系,我們將它

稱為負(fù)相關(guān),如圖(2)所不.

y

???????

,??

,*

o5;o

(1)(2)

3、相關(guān)系數(shù)

若相應(yīng)于變量X的取值X,,變量y的觀測值為y(1<i<ri),則變量x與y的相關(guān)系數(shù)

n__

E(X]-x)(%-y)^x^-nxy

?2L,通常用廠來衡量x與y之間的線性關(guān)系的強弱,r

唇廠孩唇:-方

的范圍為一.

(1)當(dāng)r>0時,表示兩個變量正相關(guān);當(dāng)廠<0時,表示兩個變量負(fù)相關(guān).

(2)W越接近1,表示兩個變量的線性相關(guān)性越強;H越接近0,表示兩個變量間幾乎不存在線性相

關(guān)關(guān)系.當(dāng)加=1時,所有數(shù)據(jù)點都在一條直線上.

(3)通常當(dāng)|廠|>0.75時,認(rèn)為兩個變量具有很強的線性相關(guān)關(guān)系.

知識點二、線性回歸

1、線性回歸

線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個變量之間的關(guān)系(相關(guān)關(guān)系)的方法.

對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(尤1,yi),(%2,J2),...,(X",y"),其回歸方程y=加+。的求法為

〃__“__

£-尤)(yt-v)£X:yt-nxy

b=^—^---------------------T--------------------

一彳了一屋

i=li=\

a=y-bx

其中,X=~txi,y=-tyi'(x,y)稱為樣本點的中心.

n/=in,=i

2、殘差分析

對于預(yù)報變量y,通過觀測得到的數(shù)據(jù)稱為觀測值y,通過回歸方程得到的y稱為預(yù)測值,觀測值減去

預(yù)測值等于殘差,自稱為相應(yīng)于點(七,y)的殘差,即有=殘差是隨機誤差的估計結(jié)果,通過對殘

差的分析可以判斷模型刻畫數(shù)據(jù)的效果以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分

析.

U)殘差圖

通過殘差分析,殘差點&,自)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,其中這樣

的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合適.

(2)通過殘差平方和。=£(?-%)2分析,如果殘差平方和越小,則說明選用的模型的擬合效果越好;

;=|

反之,不合適.

(3)相關(guān)指數(shù)

Z(y-y,-)2

用相關(guān)指數(shù)來刻畫回歸的效果,其計算公式是:R2=I--=1'".

Z(2)2

/=!

代越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.

知識點三、非線性回歸

解答非線性擬合問題,要先根據(jù)散點圖選擇合適的函數(shù)類型,設(shè)出回歸方程,通過換元將陌生的非線

性回歸方程化歸轉(zhuǎn)化為我們熟悉的線性回歸方程.

求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計算方法計算變換后的線性回歸方程系數(shù),還原

后即可求出非線性回歸方程,再利用回歸方程進(jìn)行預(yù)報預(yù)測,注意計算要細(xì)心,避免計算錯誤.

1、建立非線性回歸模型的基本步驟:

(1)確定研究對象,明確哪個是解釋變量,哪個是預(yù)報變量;

(2)畫出確定好的解釋變量和預(yù)報變量的散點圖,觀察它們之間的關(guān)系(是否存在非線性關(guān)系);

(3)由經(jīng)驗確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關(guān)系,一般選用反比例函數(shù)、二

次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、幕函數(shù)模型等);

(4)通過換元,將非線性回歸方程模型轉(zhuǎn)化為線性回歸方程模型;

(5)按照公式計算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;

(6)消去新元,得到非線性回歸方程;

(7)得出結(jié)果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.

知識點四、獨立性檢驗

1、分類變量和列聯(lián)表

(1)分類變量:

變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.

(2)列聯(lián)表:

①定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.

②2x2列聯(lián)表.

一般地,假設(shè)有兩個分類變量X和匕它們的取值分別為{xl,尤2}和{yl,y2],其樣本頻數(shù)列聯(lián)表(稱

為2x2列聯(lián)表)為

%為總計

%aba+b

x2Cdc+d

總計a+cb+da+b+c+d

從2x2列表中,依據(jù)‘二與工的值可直觀得出結(jié)論:兩個變量是否有關(guān)系.

a+bc+d

2、等高條形圖

(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用等高條形圖表示

列聯(lián)表數(shù)據(jù)的頻率特征.

(2)觀察等高條形圖發(fā)現(xiàn),二與上相差很大,就判斷兩個分類變量之間有關(guān)系.

a+bc+d

3、獨立性檢驗

(1)定義:利用獨立性假設(shè)、隨機變量K2來確定是否有一定把握認(rèn)為“兩個分類變量有關(guān)系”的方法

稱為兩個分類變量的獨立性檢驗.

(2)公式:K2=---------------------------------,其中〃=a+O+c+d為樣本容量.

(a+b)(c+d)(a+c)(b+d)

(3)獨立性檢驗的具體步驟如下:

①計算隨機變量K?的觀測值%,查下表確定臨界值即:

2

P(K>k0)0.50.400.250.150.100.050.0250.0100.0050.001

k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828

②如果左2%,就推斷“x與y有關(guān)系”,這種推斷犯錯誤的概率不超過/(片?%);否則,就認(rèn)為在犯

錯誤的概率不超過°(片?片)的前提下不能推斷“乂與/有關(guān)系”.

(2)兩個分類變量X和y是否有關(guān)系的判斷標(biāo)準(zhǔn):

統(tǒng)計學(xué)研究表明:

當(dāng)Q43.841時,認(rèn)為X與Y無關(guān);

當(dāng)3.841時,有95%的把握說X與Y有關(guān);

當(dāng)片>6.635時,有99%的把握說X與/有關(guān);

當(dāng)片>10.828時,有99.9%的把握說X與¥有關(guān).

【方法技巧與總結(jié)】

常見的非線性回歸模型

(1)指數(shù)函數(shù)型〉=。優(yōu)(。>0且awl,c>0)

兩邊取自然對數(shù),Iny=In[cax),即Iny=lnc+xlna,

令[y,'=lny,原方程變?yōu)閥=lnc+尤'Ina,然后按線性回歸模型求出In。,Inc.

[x=X

(2)對數(shù)函數(shù)型y=+a

令=y,原方程變?yōu)閥'=bx'+a,然后按線性回歸模型求出6,a.

[x=Inx

(3)塞函數(shù)型y=ax〃

兩邊取常用對數(shù),lgy=lg(ax〃),即lgy=mgx+lga,

令,原方程變?yōu)閥'=nr'+lga,然后按線性回歸模型求出”,Iga.

[x=Igx

(4)二次函數(shù)型y=區(qū)2+。

令:,原方程變?yōu)閥'=6x'+a,然后按線性回歸模型求出6,?.

[X=X

(5)反比例函數(shù)型y=a+9型

y'=y

令,1,原方程變?yōu)閥'=6x'+“,然后按線性回歸模型求出6,a.

X=—

、X

【題型歸納目錄】

題型一:變量間的相關(guān)關(guān)系

題型二:線性回歸

題型三:非線性回歸

題型四:獨立性檢驗

題型五:誤差分析

【典例例題】

題型一:變量間的相關(guān)關(guān)系

例1.(2022?上海嘉定?高三階段練習(xí))通過抽樣調(diào)研發(fā)現(xiàn),當(dāng)?shù)氐谌径鹊尼t(yī)院心腦血管疾病的人數(shù)和便利

店購買冷飲的人數(shù)的相關(guān)系數(shù)很高,甲認(rèn)為這是巧合,兩者其實沒有關(guān)系:乙認(rèn)為冷飲的某種攝入成分導(dǎo)

致了疾??;丙認(rèn)為病人對冷飲會有特別需求:丁認(rèn)為兩者的相關(guān)關(guān)系是存在的,但不能視為因果,請判斷

哪位成員的意見最可能成立()

A.甲B.乙C.丙D.丁

例2.(2022?四川?成都七中高三階段練習(xí)(理))某統(tǒng)計部門對四組數(shù)據(jù)進(jìn)行統(tǒng)計分析后,獲得如圖所示的

散點圖.

35

30

25

20

15

10

5

V5101520253035

相關(guān)系數(shù)為八

35f-----------------------------

30-.

25-

20-

15-.,

io-.?

5-J*,

5101520253035

相關(guān)系數(shù)為「3相關(guān)系數(shù)為&

下面關(guān)于相關(guān)系數(shù)的比較,正確的是)

A.B.r2<r^<rx<r3C.D.

例3.(2022?上海交大附中高三階段練習(xí))某沙漠地區(qū)經(jīng)過治理,生態(tài)系統(tǒng)得到很大改善,野生動物數(shù)量有

所增加.為調(diào)查該地區(qū)某種野生動物的數(shù)量,將其分成面積相近的200個地塊,從這些地塊中用簡單隨機抽

樣的方法抽取20個作為樣區(qū),調(diào)查得到樣本數(shù)據(jù)(4%)?=1,2,…,20),其中天和力分別表示第,個樣區(qū)的

2020

植物覆蓋面積(單位:公頃)和這種野生動物的數(shù)量(單位:頭),并計算得£七=60,2%=1200,

Z=1Z=1

20_220_20

=80,X(X-y)2=9000,£卜廠尤)(%->)=800.

z=li=\i=l

(1)估計該地區(qū)這種野生動物的數(shù)量;

⑵求樣本(%,%)?=1,2,…,20)的相關(guān)系數(shù).(精確到0.01)

變式1.(2022?陜西?寶雞市陳倉高級中學(xué)高三開學(xué)考試(理))對兩個變量無,y進(jìn)行線性相關(guān)檢驗,得線性

相關(guān)系數(shù)〃=0.8995,對兩個變量a,v進(jìn)行線性相關(guān)檢驗,得線性相關(guān)系數(shù)-0.9568,則下列判斷正確

的是()

A.變量x與y正相關(guān),變量“與v負(fù)相關(guān),變量尤與y的線性相關(guān)性較強

B.變量x與y負(fù)相關(guān),變量〃與v正相關(guān),變量x與y的線性相關(guān)性較強

C.變量x與y正相關(guān),變量〃與v負(fù)相關(guān),變量〃與v的線性相關(guān)性較強

D.變量尤與y負(fù)相關(guān),變量"與v正相關(guān),變量"與v的線性相關(guān)性較強

變式2.(2022?全國?高三專題練習(xí))甲、乙、丙、丁四位同學(xué)各自對兩變量的線性相關(guān)性做試驗,分別求

得樣本相關(guān)系數(shù)/,如下表:

甲乙丙T

r0.20-0.95-0.120.85

則試驗結(jié)果中蒼丁兩變量有更強線性相關(guān)性的是()

A.甲B.乙C.丙D.丁

變式3.(2022.江蘇.南京市第一中學(xué)高三階段練習(xí))某網(wǎng)絡(luò)電視劇已開播一段時間,其每日播放量有如下統(tǒng)

計表:

開播天數(shù)X(單

12345

位:天)

當(dāng)天播放量y

335910

(單位:百萬

次)

(1)請用線性回歸模型擬合y與x的關(guān)系,并用相關(guān)系數(shù)加以說明;

(2)假設(shè)開播后的兩周內(nèi)(除前5天),當(dāng)天播放量y與開播天數(shù)尤服從(1)中的線性關(guān)系.若每百萬播放量

可為制作方帶來0.7萬元的收益,且每開播一天需支出1萬元的廣告費,估計制作方在該劇開播兩周內(nèi)獲得

的利潤.

參考公式:/,石二口七------------,a=y-bx.

歸x"歸y"自…

555_____

參考數(shù)據(jù):^xiyi=110,2%;=55,=224,7110-10.5.

i=li=li=l

注:①一般地,相關(guān)系數(shù)r的絕對值在0.95以上(含0.95)認(rèn)為線性相關(guān)性較強;否則,線性相關(guān)性較弱.

②利潤=收益一廣告費.

題型二:線性回歸

例4.(2022.重慶南開中學(xué)高三階段練習(xí))重慶位于北半球亞熱帶內(nèi)陸地區(qū),其氣候特征恰如幾句俗諺:春

早氣溫不穩(wěn)定,夏長酷熱多伏旱,秋涼綿綿陰雨天,冬暖少雪云霧多.尤其是10月份,晝夜溫差很大,某

數(shù)學(xué)興趣小組欲研究晝夜溫差大小與患感冒人數(shù)多少之間的關(guān)系,他們分別到氣象局與某醫(yī)院抄錄了2021

年10月某六天的晝夜溫差情況與因患感冒而就診的人數(shù),得到如下資料:

日期第一日第三日第五日第四日第二日第六日

晝夜溫差X(℃)47891214

就診人數(shù)y(個)%%%%)6

66_2

其中:%eN*,i=\,2,3,4,5,6,參考數(shù)據(jù):=2658,=258,7258?16.

i=li=l'

(D根據(jù)散點圖可以認(rèn)為x與y之間存在線性相關(guān)關(guān)系,且相關(guān)系數(shù)r=三,請用最小二乘法求出線性回歸

方程y=6x+a(?,b用分?jǐn)?shù)表示);

(2)分析數(shù)據(jù)發(fā)現(xiàn):第六日就診人數(shù)%=3。,第一日就診患者中有3個小孩,其他患者全是大人,現(xiàn)隨機的

Q

從第一日所有就診患者中選出2人,若2人中至少有一個小孩的概率為二;

①求%的值;

②若%<%<%<為,求%,為,>4,%的值(只寫結(jié)果,不要求過程).

2(%-磯%

(參考公式:J————a=y-b'X,

Z")

i=\

例5.(2022?全國?高三專題練習(xí))已知龍,丁的取值如表:

X0134

ya4.34.86.7

若X,y具有線性相關(guān)關(guān)系,且回歸方程為9=0.95x+2.6,則。=

例6.(2022?河北衡水?高三階段練習(xí))已知一組樣本數(shù)據(jù)(多,yj,(々,坊),…,(%,%)"22,占,巧,...,

乙不相等),若這組數(shù)據(jù)的樣本相關(guān)系數(shù)為T,則在這組樣本數(shù)據(jù)的散點圖中,所有樣本點(4》)(1=1,

2,〃)所在的曲線可能是()

A.y=-2x+3B.y=x+3C.y=-x1+3D.y=?+3

變式4.(2022?全國?高三專題練習(xí)(文))給出下列說法:①回歸直線夕=嬴+&恒過樣本點的中心丘,7),

且至少過一個樣本點;②兩個變量相關(guān)性越強,則相關(guān)系數(shù)⑺就越接近1;③將一組數(shù)據(jù)的每個數(shù)據(jù)都加

一個相同的常數(shù)后,方差不變;④在回歸直線方程3=2-0.5x中,當(dāng)解釋變量x增加一個單位時,預(yù)報變量

亍平均減少0.5個單位.其中說法正確的是()

A.①②④B.②③④C.①③④D.②④

變式5.(2022?全國?高三專題練習(xí))對于數(shù)據(jù)組(專切[=1,2,3,...,“),如果由線性回歸方程得到的對應(yīng)于自

變量者的估計值是力,那么將稱為相應(yīng)于點(乙,%)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量無(噸)與

所需某種原材料丫噸)的相關(guān)性,在生產(chǎn)過程中收集4組對應(yīng)數(shù)據(jù)(x,y)如下表所示:

X3456

y2.534m

根據(jù)表中數(shù)據(jù),得出,關(guān)于x的線性回歸方程為y=0.7x+〃,據(jù)此計算出樣本點(4,3)處的殘差為一0.15,

則表中m的值為()

A.3.3B.4.5C.5D.5.5

變式6.(2022.全國?高三專題練習(xí))已知兩個變量工和,之間有線性相關(guān)關(guān)系,經(jīng)調(diào)查得到如下樣本數(shù)據(jù),

X34567

y3.52.41.1-0.2-1.3

根據(jù)表格中的數(shù)據(jù)求得同歸方程亍=%+&,則下列說法正確的是()

A.a>0,b>0B.a>0,b<0

C.a<0,b>0D.a<0,b<0

變式7.(2022.全國?高三專題練習(xí))為研究某種細(xì)菌在特定環(huán)境下,隨時間變化的繁殖情況,得到如下實驗

數(shù)據(jù):

天數(shù)X(天)3456

繁殖個數(shù)y(千個)2.5344.5

由最小二乘法得>與x的線性回歸方程為3=0.7x+&,則當(dāng)x=7時,繁殖個數(shù)》的預(yù)測值為()

A.4.9B.5.25

C.5.95D.6.15

變式8.(2022?北京師大附中高三階段練習(xí)(文))為了規(guī)定工時定額,需要確定加工某種零件所需的時間,

為此進(jìn)行了5次試驗,得到5組數(shù)據(jù):(工,%),(孫力),(毛,%),(%,%),(%,%),由最小二乘法求得回歸直線

方程為y=0.67x+54.9.若己知占+々+%+%+%=15°,則%+%+%+%+%=

A.75B.155.4C.375D.466.2

變式9.(2022?廣東?順德一中高三階段練習(xí))據(jù)一組樣本數(shù)據(jù)(%,%),(々,為),…,(%,%),求得經(jīng)驗回歸

方程為a=L5x+0.5,且;=3.現(xiàn)發(fā)現(xiàn)這組樣本數(shù)據(jù)中有兩個樣本點(122.2)和(4.8,7.8)誤差較大,去除后

重新求得的經(jīng)驗回歸直線/的斜率為1.2,則()

A.去除兩個誤差較大的樣本點后,丁的估計值增加速度變快

B.去除兩個誤差較大的樣本點后,重新求得的回歸方程一定過點(3,4)

C.去除兩個誤差較大的樣本點后,重新求得的回歸方程為a=L2x+L4

D.去除兩個誤差較大的樣本點后,相應(yīng)于樣本點(2,3.75)的殘差為0.05

變式10.(2022.全國?高三專題練習(xí))新冠肺炎疫情發(fā)生以來,中醫(yī)藥全面參與疫情防控救治,做出了重要

貢獻(xiàn).某中醫(yī)藥企業(yè)根據(jù)市場調(diào)研與模擬,得到研發(fā)投入億元)與產(chǎn)品收益y(億元)的數(shù)據(jù)統(tǒng)計如下:

研發(fā)投入X(億元)12345

產(chǎn)品收益y(億元)3791011

(1)計算X,y的相關(guān)系數(shù)r,并判斷是否可以認(rèn)為研發(fā)投入與產(chǎn)品收益具有較高的線性相關(guān)程度?(若

0.3<|r|<0.75,則線性相關(guān)程度一般,若|川>0.75,則線性相關(guān)程度較高)

(2)求出y關(guān)于x的線性回歸方程,并預(yù)測研發(fā)投入20(億元)時產(chǎn)品的收益.

555

2

參考數(shù)據(jù):£(尤,-可2=10,E(x-y)=4o,^(x,-x)(z-y)=i9.

z=li=li=l

附:相關(guān)系數(shù)公式:r=「,回歸直線方程的斜率A=J-----------------,截距

Vi=lVz=li-l

d=y-bx.

變式11.(2022.全國?模擬預(yù)測(文))2020年,國慶“遇上”中秋,中國人把這個“超長黃金周”過出了年味.

假期期間,全國各大旅游景點、車站、機場人頭攢動的景象也吸引了世界的目光.外國媒體、專家和網(wǎng)友“實

名羨慕”,這一派熱鬧景象證明了抗疫的成功,也展示了中國經(jīng)濟復(fù)蘇的勁頭.抗疫的成功離不開國家強大的

醫(yī)療衛(wèi)生體系,下表是某省2013年至2019年醫(yī)療衛(wèi)生機構(gòu)數(shù)》(單位:萬個):

年份2013201420152016201720182019

年份代號,1234567

醫(yī)療衛(wèi)生機構(gòu)數(shù)y4.24.34.54.74.84.84.9

(1)求y關(guān)于f的線性回歸方程、=命+&(a,3保留兩位小數(shù));

(2)規(guī)定若某年的實際醫(yī)療衛(wèi)生機構(gòu)數(shù)與估計值的差的絕對值不超過500個,則稱該年是“吻合”年.利用(1)

的結(jié)果,假設(shè)2020年該省醫(yī)療衛(wèi)生機構(gòu)數(shù)的估計值為實際值,現(xiàn)從2013年至2020年這8年中任選3年,

其中“吻合,,年的個數(shù)為X,求X的分布列與數(shù)學(xué)期望.

7

參考數(shù)據(jù):工4%=1322,7=4.6.

Z=1

參考公式:線性回歸方程y=中斜率和截距的最小二乘估計公式分別為:b=「----------,

Ef=l"

a=y—bt.

變式12.(2022?全國?高三專題練習(xí))在我國抗疫期間,素有“南抖音,北快手”之說的小視頻除了給人們帶

來生活中的快樂外,更在于傳遞了一種正能量,為抗疫起到了積極的作用,但一個優(yōu)秀的作品除了需要有

很好的素材外,更要有制作上的技術(shù)要求,某同學(xué)學(xué)習(xí)利用“快影”軟件將已拍攝的素材進(jìn)行制作,每次制作

分三個環(huán)節(jié)來進(jìn)行,其中每個環(huán)節(jié)制作合格的概率分別為3:,三4,:2,只有當(dāng)每個環(huán)節(jié)制作都合格才認(rèn)為一

453

次成功制作,該小視頻視為合格作品.

(1)求該同學(xué)進(jìn)行3次制作,恰有一次合格作品的概率;

(2)若該同學(xué)制作10次,其中合格作品數(shù)為X,求X的數(shù)學(xué)期望與方差;

(3)該同學(xué)掌握技術(shù)后制作的小視頻被某廣告公司看中,聘其為公司做廣告宣傳,決定試用一段時間,每

天制作小視頻(注:每天可提供素材制作個數(shù)至多40個),其中前7天制作合格作品數(shù)》與時間f如下表:(第

f天用數(shù)字t表示)

時間(,)1234567

合格作品數(shù)(V)3434768

其中合格作品數(shù)(V)與時間")具有線性相關(guān)關(guān)系,求,關(guān)于「的線性回歸方程(精確到0.01),并估算第14天

能制作多少個合格作品(四舍五入取整)?

.£占%一“

(參考公式》=號------=上———7^,6=3-威,參考數(shù)據(jù):1^=163.)

七年-wx-一;=1

z=li=\

題型三:非線性回歸

例7.(2022.廣東.順德一中高三階段練習(xí))在國家大力發(fā)展新能源汽車產(chǎn)業(yè)的政策下,我國新能源汽車的產(chǎn)

銷量高速增長.已知某地區(qū)2014年底到2021年底新能源汽車保有量的數(shù)據(jù)統(tǒng)計表如下:

年份(年)20142015201620172018201920202021

年份代碼X12345678

保有量W千輛1.952.924.386.589.8715.0022.5033.70

888

參考數(shù)據(jù):9=12.1]=2.1,£x;=204,=613.7,£必=92.4,,其中

z=li=lf=l

J=Iny,1g2P0.30,lg3?0.48,1gee0.43.

人力千輛

35

30

25

20

15

10

5

O12345678

(1)根據(jù)統(tǒng)計表中的數(shù)據(jù)畫出散點圖(如圖),請判斷9=&與5;=e&+<5哪一個更適合作為y關(guān)于x的經(jīng)驗

回歸方程(給出判斷即可,不必說明理由),并根據(jù)你的判斷結(jié)果建立y關(guān)于龍的經(jīng)驗回歸方程:

(2)假設(shè)每年新能源汽車保有量按(1)中求得的函數(shù)模型增長,且傳統(tǒng)能源汽車保有量每年下降的百分比相

同.若2021年底該地區(qū)傳統(tǒng)能源汽車保有量為500千輛,預(yù)計到2026年底傳統(tǒng)能源汽車保有量將下降10%.

試估計到哪一年底新能源汽車保有量將超過傳統(tǒng)能源汽車保有量.

參考公式:對于一組數(shù)據(jù)(%,V/),(%,嶺),…,(""M),其經(jīng)驗回歸直線£=/"+&的斜率和截距的最小

Z(M;-M)(v;-V)Zujvi-nu-V

二乘估計公式分別為B=上匕--------=%---------,a=v-^u-,;

22

Z(w;-M)工uf-nu

1=1i=l

例8.(2022?全國?高三專題練習(xí))2020年的“金九銀十”變成“銅九鐵十”,全國各地房價“跳水”嚴(yán)重,但某地

二手房交易卻“逆市”而行.下圖是該地某小區(qū)2019年11月至2020年H月間,當(dāng)月在售二手房均價(單位:

萬元/平方米)的散點圖.(圖中月份代碼1至13分別對應(yīng)2019年H月至2020年11月)()

A當(dāng)月在手二手房

L°4-均儕....

1.02-???*

1.00-??

0.98-?*

0.96-

?

0.94-

°12345678910111213月份代碼x

根據(jù)散點圖選擇、=。+6?和'=。+〃111萬兩個模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到的兩個回歸方程分別為

y=0.9369+0.0285石和y=0.9554+0.0306Inx,并得到以下一些統(tǒng)計量的值:

)=0.9369+0.0285&y=0.9554+0.03061nx

R20.9230.973

注:£是樣本數(shù)據(jù)中關(guān)的平均數(shù),亍是樣本數(shù)據(jù)中了的平均數(shù),則于列說法不一定成立的是()

A.當(dāng)月在售二手房均價y與月份代碼x呈正相關(guān)關(guān)系

B.根據(jù)>=0.9369+0.02856可以預(yù)測2021年2月在售二手房均價約為1.0509萬元/平方米

C.曲線y=0.9369+0.02854與y=0.9554+0.0306Inx的圖形經(jīng)過點(x,y)

D.y=0.9554+0.0306Inx回歸曲線的擬合效果好于_y=0.9369+0.0285Vx

例9.(2022?全國?高三專題練習(xí))一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān),現(xiàn)收集了6組觀測數(shù)據(jù),y(單位:

個)與溫度x(單位:℃)得到樣本數(shù)據(jù)(8%)(i=l,2,3,4,5,6),令z,=ln/,并將(4馬)繪制成

如圖所示的散點圖.若用方程y=ae"對y與x的關(guān)系進(jìn)行擬合,則()

z八

4■

3-??

2-?,,

1-,

——I——I——I——I——I——I-

20212223242526x

A.a>l,b>0B.a>l,b<0

C.Ovavl,b>0D.0<a<l,b<0

變式13.(2022?全國?高三專題練習(xí))用模型y=a*M(a>0)擬合一組數(shù)據(jù)時,令z=lny,將其變換后得到

h

回歸直線方程z=2x+a,則一=()

a

A.eB.—C.—D.2

e2

變式14.(2022?全國?高三專題練習(xí))在一組樣本數(shù)據(jù)(4丹),(巧,%),匕,(天,為)的散點圖中,若所有

7

樣本點(4%)(,=1,2,L,7)都在曲線y=aln(%-1895)+12.15附近波動,經(jīng)計算T895)=210.77,

z=i

77

=73.50,^ln(x,.-1895)=23.10,則實數(shù)。=()

Z=1Z=1

A.一0.5B.0.5C.-iD.1

變式15.(2022?全國?高三專題練習(xí))如圖是一組實驗數(shù)據(jù)構(gòu)成的散點圖,以下函數(shù)中適合作為》與無的回

歸方程的類型是()

2x

A.y=ax+bB.y=ax+cc.y=b\ogax+cD.y=ba+c

變式16.(2022?全國?高三專題練習(xí))如圖是一組實驗數(shù)據(jù)構(gòu)成的散點圖,以下函數(shù)中適合作為丫與x的回

歸方程的類型是()

?

x

x

A.y=ax+bB.y=ax"+cC.y=b\ogax+cD.y=ba+c

變式17.(多選題)(2022?全國?高三專題練習(xí))在對具有相關(guān)關(guān)系的兩個變量進(jìn)行回歸分析時,若兩個變量

不呈線性相關(guān)關(guān)系,可以建立含兩個待定參數(shù)的非線性模型,并引入中間變量將其轉(zhuǎn)化為線性關(guān)系,再利

用最小二乘法進(jìn)行線性回歸分析.下列選項為四個同學(xué)根據(jù)自己所得數(shù)據(jù)的散點圖建立的非線性模型,且散

點圖的樣本點均位于第一象限,則其中可以根據(jù)上述方法進(jìn)行回歸分析的模型有()

A.y-cxx+c2x

C.y=q+ln(x+c2)

變式18.(2022?全國?高三專題練習(xí))我國為全面建設(shè)社會主義現(xiàn)代化國家,制定了從2021年到2025年的“十

四五”規(guī)劃.某企業(yè)為響應(yīng)國家號召,匯聚科研力量,加強科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金.現(xiàn)該企業(yè)為了了

解年研發(fā)資金投入額x(單位:億元)對年盈利額》(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)

劃發(fā)展期間近10年年研發(fā)資金投入額占和年盈利額%的數(shù)據(jù).通過對比分析,建立了兩個函數(shù)模型:①

y=a+歐;②y=其中a、夕、彳、t均為常數(shù),e為自然對數(shù)的底數(shù).令%=X;,”=In%G=1,2,…,10),

經(jīng)計算得如下數(shù)據(jù):

1010

XS(x-y)2u

Z=1Z=1

26215652680

10°101010

£(x,.-x)(v,.-v)

V力%-7)ZU-7)2

?=1Z=1i=li=\

5.36112501302.612

(1)請從相關(guān)系數(shù)的角度,分析哪一個模型擬合程度更好?

(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于尤的回歸方程;(系數(shù)精確到o.oi)

(3)若希望2021年盈利額y為250億元,請預(yù)測2021年的研發(fā)資金投入額了為多少億元.(結(jié)果精確到0.01)

變式19.(2022.全國?高三專題練習(xí))在疫情防控常態(tài)化的背景下,山東省政府各部門在保安全,保穩(wěn)定的

前提下有序恢復(fù)生產(chǎn),生活和工作秩序,五一期間,文旅部門在落實防控舉措的同時,推出了多款套票文

旅產(chǎn)品,得到消費者的積極回應(yīng).下面是文旅部門在某地區(qū)推出六款不同價位的旅游套票,每款的套票價

格x(單位:元)與購買人數(shù)y(單位:萬人)的數(shù)據(jù)如下表:

旅游類別城市展館科技游鄉(xiāng)村特色游齊魯紅色游登山套票游園套票觀海套票

套票價格X(元)394958677786

購買數(shù)量y(萬人)16.718.720.622.524.125.6

在分析數(shù)據(jù)、描點繪圖中,發(fā)現(xiàn)散點(匕,①集中在一條直線附近,其中”=1叫,co,.=lny;

6666

附:①可能用到的數(shù)據(jù):?>叫=753£匕=246?>產(chǎn)1832>;=101.4.

i=\i=\i=\z=l

②對于一組數(shù)據(jù)(匕,sj,?,①2),…,3,3”),其回歸直線質(zhì)=加+<5的斜率和截距的最小二乘估計值分別

£vimi-rivm

^b=—..................,a=m-bv

”-怖2

,=i

(1)根據(jù)所給數(shù)據(jù),求y關(guān)于龍的回歸方程;

ee

(2)按照文旅部門的指標(biāo)測定,當(dāng)購買數(shù)量y與套票價格x的比在區(qū)間-,-上時,該套票受消費者的歡迎

程度更高,可以被認(rèn)定為“熱門套票”,現(xiàn)有三位同學(xué)從以上六款旅游套票中,購買不同的三款各自旅游.記

三人中購買“熱門套票”的人數(shù)為X,求隨機變量X的分布列和期望.

變式20.(2022.全國?高三專題練習(xí))數(shù)據(jù)顯示,中國在線直播用戶規(guī)模及在線直播購物規(guī)模近幾年都保持

高速增長態(tài)勢,下表為2017—2021年中國在線直播用戶規(guī)模(單位:億人),其中2017年—2021年對應(yīng)的

代碼依次為1—5.

年份代碼尤12345

市場規(guī)模y3.984.565.045.866.36

參考數(shù)據(jù):歹=5.16,V=1.68,^v,.y,.=45.10,其中匕=嘉.

1=1

參考公式:對于一組數(shù)據(jù)(qyj,(v2,%),…,(匕,%),其回歸直線5=加+力的斜率和截距的最小二乘

2匕%一〃藥

估計公式分別為3=嚀--------,a=y-bv.

2—2

匕一次

Zz=i

(1)由上表數(shù)據(jù)可知,可用函數(shù)模型9=+d擬合y與x的關(guān)系,請建立y關(guān)于x的回歸方程(6,g的值

精確到0.01);

(2)已知中國在線直播購物用戶選擇在品牌官方直播間購物的概率為p,現(xiàn)從中國在線直播購物用戶中隨機抽

取4人,記這4人中選擇在品牌官方直播間購物的人數(shù)為X,若P(X=3)=尸(X=4),求X的分布列與期

望.

變式21.(2022?湖南.長沙市明德中學(xué)高三開學(xué)考試)近期國內(nèi)疫情反復(fù),對我們的學(xué)習(xí)生活以及對各個行

業(yè)影響都比較大,某房地產(chǎn)開發(fā)公司為了回籠資金,提升銷售業(yè)績,讓公司旗下的某個樓盤統(tǒng)一推出了為

期10天的優(yōu)惠活動,負(fù)責(zé)人記錄了推出活動以后售樓部到訪客戶的情況,根據(jù)記錄第一天到訪了12人次,

第二天到訪了22人次,第三天到訪了42人次,第四天到訪了68人次,第五天到訪了132人次,第六天到

訪了202人次,第七天到訪了392人次,根據(jù)以上數(shù)據(jù),用x表示活動推出的天數(shù),y表示每天來訪的人次,

繪制了以下散點圖.

八川人次)

400

350

300

250

200

150

100

50

O

⑴請根據(jù)散點圖判斷,以下兩個函數(shù)模型y=a+法與y=(c,d均為大于零的常數(shù))哪一個適宜作為

人次y關(guān)于活動推出天數(shù)元的回歸方程類型?(給出判斷即可,不必說明理由);

(2)根據(jù)(1)的判斷結(jié)果及下表中的數(shù)據(jù),求y關(guān)于元的回歸方程,并預(yù)測活動推出第8天售樓部來訪的入

17

次,參考數(shù)據(jù):其中匕=lg、,v=-Xvz.

'z=l

7

£%匕084

V1O

Z=1

1.8458.556.9

八z七/一〃孫

線性回歸方程:§=》%+金,其中B=t---------丁,金=丁一令%.

2X;-

i=l

(3)己知此樓盤第一天共有10套房源進(jìn)行銷售,其中6套正價房,4套特價房,設(shè)第一天賣出的4套房中特

價房的數(shù)量為久求4的分布列與數(shù)學(xué)期望.

題型四:獨立性檢驗

例10.(2022?江蘇?南京市秦淮中學(xué)高三階段練習(xí))某校為引導(dǎo)學(xué)生學(xué)習(xí)黨史,校黨委宣傳組織了黨史知識

競賽,對前來參賽的150名學(xué)生(男生100人,女生50人),成績不低于80分的學(xué)生為“黨史達(dá)人”,成績

低于80分的學(xué)生為“非黨史達(dá)人”,統(tǒng)計了他們的成績情況,結(jié)果如下:男生中有60人被評為“黨史達(dá)人”,

女生中有40人被評為“黨史達(dá)人”.

(1)完善列聯(lián)表,并判斷:是否有99%的把握認(rèn)為黨史成績優(yōu)秀與否與性別有關(guān)?

性別

黨史達(dá)人非黨史達(dá)人

是否為黨史達(dá)人

男生

女生

(2)如果用這150名學(xué)生中,男生和女生“黨史達(dá)人”的頻率分別代替該校男生和女生被評為“黨史達(dá)人”的概

率,且每位學(xué)生是否被評為“黨史達(dá)人”相互獨立,現(xiàn)從該校學(xué)生中隨機抽取3人(2男1女),設(shè)隨機變量X

表示“3人中黨史達(dá)人”的人數(shù),試求X的分布列和數(shù)學(xué)期望.

n(ad-bc)2

附:K2=n=a+b+c+d

(a+/?)(c+d)(a+c)(6+d)'

P(K2>k]0.100.050.0250.010.005

k2.7063.8415.0246.6357.879

例11.(2022?四川?樹德中學(xué)高三階段練習(xí)(文))根據(jù)分類變量x與y的觀察數(shù)據(jù),計算得至1」片=2.974.依

據(jù)下面給出的臨界值表,

0.500.400.250.150.100.050.0250.0100.005

k00.4550.7081.3232.0722.7063.8415.0246.6357.879

可知下列判斷中正確的是()

A.有95%的把握認(rèn)為變量x與y獨立

B.有95%的把握認(rèn)為變量x與y不獨立

C.變量x與y獨立,這個結(jié)論犯錯誤的概率不超過10%

D.變量x與y不獨立,這個結(jié)論犯錯誤的概率不超過10%

例12.(2022?浙江省蒼南中學(xué)高三階段練習(xí))在新高考改革中,浙江省新高考實行的是7選3的3+3模式,

即語數(shù)外三門為必考科目,然后從物理、化學(xué)、生物、政治、歷史、地理、技術(shù)(含信息技術(shù)和通用技術(shù))

7門課中選考3門.某校高二學(xué)生選課情況如下列聯(lián)表一和列聯(lián)表二(單位:人)

選物理不選物理總計

男生340110450

女生140210350

總計480320800

表一

選生物不選生物總計

男生150300450

女生150200

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論