成對數(shù)據(jù)的統(tǒng)計相關(guān)性(原卷版)_第1頁
成對數(shù)據(jù)的統(tǒng)計相關(guān)性(原卷版)_第2頁
成對數(shù)據(jù)的統(tǒng)計相關(guān)性(原卷版)_第3頁
成對數(shù)據(jù)的統(tǒng)計相關(guān)性(原卷版)_第4頁
成對數(shù)據(jù)的統(tǒng)計相關(guān)性(原卷版)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

8.1成對數(shù)據(jù)的統(tǒng)計相關(guān)性

【知識點梳理】

1.相關(guān)關(guān)系

兩個變量間的關(guān)系有函數(shù)關(guān)系,相關(guān)關(guān)系和不相關(guān)關(guān)系

兩個變量有關(guān)系,但乂沒有確切到可由其中的一個去精確地決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.

2.止相關(guān)、負相關(guān)

從整體上看,當一個變量的值塢加時,另一個變量的相應(yīng)值乜呈現(xiàn)增加的趨勢,我們就稱這兩個變量止

相關(guān);如果一個變量值增加時,另一個變量的相應(yīng)值呈現(xiàn)減少的趨勢,則稱這個兩個變量負相關(guān).

3.線性相關(guān)

一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在一條線附近,我們就稱這兩個變量線

性相關(guān).

一般地,如果兩個變量具有相關(guān)性,但不是線性相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).

4.相關(guān)系數(shù)「的計算

注意:相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量

假設(shè)兩個隨機變量的數(shù)據(jù)分別為(乃,V),(K2,),2),…,(&,%),對數(shù)據(jù)作進一步的“標準化處理”處理,

用“=y三工(為一x)2,?=、(y—y)2分別除x和%—J(i=1,2,…,〃,工和1y分別為M,

X2,…,心和V,兒,…,%的均值),得£二,匕£|,k二C由二£|,…,L=,包二21,為簡單起

見,把上述“標準化”處理后的成對數(shù)據(jù)分別記為(即‘,巾),(X2%過),…,W,四),則變量X和變量),的樣

本相關(guān)系數(shù),?的計算公式如下:

一]?'V'+x2'”'+...+xJ/J)

g(x/—x)(y-y)

(1)當/>0時,稱成對樣本數(shù)據(jù)正相關(guān);當代0時,成對樣本數(shù)據(jù)負相關(guān):當r=0時,成對樣本數(shù)據(jù)間

沒有線性相關(guān)關(guān)系.

(2)樣本相關(guān)系數(shù)r的取值范圍為[-1,1].

當|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;

當IH越接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.

6.樣本相關(guān)系數(shù)與標準化數(shù)據(jù)向量夾角的關(guān)系

r=%y=,1WcosJ=cos。(其中7=(媒,W....xJ),V=(W,城),M|=W=/,。為向量

V和向量V的夾角).

【典型例題】

題型一相關(guān)關(guān)系的理解

例I.(2021.全國?高二課時練習(xí))下列兩個變量間的關(guān)系,是相關(guān)關(guān)系的是()

A.任意實數(shù)和它的平方B.圓半徑和圓的周長

C.正多邊形的邊數(shù)和內(nèi)角度數(shù)之和D.天空中的云量和下雨

規(guī)律方法函數(shù)關(guān)系是一種確定的關(guān)系,而相關(guān)關(guān)系是非隨機變量與隨機變量的關(guān)系.函數(shù)關(guān)系是一種

因果關(guān)系,而相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系.

例2.(2021?全國?高二課時練習(xí))有幾組變最:①汽車的重最和汽車每消耗1升汽油所行駛的平均路程;②

平均口學(xué)習(xí)時間和平均學(xué)習(xí)成績;③立方體的棱長和體積.其中兩個變量成正相關(guān)的是()

A.①@B.②③

C.②D.③

例3.(2021?江西南昌?高一期末)對兩變量間的關(guān)系,下列論述正確的是()

A.任何兩個變量都具有相關(guān)關(guān)系

B.正方形的面積與該正方形的邊長具有相關(guān)關(guān)系

C.農(nóng)作物的產(chǎn)量與施化肥量之間是一種確定性關(guān)系

D.一個學(xué)生的數(shù)學(xué)成績與物理成績之間是一種非確定性的關(guān)系

題型二散點圖與相關(guān)性

例4.(2021?全國?窗課時練習(xí))如下四個散點圖中,正相關(guān)的是()

規(guī)律方法判斷兩個變量X和間是否具有線性相關(guān)關(guān)系,常用的簡便方法就是繪制散點圖,如果發(fā)現(xiàn)點

的分布從整體上看大致在一條直線附近,那么這兩個變量就是線性相關(guān)的,注意不要受個別點的位置的影

響.

例5.(2020?全國?高二單元測試(理))有一個食品商店為了調(diào)查氣溫對熱飲銷售的影響,經(jīng)過調(diào)查得到關(guān)

于賣出的熱飲杯數(shù)與當天氣溫的數(shù)據(jù)如下表,繪出散點圖如下.通過計算,可以得到對應(yīng)的叵歸方程),=

-2.352x4-147.767,根據(jù)以上信息,判斷下列結(jié)論中正確的是()

7

80

60

40

20

00

80

60

40

20

A.氣溫與熱飲的銷售杯數(shù)之間成正相關(guān)

B.當天氣溫為2℃時,這天大約可以賣出143杯熱飲

C.當天氣溫為這天恰賣出124杯熱飲

D.由于x=0時,),的值與調(diào)查數(shù)據(jù)不符,故氣溫與賣出熱飲杯數(shù)不存在線性相關(guān)性

例6.(2020?云南?羅平縣第二中學(xué)高二期末(文))已知某次考試之后,班主任從全班同學(xué)中隨機抽取一個

容量為8的樣本,他們的數(shù)學(xué)、物理成績(單位:分)對應(yīng)如下表,對應(yīng)散點圖如圖所示:

學(xué)生編號17345678

數(shù)學(xué)成績6065707580859095

物理成績7277808488909395

物理成績/分

100

90

80.?

70?

60

501~?一一■一^-----------------------------

5060708090100數(shù)學(xué)成績/分

根據(jù)以上信息,則下列結(jié)論:

①根據(jù)散點圖,可以判斷數(shù)學(xué)成績與物理成績具有線性相關(guān)關(guān)系;

②根據(jù)散點圖,可以判斷數(shù)學(xué)成績與物理成績具有?次函數(shù)關(guān)系;

③從全班隨機抽取2名同學(xué)(記為甲、乙),若甲同學(xué)的數(shù)學(xué)成績?yōu)?0分,乙同學(xué)的數(shù)學(xué)成績?yōu)?0分,則

可以判斷出甲同學(xué)的物理成績一定比乙同學(xué)的物理成績高;

④從全班隨機抽取2名同學(xué)(記為甲、乙),若甲同學(xué)的數(shù)學(xué)成績?yōu)?0分,乙同學(xué)的數(shù)學(xué)成績?yōu)?0分,則

不能判斷出甲同學(xué)的物理成績一定比乙同學(xué)的物理成績高;

其中正確的個數(shù)是()

A.1B.2C.3D.4

題型三散點圖及其應(yīng)用

例7.(2021?全國?高二課時練習(xí))兩對變量A和叢C和。的取值分別對應(yīng)如表1和表2,畫出散點圖,分

別判斷它們是否具有相關(guān)關(guān)系;若具有相關(guān)關(guān)系,說出它們相關(guān)關(guān)系的M別.

表1

A261813104-1

B202434385064

表2

C05101520253035

D541.67602.66672.09704.99806.71908.59975.421034.75

規(guī)律方法1.畫散點圖時應(yīng)注意合理選擇單位長度,避免圖形過大或偏小,或者是點的坐標在坐標系中畫

不在,使圖形失真,導(dǎo)致得出錯誤結(jié)論.

2.在這里利用散點圖直觀感知事物的形態(tài)與變化,理解事物間的關(guān)聯(lián)及變化規(guī)律,是數(shù)學(xué)核心素養(yǎng)直觀

想象的具體體現(xiàn).

題型四線性相關(guān)性的檢驗

例8.(2021?全國?高二課時練習(xí))兩對變量A和8,。和。的取值分別對應(yīng)如表1和表2,畫出散點圖,分

別判斷它們是否具有相關(guān)關(guān)系:若具有相關(guān)關(guān)系,說出它們相關(guān)關(guān)系的區(qū)別.

表1

A261813104-1

B202434385064

表2

C05101520253035

D541.67602.66672.09704.99806.71908.59975.421034.75

例9.(2021?全國?高二課時練習(xí))某個男孩的年齡與身高的統(tǒng)計數(shù)據(jù)如下表所示.

年齡女(歲)123456

身高y(cm)788798108115120

(1)畫出散點圖:

(2)判斷),與x是否具有線性相關(guān)關(guān)系.

例10.(2021?江蘇?高二課時練習(xí))有人收集了某城市居民年收入(即所有居民在一年內(nèi)收入的總和)與A商

品銷售額的10年數(shù)據(jù),如表.

第〃年12345678910

居民年收入/億元32.231.132.935.837.138.039.043.044.646.0

A商品銷售額/萬元25.030.034.037.039.041.042.044.048.051.0

畫出散點圖,判斷成對樣本數(shù)據(jù)是否線性相關(guān),并通過樣本相關(guān)系數(shù)判斷居民年收入與A商品銷售額的相

關(guān)程度和變化趨勢的異同.

題型五判斷線性相關(guān)的強弱

例11.(2021.全國?高二課時練習(xí))某公司為了準確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進

行整理得到了第x年與年銷量)’(單位:萬件)之間的關(guān)系如表:

X1234

y12284256

在圖中畫出表中數(shù)據(jù)的散點圖,推斷兩個變量是否線性相關(guān),計算樣本相關(guān)系數(shù),并估計它們的相關(guān)程度.

,M萬件)

60?

50■

40

30■

20

10

31234x

附注:參考數(shù)據(jù):膠(』-方、32.6,6=2.24,1>戊=418.

V>=1注1

參考公式:相關(guān)系數(shù),=n----------------

規(guī)律方法當相關(guān)系數(shù)H越接近1時,兩個變量的相關(guān)關(guān)系越強,當相關(guān)系數(shù)”越接近。時.,兩個變量的

相關(guān)關(guān)系越弱.

例12.(2021?吉林吉林?三模(文))2020年是決勝全面建成小康社會、決戰(zhàn)脫貧攻堅之年,面對新冠肺炎疫

情和嚴重洪澇災(zāi)害的考驗.黨中央堅定如期完成脫貧攻堅目標決心不動搖,全黨全社會戮力同心真抓實干,

取得了積極成效.某貧困縣為了響應(yīng)國家精準扶貧的號召,特地承包了一塊土地,已知土地的使用面積x與

相應(yīng)的管理時間)'的關(guān)系如下表所示:

土地使用面積

12345

X(單位:畝)

管理時間)(單811142423

位:月)

并調(diào)杳了某村30()名村民參與管理的意愿,得到的部分數(shù)據(jù)如下表所示;

愿意參與管理不愿意參與管理

男性村民14060

女性村民40

(1)做出散點圖,判斷土地使用面積x與管理時間了是否線性相關(guān);并根據(jù)相關(guān)系數(shù),?說明相關(guān)關(guān)系的強

弱.(若|r|20.75,認為兩個變量有很強的線性相關(guān)性,〃值精確到0.001).

(2)若以該村的村民的性別與參與管理黃風(fēng)的情況估計貧困具的情況,口.每位村民參與管理的竟互不影響,

則從該貧困縣村民中任取3人,記取到不愿意參與管理的女性村民的人數(shù)為X,求X的分布列及數(shù)學(xué)期望.

參考數(shù)據(jù):?=16,X(-V)2=206,7515?22.7

例13.(2019?全國?高三專題練習(xí)(文))春節(jié)期間,由于高速免贄,車流量逐步增加,某高速口統(tǒng)計了5天

中的車流量與空氣質(zhì)量指數(shù)的關(guān)系,所得數(shù)據(jù)如卜表所示:

車流量X(萬輛)1212.51313.514

空氣質(zhì)量指數(shù)y7476787780

(I)在下列網(wǎng)格紙中繪制出散點圖;

1212J131I514

(2)由(1)判斷是否能用線性回歸模型擬合),與x的關(guān)系,并用相關(guān)系數(shù)加以說明;

(3)記這5天的空氣質(zhì)量指數(shù)的平均數(shù)為5,若從5天中任選2天的數(shù)據(jù)作調(diào)研,求這2天中恰有1天的

空氣質(zhì)量指數(shù)高于5的概率.

工(斗-君(州一刃

參考公式:相關(guān)系數(shù)r=.參考數(shù)據(jù):71=1.414,岳=2236,V10?3.162.

【同步練習(xí)】

一、單選題

1.(2021?全國?高二課時練習(xí))某次考試之后,班主任從全班同學(xué)中隨機抽取8位同學(xué),他們的數(shù)學(xué)、物理

成績(單位:分,滿分100分)的散點圖如圖所示:

物理成績/分

100?

90

80?,

70?

60

5°5060708090100數(shù)學(xué)成績/分

根據(jù)以上信息,有下列結(jié)論:

①根據(jù)散點圖,可以判斷數(shù)學(xué)成績與物理成績具有線性相關(guān)關(guān)系:

②從全班同學(xué)中隨機抽取2名同學(xué)(記為甲、乙),若甲同學(xué)的數(shù)學(xué)成績?yōu)?0分,乙同學(xué)的數(shù)學(xué)成績?yōu)?0

分,則可以判斷出甲同學(xué)的物理成績一定比乙同學(xué)的物理成績高;

③從全班同學(xué)中隨機抽取2名同學(xué)(記為甲、乙),若甲同學(xué)的數(shù)學(xué)成績?yōu)?()分,乙同學(xué)的數(shù)學(xué)成績?yōu)?0

分,則不能判斷出甲同學(xué)的物理成績一定比乙同學(xué)的物理成績高.

其中正確的個數(shù)是()

A.0B.1C.2D.3

2.12022?四川省內(nèi)江市第六中學(xué)高二開學(xué)考試(文))如圖,是對某位同學(xué)一學(xué)期8次體育測試成績(單位:

分)進行統(tǒng)計得到的散點圖,關(guān)于這位同學(xué)的成績分析,下列結(jié)論錯誤的是()

B.該同學(xué)8次測試成績的眾數(shù)是48分

C.該同學(xué)8次測試成績的中位數(shù)是49分

D.該同學(xué)8次測試成績與測試次數(shù)具有相關(guān)性,且呈正相關(guān)

3.(2021.全國?高二課時練習(xí))已知變量X與y相對應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.83),(12.5,4),

(13,5),變量U與V相對應(yīng)的一組數(shù)據(jù)為(1數(shù)5),(11.3,4),(11.8,3),(12.5,2),(13,1).4表示變量X與丫

之間的線性相關(guān)系數(shù),4表示變量U與丫之間的線性相關(guān)系數(shù),則下列結(jié)論中正確的是()

A,4<4<0B,0<與<耳C.4<0<4D.弓=4

4.(2021?廣西?玉林市育才中學(xué)高二階段練習(xí))己知。表示變量X與丫之間的線性相關(guān)系數(shù),72表示變量U

與力之間的線性相關(guān)系數(shù),且,=。837,?0957,則()

A.變量x與丫之間呈正相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與V之間的相關(guān)性

B.變量x與y之間呈負相關(guān)關(guān)系,且x與y之間的相關(guān)性強于u與v之間的相關(guān)性

c.變量u與v之間呈負相關(guān)關(guān)系,日x與y之間的相關(guān)性弱干u與v之間的相關(guān)件

D,變量u與V之間呈正相關(guān)關(guān)系,且x與丫之間的相關(guān)性弱二u與v之間的相關(guān)性

5.(2021?全國?高二課時練習(xí))下列說法錯誤的是()

A.正方體的體積與棱長之間的關(guān)系是函數(shù)關(guān)系

B.人的身高與視力之間的關(guān)系是相關(guān)關(guān)系

C.汽車的重量與汽車每消耗1升汽油所行駛的平均路程負相關(guān)

D.體重與學(xué)習(xí)成績之間不具有相關(guān)關(guān)系

6.(2021?全國?高一課時練習(xí))最新《交通安全法》實施后,某市管理部門以周為單位,記錄的每周查處的

酒駕人數(shù)與該周內(nèi)出現(xiàn)的交通事故數(shù)量如下:

酒駕人數(shù)X801471211009610387

交通事故)’19313023252420

通過如表數(shù)據(jù)可知,酒駕人數(shù)上與交通事故數(shù))'之間是()

A.正相關(guān)B.負相關(guān)C.不相關(guān)D.函數(shù)關(guān)系

7.(2021?全國?高一課時練習(xí))如圖,5個(尤、)數(shù)據(jù),去掉。(3,10)后,下列說法錯誤的是()

憚.E(10s12)

?ZX3,10)

OX

A.4與y的相關(guān)性變強B.殘差平方和變大

C.相關(guān)指數(shù)&變大D.解釋變量X與預(yù)報變量y的相關(guān)性變強

8.(2019?四川?高考模擬(理))下列說法中錯誤的是

A.先把高二年級的1000名學(xué)生編號為1到1000,再從編號為1到50的50名學(xué)生中隨機抽取1名學(xué)生,其編

號為〃"然后抽取編號為"7+5(),〃?+l(X),m+150……的學(xué)生,這樣的抽樣方法是系統(tǒng)抽樣法.

B.正態(tài)分布N(l,9)在區(qū)間(-1,0)和(2,3)上取值的概率相等

C.若兩個隨機變量的線性相關(guān)性越強,則相關(guān)系數(shù),?的值越接近于1

D.若一組數(shù)據(jù)1、。、2、3的平均數(shù)是2,則這組數(shù)據(jù)的眾數(shù)和中位數(shù)都是2

二、多選題

9.(2021?全國?高二單元測試)根據(jù)下曲四個散點圖中點的分布狀態(tài),可以直觀地判斷兩個變量之間具有線

性相關(guān)關(guān)系的是()

10.(2021.仝國?高二課時練習(xí))下列關(guān)于相關(guān)系數(shù)「的說法中,正確的是()

A.相關(guān)系數(shù),?越大,兩個變量間線性相關(guān)性越強

B.相關(guān)系數(shù),?的取值范圍是[7』

C.相關(guān)系數(shù)廠>0時兩個變量正相關(guān),廠<0時兩個變量負相關(guān)

D.相關(guān)系數(shù)r=1時,樣本點在同一直線上

11.(2021?廣東廣雅中學(xué)高三階段練習(xí))如圖是國家統(tǒng)計周公布的2020年下半年快遞運輸量情況,請根據(jù)

圖中信息選出正確的選項()

832527.2

A.2020年下半年,每個月的異地快遞量部是同城快遞量的6倍以上

B.202()年10月份異地快遞增長率小于9月份的異地快遞增長率(注.增長率指相對前一個月而言)

C.2020年下半年,異地快遞量與月份呈正相關(guān)關(guān)系

D.2020年下半年,同城和異地快遞量最高均出現(xiàn)在11月

12.(2021?全國?高二課時練習(xí))為了檢驗變量%與>的線性相關(guān)程度,由樣本點(/%),(%外),…,

(XKPXO)求得兩個變量的樣本相關(guān)系數(shù)為小則下列說法錯誤的是()

A.若所有樣本點都在直線),=-2x+l上,則r=1

B.若所有樣本點都在直線),=-2萬+1上,則廠二一1

C.若卜|越大,則變量x與),的線性相關(guān)程度越強

D.若卜|越小,則變量上與>的線性相關(guān)程度越強

三、填空題

13.(2021.全國?高二課時練習(xí))在一組樣本數(shù)據(jù)(為,y),伍,了2),…,(天,匕)(〃?2小,/、…,/不全相

等)的散點圖中,若所有樣本點(4,)。=1,2,3「、〃)都在直線21+),-1=0上,則這組樣本數(shù)據(jù)的相關(guān)系

數(shù),為.

14.(2021?全國?高二課時練習(xí))若變量x和),滿足關(guān)系R-0.6X+1,變量),與z正相關(guān),則工與z

相關(guān).

15.(2021?全國?高二課時練習(xí))如圖,有5組(北),)數(shù)據(jù),去掉點對應(yīng)的數(shù)據(jù)后,剩下的4組數(shù)據(jù)

的線性相關(guān)程度最大.

12?£(10,12)

11

10?0(3,10)

9

8

7

6

5.C(4,5)

4.?8(2,4)

3)(1.3)

2

O123456789101112

16.(2021?全國?高二單元測試)對兩個變量的相關(guān)系數(shù),,有下列說法:(1)卜|越大,相關(guān)程度越大;(2)

卜|越小,相關(guān)程度越大;(3)年|趨近于0時,沒有非線性相關(guān)系數(shù);(4)卜|越接近于1時,線性相關(guān)程度

越強,其中正確的是.

四、解答題

17.(2022?全國?高二課時練習(xí))互聯(lián)網(wǎng)使我們的生活日益便捷,網(wǎng)絡(luò)外賣也開始成為不少人日常生活中不

可或缺的一部分,某市一調(diào)查機構(gòu)制對該市市場占有率較高的甲,乙兩家網(wǎng)絡(luò)外賣企業(yè)(以下稱外賣印、

外賣乙)的經(jīng)營情況進行了調(diào)查,調(diào)查結(jié)果如下表:

1日2日3日4R5R

外賣甲日接單工(百單)529811

外賣乙日接單)’(百單)2310515

(1)試根據(jù)表格中這五天的日接單量情況,從統(tǒng)計的角度說明這兩家外賣企業(yè)的經(jīng)營狀況;

(2)據(jù)統(tǒng)計表明,y與X之間具有線性相關(guān)關(guān)系,請用相關(guān)系數(shù),-對y與X之間的相關(guān)性強弱進行判斷;(若

1-1>0.75,則可認為y與X有較強的線性相關(guān)關(guān)系,「值精確到0.001)

參考數(shù)據(jù):£(七一可5-方=66,Jta-對£(y-寸=77.

Vr-|,-1

18.(2021?全國?高二課時練習(xí))某生物小組為了研究溫度對某和酶的活性的影響進行了一組實驗,實驗數(shù)

據(jù)經(jīng)整理得到如下的折線圖:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論