版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
2025高考數(shù)學考二輪專題復習-第十講-統(tǒng)計(三大考向)-專項訓
練
-:考情分析
命題解讀考向考查統(tǒng)計
1.高考對統(tǒng)計的考查,重點是2022?新高考□卷,
以下考點(1)分層隨機抽樣
19(1)
(2)統(tǒng)計圖表頻率分布直方圖、頻數(shù)分布2023?新高考□卷,
19(1)
(3)會用統(tǒng)計圖表對總體進表
行估計,會求n個數(shù)據(jù)的第p2024?新高考□卷,
百分位數(shù).4
2022?新高考□卷,
(4)能用數(shù)字特征估計總體獨立性檢驗
20(1)
集中趨勢和總體離散程度.
(5)了解樣本相關系數(shù)的統(tǒng)
計含義.
2023?新高考口卷,
(6)理解一元線性回歸模型數(shù)據(jù)的數(shù)字特征
9
和2x2列聯(lián)表,會運用這些方
法解決簡單的實際問題.
二:2024高考命題分析
2024年高考新高考口卷未考查統(tǒng)計相關內容,口卷中考查了頻數(shù)分布表中數(shù)據(jù)的
數(shù)字特征的求法。統(tǒng)計的考查應關注:相關性、頻率分布直方圖、樣本的數(shù)字特征、
獨立性檢驗、回歸分析等。這些考驗的是學生讀取數(shù)據(jù)、分析數(shù)據(jù)、處理數(shù)據(jù)的能
力。預計2025年高考還是主要考查頻率分布直方圖和數(shù)據(jù)的數(shù)字特征,可以多留意方
差的計算方法!
三:試題精講
一、單選題
1.(2024新高考口卷4)某農業(yè)研究部門在面積相等的100塊稻田上種植一種新型水
稻,得到各塊稻田的畝產量(均在[900,1200)之間,單位:kg)并部分整理下表
畝產[900,[950,[1000,[1100,[1150,
量950)1000)1050)1150)1200)
頻數(shù)612182410
據(jù)表中數(shù)據(jù),結論中正確的是()
A.100塊稻田畝產量的中位數(shù)小于1050kg
B.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產量的極差介于200kg至300kg之間
D.100塊稻田畝產量的平均值介于900kg至1000kg之間
高考真題練
一、多選題
1.(2023新高考口卷-9)有一組樣本數(shù)據(jù)占,…,品,其中巧是最小值,工6是最大值,
貝I()
A.尤2,*3,匕,工5的平均數(shù)等于占,*2,…,工6的平均數(shù)
B.4,三,4三的中位數(shù)等于%的中位數(shù)
C.%,三,尤4,三的標準差不小于%,々,…,尤6的標準差
D.3,當,匕,毛的極差不大于占,馬,…,%的極差
二、解答題
1.(2022新高考口卷20)一醫(yī)療團隊為研究某地的一種地方性疾病與當?shù)鼐用竦男l(wèi)生
習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查
T100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照
組),得到如下數(shù)據(jù):
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?
n(ad-be)。
(a+b)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
2.(2022新高考口卷T9)在某地區(qū)進行流行病學調查,隨機調查了100位某種疾病患
者的年齡,得到如下的樣本數(shù)據(jù)的頻率分布直方圖:
(1)估計該地區(qū)這種疾病患者的平均年齡(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代
表);
3.(2023新高考口卷T9)某研究小組經過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某
項醫(yī)學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率
分布直方圖:
^^0林也組距
0.040...........................Cu8
5o6
0.036...........................o.o4
0.034...........................o.
0.012...........
0.010-------------------------------------
CHMtt二:T——指標0.002?????????
<^9510()105110115120125130t^7075W85W95100105
也輛名關■族者
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,
小于或等于C的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,
記為P(C);誤診率是將未患病者判定為陽性的概率,記為式C).假設數(shù)據(jù)在組內均勻
分布,以事件發(fā)生的頻率作為相應事件發(fā)生的概率.
⑴當漏診率p(c)=o.5%時,求臨界值C和誤診率4(c);
知識點總結
一、分層隨機抽樣
1、分層隨機抽樣的概念
一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個
子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合
在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.
2、分層隨機抽樣的平均數(shù)計算
在分層隨機抽樣中,以層數(shù)是2為例,如果第1層和第2層包含的個體數(shù)分別為M和
N,抽取的樣本量分別為加和",第1層和第2層的樣本平均數(shù)分別為最,y,樣本
_—A/7—N-TYI—n-
平均數(shù)位右,則0=------X+------y=——X+——y.我們可以采用樣本平均
M+NM+Nm+nm+n
數(shù)萬估計總體平均數(shù)評
二、樣本的數(shù)字特征
1、眾數(shù)、中位數(shù)、平均數(shù)
(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)叫眾數(shù),眾數(shù)反應一組數(shù)據(jù)的多數(shù)水平.
(2)中位數(shù):將一組數(shù)據(jù)按大小順序依次排列,把處在最中間位置的一個數(shù)據(jù)(或最
中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),中位數(shù)反應一組數(shù)據(jù)的中間水平.
(3)平均數(shù):〃個樣本數(shù)據(jù)占其,…,%的平均數(shù)為1=芯+%+…,反應一組數(shù)據(jù)
n
的平均水平,公式變形:£.r,.=nx.
4=1
2、標準差和方差
(1)標準差:標準差是樣本數(shù)據(jù)到平均數(shù)的一種平均距離,一般用s表示.假設樣本
數(shù)據(jù)是為尤2,…,尤,,工表示這組數(shù)據(jù)的平均數(shù),則標準差
2
s=J—[(占-X)+(無2-尤)2---1-(Xn-X)"].
Vn
(2)方差:方差就是標準差的平方,即/=—[(X]-x)2+(々-x)2H---F(x—X)2].顯
n"n
然,在刻畫樣本數(shù)據(jù)的分散程度上,方差與標準差是一樣的.在解決實際問題時,多
采用標準差.
(3)數(shù)據(jù)特征
標準差、方差描述了一組數(shù)據(jù)圍繞平均數(shù)波動程度的大小.標準差、方差越大,則數(shù)
據(jù)的離散程度越大;標準差、方差越小,數(shù)據(jù)的離散程度越小.反之亦可由離散程度
的大小推算標準差、方差的大小.
三、頻率分布直方圖
1、頻率、頻數(shù)、樣本容量的計算方法
頻率
口西施X組距=頻率.
匚犀頻蔑數(shù)量=頻率,頻簫數(shù)=樣本容量,樣本容量X頻率=頻數(shù).
口頻率分布直方圖中各個小方形的面積總和等于1.
2、頻率分布直方圖中數(shù)字特征的計算
(1)最高的小長方形底邊中點的橫坐標即是眾數(shù).
(2)中位數(shù)左邊和右邊的小長方形的面積和是相等的.設中位數(shù)為x,利用尤左
(右)側矩形面積之和等于0.5,即可求出x.
(3)平均數(shù)是頻率分布直方圖的“重心”,等于頻率分布直方圖中每個小長方形的面積
乘以小長方形底邊中點的橫坐標之和,即有X=X[P1+X]P1++Xnpn,其中X"為每個小
長方形底邊的中點,P“為每個小長方形的面積.
四、百分位數(shù)
1、定義
一組數(shù)據(jù)的第P百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有P%的數(shù)據(jù)小于或
等于這個值,且至少有(100-P)%的數(shù)據(jù)大于或等于這個值.
2、計算一組"個數(shù)據(jù)的的第。百分位數(shù)的步驟
(1)按從小到大排列原始數(shù)據(jù).
(2)計算j=p%.
(3)若i不是整數(shù)而大于,?的比鄰整數(shù)人則第p百分位數(shù)為第,項數(shù)據(jù);若i是整
數(shù),則第2百分位數(shù)為第i項與第"1項數(shù)據(jù)的平均數(shù).
3、四分位數(shù)
我們之前學過的中位數(shù),相當于是第50百分位數(shù).在實際應用中,除了中位數(shù)外,常
用的分位數(shù)還有第25百分位數(shù),第75百分位數(shù).這三個分位數(shù)把一組由小到大排列后
的數(shù)據(jù)分成四等份,因此稱為四分位數(shù).
五、變量間的相關關系
1、變量之間的相關關系
當自變量取值一定時,因變量的取值帶有一定的隨機性,則這兩個變量之間的關系叫
相關關系.由于相關關系的不確定性,在尋找變量之間相關關系的過程中,統(tǒng)計發(fā)揮
著非常重要的作用.我們可以通過收集大量的數(shù)據(jù),在對數(shù)據(jù)進行統(tǒng)計分析的基礎
上,發(fā)現(xiàn)其中的規(guī)律,對它們的關系作出判斷.
注意:相關關系與函數(shù)關系是不同的,相關關系是一種非確定的關系,函數(shù)關系是一
種確定的關系,而且函數(shù)關系是一種因果關系,但相關關系不一定是因果關系,也可
能是伴隨關系.
2、散點圖
將樣本中的n個數(shù)據(jù)點(4y)(7=1,2,描在平面直角坐標系中,所得圖形叫做散點
圖.根據(jù)散點圖中點的分布可以直觀地判斷兩個變量之間的關系.
(1)如果散點圖中的點散布在從左下角到右上角的區(qū)域內,對于兩個變量的這種相關
關系,我們將它稱為正相關,如圖(1)所示;
(2)如果散點圖中的點散布在從左上角到右下角的區(qū)域內,對于兩個變量的這種相關
關系,我們將它稱為負相關,如圖(2)所示.
(1)(2)
3、相關系數(shù)
若相應于變量%的取值%,變量y的觀測值為y(14V”),則變量x與y的相關系數(shù)
Z(七一尤Xy-y)2%%一"盯
i=l_i=I通常用r來衡量X與y之間的線
£@<這(》-方瓦廠1瓦「后
1=11=1VZ=1V4=1
性關系的強弱,r的范圍為-IWrWl.
(1)當廠>0時,表示兩個變量正相關;當「<0時,表示兩個變量負相關.
(2)卜|越接近1,表示兩個變量的線性相關性越強;M越接近。,表示兩個變量間幾
乎不存在線性相關關系.當|廠|=1時,所有數(shù)據(jù)點都在一條直線上.
(3)通常當M>0.75時,認為兩個變量具有很強的線性相關關系.
六、線性回歸
1、線性回歸
線性回歸是研究不具備確定的函數(shù)關系的兩個變量之間的關系(相關關系)的方法.
對于一組具有線性相關關系的數(shù)據(jù)(XI,m),(X2,了2),…,(羽,女),其回歸方程
y=bx+a的求法為
n__“__
£(占一x)(y;-y)-nxy
b=-^—^-------------------二號-----------
-尤)2-nx
i=lz=l
a=y-bx
其中,xYx.,y=—,(],y)稱為樣本點的中心.
2、殘差分析
對于預報變量y,通過觀測得到的數(shù)據(jù)稱為觀測值y,通過回歸方程得到的y稱為預
測值,觀測值減去預測值等于殘差,自稱為相應于點(尤,,y)的殘差,即有自=
殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果
以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.
(1)殘差圖
通過殘差分析,殘差點(占,2,)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比
較合適,其中這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精確度越高;反之,不合
適.
(2)通過殘差平方和Q=f(y-B)2分析,如果殘差平方和越小,則說明選用的模型
i=l
的擬合效果越好;反之,不合適.
(3)相關指數(shù)
反(M-獷
用相關指數(shù)來刻畫回歸的效果,其計算公式是:--------
Z(x-y)2
1=1
心越接近于1,說明殘差的平方和越小,也表示回歸的效果越好.
七、非線性回歸
解答非線性擬合問題,要先根據(jù)散點圖選擇合適的函數(shù)類型,設出回歸方程,通過換
元將陌生的非線性回歸方程化歸轉化為我們熟悉的線性回歸方程.
求出樣本數(shù)據(jù)換元后的值,然后根據(jù)線性回歸方程的計算方法計算變換后的線性回歸
方程系數(shù),還原后即可求出非線性回歸方程,再利用回歸方程進行預報預測,注意計
算要細心,避免計算錯誤.
1、建立非線性回歸模型的基本步驟:
(1)確定研究對象,明確哪個是解釋變量,哪個是預報變量;
(2)畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系(是否存在非
線性關系);
(3)由經驗確定非線性回歸方程的類型(如我們觀察到數(shù)據(jù)呈非線性關系,一般選用
反比例函數(shù)、二次函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)、幕函數(shù)模型等);
(4)通過換元,將非線性回歸方程模型轉化為線性回歸方程模型;
(5)按照公式計算線性回歸方程中的參數(shù)(如最小二乘法),得到線性回歸方程;
(6)消去新元,得到非線性回歸方程;
(7)得出結果后分析殘差圖是否有異常.若存在異常,則檢查數(shù)據(jù)是否有誤,或模型
是否合適等.
八、獨立性檢驗
1、分類變量和列聯(lián)表
(1)分類變量:
變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量.
(2)列聯(lián)表:
口定義:列出的兩個分類變量的頻數(shù)表稱為列聯(lián)表.
□2x2列聯(lián)表.
一般地,假設有兩個分類變量X和匕它們的取值分別為{占,和{%,為},其樣
本頻數(shù)列聯(lián)表(稱為2x2列聯(lián)表)為
%總計
不aba+b
cdc+d
總計a+cb+dn=a-\-b+c+d
從2x2列表中,依據(jù)」與上的值可直觀得出結論:兩個變量是否有關系.
a+bc+d
2、等高條形圖
(1)等高條形圖和表格相比,更能直觀地反映出兩個分類變量間是否相互影響,常用
等高條形圖表示列聯(lián)表數(shù)據(jù)的頻率特征.
(2)觀察等高條形圖發(fā)現(xiàn),與上相差很大,就判斷兩個分類變量之間有關系.
a+bc+d
3、獨立性檢驗
計算隨機變量爐=-----MadTcf—利用/的取值推斷分類變量x和y是否獨
(Q+b){c+d)(Q+c)(b+d)
立的方法稱為X2獨立性檢驗.
0.010.00
a0.100.050.001
05
2.703.846.637.8710.82
%
61598
【統(tǒng)計常用結論】
均數(shù)、方差的性質:如果數(shù)據(jù)%,馬,……,居的平均數(shù)為"方差為那么
口一組新數(shù)據(jù)%+4%+反……%+人的平均數(shù)為,方差是r.
□一組新數(shù)據(jù)時,以2,,31的平均數(shù)為QX,方差是。2d.
□一組新數(shù)據(jù)叼+b,ax2+Z?,...,axn+Z?的平均數(shù)為+b,方差是〃2s2.
常見的非線性回歸模型
(1)指數(shù)函數(shù)型y=(。>0且awl,c>0)
兩邊取自然對數(shù),lny=ln(c〃x),即Iny=lnc+xlna,
令卜In’,原方程變?yōu)閥=inc+/ina,然后按線性回歸模型求出Ina,Inc.
[x=x
(2)對數(shù)函數(shù)型y=blnx+a
令F:二:,原方程變?yōu)閥'=Z^+a,然后按線性回歸模型求出6,a.
x=lnx
(3)募函數(shù)型y=ax'
兩邊取常用對數(shù),Igy=lg?"),BPlgy=n\gx+lga,
令,原方程變?yōu)?,=加,+]g〃,然后按線性回歸模型求出〃,Iga.
p=lgx
(4)二次函數(shù)型丁=法2+〃
令,原方程變?yōu)閥'=bx'+a,然后按線性回歸模型求出6,a.
\x=x
(5)反比例函數(shù)型y=a+2型
X
yr=y
令,1,原方程變?yōu)閂=+然后按線性回歸模型求出b,a.
x=-
、x
名校模擬練
一、單選題
1.(2024?河南?三模)已知某學校高三年級甲、乙、丙三個班級人數(shù)分別為40,30,
50,學校計劃采用按比例分配的分層隨機抽樣的方法在三個班級中評選優(yōu)秀學生,已
知乙班分配到的優(yōu)秀學生名單為6人,則高三年級三個班優(yōu)秀學生總人數(shù)為()
A.16B.30C.24D.18
2.(2024?山東?二模)某校高三共有200人參加體育測試,根據(jù)規(guī)則,82分以上的考生
成績等級為A,則估計獲得A的考生人數(shù)約為()
A.100B.75C.50D.25
3.(2024?浙江紹興?三模)有一組樣本數(shù)據(jù):2,3,3,3,4,4,5,5,6,6.則關于
該組數(shù)據(jù)的下列數(shù)字特征中,數(shù)值最大的為()
A.第75百分位數(shù)B.平均數(shù)C.極差D.眾數(shù)
4.(2024?山西?三模)某次趣味運動會,設置了教師足球射門比賽:教師射門,學生守
門.已知參與射門比賽的教師有60名,進球數(shù)的平均值和方差分別是3和13,其中男
教師進球數(shù)的平均值和方差分別是4和8,女教師進球數(shù)的平均值為2,則女教師進球
數(shù)的方差為()
A.15B.16C.17D.18
5.(2024?四川涼山三模)樣本數(shù)據(jù)和馬,,毛的平均數(shù)了=4,方差s2=i,則樣本數(shù)
據(jù)2占+1,2%+1,L,2%+1的平均數(shù),方差分別為()
A.9,4B.9,2C.4,1D.2,1
6.(2024?四川成都?三模)“數(shù)九”從每年“冬至”當天開始計算,每九天為一個單位,
冬至后的第81天,“數(shù)九”結束,天氣就變得溫暖起來.如圖,以溫江國家基準氣
候站為代表記錄了2023—2024年從“一九”到“九九”成都市的“平均氣溫”和“多年平
均氣溫”(單位:C),下列說法正確的是()
數(shù)九寒天氣溫對比
■■平均氣溫匚口多年平均氣溫單位:℃
一九二九三九四九五九六九七九八九九九
A.“四九”以后成都市“平均氣溫”一直上升
B.“四九”成都市“平均氣溫”較“多年平均氣溫”低0.1"C
C.“一九”到“五九”成都市“平均氣溫”的方差小于“多年平均氣溫”的方差
D.“一九”到“九九”成都市“平均氣溫”的極差小于“多年平均氣溫”的極差
7.(2024?陜西?三模)2024年1月九省聯(lián)考的數(shù)學試卷出現(xiàn)新結構,其中多選題計分標
準如下:口本題共3小題,每小題6分,滿分18分;□每道小題的四個選項中有兩個
或三個正確選項,全部選對得6分,有選錯的得0分;口部分選對得部分分(若某小
題正確選項為兩個,漏選一個正確選項得3分;若某小題正確選項為三個,漏選一個
正確選項得4分,漏選兩個正確選項得2分).已知在某次新結構數(shù)學試題的考試中,
小明同學三個多選題中第一小題確定得滿分,第二小題隨機地選了兩個選項,第三小
題隨機地選了一個選項,則小明同學多選題所有可能總得分(相同總分只記錄一次)
的中位數(shù)為()
A.9B.10C.11D.12
8.(2024?浙江?三模)在對某校高三學生體質健康狀況某個項目的調查中,采用樣本量
比例分配的分層隨機抽樣,如果不知道樣本數(shù)據(jù),只知道抽取了男生80人,女生120
人,其方差分別為15,10,由此估計樣本的方差不可能為()
A.11B.13C.15D.17
9.(2024?安徽安慶?三模)已知一組數(shù)據(jù)國,馬,?,%的平均數(shù)為]o另一組數(shù)據(jù)
的平均數(shù)為了(元片了).若數(shù)據(jù)網(wǎng),々,,xm,y{,y2,,%的平均數(shù)為
z=ax+(l-a)y,其中;則〃5的大小關系為()
A.m<nB.m>nC.m=nD.加,”的大小關系
不確定
10.(2024?陜西榆林?三模)在一次數(shù)學模考中,從甲乙兩個班各自抽出10個人的成
績,甲班的十個人成績分別為公、々、、稅,乙班的十個人成績分別為.假設
這兩組數(shù)據(jù)中位數(shù)相同方差也相同,則把這20個數(shù)據(jù)合并后()
A.中位數(shù)一定不變,方差可能變大
B.中位數(shù)可能改變,方差可能變大
C.中位數(shù)一定不變,方差可能變小
D.中位數(shù)可能改變,方差可能變小
二、多選題
11.(2024?全國?三模)在某次數(shù)學測試中,甲、乙兩個班的成績情況如下表:
班級人數(shù)平均分方差
甲45881
乙45902
記這兩個班的數(shù)學成績的總平均分為"總方差為$2,則()
A.x=88B.x=89C.?=8.6D.52=2.5
12.(2024?廣東廣州?三模)在某次學科期末檢測后,從全部考生中選取100名考生的
成績(百分制,均為整數(shù))分成[50,60),[60,70),[70,80),[80,90),[90,100)五組
后,得到如下圖的頻率分布直方圖,則()
A.圖中。的值為0.005B.低于70分的考生人數(shù)約為40人
C.考生成績的平均分約為73分D.估計考生成績第80百分位數(shù)為83分
13.(2024?河北?三模)根據(jù)中國報告大廳對2023年3月?10月全國太陽能發(fā)電量進行
監(jiān)測統(tǒng)計,太陽能發(fā)電量(單位:億千瓦時)月度數(shù)據(jù)統(tǒng)計如下表:
月份3456
發(fā)電量/億千瓦時242.94230.87240.59259.33
月份78910
發(fā)電量/億千瓦時258.9269.19246.06244.31
關于2023年3月?10月全國太陽能發(fā)電量,下列四種說法正確的是()
A.中位數(shù)是259.115B.極差是38.32
C.第85百分位數(shù)是259.33D.第25百分位數(shù)是240.59
14.(2024?廣東汕頭?三模)下圖是樣本甲與樣本乙的頻率分布直方圖,下列說法判斷
正確的是()
A.樣本乙的極差一定大于樣本甲的極差
B.樣本乙的眾數(shù)一定大于樣本甲的眾數(shù)
C.樣本乙的方差一定小于樣本甲的方差
D.樣本甲的中位數(shù)一定小于樣本乙的中位數(shù)
15.(2024?黑龍江?三模)在某市初三年級舉行的一次體育考試中(滿分100分),所有考
生成績均在[50,100]內,按照[50,60),[60,70),[70,80),[80,90),[90,100]分成五組,
甲、乙兩班考生的成績占比如圖所示,則下列說法錯誤的是()
[50,60)[60,70)[70,80)[80,90)[90,100]
一甲班成績占比■—乙班成績占比
A.成績在[70,80)的考生中,甲班人數(shù)多于乙班人數(shù)
B.甲班成績在[80,90)內人數(shù)最多
C.乙班成績在[70,80)內人數(shù)最多
D.甲班成績的極差比乙班成績的極差小
三、解答題
16.(2024?青海海南?二模)某青少年跳水隊共有100人,在強化訓練前、后,教練組
對他們進行了成績測試,分別得到如圖1所示的強化訓練前的頻率分布直方圖,如圖2
所示的強化訓練后的頻率分布直方圖.
圖2
⑴根據(jù)表中數(shù)據(jù),估計強化訓練后的平均成績(同一組中的數(shù)據(jù)用該組區(qū)間的中點值
作代表).
(2)我們規(guī)定得分80分以上(含80分)的為“優(yōu)秀”,低于80分的為“非優(yōu)秀”.
優(yōu)秀人數(shù)非優(yōu)秀人數(shù)合計
強化訓練前
強化訓練后
合計
將上面的表格補充完整,并回答能否有99.5%的把握認為跳水運動員是否優(yōu)秀與強化訓
練有關.
附:K2=---------------"(ad-bcf-------^n=a+b+c+d_
(a+Z?)(c+d)(a+c)(b+d)
2
P(K>k0)0.050.0100.0050.001
卜03.8416.6357.87910.828
17.(2024?陜西?模擬預測)某公司新研發(fā)了一款智能燈,此燈有拍照搜題功能,學生
遇到疑難問題,通過拍照搜題后,會在顯示屏上顯示該題的解答過程以及該題考查的
知識點與相應的解題方法該產品投入市場三個月后,公司對部分用戶做了調研:抽取
了200位使用者,每人填寫一份評分表(滿分為100分),現(xiàn)從200份評分表中,隨機
抽取40份(其中男女使用者的評分表各20份)
作為樣本,經統(tǒng)計得到如下的數(shù)據(jù):
女生使用者評分:67,71,72,75,80,83,83,83,84,84,85,86,88,90,
90,91,92,92,92,92
男生使用者評分:67,68,69,69,70,72,72,73,74,75,76,76,77,78,
79,82,84,84,89,92
記該樣本的中位數(shù)為“,按評分情況將使用.都對該智能燈的態(tài)度分為兩種類型:評分
不小于M的稱為“滿意型”,其余的都稱為“不滿意型”.
⑴求M的值,填寫如下2x2列聯(lián)表
女生評分男生評分合計
“滿意型”人數(shù)
“不滿意型”人數(shù)
合計
(2)能否有99%的把握認為滿意與性別有關?
n(ad-bc')2
參考公式與數(shù)據(jù):K2=
(a+b)(c+d)(o+c)(6+d)
2
P(K>k0)0.10.050.0250.01
左02.7063.8415.0246.635
18.(2024?河南鄭州?三模)按照《中華人民共和國環(huán)境保護法》的規(guī)定,每年生態(tài)環(huán)
境部都會會同國家發(fā)展改革委等部門共同編制《中國生態(tài)環(huán)境狀況公報》,并向社會公
開發(fā)布.下表是2017-2021年五年《中國生態(tài)環(huán)境狀況公報》中酸雨區(qū)面積約占國土
面積的百分比(%%):
年份2017年2018年2019年2020年2021年
年份代碼X,12345
6.45.55.04.83.8
(1)求2017—2021年年份代碼士與%的樣本相關系數(shù)(精確到0.01);
(2)請用樣本相關系數(shù)說明該組數(shù)據(jù)中了與x之間的關系可用一元線性回歸模型進行描
述,并求出y關于x的經驗回歸方程;
(3)預測2024年的酸雨區(qū)面積占國土面積的百分比.
(回歸直線的斜率和截距的最小二乘法估計公式分別為:
,f(無,-丁)(y-歹)/55
J=]
i>=—n-----------------,a=y-bx\xiyj=70.6,£y;=133.69
JT
i=\
附:樣本相關系數(shù),「=I/",屈。6.
屈―%%-刃2
V1=1i=l
19.(2024?陜西渭南?三模)某市為提高市民對文明城市創(chuàng)建的認識,舉辦了“創(chuàng)建文明
城市”知識競賽,從所有答卷中隨機抽取100份作為樣本,將100個樣本數(shù)據(jù)按
[30,40),[40,50),[50,60),[60,70),[70,80),[80,90]分成6組,并整理得到如下頻
率分布直方圖.
(1)請通過頻率分布直方圖估計這100份樣本數(shù)據(jù)的平均值(同一組中的數(shù)據(jù)用該組區(qū)
間的中點值作代表)和中位數(shù);
(2)該市決定表彰知識競賽成績排名前30%的市民,某市民知識競賽的成績是78,請估
計該市民能否得到表彰.
20.(2024?江西九江?三模)車胎凹槽深度是影響汽車剎車的因素,汽車行駛會導致輪
胎胎面磨損.某實驗室通過實驗測得轎車行駛里程與某品牌輪胎凹槽深度的數(shù)據(jù),如下
表所示:
行駛里程力/萬km0.00.41.01.62.42.83.44.4
輪胎凹槽深度/i/mm8.07.87.26.25.64.84.44.0
fx也=79.68,大龍:一可2=16.24,、歸(七一元八回4一肛"16.56.
1=11=1Vt=iVi=i
(1)求該品牌輪胎凹槽深度〃與行駛里程X的相關系數(shù)廠,并判斷二者之間是否具有很強
的線性相關性;(結果保留兩位有效數(shù)字)
(2)根據(jù)我國國家標準規(guī)定:轎車輪胎凹槽安全深度為1.6mm(當凹槽深度低于L6mm
時剎車距離增大,駕駛風險增加,必須更換新輪胎).某人在保養(yǎng)汽車時將小轎車的輪
胎全部更換成了該品牌的新輪胎,請問在正常行駛情況下,更換新輪胎后繼續(xù)行駛約
多少公里需對輪胎再次更換?
£(占-可(%-9)
附:變量無與y的樣本相關系數(shù)7臥F=除f;對于一組數(shù)據(jù)
(%,X),(%,%),.......,(X",%),其線性回歸方程9=液+&的斜率和截距的最小二乘估
。2(西一?。▂-力_
計分別為:B=--------,a=y-bx.
可2
i=\
21.(2024?內蒙古?三模)現(xiàn)統(tǒng)計了甲12次投籃訓練的投籃次數(shù)和乙8次投籃訓練的投
籃次數(shù),得到如下數(shù)據(jù):
甲777377818581778593737781
乙7181737371738573
已知甲12次投籃次數(shù)的平均數(shù)另=80,乙8次投籃次數(shù)的平均數(shù)兀=75.
(1)求這20次投籃次數(shù)的中位數(shù)加,估計甲每次訓練投籃次數(shù)超過小的概率;
(2)求這20次投籃次數(shù)的平均數(shù)最與方差52.
22.(2024?甘肅張掖?模擬預測)近年來,馬拉松比賽受到廣大體育愛好者的喜愛.某地
體育局在五一長假期間舉辦比賽,志愿者的服務工作是成功舉辦的重要保障.現(xiàn)抽取了
200名候選者的面試成績,并分成六組:第一組[40,50),第二組[50,60),第三組
[60,70),第四組[70,80),第五組[80,90),第六組[90,100),繪制成如圖所示的頻率分
布直方圖.
⑴求加;
(2)估計候選者面試成績的平均數(shù)(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表);
(3)在抽出的200名候選者的面試成績中,若規(guī)定分數(shù)不低于80分的候選者為被錄取的
志愿者,已知這200名候選者中男生與女生人數(shù)相同,男生中有20人被錄取,請補充
2x2列聯(lián)表,并判斷是否有99%的把握認為“候選者是否被錄取與性別有關”.
“2n(ad-bc)2_.
附:看=證記師7證團'其中〃
0.050.0100.0050.001
k03.8416.6357.87910.828
23.(2024?湖南邵陽?三模)某市開展“安全隨我行”活動,交警部門在某個交通路口增
設電子抓拍眼,并記錄了某月該路口連續(xù)10日騎電動摩托車未佩戴頭盔的人數(shù)》與天
數(shù)x的情況,對統(tǒng)計得到的樣本數(shù)據(jù)…,10)作了初步處理,得到下面的散
點圖及一些統(tǒng)計量的值.
機人)
25-
20-
15-
10-
5-
,,,,?
0
12345678910x(Q)
101010
XyY
i=l1=1Z=1
5.58.71.930138579.75
_110
表中匕=iny,r.
1Uj=i
(1)依據(jù)散點圖推斷,>與y=e"*哪一個更適合作為未佩戴頭盔人數(shù)》與天數(shù)x
的回歸方程類型?(給出判斷即可,不必說明理由)
(2)依據(jù)(1)的結果和上表中的數(shù)據(jù)求出y關于龍的回歸方程.
(3)為了解佩戴頭盔情況與性別的關聯(lián)性,交警對該路口騎電動摩托車市民進行調查,
得到如下列聯(lián)表:
性別佩戴頭盔合計
不佩戴佩戴
女性81220
男性14620
合計221840
依據(jù)夕=0.10的獨立性檢驗,能否認為市民騎電動摩托車佩戴頭盔與性別有關聯(lián)?
八z%,一屈
n^ad-bc^
參考公式:b=^-------------,a=y-bx,Z2其中
(〃+b)(c+d)(Q+c)(b+d)'
Xx;-rix2
i=\
n=a+b+c+d.
a0.150.100.050.0250.0100.0050.001
Xa2.0722.7063.8415.0246.6357.87910.828
參考答案與詳細解析
考情分析
命題解讀考向考查統(tǒng)計
1.高考對統(tǒng)計的考查,重點是2022?新高考口卷,
以下考點(1)分層隨機抽樣19(1)
(2)統(tǒng)計圖表頻率分布直方圖、頻數(shù)分布2023?新高考口卷,
表19(1)
(3)會用統(tǒng)計圖表對總體進
2024?新高考口卷,
行估計,會求n個數(shù)據(jù)的第p
4
百分位數(shù).
2022?新高考口卷,
(4)能用數(shù)字特征估計總體獨立性檢驗
20(1)
集中趨勢和總體離散程度.
2023?新高考口卷,
(5)了解樣本相關系數(shù)的統(tǒng)數(shù)據(jù)的數(shù)字特征
9
計含義.
(6)理解一元線性回歸模型
和2x2列聯(lián)表,會運用這些方
法解決簡單的實際問題.
二:2024高考命題分析
2024年高考新高考口卷未考查統(tǒng)計相關內容,口卷中考查了頻數(shù)分布表中數(shù)據(jù)的
數(shù)字特征的求法。統(tǒng)計的考查應關注:相關性、頻率分布直方圖、樣本的數(shù)字特征、
獨立性檢驗、回歸分析等。這些考驗的是學生讀取數(shù)據(jù)、分析數(shù)據(jù)、處理數(shù)據(jù)的能
力。預計2025年高考還是主要考查頻率分布直方圖和數(shù)據(jù)的數(shù)字特征,可以多留意方
差的計算方法!
三:試題精講
一、單選題
1.(2024新高考口卷4)某農業(yè)研究部門在面積相等的100塊稻田上種植一種新型水
稻,得到各塊稻田的畝產量(均在[900,1200)之間,單位:kg)并部分整理下表
畝產[900,[950,[1000,[1100,[1150,
量950)1000)1050)1150)1200)
頻數(shù)612182410
據(jù)表中數(shù)據(jù),結論中正確的是()
A.100塊稻田畝產量的中位數(shù)小于1050kg
B.100塊稻田中畝產量低于1100kg的稻田所占比例超過80%
C.100塊稻田畝產量的極差介于200kg至300kg之間
D.100塊稻田畝產量的平均值介于900kg至1000kg之間
【答案】C
【分析】計算出前三段頻數(shù)即可判斷A;計算出低于1100kg的頻數(shù),再計算比例即可
判斷B;根據(jù)極差計算方法即可判斷C;根據(jù)平均值計算公式即可判斷D.
【詳解】對于A,根據(jù)頻數(shù)分布表可知,6+12+18=36<50,
所以畝產量的中位數(shù)不小于1050kg,故A錯誤;
對于B,畝產量不低于1100kg的頻數(shù)為24+10=34,
所以低于1100kg的稻田占比為10與0-盧34=66%,故B錯誤;
對于C,稻田畝產量的極差最大為1200-900=300,最小為1150-950=200,故C正
確;
對于D,由頻數(shù)分布表可得,畝產量在口050,1100)的頻數(shù)為
100-(6+12+18+24+10)=30,
所以平均值為工x(6x925+12x975+18xl025+30xl075+24xll25+10xll75)=1067,故
100
D錯誤.
故選;C.
高考真題練
一、多選題
1.(2023新高考口卷9)有一組樣本數(shù)據(jù)尤…,%,其中a是最小值,%是最大值,
貝U()
A.無2,%,了4,%的平均數(shù)等于玉,尤2,,",%的平均數(shù)
B.9,W,%,尤5的中位數(shù)等于工,馬,…,天的中位數(shù)
C.無2,%,匕,%的標準差不小于%,%,…,毛的標準差
D.工2,尤3,4尤5的極差不大于不,%,…,%的極差
【答案】BD
【分析】根據(jù)題意結合平均數(shù)、中位數(shù)、標準差以及極差的概念逐項分析判斷.
【詳解】對于選項A:設%2,%3,%4,%5的平均數(shù)為加,%1,兀2,…,%6的平均數(shù)為,,
Q|.|%]+W+冗3++%5+*6%+*3+*4+毛2(±+4)—(毛+,2+”3+,4)
U~m~64―-12
因為沒有確定2(玉+/),毛+%2+毛+尤4的大小關系,所以無法判斷人〃的大小,
例如:1,2,3,4,5,6,可得丁=九=3.5;
例如1,1,1,1,1,7,可得機=1,〃=2;
例如L2,2,2,2,2,可得“7=2,”=?;故A錯誤;
O
對于選項B:不妨設玉V尤2VX3Vx4Vx5Vx6,
可知馬,W,尤4,三的中位數(shù)等于小程…,%的中位數(shù)均為與&,故B正確;
對于選項C:因為玉是最小值,%是最大值,
則超,W,%,%的波動性不大于W,尤2,…,工6的波動性,即4,W,尤4,%的標準差不大于
%,尤2,…'天的差,
例如:2,4,6,8,10,12,則平均數(shù)“=9(2+4+6+8+10+12)=7,
6
標準差1=^[(2-7)2+(4-7)2+(6-7)2+(8-7)2+(10-7)2+(12-7)2]=,
4,6,8,10,貝!|平均數(shù)〃z=;(4+6+8+10)=7,
標準差S?=^[(4-7)2+(6-7)2+(8-7)2+(10-7)2]=也,
顯然巫1>E,即為>$2;故C錯誤;
3
對于選項D:不妨設為<x2<x3<x4<x5<x6,
則工6-芯之“5-工2,當且僅當%=工2,入5=工6時,等號成故D正確;
故選:BD.
二、解答題
1.(2022新高考口卷20)一醫(yī)療團隊為研究某地的一種地方性疾病與當?shù)鼐用竦男l(wèi)生
習慣(衛(wèi)生習慣分為良好和不夠良好兩類)的關系,在已患該疾病的病例中隨機調查
了100例(稱為病例組),同時在未患該疾病的人群中隨機調查了100人(稱為對照
組),得到如下數(shù)據(jù):
不夠良好良好
病例組4060
對照組1090
(1)能否有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異?
n(ad-bc)2
(4+b)(c+d)(a+c)(b+d)
P(K2>k)0.0500.0100.001
k3.8416.63510.828
【答案】⑴答案見解析
【分析】(1)由所給數(shù)據(jù)結合公式求出K2的值,將其與臨界值比較大小,由此確定是否
有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異;(2)(i)根據(jù)定
義結合條件概率公式即可完成證明;(ii)根據(jù)(i)結合已知數(shù)據(jù)求R.
n(ad-be)2200(40x90-60x10)
【詳解】(1)由已知片=
(a+b)(c+d)(a+c)(b+d)50x150x100x100
又尸(K?26.635)=0.01,24>6,635,
所以有99%的把握認為患該疾病群體與未患該疾病群體的衛(wèi)生習慣有差異.
2.(2022新高考口卷T9)在某地區(qū)進行流行病學調查,隨機調查了100位某種疾病患
者的年齡,得到如下的樣本數(shù)據(jù)的頻率分布直方圖:
(1)估計該地區(qū)這種疾病患者的平均年齡(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代
表);
【答案】⑴47.9歲;
【分析】(1)根據(jù)平均值等于各矩形的面積乘以對應區(qū)間的中點值的和即可求出;
【詳解】(1)平均年齡元=(5x0.001+15x0.002+25x0.012+35x0.017+45x0.023
+55x0.020+65x0.017+75x0.006+85x0.002)x10=47.9(歲).
3.(2023新高考口卷T9)某研究小組經過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某
項醫(yī)學指標有明顯差異,經過大量調查,得到如下的患病者和未患病者該指標的頻率
分布直方圖:
t就率阻距c&0m
0.040...........................^U8
O6
0.036...........................oa.O4■、
0.034..........................
0.012...................
0.010--------------------------------------
—指標0.002j-------------,岫
(^9510()10511015120125130<^707580859095100105
東電磕%
利用該指標制定一個檢測標準,需要確定臨界值c,將該指標大于c的人判定為陽性,
小于或等于C的人判定為陰性.此檢測標準的漏診率是將患病者判定為陰性的概率,
記為0(C);誤診率是將未患病者判定為陽性的概率,記為4(c).假設數(shù)據(jù)在組內均勻
分布,以事件發(fā)生的頻率作為相應事件發(fā)生的概率.
(1)當漏診率p(c)=0.5%時,求臨界值c和誤診率"(c);
【答案】⑴c=97.5,4(c)=3.5%;
【分析】(1)根據(jù)題意由第一個圖可先求出。,再根據(jù)第二個圖求出C297.5的矩形面
積即可解出;
【詳解】(1)依題可知,左邊圖形第一個小矩形的面積為5x0.002>0.5%,所以
95<c<100,
所以(c-95)x0.002=0.5%,解得:c=97.5,
q(c)=0.01x(100-97.5)+5x0.002=0.035=3.5%.
知識點總結
一、分層隨機抽樣
1、分層隨機抽樣的概念
一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個
子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合
在一起作為總樣本,這樣的抽樣方法稱為分層隨機抽樣,每一個子總體稱為層.
2、分層隨機抽樣的平均數(shù)計算
在分層隨機抽樣中,以層數(shù)是2為例,如果第1層和第2層包含的個體數(shù)分別為〃和
N,抽取的樣本量分別為加和九,第1層和第2層的樣本平均數(shù)分別為I,亍,樣本
_———Z77—77—
平均數(shù)位①,則0=------X+------y=——x+——y.我們可以采用樣本平均
M+NM+Nm+nm+n
數(shù)了估計總體平均數(shù)”
二、樣本的數(shù)字特征
1、眾數(shù)、中位數(shù)、平均數(shù)
(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)叫眾數(shù),眾數(shù)反應一組數(shù)據(jù)的多數(shù)水平.
(2)中位數(shù):將一組數(shù)據(jù)按大小順序依次排列,把處在最中間位置的一個數(shù)據(jù)(或最
中間兩個數(shù)據(jù)的平均數(shù))叫做這組數(shù)據(jù)的中位數(shù),中位數(shù)反應一組數(shù)據(jù)的中間水平.
(3)平均數(shù):〃個樣本數(shù)據(jù)占,程…,的平均數(shù)為[=*+如+…%,反應一組數(shù)據(jù)
n
的平均水平,公式變形:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 后勤工作合同范本
- 品牌客戶合同范本
- 唱模板約合同范本
- 喝酒不訛人協(xié)議書
- 社區(qū)監(jiān)管協(xié)議書
- 水電繳費協(xié)議書
- 教育行業(yè)教學物資采購專員面試題集
- 協(xié)議書醫(yī)院協(xié)議書
- 簽約養(yǎng)護協(xié)議書
- 線路經營協(xié)議書
- GB/T 26289-2010高純硒化學分析方法硼、鋁、鐵、鋅、砷、銀、錫、銻、碲、汞、鎂、鈦、鎳、銅、鎵、鎘、銦、鉛、鉍量的測定電感耦合等離子體質譜法
- GB/T 25848-2010耐酸陶瓷球拱
- GA 923-2011公安特警專用車輛外觀制式涂裝規(guī)范
- 羽毛球教學大綱
- 《居民投資理財問題研究8800字【論文】》
- 第十六章 教學交往與課堂管理
- DB32T 4064-2021 江蘇省城鎮(zhèn)燃氣安全檢查標準
- Aletterofsympathy慰問信課件-高三英語寫作專項
- 閥出廠檢驗規(guī)程
- 初中數(shù)學華東師大七年級下冊(2023年新編)第10章 軸對稱平移與旋轉專題將軍飲馬2
- 大學《世界古代史》期末復習簡答題、論述題合集及答案
評論
0/150
提交評論