統(tǒng)計講義-2025屆高三數(shù)學一輪復習_第1頁
統(tǒng)計講義-2025屆高三數(shù)學一輪復習_第2頁
統(tǒng)計講義-2025屆高三數(shù)學一輪復習_第3頁
統(tǒng)計講義-2025屆高三數(shù)學一輪復習_第4頁
統(tǒng)計講義-2025屆高三數(shù)學一輪復習_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第12章概率統(tǒng)計

模塊1統(tǒng)計

§第1節(jié)抽樣

一、內(nèi)容提要

高中數(shù)學中需掌握的抽樣方法有簡單隨機抽樣、分層隨機抽樣兩種.

i.簡單隨機抽樣:簡單隨機抽樣常用抽簽法、隨機數(shù)法來實現(xiàn),它有方法簡單、直觀等特點,

是一種基本的抽樣方法.但當總體很大時,操作起來不方便,且簡單隨機抽樣沒有利用其它輔

助信息,估計效率往往不高.

2.分層隨機抽樣:在個體差異較大的情形下,只要選取的分層變量合適,使得各層間差異明顯、

層內(nèi)差異不大,分層隨機抽樣的效果一般會好于簡單隨機抽樣,且分層隨機抽樣除了能得到總

體的估計外,還能得到每層的估計.

3.兩種抽樣估計總體平均數(shù)的方法

①簡單隨機抽樣:從總體中用簡單隨機抽樣抽取一個容量為n的樣本,它們的變量值分別為yi,

y2,…,yn,則稱y=為樣本均值,又稱樣本平均數(shù),我們常用樣本平均數(shù)y去估計總

體平均數(shù).

②分層隨機抽樣:核心方法是用樣本中各層的平均數(shù)估計總體中各層的平均數(shù).

以將總體分2層為例,設第1層各個個體的變量值分別為X1;X2,-,XM,從第1層中抽取的

樣本的變量值分別為.X1,X2,…,Xm,則可用第1層的樣本平均數(shù)又=X1+X2:?+Xm來估計第1層的

總體平均數(shù)X=xm+…+XM.

M

同理,設第2層的各個個體的變量值分別為YI,Y2,...,YN,從第2層中抽取的樣本的變量值

分別為y〃y2,…,yn,則可用第2層的樣本平均數(shù)y="(也來估計第2層的總體平均數(shù)Y=

丫1+丫2~1--FYN

N1

所以總體的平均數(shù)的估計值為等¥=/元

M+NM+NM+N,

在按比例分配的分層隨機抽樣中,與=4=篙,所以懸=口,急=吃,從而盛云+

MNM+NM+Nm+nM+Nm+nM+N

盤y=上天+q%其中上元+,y即為總樣本平均數(shù),故可直接用總樣本平均數(shù)估計總

體平均數(shù).

二、考點題型

類型I:抽樣方法的選擇

【例1】現(xiàn)要完成下列兩項抽樣調(diào)查:①從20盒餅干中抽取4盒進行食品衛(wèi)生檢查;②某中學

有360名教職工,其中一般教師280名,行政人員55名,后勤人員25名,為了了解教職工對學

校在校務公開方面的意見,擬抽取一個樣本量為72的樣本;較為合理的抽樣方法是()

A.①簡單隨機抽樣,②分層抽樣B.①簡單隨機抽樣,②簡單隨機抽樣

C.①分層抽樣,②分層抽樣D.①分層抽樣,②簡單隨機抽樣

【例2]某班有男生20人,女生30人,從中抽取10人為樣本,恰好抽到了4名男生和6名女

生,則下列說法正確的是()

A.該抽樣可能是比例分配的分層隨機抽樣

B.該抽樣必定是比例分配的分層隨機抽樣

C.該抽樣一定不是用隨機數(shù)法

D.該抽樣中每個女生被抽到的概率大于每個男生被抽到的概率

類型n:分層隨機抽樣中抽取個數(shù)的計算

【例3】一支田徑隊有運動員98人,其中男運動員56人,按男女比例用分層隨機抽樣,從全體

運動員中抽取一個樣本量為42的樣本,那么應抽取女運動員的人數(shù)是.

【變式1】為了貫徹落實中央新疆工作座談會和全國對口支援新疆工作會議精神,促進新疆教育

事業(yè)發(fā)展,要從甲、乙、丙三個城市選取300名教師支援新疆的教育事業(yè).已知乙城市教師人

數(shù)有18600人,丙城市教師人數(shù)有41400人,若用按比例分配的分層隨機抽樣方法,甲城市需要

選派100人,那么甲城市總共的教師人數(shù)為()

A.10000B.20000C.24000D.30000

【變式2】某中學有高中生1800人,初中生1200人,為了解學生的課外鍛煉情況,用按比例分

配的分層隨機抽樣方法從學生中抽取一個樣本量為n的樣本,已知從高中生中抽取的人數(shù)比從

初中生中抽取的人數(shù)多24,則n=()

A.48B.72C.60D.120

【總結(jié)】在按比例分配的分層隨機抽樣中,涉及抽取個數(shù)的有關計算問題,往往抓住各層的抽取

率相等且等于總體的抽取率來建立方程并求解.

類型皿:總體平均數(shù)的估計

【例4】(多選)現(xiàn)有同類型的A,B兩種產(chǎn)品1000件,其中A產(chǎn)品400件,B產(chǎn)品600件,為了調(diào)

查這1000件產(chǎn)品的質(zhì)量指標值,用分層隨機抽樣的方法得到了一個樣本,樣本中A產(chǎn)品和B產(chǎn)

品質(zhì)量指標值的平均數(shù)分別為84和90,則下列說法正確的是()

A.若是按比例分配分層抽取,且樣本量是100,則A產(chǎn)品抽取了40件

B.若是按比例分配分層抽取,則可估計1000件產(chǎn)品的質(zhì)量指標值為87.6

C.若A,B產(chǎn)品分別抽取了20件和80件,則可估計1000件產(chǎn)品的質(zhì)量指標值為88.8

D.若A,B產(chǎn)品分別抽取了20件和80件,則可估計1000件產(chǎn)品的質(zhì)量指標值為87.6

【總結(jié)】對于分層隨機抽樣,若是按比例抽取,則可用總樣本的平均數(shù)估計總體的平均數(shù);若

不是按比例抽取,則常用樣本中各層的平均數(shù)來估計總體中各層的平均數(shù),再計算總體的平均

數(shù).

§第2節(jié)用樣本估計總體

一、內(nèi)容提要

本節(jié)包含總體取值規(guī)律的估計,總體百分位數(shù)的估計,總體集中趨勢估計,總體離散程度

估計等內(nèi)容,下面先把涉及到的一些基礎知識進行梳理.

1.頻率分布直方圖:每個小矩形的面積表示數(shù)據(jù)落在該組的頻率,各小矩形的面積之和為1.

2.百分位數(shù):一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有p%的數(shù)據(jù)小

于或等于這個值,且至少有(100-p)%的數(shù)據(jù)大于或等于這個值,其計算步驟為:

①按從小到大排列原始數(shù)據(jù);

②計算i=nxp%,其中n為樣本量;

③若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第P百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則

第p百分位數(shù)為第i項和第i+1項數(shù)據(jù)的平均數(shù).

3.平均數(shù):可反映數(shù)據(jù)的集中趨勢.

①一組數(shù)據(jù)X1,X2.....Xn的平均數(shù)天=X1+X2;.+Xn,

②由頻率分布直方圖估計樣本平均數(shù),常用每組區(qū)間中點值代表落在該區(qū)間的數(shù)據(jù),若設各組

區(qū)間中點為Xi,X2Xn,對應各組的頻率為fi,f2,ffl,則可估計樣本平均數(shù)云=JXiXifj.

4.中位數(shù):可反映數(shù)據(jù)的集中趨勢.

①對于從小到大排列的一組數(shù)據(jù),若數(shù)據(jù)個數(shù)為奇數(shù),則中位數(shù)為最中間的一個數(shù)據(jù);若數(shù)據(jù)

個數(shù)為偶數(shù),則中位數(shù)為中間兩個數(shù)據(jù)的平均數(shù).

②由頻率分布直方圖估計樣本中位數(shù),應在橫軸上找到一個數(shù),使其左右兩側(cè)頻率各占0.5.

5.眾數(shù):可反映數(shù)據(jù)的集中趨勢.

①一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)即為該組數(shù)據(jù)的眾數(shù),若有幾個數(shù)據(jù)出現(xiàn)次數(shù)一樣多,且都

比其它數(shù)據(jù)多,則它們都是眾數(shù).

②由頻率分布直方圖估計樣本眾數(shù),取最高的小矩形區(qū)間中點即可.

6.極差:一組數(shù)據(jù)的最大值與最小值之差,它可以一定程度反映數(shù)據(jù)的離散程度.

7.方差、標準差:刻畫數(shù)據(jù)的離散程度.方差、標準差越大,數(shù)據(jù)越分散,反之越集中.

①一組數(shù)據(jù).X],X2,…,Xn的方差s2=(£K](Xi—幻2=(2匕X?—又2,方差公式的兩種形式都需

掌握,計算或證明時都可能用到.方差的算數(shù)平方根S即為標準差.若數(shù)據(jù)X],X2,…,Xn有重復,

設其不重復的值為丫1,丫2,…,yk,對應的數(shù)據(jù)個數(shù)依次為fk,則S?=[荒在皿一幻2.

②由頻率分布直方圖估計樣本方差,常用每組區(qū)間中點值代表落在該區(qū)間的數(shù)據(jù),若設各組區(qū)

間中點為X],X2,…,Xn,對應各組的頻率為.3則可估計樣本方差S?=£匕(又一二4電

③方差、標準差的性質(zhì):設數(shù)據(jù)X],X2,…,Xn的平均數(shù)為男方差為S2,則數(shù)據(jù)Yi=aXi+b(i=1,

22

2,―,n)的平均數(shù)y=ax+b,方差sf=as(后面有證明),標準差sy=|a|s.

證明:—產(chǎn)

1

=-SiLiCaXj+b)2-(ax+b)2

1

=-XiLi(a2x?+2abXj+b2)-(a2x2+2abx+b2)

111

=-SLia2x?+-ELi2abx+-SLib2-(a2x2+2abx+b2)

nnin

11

=a2-+2abx+--nb2-(a2x2+2abx+b2)

=a2QSiLiX?-x2)=a2s2.

二、考點題型

類型I:由頻率分布直方圖計算頻率、頻數(shù)

[例1]某地區(qū)工會利用“健步行APP”開展健步走活動.為了解會員的健步走情況,工會在某

天從系統(tǒng)中抽取了1000名會員,統(tǒng)計了當天他們的步數(shù)(千步為單位),并將樣本數(shù)據(jù)分為[3,

5),[5,7),[7,9),[17,19),[19,21]九組,整理得到如圖所示的頻率分布直方圖,則當

天這1000名會員中步數(shù)少于11千步的人數(shù)為()

A.100B.200C.260D.300

頻率

0.15

6

10

0M5

o.03

o.02

.01

o.。,步數(shù)(單.位:千步)

o.

o.3579111315171921

【變式】如圖是一學校期末考試中某班物理成績的頻率分布直方圖,數(shù)據(jù)的分組依次為[40,50),

[50,60),[60,70),[70,80),[80,90),[90,100],若成績不低于70分的人數(shù)比成績低于70

分的人數(shù)多4人,則@=;該班的學生人數(shù)為.

【總結(jié)】在頻率分布直方圖中,需注意三點:①某個小矩形的面積代表數(shù)據(jù)落在該組的頻率;②

小矩形的面積之和為1;③計算頻數(shù)用頻率X樣本量.

類型II:百分位數(shù)的計算

【例2】如圖是根據(jù)某市1月1日至1月10日的最低氣溫(單位:。C)的情況繪制的折線統(tǒng)計圖,

由圖可知這10天的最低氣溫的第40百分位數(shù)是()

A.2℃B.-l℃C.-0.5℃D.-2℃

12345678910

【變式1】某學校組織班級知識競賽,某班的12名學生的成績(單位:分)分別是58,67,73,7

4,76,82,82,87,90,92,93,98,則這12名學生成績的第70百分位數(shù)是.

【變式2】凱里市被評為全國文明城市,為了鞏文固衛(wèi),凱里一中某研究性學習小組舉辦了“文

明城市”知識競賽,從所有答卷中隨機抽取400份試卷作為樣本,將樣本的成績(滿分100分,

成績均為不低于40分的整數(shù))分成6段:[40,50),[50,60),[90,100],得到如圖所示的頻

率分布直方圖,則2=;由圖可估計知識競賽的第80百分位數(shù)為.

【總結(jié)】①給出n個數(shù)據(jù),讓求第p百分位數(shù),先將數(shù)據(jù)按從小到大的順序排列,再計算i=n

xp%,若i為整數(shù),則取第i個和第i+1個數(shù)據(jù)的平均值作為第p百分位數(shù),若i不是整數(shù),

而比i大的最小整數(shù)為j,則取第j個數(shù)據(jù)為第P百分位數(shù);②由頻率分布直方圖估計第p百分

位數(shù),只需在頻率分布直方圖中找到左側(cè)小矩形面積和為p%的位置即可.

類型ni:平均數(shù)、中位數(shù)、眾數(shù)的計算

【例3】甲、乙兩位同學本學期前8周的各周課外閱讀時長的條形統(tǒng)計圖如圖所示.

則下列結(jié)論正確的是()

A.甲同學周課外閱讀時長的樣本眾數(shù)為8

B.甲同學周課外閱讀時長的樣本中位數(shù)是5.5

C.乙同學周課外閱讀時長的樣本平均數(shù)是7.5

D.乙同學周課外閱讀時長大于8的概率的估計值大于0.4

【反思】一組數(shù)據(jù)的眾數(shù)是出現(xiàn)次數(shù)最多的數(shù)據(jù),若有多個數(shù)據(jù)出現(xiàn)次數(shù)一樣多,且都比其它數(shù)

據(jù)多,那它們都是眾數(shù).

【例4】非物質(zhì)文化遺產(chǎn)(簡稱“非遺”)是優(yōu)秀傳統(tǒng)文化的重要組成部分,是一個國家和民族

歷史文化成就的重要標志.隨著短視頻這一新興媒介形態(tài)的興起,非遺傳播獲得廣闊的平臺,

非遺文化迎來了發(fā)展的春天.為研究非遺短視頻受眾的年齡結(jié)構(gòu),現(xiàn)從各短視頻平臺隨機調(diào)查

了1000名非遺短視頻的粉絲,記錄他們的年齡,將數(shù)據(jù)分成6組:[10,20),[20,30),…,[50,60),

[60,70],并整理得到如下的頻率分布直方圖:

(1)求a的值;

(2)在頻率分布直方圖中,用每一個小矩形底邊中點的橫坐標作為該組粉絲年齡的平均數(shù),估計

非遺短視頻粉絲年齡的平均數(shù)m,若中位數(shù)的估計值為n,比較m與n的大小關系.

【反思】由頻率分布直方圖估計樣本數(shù)據(jù)的中位數(shù),就是在頻率分布直方圖的橫軸上找一個數(shù),

使不超過該數(shù)的頻率和為0.5,求解時應先判斷中位數(shù)位于哪一組,再列方程計算.

類型IV:方差、標準差的計算與分析

[例5]某社區(qū)通過公益講座來普及社區(qū)居民的垃圾分類知識,隨機抽取10位社區(qū)居民,讓他

們在講座前和講座后各回答一份垃圾分類知識問卷,這10位社區(qū)居民在講座前和講座后問卷答

A.講座前問卷答題的正確率的中位數(shù)小于70%

B.講座后問卷答題的正確率的平均數(shù)大于85%

C.講座前問卷答題的正確率的標準差小于講座后正確率的標準差

D.講座后問卷答題的正確率的極差大于講座前正確率的極差

【變式】已知一組數(shù)據(jù)為:4,1,2,5,5,3,3,2,3,2,則這組數(shù)據(jù)的方差為;標準

差為.

【例6】(多選)第一組數(shù)據(jù):X1,x2,…,x團,由這組數(shù)據(jù)得到第二組數(shù)據(jù):yi,y2,…,yn,其中火=

axj+b(i=1,2,…,n))且a,b為正數(shù),則下列命題正確的是()

A.當a=l時,兩組數(shù)據(jù)的平均數(shù)不相同

B.第二組數(shù)據(jù)的極差是第一組的a倍

C.第二組數(shù)據(jù)的方差是第一組的a倍

D.第二組數(shù)據(jù)的標準差是第一組的a倍

【反思】若數(shù)據(jù)%6=1,2,-??,n)的標準差為s,則數(shù)據(jù)a%+b(i=1,2,…,n)的標準差為|a|s,方

差為a2sz.

【變式】已知一組數(shù)據(jù)xi,X2,X3的平均數(shù)為4,方差為2,則由3xi-1,3X2—1,3X3-1和11

這四個數(shù)據(jù)組成的新數(shù)據(jù)組的方差是.

【反思】對于添項或減項的新數(shù)據(jù)組方差計算問題,常

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論