2026屆高考數(shù)學(xué)總復(fù)習(xí)(第1輪)基礎(chǔ)版專題7 統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布1_第1頁
2026屆高考數(shù)學(xué)總復(fù)習(xí)(第1輪)基礎(chǔ)版專題7 統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布1_第2頁
2026屆高考數(shù)學(xué)總復(fù)習(xí)(第1輪)基礎(chǔ)版專題7 統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布1_第3頁
2026屆高考數(shù)學(xué)總復(fù)習(xí)(第1輪)基礎(chǔ)版專題7 統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布1_第4頁
2026屆高考數(shù)學(xué)總復(fù)習(xí)(第1輪)基礎(chǔ)版專題7 統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布1_第5頁
已閱讀5頁,還剩83頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

專題7統(tǒng)計、成對數(shù)據(jù)的統(tǒng)計分析、計數(shù)原理、概率、隨機變量及其分布考點考情考向考頻概率與統(tǒng)計統(tǒng)計2022年新課標(biāo)Ⅱ卷T192023年新課標(biāo)Ⅰ卷T92023年新課標(biāo)Ⅱ卷T192024年新課標(biāo)Ⅰ卷T92024年新課標(biāo)Ⅱ卷T43年5考計數(shù)原理與二項式定理2022年新課標(biāo)Ⅰ卷T132022年新課標(biāo)Ⅱ卷T52023年新課標(biāo)Ⅰ卷T132023年新課標(biāo)Ⅱ卷T32024年新課標(biāo)Ⅱ卷T143年5考概率與概率性質(zhì)2022年新課標(biāo)Ⅰ卷T5、T202022年新課標(biāo)Ⅱ卷T192023年新課標(biāo)Ⅰ卷T212023年新課標(biāo)Ⅱ卷T12、T192024年新課標(biāo)I卷T14、T192024年新課標(biāo)Ⅱ卷T183年9考成對數(shù)據(jù)的統(tǒng)計分析2022年新課標(biāo)Ⅰ卷T203年1考隨機變量及其分布2022年新課標(biāo)Ⅱ卷T132023年新課標(biāo)Ⅰ卷T212024年新課標(biāo)Ⅰ卷T92024年新課標(biāo)Ⅱ卷T183年4考近三年的高考命題,重點考查樣本數(shù)據(jù)的中位數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、極差的含義,正態(tài)分布,成對數(shù)據(jù)的相關(guān)性,回歸分析,獨立性檢驗,二項式定理,計數(shù)原理,古典概型,條件概率,互斥事件、對立事件和相互獨立事件的定義與概率,條件概率與全概率,離散型隨機變量及其分布列、數(shù)學(xué)期望等.常以容易題或中檔題形式考查樣本數(shù)據(jù)的中位數(shù)、平均數(shù)、標(biāo)準(zhǔn)差、極差的含義,正態(tài)分布,回歸分析,二項式定理,計數(shù)原理,古典概型,條件概率與全概率,互斥事件、對立事件和相互獨立事件的定義與概率,以中檔題形式考查成對數(shù)據(jù)的相關(guān)性、獨立性檢驗,以中檔題或中檔偏難題形式考查離散型隨機變量及其分布列、數(shù)學(xué)期望,概率與數(shù)列或函數(shù)綜合問題.注重考查數(shù)據(jù)分析、邏揖推理、數(shù)學(xué)運算等數(shù)學(xué)素養(yǎng).本專題包括統(tǒng)計、計數(shù)原理與二項式定理、概率與概率性質(zhì)、成對數(shù)據(jù)的統(tǒng)計分析、離散型隨機變量及其分布五部分內(nèi)容.近幾年全國卷多以“兩小一大”進行考查.計數(shù)原理與二項式定理以一道較容易的客觀題考查排列與組合、二項式定理,有時與古典概型、離散型隨機變量的分布列綜合考查.概率與統(tǒng)計的客觀題主要考查概率計算(包括古典概型,獨立事件、互斥事件的概率,條件概率,全概率等)及統(tǒng)計(包括抽樣方法、統(tǒng)計圖表、正態(tài)分布、回歸分析、相關(guān)系數(shù)等),一般為容易題或中等難度題.概率與統(tǒng)計的解答題側(cè)重數(shù)學(xué)技能的考查,試題背景與日常生活及其他學(xué)科貼近,體現(xiàn)概率統(tǒng)計的思想與方法,考查數(shù)據(jù)分析、數(shù)學(xué)建模(概率統(tǒng)計模型)的數(shù)學(xué)素養(yǎng),考查閱讀、理解、分析與解決問題的數(shù)學(xué)技能.復(fù)習(xí)本單元時,要注意以下幾點:1.排列、組合、二項式定理以其獨特的研究對象和研究方法,在中學(xué)數(shù)學(xué)中占有特殊的地位.它們既是學(xué)習(xí)概率的預(yù)備知識,又是進一步學(xué)習(xí)數(shù)理統(tǒng)計、組合數(shù)學(xué)等高等數(shù)學(xué)的基礎(chǔ).盡管在高考中直接考查的試題不是很多,但仍必須非常重視.要求掌握的解排列組合應(yīng)用題的常用方法有:直接計算法與間接計算法;分類法與分步法;元素分析法和位置分析法;插空法和捆綁法等.二項式定理屬于高頻率考點,需要熟練掌握二項展開式的通項,會運用通項公式求特定項的系數(shù)和與系數(shù)有關(guān)的問題;要掌握化歸與轉(zhuǎn)化的思想方法,將非二項式的問題化歸為可以用二項式定理來處理的問題;要熟練掌握二項式系數(shù)的性質(zhì);利用恒等式的思想處理有關(guān)系數(shù)和的問題.2.高考主要是以生活實際問題作為背景考查概率與統(tǒng)計的綜合應(yīng)用.求解概率問題時應(yīng)首先分清是哪類概率問題,明確事件之間的關(guān)系,如互斥、對立、相互獨立、條件概率等,針對不同的概型靈活地選擇相應(yīng)的方法及公式.3.進一步掌握統(tǒng)計思想與方法及數(shù)據(jù)處理能力.當(dāng)總體容量大或檢測具有一定的破壞性時,可以從總體中抽取適當(dāng)?shù)臉颖?,通過對樣本進行分析研究,得到對總體的估計,這就是統(tǒng)計分析的基本過程,用樣本估計總體是統(tǒng)計思想的本質(zhì).4.對于兩個變量的樣本數(shù)據(jù)進行相關(guān)分析,可發(fā)現(xiàn)存在現(xiàn)實世界的回歸現(xiàn)象,要掌握用最小二乘法得到的經(jīng)驗回歸方程進行預(yù)測和估計,為決策者提供依據(jù).掌握回歸分析的基本思想及其初步應(yīng)用、獨立性檢驗的基本思想及其初步應(yīng)用,提高自身的計算能力及解答實際問題的能力.概率與統(tǒng)計拓寬了應(yīng)用問題取材的范圍,概率的計算、成對數(shù)據(jù)的統(tǒng)計分析、離散型隨機變量的分布列和數(shù)學(xué)期望的計算等內(nèi)容都是考查實踐能力的極好素材.考慮到教學(xué)實際和學(xué)生的生活實際,高考對這部分內(nèi)容的考查主要是以學(xué)生的生活實際為背景材料,考查基礎(chǔ)知識和基本方法.在復(fù)習(xí)過程中,要立足教材,重視對教材例題與復(fù)習(xí)參考題的探究、延伸與創(chuàng)新.

第40講隨機抽樣、統(tǒng)計圖表、用樣本估計總體[課標(biāo)要求]1.理解隨機抽樣的必要性和重要性,會用簡單隨機抽樣方法從總體中抽取樣本,了解分層隨機抽樣.2.會列頻率分布表,會畫頻率分布直方圖,理解它們各自的特點.3.理解樣本數(shù)據(jù)標(biāo)準(zhǔn)差的意義和作用,會計算數(shù)據(jù)標(biāo)準(zhǔn)差.能從樣本數(shù)據(jù)中提取基本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差),并給出合理的解釋.4.會用統(tǒng)計圖表對總體進行估計,會求n個數(shù)據(jù)的第p百分位數(shù),會用樣本的基本數(shù)字特征估計總體集中趨勢和總體離散程度,理解用樣本估計總體的思想.1.簡單隨機抽樣(1)簡單隨機抽樣分為放回簡單隨機抽樣和不放回簡單隨機抽樣,除非特殊聲明,所稱的簡單隨機抽樣是指不放回簡單隨機抽樣.不放回簡單隨機抽樣:設(shè)一個總體含有N(N為正整數(shù))個個體,從中__逐個__抽取n(1≤n<N)個個體作為樣本,如果抽取是__不放回的__,且每次抽取時總體內(nèi)未進入樣本的各個個體被抽到的__概率__都相等.最常用的簡單隨機抽樣的方法有兩種:__抽簽法__和__隨機數(shù)法__.(2)分層隨機抽樣:一般地,按一個或多個變量把總體劃分成若干個子總體,每個個體屬于且僅屬于一個子總體,在每個子總體中獨立地進行簡單隨機抽樣,再把所有子總體中抽取的樣本合在一起作為總樣本,這種抽樣方法稱為分層隨機抽樣,每個子總體稱為層.簡單隨機抽樣、分層隨機抽樣的共同特點是在抽樣過程中每一個個體被抽取的__概率相等__,體現(xiàn)了這些抽樣方法的客觀性和公平性.2.用樣本估計總體(1)通常我們對總體做出的估計一般分成兩種:一種是用樣本的頻率分布估計__總體的分布__;另一種是用樣本的數(shù)字特征(如平均數(shù)、標(biāo)準(zhǔn)差等)估計__總體數(shù)字特征__.(2)作頻率分布直方圖的步驟①求極差(即一組數(shù)據(jù)中最大值與最小值的差).②決定__組距__與__組數(shù)__.③將數(shù)據(jù)分組.④列頻率分布表.⑤畫頻率分布直方圖.(3)在頻率分布直方圖中,縱軸表示__eq\f(頻率,組距)__,數(shù)據(jù)落在各個小組內(nèi)的頻率用__各小長方形的面積__表示.各小長方形的面積總和等于1.(4)常見的其他統(tǒng)計圖:條形圖、扇形圖、折線圖.①扇形圖主要用于直觀描述各類數(shù)據(jù)占總數(shù)的比例.②條形圖和直方圖主要用于直觀描述不同類別或分組數(shù)據(jù)的頻數(shù)和頻率.③折線圖主要用于描述數(shù)據(jù)隨時間的變化趨勢.(5)總體百分位數(shù)的估計①第p百分位數(shù)的定義一般地,一組數(shù)據(jù)的第p百分位數(shù)是這樣一個值,它使得這組數(shù)據(jù)中至少有__p%__的數(shù)據(jù)小于或等于這個值,且至少有__(100-p)%__的數(shù)據(jù)大于或等于這個值.②計算一組n個數(shù)據(jù)的第p百分位數(shù)的步驟第1步,按從小到大排列原始數(shù)據(jù).第2步,計算i=__n×p%__.第3步,若i不是整數(shù),而大于i的比鄰整數(shù)為j,則第p百分位數(shù)為__第j項__數(shù)據(jù).若i是整數(shù),則第p百分位數(shù)為第i項與第(i+1)項數(shù)據(jù)的__平均數(shù)__.③四分位數(shù)常用的分位數(shù)有第__25__百分位數(shù)、第__50__百分位數(shù)、第__75__百分位數(shù),這三個分位數(shù)把一組由小到大排列后的數(shù)據(jù)分成__四等__份,因此稱為四分位數(shù).其中第__25__百分位數(shù)也稱為第一四分位數(shù)或下四分位數(shù)等,第__75__百分位數(shù)也稱為第三四分位數(shù)或上四分位數(shù)等.(6)用樣本的數(shù)字特征估計總體的數(shù)字特征①眾數(shù)、中位數(shù)、平均數(shù)的定義眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).眾數(shù)對其他數(shù)據(jù)信息的忽略比較明顯,無法客觀反映總體特征.中位數(shù):將數(shù)據(jù)從小到大(或從大到小)排列,若有奇數(shù)個數(shù),則最中間的數(shù)是中位數(shù);若有偶數(shù)個數(shù),則中間兩個數(shù)的平均數(shù)是中位數(shù).中位數(shù)等分樣本數(shù)據(jù)所占頻率,它不受少數(shù)幾個極端值的影響,同時對極端值不敏感.平均數(shù):a.總體均值(總體平均數(shù))一般地,總體中有N個個體,它們的變量分別為Y1,Y2,…,YN,則稱eq\o(Y,\s\up6(-))=eq\f(Y1+Y2+…+YN,N)=eq\f(1,N)為總體均值,又稱總體平均數(shù).如果總體的N個變量中,不同的值共有k(k≤N)個,不妨記為Y1,Y2,…,Yk,其中Yi出現(xiàn)的頻數(shù)為fi(i=1,2,…,k),則總體均值還可以寫成加權(quán)平均數(shù)形式的總體平均數(shù)eq\o(Y,\s\up6(-))=eq\f(1,N).b.樣本均值(樣本平均數(shù))如果從總體中抽取一個容量為n的樣本,它們的變量分別為y1,y2,…,yn,則稱eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\f(1,n)為樣本均值,又稱樣本平均數(shù).樣本均值反映了一組數(shù)據(jù)的平均水平,與每一個樣本數(shù)據(jù)有關(guān),可以反映出更多關(guān)于樣本數(shù)據(jù)全體的信息,但平均數(shù)受數(shù)據(jù)中極端值的影響較大,使平均數(shù)在估計總體時可靠性降低.②頻率分布直方圖中的眾數(shù)、中位數(shù)和平均數(shù)a.眾數(shù):最高的小長方形底邊中點的橫坐標(biāo).b.中位數(shù):平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點的橫坐標(biāo).c.平均數(shù):頻率分布直方圖中每個小長方形的面積乘小長方形底邊中點的橫坐標(biāo)之和.③方差和標(biāo)準(zhǔn)差a.總體方差和標(biāo)準(zhǔn)差如果總體中所有個體的變量值分別為Y1,Y2,…,YN,總體平均數(shù)為eq\o(Y,\s\up6(-)),則總體方差S2=__eq\f(1,N)eq\o(∑,\s\up9(N),\s\do9(i=1))(Yi-eq\o(Y,\s\up6(-)))2__,S=eq\r(S2)為總體標(biāo)準(zhǔn)差.b.樣本方差和標(biāo)準(zhǔn)差如果一個樣本中個體的變量值分別為y1,y2,…,yn,樣本的平均數(shù)為eq\o(y,\s\up6(-)),則樣本方差為s2=_eq\f(1,n)eq\o(∑,\s\up9(n),\s\do9(i=1))(yi-eq\o(y,\s\up6(-)))2__,s=eq\r(s2)為樣本標(biāo)準(zhǔn)差.樣本標(biāo)準(zhǔn)差(方差)刻畫了樣本數(shù)據(jù)的__離散程度或波動幅度__,標(biāo)準(zhǔn)差(方差)越大,數(shù)據(jù)的離散程度越大;標(biāo)準(zhǔn)差(方差)越小,數(shù)據(jù)的離散程度越?。?.(教材母題必修9.1T1)某學(xué)校為了了解三年級、六年級、九年級這三個年級的學(xué)生視力是否存在顯著差異,擬從這三個年級中按人數(shù)比例抽取部分學(xué)生進行調(diào)查,則最合理的抽樣方法是()A.抽簽法B.隨機數(shù)法C.分層隨機抽樣法D.其他方法解析:C因為三年級、六年級、九年級三個年級的學(xué)生視力存在差異,且對統(tǒng)計結(jié)果有影響,所以按人數(shù)比例抽取部分學(xué)生進行調(diào)查時,合理的抽樣方法為分層隨機抽樣法.故選C.2.(2024·湖南長沙二模)已知樣本數(shù)據(jù)x1,x2,…,x100的平均數(shù)和標(biāo)準(zhǔn)差均為4,則數(shù)據(jù)-x1-1,-x2-1,…,-x100-1的平均數(shù)與方差分別為()A.-5,4B.-5,16C.4,16D.4,4解析:B由題意知樣本數(shù)據(jù)x1,x2,…,x100的平均數(shù)和標(biāo)準(zhǔn)差均為4,則x1,x2,…,x100的方差為16,則-x1,-x2,…,-x100的平均數(shù)為-4,方差為(-1)2×16=16,故-x1-1,-x2-1,…,-x100-1的平均數(shù)為-4-1=-5,方差為16,故選B.3.已知某運動員每次投籃命中的概率是40%.現(xiàn)采用隨機模擬的方法估計該運動員三次投籃恰有兩次命中的概率:先由計算器產(chǎn)生0到9之間取整數(shù)值的隨機數(shù),指定1,2,3,4表示命中,5,6,7,8,9,0表示不命中;再以每三個隨機數(shù)為一組,代表三次投籃的結(jié)果.經(jīng)隨機模擬產(chǎn)生了如下10組隨機數(shù):204978171935263321947468579682.據(jù)此估計,該運動員三次投籃恰有兩次命中的概率為()A.eq\f(1,5)B.eq\f(3,10)C.eq\f(2,5)D.eq\f(4,5)解析:B10組隨機數(shù)204978171935263321947468579682中,表示三次投籃恰有兩次命中的事件是204,171,263,共3組,所以該運動員三次投籃恰有兩次命中的概率為P=eq\f(3,10).故選B.4.200輛汽車通過某一段公路時的時速的頻率分布直方圖如圖所示,則時速的眾數(shù)、中位數(shù)的估計值分別為__________.解析:65,62.5因為最高的矩形為第三個矩形,所以時速的眾數(shù)的估計值為eq\f(60+70,2)=65.前兩個矩形的面積為(0.01+0.03)×10=0.4<0.5,前三個矩形的面積為(0.01+0.03+0.04)×10=0.8>0.5,所以中位數(shù)在區(qū)間(60,70),設(shè)中位數(shù)為x,由題得0.4+(x-60)×0.04=0.5,解得x=62.5.所以中位數(shù)的估計值為62.5.5.高二年級進行消防知識競賽,統(tǒng)計所有參賽同學(xué)的成績,成績都在[50,100]內(nèi),估計所有參賽同學(xué)成績的第75百分位數(shù)為___________________.解析:85因為2a×10=1,所以a=0.05.參賽成績位于[50,80)內(nèi)的頻率為10×(0.01+0.015+0.035)=0.6,第75百分位數(shù)在[80,90)內(nèi),設(shè)為80+y,則0.03y=0.15,解得y=5,即第75百分位數(shù)為85.探究點1抽樣方法【例1】(1)(教材母題必修復(fù)習(xí)參考題9T4改編)某中學(xué)有高中生960人,初中生480人,為了了解學(xué)生的身體狀況,采用分層隨機抽樣的方法,從該校學(xué)生中抽取容量為n的樣本,其中高中生有24人,那么n=()A.12B.18C.24D.36(2)從一個容量為100的總體中抽取容量為10的樣本,選取簡單隨機抽樣和分層隨機抽樣兩種不同方法抽取樣本.在簡單隨機抽樣中,總體中每個個體被抽中的概率為p1,某個體第一次被抽中的概率為p2,在分層隨機抽樣中,總體中每個個體被抽中的概率為p3,則()A.p2<p1<p3B.p1=p2=p3C.p2<p1=p3D.p1=p2<p3(3)戰(zhàn)爭期間友軍的統(tǒng)計學(xué)家主要是將繳獲的敵軍坦克序列號作為樣本,用樣本估計總體的方法得出敵軍某月生產(chǎn)的坦克總數(shù).假設(shè)敵軍某月生產(chǎn)的坦克總數(shù)是N,繳獲的該月生產(chǎn)的n輛坦克編號從小到大為x1,x2,…,xn,即最大編號為xn,且繳獲的坦克是從所生產(chǎn)的坦克中隨機獲取的,因為生產(chǎn)坦克是連續(xù)編號的,所以繳獲坦克的編號x1,x2,…,xn,相當(dāng)于從[0,N]中隨機抽取的n個整數(shù),這n個數(shù)將區(qū)間[0,N]分成(n+1)個小區(qū)間,由于N是未知的,除了最右邊的區(qū)間外,其他n個區(qū)間都是已知的.由于這n個數(shù)是隨機抽取的,所以可以用前n個區(qū)間的平均長度eq\f(xn,n)估計所有(n+1)個區(qū)間的平均長度eq\f(N,n+1),進而得到N的估計值.例如,繳獲坦克的編號是3,5,12,18,20,則統(tǒng)計學(xué)家利用上述方法估計敵軍每月生產(chǎn)的坦克數(shù)為__________.解析:(1)D因為有高中生960人,初中生480人,所以總?cè)藬?shù)為960+480=1440人,所以其高中生占比為eq\f(960,1440)=eq\f(2,3),初中生占比為eq\f(1,3).由分層隨機抽樣的原理可知,抽取高中生的比例應(yīng)為高中生與總?cè)藬?shù)的比值eq\f(2,3),即n×eq\f(2,3)=24,則n=36.故選D.(2)B根據(jù)抽樣調(diào)查的原理可得簡單隨機抽樣、分層隨機抽樣都必須滿足每個個體被抽到的概率相等,即p1=p2=p3=eq\f(n,N)=eq\f(10,100).故選B.(3)24由于用前n個區(qū)間的平均長度eq\f(xn,n)估計所有(n+1)個區(qū)間的平均長度eq\f(N,n+1),而繳獲坦克的編號是3,5,12,18,20,即n=5,x5=20,故eq\f(20,5)=eq\f(N,5+1),所以N=24,即則統(tǒng)計學(xué)家利用上述方法估計敵軍每月生產(chǎn)的坦克數(shù)為24.分層隨機抽樣的步驟:①分層;②按比例確定每層抽取個體的個數(shù);③各層抽樣(方法可以不同);④合成樣本.采用分層隨機抽樣時,要注意公式的準(zhǔn)確運用:①抽樣比=eq\f(樣本容量,個體總量)=eq\f(各層樣本容量,各層個體數(shù)量);②某層抽取的個體數(shù)=抽樣比×該層個體數(shù).變式探究1.某學(xué)校初中部共120名教師,高中部共180名教師,其性別比例如圖所示,已知按分層隨機抽樣的方法得到的工會代表中,高中部女教師有6人,則工會代表中男教師的總?cè)藬?shù)為()A.12B.10C.8D.6解析:A因為高中部女教師有6人,占40%,設(shè)高中部人數(shù)為x,則x×40%=6,得x=15,即抽取的高中教師人數(shù)為15,則抽取的初中教師人數(shù)為eq\f(15,180)×120=10,則男教師有15×60%+10×30%=9+3=12(人),故選A.2.利用簡單隨機抽樣的方法,從n個個體(n>15)中抽取15個個體,若第二次抽取時,每個個體被抽到的概率為eq\f(1,4).則在整個抽樣過程中,每個個體被抽到的概率為________.解析:eq\f(5,19)第二次抽取時,余下的每個個體被抽取到的概率為eq\f(1,4),則eq\f(15-1,n-1)=eq\f(1,4),解得n=57,所以在整個抽樣過程中,每個個體被抽到的概率為P=eq\f(15,57)=eq\f(5,19).探究點2頻率分布直方圖【例2】(1)(多選)在某市高二舉行的一次期中考試中,某學(xué)科共有2000人參加考試.為了了解本次考試學(xué)生成績情況,從中抽取了部分學(xué)生的成績(成績均為正整數(shù),滿分為150分)作為樣本進行統(tǒng)計,樣本容量為n.按照[50,70),[70,90),[90,110)[110,130),[130,150]的分組作出頻率分布直方圖,如圖所示.其中,成績落在區(qū)間[50,70)內(nèi)的人數(shù)為16.下列結(jié)論正確的是()A.樣本容量n=1000B.x=0.015C.由樣本估計總體,該市全體學(xué)生成績的平均分近似為91.2分D.該市要對成績由高到低前20%的學(xué)生授予“優(yōu)秀學(xué)生”稱號,則成績?yōu)?06分的學(xué)生肯定能得到此稱號(2)(2023·新課標(biāo)Ⅱ卷)某研究小組經(jīng)過研究發(fā)現(xiàn)某種疾病的患病者與未患病者的某項醫(yī)學(xué)指標(biāo)有明顯差異,經(jīng)過大量調(diào)查,得到如下的患病者和未患病者該指標(biāo)的頻率分布直方圖:利用該指標(biāo)制定一個檢測標(biāo)準(zhǔn),需要確定臨界值c,將該指標(biāo)大于c的人判定為陽性,小于或等于c的人判定為陰性.此檢測標(biāo)準(zhǔn)的漏診率是將患病者判定為陰性的概率,記為p(c);誤診率是將未患病者判定為陽性的概率,記為q(c).假設(shè)數(shù)據(jù)在組內(nèi)均勻分布,以事件發(fā)生的頻率作為相應(yīng)事件發(fā)生的概率.(ⅰ)當(dāng)漏診率p(c)=0.5%時,求臨界值c和誤診率q(c);(ⅱ)設(shè)函數(shù)f(c)=p(c)+q(c),當(dāng)c∈[95,105]時,求f(c)的解析式,并求f(c)在區(qū)間[95,105]的最小值.解析:(1)BC對于A,因為成績落在區(qū)間[50,70)內(nèi)的人數(shù)為16,所以樣本容量n=eq\f(16,0.008×20)=100,A錯誤;對于B,因為(0.008+x+0.020+0.005+0.002)×20=1,解得x=0.015,B正確;對于C,學(xué)生成績平均分為0.008×20×60+0.015×20×80+0.020×20×100+0.005×20×120+0.002×20×140=91.2,C正確;對于D,因為20×(0.002+0.005)+(110-106)×0.020=0.22>0.20,即按照成績由高到低前20%的學(xué)生中不含106分的學(xué)生,所以成績?yōu)?06分的學(xué)生不能得到此稱號,D錯誤.故選BC.(2)(ⅰ)依題可知,第一個圖形中第一個小矩形的面積為5×0.002=0.01>0.5%,所以95<c<100,所以(c-95)×0.002=0.5%,解得c=97.5,q(c)=0.01×(100-97.5)+5×0.002=0.035=3.5%.(ⅱ)當(dāng)c∈[95,100]時,f(c)=p(c)+q(c)=(c-95)×0.002+(100-c)×0.01+5×0.002=-0.008c+0.82≥0.02;當(dāng)c∈(100,105]時,f(c)=p(c)+q(c)=5×0.002+(c-100)×0.012+(105-c)×0.002=0.01c-0.98>0.02,故f(c)=eq\b\lc\{(\a\vs4\al\co1(-0.008c+0.82,95≤c≤100,,0.01c-0.98,100<c≤105,))所以f(c)在區(qū)間[95,105]的最小值為0.02.(1)在頻率分布直方圖中,要注意掌握如下性質(zhì):①每個小矩形的高等于eq\f(每一組的頻率,組距);②每個小矩形的面積表示頻率;③所有矩形的面積之和等于1.(2)性質(zhì)的應(yīng)用:①若縱軸上存在參數(shù),則根據(jù)“所有矩形的面積之和等于1”,列方程即可求得參數(shù)值.②某組上的頻率、頻數(shù)的計算某組上的頻率=eq\f(這小組的頻數(shù),樣本容量)=小矩形的面積;某組的頻數(shù)=該小組的頻率×樣本容量.(3)用頻率分布直方圖估計樣本的數(shù)字特征:①平均數(shù)eq\o(x,\s\up6(-))=(xi表示第i個小矩形下底邊中點的橫坐標(biāo),Si表示第i個小矩形的面積).②方差:s2=(xi-eq\o(x,\s\up6(-)))2·Si.③眾數(shù):最高小矩形下底邊中點的橫坐標(biāo).④中位數(shù):把頻率分布直方圖劃分為左、右兩個面積相等的部分時,分界線與橫軸交點的橫坐標(biāo).變式探究3.(多選)某校為了解學(xué)生體能素質(zhì),隨機抽取了50名學(xué)生,進行體能測試,并將這50名學(xué)生成績整理得如下頻率分布直方圖.根據(jù)此頻率分布直方圖,下列結(jié)論中正確的是()A.這50名學(xué)生中成績在[80,100]內(nèi)的人數(shù)占比為20%B.這50名學(xué)生中成績在[60,80)內(nèi)的人數(shù)為26C.這50名學(xué)生成績的中位數(shù)為70D.這50名學(xué)生的平均成績eq\o(x,\s\up6(-))=68.2(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表)解析:ABD根據(jù)此頻率分布直方圖,成績在[80,100]內(nèi)的頻率為(0.008+0.012)×10=0.20,A正確;這50名學(xué)生中成績在[60,80)內(nèi)的人數(shù)為(0.032+0.020)×10×50=26,B正確;根據(jù)此頻率分布直方圖,得(0.008+0.02)×10=0.28<0.5,(0.008+0.02+0.032)×10=0.6>0.5,可得這50名學(xué)生成績的中位數(shù)位于(60,70)內(nèi),C錯誤;根據(jù)頻率分布直方圖的平均數(shù)的計算公式,可得eq\o(x,\s\up6(-))=45×0.008×10+55×0.02×10+65×0.032×10+75×0.02×10+85×0.012×10+95×0.008×10=68.2,D正確.故選ABD.4.某保險公司為了給年齡在20~70歲的客戶提供某種醫(yī)療保障,設(shè)計了一款針對某疾病的保險.現(xiàn)從10000名參保人員中隨機抽取100名進行分析,并按年齡段[20,30),[30,40),[40,50),[50,60),[60,70]分成了五組,其頻率分布直方圖如圖所示,每人每年所交納的保費與參保年齡如下表所示:年齡[20,30)[30,40)[40,50)[50,60)[60,70]保費(單位:元)x2x3x5x7x(1)若采用分層隨機抽樣的方法,從年齡段在[30,40)和[40,50)內(nèi)的參保人員中共抽取6人進行問卷調(diào)查,再從中選取2人進行調(diào)查對該種保險的滿意度,求這2人中恰好有1人年齡段在[30,40)內(nèi)的概率;(2)由于10000人參加保險,該公司每年為此項保險支出的各種費用為200萬元.為使公司不虧本,則年齡段[50,60)的參保人員每人每年需要繳納的保費至少為多少元?解析:(1)由(0.007+0.016+a+0.025+0.02)×10=1得a=0.032,設(shè)“抽取2人中恰好有1人年齡段在[30,40)內(nèi)”為事件M.由題設(shè)可知,年齡在[30,40)和[40,50)內(nèi)的頻率分別為0.16和0.32,則抽取的6人中,年齡在[30,40)內(nèi)的有2人,年齡在[40,50)內(nèi)的有4人.記年齡在[30,40)內(nèi)的2位參保人員為a,b,年齡在[40,50)內(nèi)的4位參保人員為A,B,C,D,則從6人中任取2人,樣本空間Ω={(a,b),(a,A),(a,B),(a,C),(a,D),(b,A),(b,B),(b,C),(b,D),(A,B),(A,C),(A,D),(B,C),(B,D),(C,D)},共包含15個樣本點,M={(a,A),(a,B),(a,C),(a,D),(b,A),(b,B),(b,C),(b,D)},共包含8個樣本點,所以P(M)=eq\f(8,15).(2)保險公司每年收取的保費為10000(0.07x+0.16×2x+0.32×3x+0.25×5x+0.2×7x)=10000×4x,所以要使公司不虧本,則10000×4x≥2000000,即4x≥200,解得x≥50,所以年齡段[50,60)的參保人員每人每年需要繳納的保費至少為250元.探究點3總體百分?jǐn)?shù)的估計【例3】2024年7月,第33屆奧運會在巴黎舉辦,某調(diào)研機構(gòu)對不同年齡和不同職業(yè)的人舉辦了一次“奧運會”知識競賽,滿分100分(90分及以上為認(rèn)知程度高),現(xiàn)從參賽者中抽取了x人,按年齡分成5組(第一組:[20,25),第二組:[25,30),第三組:[30,35),第四組:[35,40),第五組:[40,45]),得到如圖所示的頻率分布直方圖,已知第一組有5人.(1)求x;(2)求抽取的x人的年齡的50%分位數(shù)(結(jié)果保留整數(shù));(3)以下是參賽的10人的成績:90,96,97,95,92,92,98,88,96,99.求這10人成績的20%分位數(shù)和平均數(shù),以這兩個數(shù)據(jù)為依據(jù),評價參賽人員對奧運會的認(rèn)知程度.解析:(1)第一組頻率為0.01×5=0.05,所以x=eq\f(5,0.05)=100.(2)由題圖可知年齡低于30歲的所占比例為40%,年齡低于35歲的所占比例為70%,所以抽取的x人的年齡的50%分位數(shù)在[30,35)內(nèi),由30+eq\f(0.50-0.40,0.06)=eq\f(95,3)≈32,所以抽取的x人的年齡的50%分位數(shù)為32.(3)把參賽的10人的成績按從小到大的順序排列:88,90,92,92,95,96,96,97,98,99.計算10×20%=2.所以這10人成績的20%分位數(shù)為eq\f(90+92,2)=91,這10人成績的平均數(shù)為eq\f(1,10)(88+90+92+92+95+96+96+97+98+99)=94.3.評價:從百分位數(shù)和平均數(shù)來看,參賽人員的認(rèn)知程度很高.1.計算一組n個數(shù)據(jù)的第p百分位數(shù)的一般步驟第一步,按照從小到大的順序排列原始數(shù)據(jù).第二步,計算i=n×p%.第三步,若i不是整數(shù),大于i的比鄰整數(shù)為j,則第p百分位數(shù)為第j項數(shù)據(jù);若i是整數(shù),則第p百分位數(shù)為第i項和第(i+1)項數(shù)據(jù)的平均數(shù).2.由頻率分布直方圖求百分位數(shù)的方法(1)要注意頻率分布直方圖中小矩形的面積,就是數(shù)據(jù)落在該組的頻率.(2)一般采用方程的思想,設(shè)出第p百分位數(shù),根據(jù)其意義列出方程并求解即可.變式探究5.如圖所示是根據(jù)某市3月1日至3月10日的最低氣溫(單位:℃)的情況繪制的折線統(tǒng)計圖,由圖可知這10天最低氣溫的第80百分位數(shù)是()A.-2B.0C.1D.2解析:D由折線圖可知,這10天的最低氣溫按照從小到大的順序排列為-3,-2,-1,-1,0,0,1,2,2,2.因為共有10個數(shù)據(jù),所以10×80%=8,所以這10天最低氣溫的第80百分位數(shù)是eq\f(2+2,2)=2.故選D.6.某省有關(guān)部門要求各中小學(xué)要把“每天鍛煉一小時”寫入課程表,為了響應(yīng)這一號召,某校圍繞著“你最喜歡的體育活動項目是什么?(只寫一項)”的問題,對在校學(xué)生進行了隨機抽樣調(diào)查,從而得到一組數(shù)據(jù).圖1是根據(jù)這組數(shù)據(jù)繪制的條形統(tǒng)計圖.由條形統(tǒng)計圖可知本次抽樣調(diào)查中,最喜歡籃球活動的占被調(diào)查人數(shù)的百分比是________,若該校九年級共有200名學(xué)生,圖2是根據(jù)各年級學(xué)生人數(shù)占全校學(xué)生總?cè)藬?shù)的百分比繪制的扇形統(tǒng)計圖,則全校學(xué)生中最喜歡跳繩活動的人數(shù)估計為________.解析:36%160最喜歡籃球活動的占被調(diào)查人數(shù)的百分比是eq\f(18,4+8+10+18+10)×100%=36%,由圖2可知,九年級學(xué)生人數(shù)占全校學(xué)生總?cè)藬?shù)的1-(26%+24%+30%)=20%,則全???cè)藬?shù)為200÷20%=1000,則全校學(xué)生中最喜歡跳繩活動的人數(shù)估計為1000×eq\f(8,4+8+10+18+10)=160.探究點4樣本估計總體【例4】(1)(多選)(2024·江蘇常州期末)已知一組樣本數(shù)據(jù)x1,x2,…,xn(n≥4),其中x1<0<xn,若由yk=2xk+1(k=1,2,…,n)生成一組新的數(shù)據(jù)y1,y2,…,yn,則這組新數(shù)據(jù)與原數(shù)據(jù)可能相等的量有()A.極差B.平均數(shù)C.中位數(shù)D.標(biāo)準(zhǔn)差(2)某校為了解該校高三年級學(xué)生的物理成績,從某次高三年級物理測試中隨機抽取12名男生和8名女生的測試試卷,記錄其物理成績(單位:分),得到如下數(shù)據(jù):12名男生的物理成績分別為72,68,72,76,80,76,72,80,88,68,72,76;8名女生的物理成績分別為66,76,68,68,66,68,80,68.(ⅰ)求這12名男生物理成績的平均分eq\o(x,\s\up6(-))1與方差seq\o\al(2,1);(ⅱ)經(jīng)計算得這8名女生物理成績的平均分eq\o(x,\s\up6(-))2=70,方差seq\o\al(2,2)=23,求這20名學(xué)生物理成績的平均分與方差.附:分層隨機抽樣的方差公式s2=eq\o(∑,\s\up7(n),\s\do7(i=1))wi[seq\o\al(2,i)+(eq\o(x,\s\up6(-))i-eq\o(x,\s\up6(-)))2],wi(i=1,2)表示第i(i=1,2)層所占的比例.解析:(1)BC對于A,不妨設(shè)x1<x2<…<xn,則樣本數(shù)據(jù)x1,x2,…,xn(n≥4)的極差為xn-x1,樣本數(shù)據(jù)y1,y2,…,yn的極差為yn-y1=(2xn+1)-(2x1+1)=2(xn-x1),因為xn-x1>0,則yn-y1=2(xn-x1)>xn-x1,A錯誤;對于B,設(shè)樣本數(shù)據(jù)x1,x2,…,xn(n≥4)的平均數(shù)為eq\o(x,\s\up6(-)),即eq\o(x,\s\up6(-))=eq\f(x1+x2+…+xn,n),所以,樣本數(shù)據(jù)y1,y2,…,yn的平均數(shù)為eq\o(y,\s\up6(-))=eq\f(y1+y2+…+yn,n)=eq\f((2x1+1)+(2x2+1)+…+(2xn+1),n)=eq\f(2(x1+x2+…+xn),n)+1=2eq\o(x,\s\up6(-))+1,由eq\o(y,\s\up6(-))=2eq\o(x,\s\up6(-))+1=eq\o(x,\s\up6(-))可知,當(dāng)eq\o(x,\s\up6(-))=-1時,兩組樣本數(shù)據(jù)的平均數(shù)相等,B正確;對于C,當(dāng)n=2m-1(m∈N*)時,設(shè)樣本數(shù)據(jù)x1,x2,…,xn(n≥4)的中位數(shù)為p,樣本數(shù)據(jù)y1,y2,…,yn的中位數(shù)為2p+1,同理可知當(dāng)xm=-1時,中位數(shù)相等,當(dāng)n=2m(m∈N*)時,設(shè)樣本數(shù)據(jù)x1,x2,…,xn(n≥4)的中位數(shù)為q,樣本數(shù)據(jù)y1,y2,…,yn的中位數(shù)為2×q+1=2q+1,同理可知當(dāng)q=-1時,兩組數(shù)據(jù)的中位數(shù)相等,C正確;對于D,設(shè)樣本數(shù)據(jù)x1,x2,…,xn(n≥4)的標(biāo)準(zhǔn)差為sx,樣本數(shù)據(jù)y1,y2,…,yn的標(biāo)準(zhǔn)差為sy,則seq\o\al(2,x)=eq\f((x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2,n),seq\o\al(2,y)=eq\f((y1-\o(y,\s\up6(-)))2+(y2-\o(y,\s\up6(-)))2+…+(yn-\o(y,\s\up6(-)))2,n)=eq\f(1,n){[(2x1+1)-(2eq\o(x,\s\up6(-))+1)]2+[(2x2+1)-(2eq\o(x,\s\up6(-))+1)]2+…+[(2xn+1)-(2eq\o(x,\s\up6(-))+1)]2}=eq\f(4[(x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2],n)=4seq\o\al(2,x),因為x1<0<xn,則sx=eq\r(\f((x1-\o(x,\s\up6(-)))2+(x2-\o(x,\s\up6(-)))2+…+(xn-\o(x,\s\up6(-)))2,n))>0,故sy=2sx>sx,故兩組樣本數(shù)據(jù)的標(biāo)準(zhǔn)差不可能相等,D錯誤.故選BC.(2)(ⅰ)這12名男生物理成績的平均分為eq\o(x,\s\up6(-))1=eq\f(68×2+72×4+76×3+80×2+88,12)=75,方差為seq\o\al(2,1)=eq\f(1,12)[(68-75)2×2+(72-75)2×4+(76-75)2×3+(80-75)2×2+(88-75)2]=eq\f(89,3).(ⅱ)這20名學(xué)生物理成績的平均分為eq\o(x,\s\up6(-))=eq\f(12,20)eq\o(x,\s\up6(-))1+eq\f(8,20)eq\o(x,\s\up6(-))2=eq\f(3×75+2×70,5)=73,方差為s2=eq\f(12,20)[seq\o\al(2,1)+(eq\o(x,\s\up6(-))1-eq\o(x,\s\up6(-)))2]+eq\f(8,20)[seq\o\al(2,2)+(eq\o(x,\s\up6(-))2-eq\o(x,\s\up6(-)))2]=eq\f(3×[\f(89,3)+(75-73)2]+2×[23+(70-73)2],5)=33.平均數(shù)、中位數(shù)、眾數(shù)與方差、標(biāo)準(zhǔn)差都是重要的數(shù)字特征,可對總體進行一種簡明的描述,它們所反映的情況有著重要的實際意義,平均數(shù)、中位數(shù)、眾數(shù)可描述總體的集中趨勢,方差和標(biāo)準(zhǔn)差可描述波動大小和穩(wěn)定狀態(tài).變式探究7.(多選)(2024·安徽模擬預(yù)測)已知樣本數(shù)據(jù)x1,x2,x3,x4,x5(x1<0,x2,x3,x4,x5>0)的方差為s2,平均數(shù)eq\o(x,\s\up6(-))>0,則()A.?dāng)?shù)據(jù)3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的方差為9s2B.?dāng)?shù)據(jù)3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均數(shù)大于0C.?dāng)?shù)據(jù)x2,x3,x4,x5的方差大于s2D.?dāng)?shù)據(jù)x2,x3,x4,x5的平均數(shù)大于eq\o(x,\s\up6(-))解析:AD對于A,數(shù)據(jù)3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的方差為9s2,A正確;對于B,數(shù)據(jù)3x1-2,3x2-2,3x3-2,3x4-2,3x5-2的平均數(shù)為3eq\o(x,\s\up6(-))-2,當(dāng)0<eq\o(x,\s\up6(-))≤eq\f(2,3)時,3eq\o(x,\s\up6(-))-2≤0,B錯誤;對于C,去掉一個最小(特異值)的數(shù)據(jù),剩下的數(shù)據(jù)的方差有可能更小,C錯誤;對于D,因為eq\o(x,\s\up6(-))=eq\f(x1+x2+x3+x4+x5,5)>0,數(shù)據(jù)x2,x3,x4,x5的平均數(shù)eq\f(x2+x3+x4+x5,4)=eq\f(5,4)eq\o(x,\s\up6(-))-eq\f(x1,4),因為x1<0,故數(shù)據(jù)x2,x3,x4,x5的平均數(shù)大于eq\o(x,\s\up6(-)),D正確.故選AD.8.某中學(xué)舉行了一次“垃圾分類知識競賽”,全校學(xué)生參加了這次競賽,為了了解本次競賽成績情況,從中抽取了部分學(xué)生的成績x(單位:分,得分取正整數(shù),滿分為100分)作為樣本進行統(tǒng)計,將成績進行整理后,分為五組(50≤x<60,60≤x<70,70≤x<80,80≤x<90,90≤x≤100),其中第4組、第1組、第2組的頻數(shù)依次成等比數(shù)列,請根據(jù)下面尚未完成的頻率分布直方圖(如圖所示)解決下列問題:(1)求a,b的值.(2)若根據(jù)這次成績,學(xué)校準(zhǔn)備淘汰80%的同學(xué),僅留20%的同學(xué)進入下一輪競賽,請問:晉級分?jǐn)?shù)線劃為多少合理?(3)某老師在此次競賽成績中抽取了10名學(xué)生的分?jǐn)?shù)x1,x2,x3,…,x10,已知這10個分?jǐn)?shù)的平均數(shù)eq\o(x,\s\up6(-))=90,標(biāo)準(zhǔn)差s=6,若剔除其中的95和85兩個分?jǐn)?shù),求剩余8個分?jǐn)?shù)的平均數(shù)與方差.附:方差計算公式s2=eq\f(1,n)eq\o(∑,\s\up7(n),\s\do7(i=1))xi-eq\o(x,\s\up6(-)))2=eq\f(1,n)[(x1-eq\o(x,\s\up6(-)))2+(x2-eq\o(x,\s\up6(-)))2+…+(xn-eq\o(x,\s\up6(-)))2]或s2=eq\f(1,n)eq\o(∑,\s\up7(n),\s\do7(i=1))xeq\o\al(2,i)-eq\o(x,\s\up6(-))2=eq\f(1,n)[(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n))-neq\o(x,\s\up6(-))2].解析:(1)由題意知,第4組、第1組、第2組的小長方形的高也成等比數(shù)列,所以0.0162=0.008a,解得a=0.032,又(0.008+0.016+0.032+0.04+b)×10=1,解得b=0.004.所以a=0.032,b=0.004.(2)成績落在[50,70)內(nèi)的頻率為0.16+0.32=0.48,落在[50,80)內(nèi)的頻率為0.16+0.32+0.40=0.88,設(shè)第80百分位數(shù)為m,則(m-70)×0.04=0.8-0.48,解得m=78,所以晉級分?jǐn)?shù)線劃為78分合理.(3)由eq\o(x,\s\up6(-))=90,得x1+x2+x3+…+x10=10×90=900.又s2=eq\f(1,10)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,10))-902=62,所以xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,10)=81360,剔除其中的95和85兩個分?jǐn)?shù),設(shè)剩余8個數(shù)為x1,x2,x3,…,x8,平均數(shù)與標(biāo)準(zhǔn)差分別為eq\o(x,\s\up6(-))0,s0,則剩余8個分?jǐn)?shù)的平均數(shù)eq\o(x,\s\up6(-))0=eq\f(x1+x2+x3+…+x8,8)=eq\f(900-95-85,8)=90.方差seq\o\al(2,0)=eq\f(1,8)(xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,8))-902=eq\f(1,8)(81360-952-852)-902=38.75.1.現(xiàn)要完成下列2項抽樣調(diào)查:①從10盒酸奶中抽取3盒進行食品衛(wèi)生檢查;②東方中學(xué)共有160名教職工,其中教師120名,行政人員16名,后勤人員24名.為了了解教職工對學(xué)校在校務(wù)公開方面的意見,擬抽取一個容量為20的樣本.較為合理的抽樣方法是()A.①抽簽法,②分層隨機抽樣B.①隨機數(shù)法,②分層隨機抽樣C.①隨機數(shù)法,②抽簽法D.①抽簽法,②隨機數(shù)法解析:A①總體較少,宜用抽簽法;②各層間差異明顯,宜用分層隨機抽樣.故選A.2.對總數(shù)為N的一批零件抽取一容量為20的樣本,若每個零件被抽取的可能性為20%,則N為()A.150B.120C.100D.40解析:C由題意可得eq\f(20,N)=20%,解得N=100.故選C.3.(2024·黑龍江大慶三模)小明希望自己的高考數(shù)學(xué)成績能超過120分,為了激勵自己,他記錄了近8次數(shù)學(xué)考試成績,并繪制成折線統(tǒng)計圖,如圖,這8次成績的第80百分位數(shù)是()A.100B.105C.110D.120解析:C因為8×80%=6.4,由圖可知8次成績由小到大排序,第7個位置的數(shù)是110,所以這8次成績的第80百分位數(shù)是110.故選C.4.已知一組數(shù)據(jù)x1,x2,x3,x4,x5的平均數(shù)是2,方差是eq\f(1,3),那么另一組數(shù)據(jù)3x1+1,3x2+1,3x3+1,3x4+1,3x5+1的平均數(shù)和方差分別是()A.2,eq\f(1,3)B.2,1C.7,3D.7,4解析:C設(shè)數(shù)據(jù)x1,x2,x3,x4,x5的平均數(shù)是eq\o(x,\s\up3(-))=2,方差是s2=eq\f(1,3),則新數(shù)據(jù)組的平均數(shù)為eq\f((3x1+1)+(3x2+1)+…+(3x5+1),5)=3×eq\f(x1+x2+…+x5,5)+1=3eq\o(x,\s\up3(-))+1=7,方差seq\o\al(2,1)=eq\f(1,5)[(3x1+1-3eq\o(x,\s\up3(-))-1)2+(3x2+1-3eq\o(x,\s\up3(-))-1)2+…+(3x5+1-3eq\o(x,\s\up3(-))-1)2]=eq\f(9,5)[(x1-eq\o(x,\s\up3(-)))2+(x2-eq\o(x,\s\up3(-)))2+…+(x5-eq\o(x,\s\up3(-)))2]=9s2=9×eq\f(1,3)=3.故選C.5.(2024·四川遂寧三模)某調(diào)查機構(gòu)對某地快遞行業(yè)從業(yè)者進行調(diào)查統(tǒng)計,得到快遞行業(yè)從業(yè)人員年齡分布餅狀圖(圖1)、“90后”從事快遞行業(yè)崗位分布條形圖(圖2),則下列結(jié)論中錯誤的是()A.快遞行業(yè)從業(yè)人員中,“90后”占一半以上B.快遞行業(yè)從業(yè)人員中,從事技術(shù)崗位的“90后”的人數(shù)超過總?cè)藬?shù)的20%C.快遞行業(yè)從業(yè)人員中,從事運營崗位的“90后”的人數(shù)比“80前”的多D.快遞行業(yè)從業(yè)人員中,從事技術(shù)崗位的“90后”的人數(shù)比“80后”的多解析:D由題圖可知,快遞行業(yè)從業(yè)人員中,“90后”占總?cè)藬?shù)的56%,超過一半,A正確;快遞行業(yè)從業(yè)人員中,從事技術(shù)崗位的“90后”的人數(shù)占總?cè)藬?shù)的百分比為56%×39.6%=22.176%,超過20%,所以快遞行業(yè)從業(yè)人員中,從事技術(shù)崗位的“90”后的人數(shù)超過總?cè)藬?shù)的20%;B正確;快遞行業(yè)從業(yè)人員中,從事運營崗位的“90后”的人數(shù)占總?cè)藬?shù)的百分比為56%×17%=9.52%,超過“80前”的人數(shù)占總?cè)藬?shù)的百分比,C正確;快遞行業(yè)從業(yè)人員中,從事技術(shù)崗位的“90后”的人數(shù)占總?cè)藬?shù)的百分比為22.176%,小于“80后”的人數(shù)占總?cè)藬?shù)的百分比,但“80后”從事技術(shù)崗位的人數(shù)占“80后”人數(shù)的比未知,D錯誤.故選D.6.(多選)某公司為保證產(chǎn)品生產(chǎn)質(zhì)量,連續(xù)10天監(jiān)測某種新產(chǎn)品生產(chǎn)線的次品件數(shù),得到關(guān)于每天出現(xiàn)的次品的件數(shù)的一組樣本數(shù)據(jù):3,4,3,1,5,3,2,5,1,3,則關(guān)于這組數(shù)據(jù)的結(jié)論正確的是()A.極差是4B.眾數(shù)小于平均數(shù)C.方差是1.8D.?dāng)?shù)據(jù)的80%分位數(shù)為4解析:AC數(shù)據(jù)從小到大排列為1,1,2,3,3,3,3,4,5,5.對于A,該組數(shù)據(jù)的極差為5-1=4,A正確;對于B,眾數(shù)為3,平均數(shù)為eq\f(1×2+2+3×4+4+5×2,10)=3,兩者相等,B錯誤;對于C,方差為eq\f(1,10)[(1-3)2×2+(2-3)2×1+(3-3)2×4+(4-3)2×1+(5-3)2×2]=1.8,C正確;對于D,因為10×80%=8,所以這組數(shù)據(jù)的80%分位數(shù)為第8個數(shù)和第9個數(shù)的平均數(shù)4.5,D錯誤.故選AC.7.某市有A,B,C三所學(xué)校,共有高三歷史類學(xué)生1500人,且A,B,C三所學(xué)校的高三歷史類學(xué)生人數(shù)成等差數(shù)列,在三月進行全市聯(lián)考后,準(zhǔn)備用分層隨機抽樣的方法從所有高三歷史類學(xué)生中抽取容量為120的樣本,進行成績分析,則應(yīng)從B校學(xué)生中抽取________人.解析:40設(shè)A,B,C三所學(xué)校高三歷史類學(xué)生人數(shù)分別為x,y,z.由題知x,y,z成等差數(shù)列,所以x+z=2y,又x+y+z=1500,所以y=500,故用分層隨機抽樣方法抽取B校學(xué)生人數(shù)為eq\f(120,1500)×500=40.8.某班成立了A,B兩個數(shù)學(xué)興趣小組,A組10人,B組30人,經(jīng)過一周的補習(xí)后進行了一次測試,在該測試中,A組的平均成績?yōu)?30分,方差為115,B組的平均成績?yōu)?10分,方差為215,則在這次測試中全班學(xué)生的方差估計為________.解析:265依題意,eq\o(x,\s\up3(-))A=130,seq\o\al(2,A)=115,eq\o(x,\s\up3(-))B=110,seq\o\al(2,B)=215,所以eq\o(x,\s\up3(-))=eq\f(10,10+30)×130+eq\f(30,10+30)×110=115(分),所以全班學(xué)生的平均成績估計為115分,則全班學(xué)生成績的方差為s2=eq\f(10,10+30)[seq\o\al(2,A)+(eq\o(x,\s\up3(-))A-eq\o(x,\s\up3(-)))2]+eq\f(30,10+30)[seq\o\al(2,B)+(eq\o(x,\s\up3(-))B-eq\o(x,\s\up3(-)))2]=eq\f(10,10+30)×(115+152)+eq\f(30,10+30)×(215+52)=85+180=265.9.(多選)(2024·廣東汕頭一模)某次物理考試后,為分析學(xué)生的學(xué)習(xí)情況,某校從某年級中隨機抽取了100名學(xué)生的成績,整理得到如圖所示的頻率分布直方圖.為進一步分析高分學(xué)生的成績分布情況,計算得到這100名學(xué)生中,成績位于[80,90)內(nèi)的學(xué)生成績方差為12,成績位于[90,100]內(nèi)的學(xué)生成績方差為10,由樣本估計總體,則下列說法正確的是()A.a(chǎn)=0.004B.估計該年級學(xué)生成績的中位數(shù)約為77.14C.估計該年級成績在80分及以上的學(xué)生成績的平均數(shù)為87.50D.估計該年級成績在80分及以上的學(xué)生成績的方差為30.25解析:BCD對于A,在頻率分布直方圖中,所有直方圖的面積之和為1,則(2a+3a+7a+6a+2a)×10=200a=1,解得a=0.005,A錯誤;對于B,前兩個矩形的面積之和為(2a+3a)×10=50a=0.25<0.5,前三個矩形的面積之和為(2a+3a+7a)×10=120a=0.6>0.5,設(shè)計該年級學(xué)生成績的中位數(shù)為m,則m∈(70,80),根據(jù)中位數(shù)的定義可得0.25+(m-70)×0.035=0.5,解得m≈77.14,所以,估計該年級學(xué)生成績的中位數(shù)約為77.14,B正確;對于C,估計成績在80分以上的同學(xué)的成績的平均數(shù)為eq\f(6a,6a+2a)×85+eq\f(2a,6a+2a)×95=87.5,C正確;對于D,估計該年級成績在80分及以上的學(xué)生成績的方差為eq\f(3,4)[12+(87.5-85)2]+eq\f(1,4)[10+(87.5-95)2]=30.25,D正確.故選BCD.10.中國航協(xié)航空大會有一個鮮明的特色是在各個展區(qū)中設(shè)置了多項互動體驗活動,吸引了很多的中小學(xué)生,其中模擬飛行體驗區(qū)是讓這些中小學(xué)生戴上VR眼鏡模擬從起飛到降落,大大激發(fā)了他們的興趣愛好.現(xiàn)從某個有互動體驗的展區(qū)中隨機抽取60名中小學(xué)生,統(tǒng)計他們的參觀時間(從進入該展區(qū)到離開該展區(qū)的時長,單位:分鐘,時間取整數(shù)),將時間分成[40,50),[50,60),…,[90,100]六組,并繪制成如圖所示的頻率分布直方圖.(1)由頻率分布直方圖,估計樣本的平均數(shù)eq\o(x,\s\up3(-))和方差seq\o\al(2,1);(每組數(shù)據(jù)以區(qū)間的中點值為代表)(2)為對比展區(qū)是否有體驗區(qū)對中小學(xué)生的吸引程度,某工作人員給出了一份該展區(qū)中沒有體驗區(qū)的參觀時間的隨機數(shù)據(jù),經(jīng)計算得到該組數(shù)據(jù)參觀時長平均值為eq\o(y,\s\up3(-))=65分鐘,方差為seq\o\al(2,2)=178,試判斷有體驗區(qū)的參觀時長均值比沒有體驗區(qū)的參觀時長均值是否有顯著提高?(如果eq\o(x,\s\up3(-))-eq\o(y,\s\up3(-))≥eq\r(\f(seq\o\al(2,1)+seq\o\al(2,2),12)),則認(rèn)為有顯著提高,否則不認(rèn)為有顯著提高)(3)利用(2)中的結(jié)果,你認(rèn)為展區(qū)是否應(yīng)該設(shè)置互動體驗展區(qū)?請說明理由.解析:(1)由題得,eq\o(x,\s\up3(-))=10×(45×0.010+55×0.015+65×0.015+75×0.030+85×0.025+95×0.005)=71,所以樣本的方差為seq\o\al(2,1)=10×[(45-71)2×0.010+(55-71)2×0.015+(65-71)2×0.015+(75-71)2×0.030+(85-71)2×0.025+(95-71)2×0.005]=194.(2)由題得eq\o(x,\s\up3(-))-eq\o(y,\s\up3(-))=71-65=6,eq\r(\f(seq\o\al(2,1)+seq\o\al(2,2),12))=eq\r(\f(194+178,12))=eq\r(31)<6,所以eq\o(x,\s\up3(-))-eq\o(y,\s\up3(-))≥eq\r(\f(seq\o\al(2,1)+seq\o\al(2,2),12)),所以有體驗區(qū)的參觀時長均值比沒有體驗區(qū)的參觀時長均值有顯著提高.(3)從(2)中可知展區(qū)應(yīng)該設(shè)置互動體驗展區(qū),這樣可以吸引更多的參觀者進行觀看與體驗,使他們能更多地了解產(chǎn)品,并能更大程度地激發(fā)中小學(xué)生的興趣愛好.11.近年來“天宮課堂”受到廣大中小學(xué)生歡迎,激發(fā)了同學(xué)們對科學(xué)知識的探索欲望和對我國航天事業(yè)成就的自豪.為領(lǐng)悟航天精神,感受中國夢想,某校組織了一次“尋夢天宮”航天知識競賽(滿分100分),各年級學(xué)生踴躍參加.校團委為了比較高一、高二學(xué)生這次競賽的成績,從兩個年級的答卷中各隨機選取了50份,將成績進行統(tǒng)計得到以下頻數(shù)分布表:成績[60,70)[70,80)[80,90)[90,100]高一學(xué)生人數(shù)1551515高二學(xué)生人數(shù)10102010試?yán)脴颖竟烙嬁傮w的思想,解決下列問題:(1)從平均數(shù)與方差的角度分析哪個年級學(xué)生這次競賽成績更好(同一組中的數(shù)據(jù)用該組區(qū)間的中點值為代表)?(2)學(xué)校決定對參與這次競賽的學(xué)生給予一定的獎勵,獎勵方案有以下兩種:方案一:記學(xué)生得分為x,當(dāng)x<70時,獎勵該學(xué)生10元食堂代金券;當(dāng)70≤x<90時,獎勵該學(xué)生25元食堂代金券;當(dāng)x≥90時,獎勵該學(xué)生35元食堂代金券;方案二:得分低于樣本中位數(shù)的每位學(xué)生獎勵10元食堂代金券;得分不低于中位數(shù)的每位學(xué)生獎勵30元食堂代金券.若高一年級組長希望本年級學(xué)生獲得更多的獎勵,則他應(yīng)該選擇哪種方案?解析:(1)樣本中,高一學(xué)生競賽平均成績?yōu)閑q\o(x,\s\up3(-))1=eq\f(1,50)×(65×15+75×5+85×15+95×15)=81,方差seq\o\al(2,1)=eq\f(1,50)×[(65-81)2×15+(75-81)2×5+(85-81)2×15+(95-81)2×15]=144;樣本中,高二學(xué)生競賽平均成績?yōu)閑q\o(x,\s\up3(-))2=eq\f(1,50)×(65×10+75×10+85×20+95×10)=81,方差seq\o\al(2,2)=eq\f(1,50)×[(65-81)2×10+(75-81)2×10+(85-81)2×20+(95-81)2×10]=104.因為eq\o(x,\s\up3(-))1=eq\o(x,\s\up3(-))2,seq\o\al(2,1)>seq\o\al(2,2),所以樣本中平均成績一樣,但高二學(xué)生的成績更穩(wěn)定.所以利用樣本估計總體的思想可以認(rèn)為,高二學(xué)生這次競賽成績更好.(2)設(shè)選擇方案一時一位學(xué)生獲得的獎金為X元,則X的可能取值為10,25,35,其對應(yīng)的頻率分別為0.3,0.4,0.3,所以獲得獎勵的平均數(shù)eq\o(X,\s\up6(-))=10×0.3+25×0.4+35×0.3=23.5(元);設(shè)選擇方案二時一位學(xué)生獲得的獎勵為Y元,則獲得獎金的平均數(shù)eq\o(Y,\s\up6(-))=10×0.5+30×0.5=20(元).因為eq\o(X,\s\up6(-))>eq\o(Y,\s\up6(-)),所以從統(tǒng)計角度看,高一年級組長應(yīng)該選擇方案一.12.(2024·云南昆明階段練習(xí))《中國制造2025》是中國實施制造強國戰(zhàn)略第一個十年的行動綱領(lǐng),制造業(yè)是國民經(jīng)濟的主體,是立國之本、興國之器、強國之基.發(fā)展制造業(yè)的基本方針為質(zhì)量為先,堅持把質(zhì)量作為建設(shè)制造強國的生命線.某電子產(chǎn)品制造企業(yè)為了提升生產(chǎn)效率,對現(xiàn)有的一條電子產(chǎn)品生產(chǎn)線進行技術(shù)升級改造,為了分析改造的效果,該企業(yè)質(zhì)檢人員從該條生產(chǎn)線所生產(chǎn)的電子產(chǎn)品中隨機抽取了1000件,檢測產(chǎn)品的某項質(zhì)量指標(biāo)值,根據(jù)檢測數(shù)據(jù)得到下表(單位:件).質(zhì)量指標(biāo)值[25,35)[35,45)[45,55)[55,65)[65,75)[75,85)[85,95]產(chǎn)品6010016030020010080(1)估計這組樣本的質(zhì)量指標(biāo)值的平均數(shù)eq\o(x,\s\up3(-))和方差s2(同一組中的數(shù)據(jù)用該組區(qū)間中點值作代表).(2)設(shè)[x]表示不大于x的最大整數(shù),{x}表示不小于x的最小整數(shù),s精確到個位,an=5·{eq\f(\o(x,\s\up3(-))-ns,5)},bn=5·[eq\f(\o(x,\s\up3(-))+ns,5)],n∈N,根據(jù)檢驗標(biāo)準(zhǔn),技術(shù)升級改造后,若質(zhì)量指標(biāo)值有65%落在[a1,b1]內(nèi),則可以判斷技術(shù)改造后的產(chǎn)品質(zhì)量初級穩(wěn)定;若有95%落在[a2,b2]內(nèi),則可以判斷技術(shù)改造后的產(chǎn)品質(zhì)量穩(wěn)定,可認(rèn)為生產(chǎn)線技術(shù)改造成功.請問:根據(jù)樣本數(shù)據(jù)估計,是否可以判定生產(chǎn)線的技術(shù)改造是成功的? 解析:(1)由題可知eq\o(x,\s\up3(-))=30×0.06+40×0.1+50×0.16+60×0.3+70×0.2+80×0.1+90×0.08=61.s2=(30-61)2×0.06+(40-61)2×0.1+(50-61)2×0.16+(60-61)2×0.3+(70-61)2×0.2+(80-61)2×0.1+(90-61)2×0.08=241.(2)由s2=241知,s≈16,則a1=5×{eq\f(61-16,5)}=45,b1=5×[eq\f(61+16,5)]=75,該抽樣數(shù)據(jù)落在[45,75]內(nèi)的頻率約為0.16+0.3+0.2=66%>65%;又a2=5×{eq\f(61-2×16,5)}=30,b2=5×[eq\f(61+2×16,5)]=90,該抽樣數(shù)據(jù)落在[30,90]內(nèi)的頻率約為1-0.03-0.04=0.93=93%<95%,所以可以判斷技術(shù)改造后的產(chǎn)品質(zhì)量初級穩(wěn)定,但不能判定生產(chǎn)線技術(shù)改造成功.13.四月的武漢被百萬株薔薇花覆蓋,形成了全城的花海景觀.薔薇花一般扦插繁殖,園林局為了更好地了解扦插枝條的長度對繁殖狀況的影響,選擇甲、乙兩區(qū)按比例分層隨機抽樣來抽取樣本.已知甲區(qū)的樣本容量m=12,樣本平均數(shù)eq\o(x,\s\up3(-))=18,樣本方差seq\o\al(2,1)=19;乙區(qū)的樣本容量n=18,樣本平均數(shù)eq\o(y,\s\up6(-))=36,樣本方差seq\o\al(2,2)=70.(1)求由兩區(qū)樣本組成的總樣本的平均數(shù)eq\o(z,\s\up3(-))及其方差S2(結(jié)果保留一位小數(shù)).(2)為了營造“花在風(fēng)中笑,人在畫中游”的美景,甲、乙兩區(qū)決定在各自最大的薔薇花海公園進行一次書畫比賽,兩區(qū)各派一支代表隊參加,經(jīng)抽簽確定第一場在甲區(qū)舉行.比賽規(guī)則如下:每場比賽分出勝負(fù),沒有平局,勝方得1分,負(fù)方得0分,下一場在負(fù)方舉行,先得2分的代表隊獲勝,比賽結(jié)束.當(dāng)比賽在甲區(qū)舉行時,甲區(qū)代表隊獲勝的概率為eq\f(3,5),當(dāng)比賽在乙區(qū)舉行時,甲區(qū)代表隊獲勝的概率為eq\f(1,2).假設(shè)每場比賽結(jié)果相互獨立.甲區(qū)代表隊的最終得分記為X,分別求X=1,2的概率.參考數(shù)據(jù):12×182=3888,18×362=23328,28.82=829.44,12×10.82=1399.68,18×7.22=933.12.解析:(1)根據(jù)題意,得eq\o(z,\s\up3(-))==eq\f(2×18+3×36,5)=28.8,因為(xi-eq\o(z,\s\up3(-)))2=(xi-eq\o(x,\s\up3(-))+eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))2=(xi-eq\o(x,\s\up3(-)))2+(xi-eq\o(x,\s\up3(-)))(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))+12(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))2=(xi-eq\o(x,\s\up3(-)))2+2(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))(xi-12eq\o(x,\s\up3(-)))+12(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))2=(xi-eq\o(x,\s\up3(-)))2+12(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))2,同理(yi-eq\o(z,\s\up3(-)))2=(yi-eq\o(y,\s\up3(-)))2+18(eq\o(y,\s\up3(-))-eq\o(z,\s\up3(-)))2,所以S2=eq\f(1,30)[(xi-eq\o(z,\s\up3(-)))2+(yi-eq\o(z,\s\up3(-)))2]=eq\f(1,30)[12seq\o\al(2,1)+12(eq\o(x,\s\up3(-))-eq\o(z,\s\up3(-)))2+18seq\o\al(2,2)+18(eq\o(y,\s\up3(-))-eq\o(z,\s\up3(-)))2]=eq\f(1,30)×(12×19+12×10.82+18×70+18×7.22)≈127.4.所以總樣本的平均數(shù)為eq\o(z,\s\up3(-))=28.8,方差S2≈127.4.(2)依題意可知,X的所有可能取值為0,1,2.設(shè)“第i場比賽在甲區(qū)舉行,甲區(qū)代表隊獲勝”為事件Ai,“第i場比賽在乙區(qū)舉行,甲區(qū)代表隊獲勝”為事件Bi,i=1,2,3,則P(Ai)=eq\f(3,5),P(Bi)=eq\f(1,2),所以P(X=0)=P(eq\o(A,\s\up6(-))1eq\o(A,\s\up6(-))2)=(1-eq\f(3,5))2=eq\f(4,25),P(X=1)=P(A1eq\o(B,\s\up6(-))2eq\o(A,\s\up6(-))3+eq\o(A,\s\up6(-))1A2eq\o(B,\s\up6(-))3)=P(A1eq\o(B,\s\up6(-))2eq\o(A,\s\up6(-))3)+P(eq\o(A,\s\up6(-))1A2eq\o(B,\s\up6(-))3)=eq\f(3,5)×eq\f(1,2)×(1-eq\f(3,5))+(1-eq\f(3,5))×eq\f(3,5)×eq\f(1,2)=eq\f(6,25),P(X=2)=1-P(X=0)-P(X=1)=eq\f(3,5).第41講變量間的相關(guān)性[課標(biāo)要求]1.會作兩個關(guān)聯(lián)變量的散點圖,會利用散點圖認(rèn)識變量間的相關(guān)關(guān)系,了解樣本相關(guān)系數(shù)的統(tǒng)計含義.2.結(jié)合實例,會通過相關(guān)系數(shù)比較多組成對數(shù)據(jù)的相關(guān)性.3.了解最小二乘法的思想,能根據(jù)最小二乘法建立線性回歸模型,會用回歸分析思想與方法解決實際問題.1.相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中一個去精確地決定另一個的程度,這種關(guān)系稱為__相關(guān)關(guān)系__.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種__不確定__關(guān)系.2.散點圖在平面直角坐標(biāo)系中描點,得到關(guān)于兩個變量的一組數(shù)據(jù)的圖形,這樣的統(tǒng)計圖叫做散點圖.它可直觀地判斷兩個變量關(guān)系是否可以用線性關(guān)系表示.從整體上看,當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值也呈現(xiàn)增加的趨勢,我們就稱這兩個變量__正相關(guān)__;當(dāng)一個變量的值增加時,另一個變量的相應(yīng)值呈現(xiàn)減小的趨勢,則稱這兩個變量__負(fù)相關(guān)__.3.樣本相關(guān)系數(shù)r=,當(dāng)r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時,稱成對樣本數(shù)據(jù)負(fù)相關(guān).|r|越接近1時,成對樣本數(shù)據(jù)的線性相關(guān)程度越強;當(dāng)|r|接近0時,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.4.一元線性回歸模型(1)在一元線性回歸模型Y=bx+a+e中,因變量Y的值由自變量x和隨機誤差e共同確定,即自變量x只能解釋部分Y的變化,在統(tǒng)計中,我們把自變量x叫做__解釋__變量,因變量Y稱為__響應(yīng)__變量.(2)經(jīng)驗回歸方程:兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù):(x1,y1),(x2,y2),…,(xn,yn),其經(jīng)驗回歸方程為,則殘差平方和為.5.殘差分析(1)殘差及殘差平方和:殘差ei=,殘差平方和為.(2)用決定系數(shù)來比較兩個模型的擬合效果,其計算公式是R2=1-,R2的值越大,表示殘差平方和越小,即回歸模型的擬合效果越好.1.(2024·天津卷)下列圖中,相關(guān)性系數(shù)最大的是()解析:A觀察四幅圖可知,A圖散點分布比較集中,且大體接近某一條直線,線性回歸模型擬合效果比較好,呈現(xiàn)明顯的正相關(guān),|r|值相比于其他三圖更接近1.故選A.2.(2020·全國Ⅰ卷)某校一個課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:℃)的關(guān)系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(xi,yi)(i=1,2,…,20)得到下面的散點圖:由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是()A.y=a+bxB.y=a+bx2C.y=a+bexD.y=a+blnx解析:D由散點圖分布可知,散點圖分布在一個對數(shù)函數(shù)的圖象附近,因此,最適合作為發(fā)芽率y和溫度x的回歸方程類型的是y=a+blnx.故選D.3.(教材母題必修8.2.2練習(xí)T2改編)某地以“綠水青山就是金山銀山”理念為引導(dǎo),推進綠色發(fā)展.現(xiàn)要訂購一批苗木,苗木長度與售價如下表:苗木長度x/cm384858687888售價y/元16.818.820.822.82425.8若苗木長度x(cm)與售價y(元)之間存在線性相關(guān)關(guān)系,其經(jīng)驗回歸方程為eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+8.9,則當(dāng)售價大約為38.9元時,苗木長度大約為()A.148cmB.150cmC.152cmD.154cm解析:B因為eq\o(x,\s\up6(-))=eq\f(38+48+58+68+78+88,6)=63,eq\o(y,\s\up6(-))=eq\f(16.8+18.8+20.8+22.8+24+25.8,6)=21.5,所以樣本中心點為(63,21.5),又知經(jīng)驗回歸方程eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+8.9經(jīng)過點(63,21.5),所以21.5=63eq\o(b,\s\up6(^))+8.9,所以eq\o(b,\s\up6(^))=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論