版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
板塊四.統(tǒng)計數(shù)據(jù)的數(shù)字特征
且H腥學(xué)問內(nèi)容
隨機抽樣
1.隨機抽樣:滿意每個個體被抽到的機會是均等的抽樣,共有三種常常采納的隨機抽樣方
法:
⑴簡潔隨機抽樣:從元素個數(shù)為N的總體中不放回地抽取容量為〃的樣本,假如每一次抽
取時總體中的各個個體有相同的可能性被抽到,這種抽樣方法叫做簡潔隨機抽樣.
抽出方法:①抽簽法:底紙片或小球分別標(biāo)號后抽簽的方法.
②隨機數(shù)表法:隨機數(shù)表是使用計算器或計算機的應(yīng)凡程序生成隨機數(shù)的功能生成的一張
數(shù)表.表中每一位置消失各個數(shù)字的可能性相同.
隨機數(shù)表法是對樣本進行編號后,依據(jù)肯定的規(guī)律從隨機數(shù)表中讀數(shù),并取出相應(yīng)的樣本的
方法.
簡潔隨機抽樣是最簡潔、最基本的抽樣方法.
⑵系統(tǒng)抽樣:將總體分成均衡的若干部分,然后依據(jù)預(yù)先制定的規(guī)章,從每一部分抽取一個
個體,得到所需要的樣本的抽樣方法.
抽出方法:從元素個數(shù)為N的總體中抽取容量為〃的樣本,假如總體容量能被樣本容量整
除,設(shè)k=),先對總體進行編號,號碼從1到N,再從數(shù)字1到&中隨機抽取一個數(shù)s作
為起始數(shù),然后順次抽取第S+3S+2&,…+汝個數(shù),這樣就得到容量為〃的樣
本.假如總體容量不能被樣本容量整除,可隨機地從總體中剔除余數(shù),然后再按系統(tǒng)抽樣
方法進行抽樣.
系統(tǒng)抽樣適用于大規(guī)模的抽樣調(diào)查,由于抽樣間隔相等,又被稱為等距抽樣.
⑶分層抽樣:當(dāng)總體有明顯差別的幾部分組成時,要反映總體狀況,常采納分層抽樣,使
總體中各個個體按某種特征分成若干個互不重疊的幾部分,每一部分叫做層,在各層中按
層在總體中所占比例進行簡潔隨機抽樣,這種抽樣方法叫做分層抽樣.
分層抽樣的樣本具有較強的代表性,而且各層抽樣時,可敏捷選用不同的抽樣方法,
應(yīng)用廣泛.
2.簡潔隨機抽樣必需具備下列特點:
⑴簡潔隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的.
⑵簡潔隨機樣本數(shù)〃小于等于樣本總體的個數(shù)N.
⑶簡潔隨機樣本是從總體中逐個抽取的.
⑷簡潔隨機抽樣是一種不放回的抽樣.
⑸簡潔隨機抽樣的每個個體入樣的可能性均為£.
3.系統(tǒng)抽樣時,當(dāng)總體個數(shù)N恰好是樣本容量〃的整數(shù)倍時,取k=?;
n
若火不是整數(shù)時,先從總體中隨機地剔除幾個個體,使得總體中剩余的個體數(shù)能被樣本容
n
量〃整除.由于每個個體被剔除的機會相等,因而整個抽樣過程中每個個體被抽取的機會仍
舊相等,為上.
n
二.頻率直方圖
列出樣本數(shù)據(jù)的頻率分布表和頻率分布直方圖的步驟:
①計算極差:找出數(shù)據(jù)的最大值與最小值,計算它們的差;
②打算組距與組數(shù):取組距,用臀打算組數(shù);
組距
③打算分點:打算起點,進行分組:
④列頻率分布直方圖:丸?落入各小組的數(shù)據(jù)累計,算出各小數(shù)的頻數(shù),除以樣本容量,得
到各小組的頻率.
⑤繪制頻率分布直方圖:以數(shù)據(jù)的值為橫坐標(biāo),以坐手的值為縱坐標(biāo)繪制直方圖,
組距
頻率
知小長方形的面積=組距X=頻率.
頻率分布折線圖:將頻率分布直方圖各個長方形上邊的中點用線段連接起來,就得到頻率分
布折線圖,一般把折線圖畫成與橫軸相連,所以橫軸左右兩端點沒有實際意義.
總體密度曲線:樣本容量不斷增大時,所分組數(shù)不斷增加,分組的組距不斷縮小,頻率分布
直方圖可以用?條光滑曲線y=/(x)來描繪,這條光滑曲線就叫做總體密度曲線.總體密度
曲線精確地反映了一個總體在各個區(qū)域內(nèi)取值的規(guī)律.
三.莖葉圖
制作莖葉圖的步驟:
①將數(shù)據(jù)分為“莖”、"葉”兩部分;
②將最大莖與最小莖之間的數(shù)字按大小挨次排成一列,并畫上豎線作為分隔線;
③將各個數(shù)據(jù)的“葉”在分界線的一側(cè)對應(yīng)莖處同行列出.
四.統(tǒng)計數(shù)據(jù)的數(shù)字特征
用樣本平均數(shù)估量總體平均數(shù);用樣本標(biāo)準(zhǔn)差估量總體標(biāo)準(zhǔn)差.
數(shù)據(jù)的離散程序可以用極差、方差或標(biāo)準(zhǔn)差來描述.
極差又叫全距,是一組數(shù)據(jù)的最大值和最小值之差,反映一組數(shù)據(jù)的變動幅度;
樣本方差描述了一組數(shù)據(jù)平均數(shù)波動的大小,樣本的標(biāo)準(zhǔn)差是方差的算術(shù)平方根.
一般地,設(shè)樣本的元素為芭,W,…,毛樣本的平均數(shù)為工,
定義樣本方差為{J")',
n
樣本標(biāo)準(zhǔn)差s=卜-a+但一::+…+區(qū)
簡化公式:,[&2+£+…+£)_欣2]
五.獨立性檢驗
1.兩個變量之間的關(guān)系;
常見的有兩類:一類是確定性的函數(shù)關(guān)系;另一類是變量間存在關(guān)系,但又不具備函數(shù)關(guān)系
所要求的確定性,它們的關(guān)系是帶有肯定隨機性的.當(dāng)一個變量取值肯定時,另一個變量的
取值帶有肯定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.
2.散點圖:將樣本中的〃個數(shù)據(jù)點(七,y)(i=l,2,…,〃)描在平面直角坐標(biāo)系中,就得到
了散點圖.
散點圖形象地反映了各個數(shù)據(jù)的親密程度,依據(jù)散點圖的分布趨勢可以直觀地推斷分析兩個
變量的關(guān)系.
3.假如當(dāng)二個變量的值變大時,另一個變量的值也在變大,則這種相關(guān)稱為正相關(guān);此時,
散點圖中的點在從左下角到右上角的區(qū)域.
反之,一個變量的值變大時,另一個變量的值由大變小,這種相關(guān)稱為負(fù)相關(guān).此時,散點
圖中的點在從左上角到右下角的區(qū)域.
散點圖可以推斷兩個變量之間有沒有相關(guān)關(guān)系.
4.統(tǒng)計假設(shè):假如大事甘與8獨立,這時應(yīng)當(dāng)有P(A8)=P(A)P(8),用字母兒表示此式,
即H。:P(AB)=P(A)P(B),稱之為統(tǒng)計假設(shè).
5.Z2(讀作“卜方”)統(tǒng)計量:
統(tǒng)計學(xué)中有一個特別有用的統(tǒng)計量,它的表達(dá)式為個=〃"“〃22-/%)2,用它的大小可以
%+%+〃+/+2
用來打算是否拒絕原來的統(tǒng)計假設(shè)〃。.假如/的值較大,就拒絕“。,即認(rèn)為A與8是有
關(guān)的.
/統(tǒng)計量的兩個臨界值:3.841、6.635;當(dāng)/>3.841對,有95%的把握說大事A與3有
關(guān);當(dāng)/>6.635時,有99%的把握說大事A與4有關(guān);當(dāng)/〈3.841時,認(rèn)為大事A與4
是無關(guān)的.
獨立性檢驗的基本思想與反證法類似,由結(jié)論不成立時推出有利于結(jié)論成立的小概率大事發(fā)
生,而小概率大事在一次試驗中通常是不會發(fā)生的,所以認(rèn)為結(jié)論在很大程度上是成立的.
1.獨立性檢驗的步驟:統(tǒng)計假設(shè):H。;列出2x2聯(lián)表;計算/統(tǒng)計量;查對臨界值表,
作出推斷.
22
2.幾個臨界值:P(Z>2.706)^0.10,P(Z>3.841)^0.05,6.635)^0.01.
2x2聯(lián)表的獨立性檢驗:
假如對于某個群體有兩種狀態(tài),對于每種狀態(tài)又有兩個狀況,這樣排成一張2x2的表,如
下:
狀態(tài)A狀態(tài)X合計
狀態(tài)A年々+
狀態(tài)N%丐2
%n
假如有調(diào)查得來的四個數(shù)據(jù)八,/,%1'42’并盼望依;據(jù)這樣的4個數(shù)據(jù)來檢驗上述的兩種
狀態(tài)A與8是否有關(guān),就稱之為2x2聯(lián)表的獨立性檢驗.
六.回歸分析
1.回歸分析:對于具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析,即回歸分
析就是會找相關(guān)關(guān)系中這種非確定關(guān)系的某種確定性.
回歸直線:假如散點圖中的各點都大致分布在一條直線四周,就稱這兩個變量之間具有線性
相關(guān)關(guān)系,這條直線叫做回歸直線.
2.最小二乘法:
記回歸直線方程為:y=a+bx,稱為變量丫對變量x的1可歸直線方程,其中叫做【可歸
系數(shù).
亍是為了區(qū)分y的實際值),,當(dāng)“取值%時,變量y的相應(yīng)觀看值為而直線上對應(yīng)于8
的縱坐標(biāo)是a=。+如.
設(shè)x,y的一組觀看值為(4,yj,i=l,2,,且回歸直線方程為亍=。+阮,
當(dāng)/取值七時,y的相應(yīng)觀看值為丫-差其-戈G=1,2,…,〃)刻畫了實際觀看值與回歸
直線上相應(yīng)點的縱坐標(biāo)之間的偏離程度,稱這些值為離差.
我們盼望這〃個離差構(gòu)成的總離差越小越好,這樣才能使所找的直線很貼近已知點.
記??飘a(chǎn),回歸直線就是全部直線中Q取最小值的那條.
r=l
這種使“離差平方和為最小''的方法,叫做最小二乘法.
用最小二乘法求回歸系數(shù)。"有如下的公式:
):X.y.—nxy
b=R---------,4=5-癥,其中上方加“人”,表示是由觀看值按最小二乘法求得的
沅2
r=l
回歸系數(shù).
3.線性回歸模型:將用于估量),值的線性函數(shù)。+云作為確定性函數(shù);),的實際值與估量
值之間的誤差記為£,稱之為隨機誤差;將),=a+Zu-+£稱為線性回歸模型.
產(chǎn)生隨機誤差的主要緣由有:
①所用的確定性函數(shù)不恰當(dāng)即模型近似引起的誤差;
②忽視了某些因素的影響,通常這些影響都比較?。?/p>
③由于測量工具等緣由,存在觀測誤差.
4.線性回歸系數(shù)的最佳估量值:
采用最小二乘法可以得到。,b的計算公式為
〃__n__
ZE-〃"_i”i?
力=『,——=—---------a=y-bx,其中》=一之七,y=-tyi
2(七4)2疝)2小'5
r=lf=1
由此得到的直線?=4+%就稱為回歸直線,此直線方程即為線性回歸方程.其中?分
別為。,人的估量值,4稱為回歸截距,A稱為回歸系數(shù),》稱為回歸值.
5.相關(guān)系數(shù):
Z(%-幻(力-y)Zwa-〃町’
.._i-l________________________LI_______________
、歷2-;)2?力(M-?)2J這X;-疝)2)(力)”心了)
V;=1r=lV1=1r=l
6.相關(guān)系數(shù)「的性質(zhì):
⑴|廠區(qū)1;
⑵|「|越接近于1,X,),的線性相關(guān)程度越強;
(3)|r|越接近于0,X,),的線性相關(guān)程度越弱.
可見,一條回歸直線有多大的猜測功能,和變量間的相關(guān)系數(shù)親密相關(guān).
7.轉(zhuǎn)化思想:
依據(jù)專業(yè)學(xué)問或散點圖,對某些特別的非線性關(guān)系,選擇適當(dāng)?shù)淖兞看鷵Q,把非線性方程轉(zhuǎn)
化為線性回歸方程,從而確定未知參數(shù).
8.一些備案
①回歸(regression)一?詞的來歷:“回歸”這個詞英國統(tǒng)計學(xué)家FrancilsGalton提出來的.1889
年,他在討論祖先與后代的身高之間的關(guān)系時發(fā)覺,身材較高的父母,他們的孩子也較高,
但這些孩子的平均身高并沒有他們父母的平均身高高;身材較矮的父母,他們的孩子也較矮,
但這些孩子的平均身高卻比他們父母的平均身高高.Galton把這種后代的身高向中間值靠近
的趨勢稱為“回歸現(xiàn)象后來,人們把由一個變量的變化去推想另一個變量的變化的方法稱
為回歸分析?.
②回歸系數(shù)的推導(dǎo)過程:
Q=E[(X-。)一如『=Z),:-2az,+〃/一2正Z丫+2abz七+
=而+2asz七-Z):)+"Z";-2/、為£+££‘
把上式看成。的二次函數(shù),/的系數(shù)〃>0,
因此當(dāng)。=_2(立-一£2=£%一冬]時取最小值.
2〃n
同理,把Q的綻開式按人的降轅排列,看成〃的二次函數(shù),當(dāng)。=皆%二⑦土?xí)r取最小值.
Z(D(另一另
解得:1)=0------------a=y-ljx,
右:-疝
r=l
其中工=」?是樣本平均數(shù).
9.對相關(guān)系數(shù)r進行相關(guān)性檢驗的步驟:
①提出統(tǒng)計假設(shè)“0:變量X,),不具有線性相關(guān)關(guān)系;
②假如以95%的把握作出推斷,那么可以依據(jù)1-0.95=0.05與〃-2(〃是樣本容量)在相
關(guān)性檢驗的臨界值表中查出一個,?的臨界值(其中1-0.95=0.05稱為檢驗水平);
③計算樣本相關(guān)系數(shù)「:
④作出統(tǒng)計推斷:若IrAq3,則否定”。,表明有95%的把握認(rèn)為變量y與x之間具有線
性相關(guān)關(guān)系;若1「區(qū)而3,則沒有理由拒絕”o,即就目前數(shù)據(jù)而言,沒有充分理由認(rèn)為變
量y與x之間具有線性相關(guān)關(guān)系.
說明:
⑴對相關(guān)系數(shù)r進行顯著性檢驗,?般取檢驗水平a=005,即牢靠程度為95%.
⑵這里的,?指的是線性相關(guān)系數(shù),,?的肯定值很小,只是說明線性相關(guān)程度低,不肯定不相
關(guān),可能是非線性相關(guān)的某種關(guān)系.
⑶這里的,?是對抽樣數(shù)據(jù)而言的.有時即使|川=1,兩者也不肯定是線性相關(guān)的.故在統(tǒng)計
分析時,不能就數(shù)據(jù)論數(shù)據(jù),要結(jié)合實際狀況進行合理解釋.
助嘛典例分析
題型一.數(shù)字特征的計算
【例1】(2022海淀二模)
某校高中班級開設(shè)了豐富多彩的校本課程,甲、乙兩班各隨機抽取了5名同學(xué)的
學(xué)分,用莖葉圖表示(如右圖).5,,*分別表示甲、乙兩班各自5名同學(xué)學(xué)分的
標(biāo)準(zhǔn)差,則0匈?(填">"、"<"或"=
甲乙
8067
54110
2243
【例2】(2022崇文二模)
甲、乙、丙三名射擊運動員在某次測試中各射擊20次,三人的測試成果如下表
標(biāo)準(zhǔn)差,則外應(yīng),S3的大小關(guān)系為
【例3】10個正數(shù)的平方和是370,方差是33,那么平均數(shù)為()
A.1B.2C.3D.4
【例4】若M個數(shù)的平均數(shù)是X,N個數(shù)的平均數(shù)是V,則這M+N個數(shù)的平均數(shù)
是()
X+YcX+yMX+NYMX+NY
AA.-----B.-----C.--------D.--------
2M+NM+NX+Y
[例5]已知一組數(shù)據(jù)不再,…,/的方差是2,
且G-3尸+(修-3尸+…-3f=380,則這組數(shù)據(jù)的平均數(shù)工=.
【例6】求下列各組數(shù)據(jù)的方差與標(biāo)準(zhǔn)差(精確到0.1),并分析由這些結(jié)果可得出什么更
一般的結(jié)論.
(1)123456789;
(2)111213141516171819;
(3)24681012141618
【例7】(2022上海18)
在發(fā)生某公共衛(wèi)生大事期間,有專業(yè)機構(gòu)認(rèn)為該大事在一段時間內(nèi)沒有發(fā)生大規(guī)模
群體感染的標(biāo)志為“連續(xù)10天,每天新增疑似病例不超過7人〃.依據(jù)過去1。天甲、
乙、丙、丁四地新增疑似病例數(shù)據(jù),肯定符合該標(biāo)志的是()
A.甲地:總體均為3,中位數(shù)為4B.乙地:總體均值為1,總體方差大于0
C.丙地:中位數(shù)為2,眾數(shù)為3D.丁地:總體均值為2,總體方差為3
【例8】(2022四川卷文)
設(shè)矩形的長為明寬為〃,其比滿意。之0.618,這種矩形給人以美感,
稱為黃金矩形.黃金矩形常應(yīng)用于工藝品設(shè)計中.下面是某工藝品廠隨機抽取兩個
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 數(shù)字政府題庫及答案
- 2026年消防宣傳員招聘面試題及答案解析
- 2026年IT互聯(lián)網(wǎng)企業(yè)人力資源助理題庫
- 企業(yè)內(nèi)部培訓(xùn)與員工激勵、成長與培訓(xùn)手冊
- 醫(yī)療機構(gòu)病歷管理手冊
- 幼兒園園本培訓(xùn)管理制度
- 承裝安全培訓(xùn)制度
- 黨員培訓(xùn)指導(dǎo)指導(dǎo)制度
- 藝術(shù)培訓(xùn)保潔員管理制度
- 化工企業(yè)班組培訓(xùn)制度
- 人教版信息科技五年級全一冊 第26課 尋找最短的路徑 課件
- 人民軍隊性質(zhì)宗旨教育
- 護士長管理培訓(xùn)課件
- 初三期末藏文試卷及答案
- 暫緩行政拘留申請書
- 小學(xué)班主任經(jīng)驗交流課件
- TSG 21-2015《固定式壓力容器安全技術(shù)監(jiān)察規(guī)程》
- 2025個人年終工作總結(jié)
- 中國水利教育培訓(xùn)手冊
- 小學(xué)數(shù)學(xué)元角分應(yīng)用題200道及答案
- 主播合同糾紛答辯狀
評論
0/150
提交評論