版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
概率論與數(shù)理統(tǒng)計(jì)第1章隨機(jī)事件與概率第2章隨機(jī)變量的分布及其數(shù)字特征第3章多維隨機(jī)變量的分布及其數(shù)字特征第4章數(shù)理統(tǒng)計(jì)的基本概念第5章參數(shù)估計(jì)第6章假設(shè)檢驗(yàn)第7章方差分析第8章回歸分析
在概率論中,隨機(jī)變量的分布通常是已知的或假設(shè)是已知的,但實(shí)際中隨機(jī)變量的分布或分布中的參數(shù)往往是未知的.數(shù)理統(tǒng)計(jì)的任務(wù)之一是尋找隨機(jī)變量的分布或分布中的參數(shù).
數(shù)理統(tǒng)計(jì)是以概率論為基礎(chǔ),研究如何采用有效的數(shù)學(xué)方法對(duì)數(shù)據(jù)進(jìn)行加工與分析,從而對(duì)隨機(jī)變量的分布、數(shù)字特征等做出統(tǒng)計(jì)推斷的一門數(shù)學(xué)學(xué)科.
統(tǒng)計(jì)推斷的一般過(guò)程是,首先從總體中抽取樣本,構(gòu)造樣本統(tǒng)計(jì)量,用統(tǒng)計(jì)量來(lái)描述樣本的分布特征,并對(duì)總體的分布或數(shù)字特征做出統(tǒng)計(jì)推斷.
重要的兩類統(tǒng)計(jì)推斷是參數(shù)估計(jì)和假設(shè)檢驗(yàn).統(tǒng)計(jì)推斷的過(guò)程第4章數(shù)理統(tǒng)計(jì)的基本概念描
述作出
推斷
構(gòu)造隨機(jī)
抽樣參數(shù)估計(jì)假設(shè)檢驗(yàn)總體樣本統(tǒng)計(jì)量第四章知識(shí)結(jié)構(gòu)第4章數(shù)理統(tǒng)計(jì)的基本概念正態(tài)總體下常用統(tǒng)計(jì)量應(yīng)用描述性統(tǒng)計(jì)總體樣本三大抽樣分布統(tǒng)計(jì)量Excel代表性獨(dú)立性實(shí)際問(wèn)題本章主要內(nèi)容有:
總體、樣本、統(tǒng)計(jì)量、描述性統(tǒng)計(jì)、正態(tài)總體下的常用統(tǒng)計(jì)量等.☆實(shí)際問(wèn)題中把研究對(duì)象的全體稱為總體,從總體中抽取的部分對(duì)象就是樣本,統(tǒng)計(jì)推斷是用樣本提供的信息來(lái)推斷總體的特征.☆常用的樣本是簡(jiǎn)單隨機(jī)樣本,它滿足代表性和獨(dú)立性.樣本的代表性和獨(dú)立性是構(gòu)造統(tǒng)計(jì)量的基礎(chǔ),也是統(tǒng)計(jì)推斷的基礎(chǔ).☆統(tǒng)計(jì)量的分布稱為抽樣分布,其中c2分布、t分布和F分布是區(qū)間估計(jì)、假設(shè)檢驗(yàn)、方差分析的基礎(chǔ).☆在樣本代表性和獨(dú)立性的基礎(chǔ)上,利用三大抽樣分布可以構(gòu)造正態(tài)總體下的常用統(tǒng)計(jì)量,這些統(tǒng)計(jì)量在區(qū)間估計(jì)或假設(shè)檢驗(yàn)中有重要應(yīng)用.☆可以利用Excel進(jìn)行樣本描述性統(tǒng)計(jì)和計(jì)算三大抽樣分布的概率以及分位數(shù).第4章數(shù)理統(tǒng)計(jì)的基本概念§4.1樣本與統(tǒng)計(jì)量§4.2樣本的描述性統(tǒng)計(jì)§4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量第4章數(shù)理統(tǒng)計(jì)的基本概念4.1.1總體與樣本4.1.2抽樣方法4.1.3簡(jiǎn)單隨機(jī)樣本4.1.4統(tǒng)計(jì)量4.1樣本與統(tǒng)計(jì)量4.1樣本與統(tǒng)計(jì)量4.1.1總體與樣本
在實(shí)際問(wèn)題中,我們常要研究某種對(duì)象的某些特征,而這些特征可用一些數(shù)量指標(biāo)來(lái)表示.比如,在研究重慶地區(qū)中學(xué)生的健康狀況時(shí),要測(cè)量中學(xué)生的年齡、身高、體重、視力、聽(tīng)力、肺活量、心率等特征,這些特征都是數(shù)量指標(biāo).在數(shù)理統(tǒng)計(jì)中,把研究對(duì)象的全體稱為總體,總體中的每個(gè)元素稱為個(gè)體.
在研究重慶地區(qū)中學(xué)生的健康狀況時(shí),所有重慶地區(qū)的中學(xué)生是總體,其中的每個(gè)中學(xué)生是個(gè)體.再如,在考察某批燈泡的質(zhì)量時(shí),該批燈泡構(gòu)成一個(gè)總體,其中的每個(gè)燈泡是個(gè)體.
對(duì)于一個(gè)總體,在試驗(yàn)前,總體的某些數(shù)量特征是未知的,這些數(shù)量特征可以理解為隨機(jī)變量,對(duì)總體的研究也就轉(zhuǎn)化為對(duì)隨機(jī)變量的研究,研究總體的數(shù)量特征也就轉(zhuǎn)化為研究隨機(jī)變量的分布特征.4.1樣本與統(tǒng)計(jì)量4.1.1總體與樣本
總體中包含的個(gè)體往往很多,這時(shí)要對(duì)所有個(gè)體進(jìn)行試驗(yàn)就需要大量的人力物力和時(shí)間,有時(shí)甚至是不可能做到的.
如在自由市場(chǎng)購(gòu)買瓜子時(shí),所有的瓜子是總體,每顆瓜子是個(gè)體.為了知道瓜子是否好吃,不可能將所有的瓜子都嘗一遍,只能選幾顆嘗一嘗,用所選的瓜子去推斷所有的瓜子.
在對(duì)總體進(jìn)行研究時(shí),一種可能或經(jīng)濟(jì)的做法是只抽取部分個(gè)體進(jìn)行研究,用這部分個(gè)體呈現(xiàn)出的特征去推斷總體的特征.
數(shù)理統(tǒng)計(jì)中,從總體中抽取部分個(gè)體進(jìn)行試驗(yàn),稱作抽取樣本,簡(jiǎn)稱抽樣.抽到的這部分個(gè)體稱作樣本,樣本中包含的個(gè)體數(shù)量稱為樣本量.4.1樣本與統(tǒng)計(jì)量4.1.2抽樣方法抽樣方法可分為概率抽樣和非概率抽樣.概率抽樣是按隨機(jī)原則進(jìn)行的抽樣.隨機(jī)原則是指在抽樣時(shí)排除主觀上有意識(shí)地抽取個(gè)體,使每個(gè)個(gè)體都有一定的機(jī)會(huì)被抽到,每個(gè)個(gè)體被抽到的概率是已知的,或是可以計(jì)算出來(lái)的.
放回抽樣是指從總體N個(gè)個(gè)體中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的個(gè)體經(jīng)記錄其有關(guān)標(biāo)志表現(xiàn)后又放回總體中重新參加下一次的抽取.放回抽樣相當(dāng)于在相同條件下進(jìn)行n次獨(dú)立的隨機(jī)試驗(yàn).
無(wú)放回抽樣是指從總體N個(gè)個(gè)體中隨機(jī)抽取一個(gè)容量為n的樣本,每次抽中的個(gè)體記錄其有關(guān)標(biāo)志表現(xiàn)后不再放回總體中參加下一次的抽取.無(wú)放回抽樣相當(dāng)于一次性同時(shí)從總體中抽中n個(gè)個(gè)體構(gòu)成樣本.4.1.2抽樣方法概率抽樣需要抽樣框,抽樣框是包含總體中每個(gè)個(gè)體特征的個(gè)體名冊(cè),如學(xué)生花名冊(cè).抽樣框用以確定總體的抽樣范圍和結(jié)構(gòu).常用的抽樣組織方式有簡(jiǎn)單隨機(jī)抽樣、分層抽樣、整群抽樣、系統(tǒng)抽樣、多階段抽樣等.簡(jiǎn)單隨機(jī)抽樣是從抽樣框中隨機(jī)地、一個(gè)一個(gè)地抽取的個(gè)體,每個(gè)個(gè)體入樣的概率是相等的.分層抽樣是先將總體按某種規(guī)則劃分為若干不同的“層”,然后在每一層內(nèi)進(jìn)行簡(jiǎn)單隨機(jī)抽樣.如某大學(xué)將學(xué)生按年級(jí)分為四層,在每個(gè)年級(jí)隨機(jī)抽取50名學(xué)生即為分層抽樣.4.1樣本與統(tǒng)計(jì)量4.1.2抽樣方法整群抽樣是先將總體按某種規(guī)則分為若干不同的“群”,以群為抽樣單位進(jìn)行簡(jiǎn)單隨機(jī)抽樣,被抽中的群作為樣本.如某大學(xué)在四個(gè)年級(jí)中隨機(jī)抽取一個(gè)年級(jí),然后對(duì)抽中的年級(jí)進(jìn)行全面調(diào)查就屬于整群抽樣.系統(tǒng)抽樣是將總體按某一標(biāo)志排序,然后每隔一定距離抽取一個(gè)個(gè)體構(gòu)成樣本.典型的做法是先從數(shù)字1~k中隨機(jī)抽取一個(gè)數(shù)字r作為初始個(gè)體,然后依次抽取第個(gè)r+k個(gè)體、第個(gè)r+2k個(gè)體、第個(gè)r+3k個(gè)體、…,
組成樣本.多階段抽樣是先抽取一個(gè)樣本,再在抽取的樣本中抽取樣本.非概率抽樣是指不按隨機(jī)原則,而是根據(jù)方便原則或研究人員的主觀判斷選擇樣本的抽樣方法.非概率抽樣有方便抽樣、判斷抽樣、配額抽樣、志愿者入樣、滾雪球抽樣等形式,這里不再贅述.4.1樣本與統(tǒng)計(jì)量4.1.3簡(jiǎn)單隨機(jī)樣本由于樣本在未試驗(yàn)之前,其數(shù)量特征也是未知的,所以通常將試驗(yàn)前的樣本也看作隨機(jī)變量,而試驗(yàn)之后的樣本取值稱為樣本值或樣本數(shù)據(jù).定義4.1.1設(shè)x1,x2,…,xn為來(lái)自總體X的容量為n的樣本.若樣本滿足:
(1)代表性:x1,x2,…,xn都與總體服從相同的分布;
(2)獨(dú)立性:x1,x2,…,xn相互獨(dú)立,則稱其為簡(jiǎn)單隨機(jī)樣本.以后我們討論的樣本都是簡(jiǎn)單隨機(jī)樣本.一般將樣本容量n<50的樣本稱作小樣本,而將n≥50,甚至n≥100的樣本稱作大樣本(很多時(shí)候n≥30就算大樣本).4.1樣本與統(tǒng)計(jì)量4.1.3簡(jiǎn)單隨機(jī)樣本例4.1.1設(shè)x1,x2,…,xn是來(lái)自總體—某小商店一小時(shí)內(nèi)到達(dá)的顧客數(shù)X~P(5)的樣本.試求E(xi),D(xi),E(2x1+3x2),D(2x1-3xn).解
X~P(5),E(X)=D(X)=5.由于簡(jiǎn)單隨機(jī)樣本中個(gè)體與總體服從相同的分布,且相互獨(dú)立,所以xi~P(5),E(xi)=D(xi)=5,i=1,2,…,n.4.1樣本與統(tǒng)計(jì)量4.1.3簡(jiǎn)單隨機(jī)樣本設(shè)總體X的分布函數(shù)為F(x),x1,x2,…,xn是來(lái)自總體容量為n的樣本,則樣本的聯(lián)合分布函數(shù)為
(4.1.1)若總體為離散型隨機(jī)變量X,其分布列為則樣本的聯(lián)合分布列為
(4.1.2)若總體為連續(xù)型隨機(jī)變量X,其密度函數(shù)為f(x),則樣本的聯(lián)合密度函數(shù)為
(4.1.3)4.1樣本與統(tǒng)計(jì)量4.1.3簡(jiǎn)單隨機(jī)樣本例4.1.2設(shè)有一大批產(chǎn)品,其廢品率p未知,現(xiàn)從中隨機(jī)抽取容量為n的樣本x1,x2,…,xn進(jìn)行檢驗(yàn),試求樣本的聯(lián)合分布.解將這批產(chǎn)品視作一個(gè)總體X,X~B(1,p)
,其分布列為
p(x)=px(1-p)1-x,x=0,1.
由樣本的代表性可知,xi~B(1,p),i=1,2,…,n,其分布列為由樣本的獨(dú)立性可知,樣本的聯(lián)合分布列為4.1樣本與統(tǒng)計(jì)量4.1.3簡(jiǎn)單隨機(jī)樣本例4.1.3設(shè)x1,x2,…,xn是來(lái)自總體X~Exp(l)的樣本,試求樣本的聯(lián)合分布.解總體X~Exp(l),則X的密度函數(shù)為由樣本的代表性可知,xi~Exp(l),xi的密度函數(shù)為由樣本的獨(dú)立性可知,樣本的聯(lián)合密度為4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量
樣本是總體的代表和反映,是統(tǒng)計(jì)推斷的基本依據(jù).樣本提供的信息不能直接用于統(tǒng)計(jì)推斷,需要對(duì)樣本進(jìn)行數(shù)學(xué)上的加工.這在數(shù)理統(tǒng)計(jì)中往往通過(guò)構(gòu)造一個(gè)合適的依賴于樣本的函數(shù)——統(tǒng)計(jì)量來(lái)達(dá)到.定義4.1.2設(shè)x1,x2,…,xn是來(lái)自總體X容量為n的樣本,不含任何未知參數(shù)的樣本的函數(shù)f(x1,x2,…,xn)稱為統(tǒng)計(jì)量.
例4.1.4設(shè)x1,x2是來(lái)自總體X~N(m,s2)的的一個(gè)樣本,其中m,s2是未知參數(shù),則x1+x2,x13+4x2+x24都是統(tǒng)計(jì)量,而
x1+m,x12+x22+s2,(x1-m)/s都不是統(tǒng)計(jì)量.
樣本理解為隨機(jī)變量,統(tǒng)計(jì)量是樣本的函數(shù),所以統(tǒng)計(jì)量也是隨機(jī)變量,將樣本值代入統(tǒng)計(jì)量,得統(tǒng)計(jì)量的值.4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量
若樣本函數(shù)中含有未知參數(shù),則樣本函數(shù)值就無(wú)法計(jì)算,用樣本函數(shù)去推斷總體就成了用未知去推斷未知,所以統(tǒng)計(jì)量中不能含有未知參數(shù).
統(tǒng)計(jì)量中雖不能含有未知參數(shù),但統(tǒng)計(jì)量的分布可能依賴于未知參數(shù).
例如,在例4.1.4中,x1+x2是統(tǒng)計(jì)量,函數(shù)x1+x2中沒(méi)有未知參數(shù)。由于樣本中的個(gè)體和總體服從相同的分布且相互獨(dú)立,因而x1+x2~N(2m,2s2)即函數(shù)x1+x2的密度函數(shù)依賴于未知參數(shù)m和s2.4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量
用樣本去推斷總體的特征,需要構(gòu)造合適的統(tǒng)計(jì)量,自然希望在構(gòu)造統(tǒng)計(jì)量的過(guò)程中盡可能地保留樣本中有關(guān)總體的全部信息.
統(tǒng)計(jì)量加工過(guò)程中一點(diǎn)信息都不損失的統(tǒng)計(jì)量稱為充分統(tǒng)計(jì)量.
假如某質(zhì)檢員從一大批某種產(chǎn)品中依次隨機(jī)地抽取了10個(gè)產(chǎn)品x1,x2,…,x10,
結(jié)果發(fā)現(xiàn)抽出的前3個(gè)產(chǎn)品都是合格品,后7個(gè)產(chǎn)品都是不合格品.設(shè)xi表示抽到的合格品數(shù),則x1=x2,=x3=1,x4=x5=x6=x7=x8=x9=x10=0,記統(tǒng)計(jì)量
則T1是充分統(tǒng)計(jì)量,T2不是充分統(tǒng)計(jì)量.4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量最常用的統(tǒng)計(jì)量是樣本均值,樣本方差,樣本標(biāo)準(zhǔn)差,樣本成數(shù)等.
(1)樣本均值:
(4.1.4)
(2)樣本方差:
(4.1.5)
(3)樣本標(biāo)準(zhǔn)差:
(4.1.6)
(4)樣本成數(shù):P=n1/n(n1是具有某種特征的樣本單位的個(gè)數(shù))
(4.1.7)
4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量樣本均值和樣本方差具有如下性質(zhì):
(1)
(4.1.8)
(2)(4.1.9)
(3)(4.1.10)證明4.1樣本與統(tǒng)計(jì)量4.1.4統(tǒng)計(jì)量例4.1.5設(shè)x1,x2,…,x20是來(lái)自總體X~Exp(0.001)的樣本,試求解由樣本均值和樣本方差的性質(zhì)知4.1樣本與統(tǒng)計(jì)量4.2.1樣本數(shù)字特征4.2.2頻率分布與直方圖4.2樣本的描述性統(tǒng)計(jì)4.2.1樣本數(shù)字特征
樣本的描述性統(tǒng)計(jì)是用數(shù)字特征、表格或圖形來(lái)描述樣本分布的統(tǒng)計(jì)方法.描述性統(tǒng)計(jì)是統(tǒng)計(jì)研究的基礎(chǔ),是統(tǒng)計(jì)推斷、統(tǒng)計(jì)咨詢、統(tǒng)計(jì)決策的事實(shí)依據(jù).
設(shè)x1,x2,…,xn是來(lái)自總體X的一個(gè)樣本值,以下是描述樣本的一些數(shù)字特征.
(1)極差:樣本值中的最大值與最小值之差,也稱全距.
(2)眾數(shù):樣本值中出現(xiàn)次數(shù)最多的樣本值.眾數(shù)可能不唯一.
(3)中位數(shù):樣本值排序后處于中間位置上的數(shù).中位數(shù)將全部樣本值分為兩部分,每部分包含50%的樣本值.若樣本容量為奇數(shù),則中位數(shù)為排序后,中間的那個(gè)樣本值;若樣本容量為偶數(shù),則中位數(shù)為排序后處于中間位置上的兩個(gè)樣本值的平均數(shù).如某班級(jí)的數(shù)學(xué)成績(jī)的中位數(shù)為80,則說(shuō)明該班有一半的同學(xué)成績(jī)?cè)?0分以上.
4.2樣本的描述性統(tǒng)計(jì)4.2.1樣本數(shù)字特征
(4)均值:(4.2.1)樣本均值用來(lái)描述樣本值的集中程度.
(5)方差:(4.2.2)
(6)標(biāo)準(zhǔn)差:(4.2.3)
樣本方差或標(biāo)準(zhǔn)差用來(lái)描述樣本值的離散程度或波動(dòng)程度.
(7)k階原點(diǎn)矩:(4.2.4)
(8)k階中心矩:(4.2.5)4.2樣本的描述性統(tǒng)計(jì)4.2樣本的描述性統(tǒng)計(jì)4.2.1樣本數(shù)字特征
(9)偏度系數(shù):(4.2.6)
偏度系數(shù)用來(lái)描述了樣本值分布的對(duì)稱性.如圖4.2.1所示.當(dāng)g1=0時(shí),樣本分布關(guān)于樣本均值對(duì)稱;當(dāng)g1>0時(shí),樣本分布是左偏態(tài)分布,此時(shí)分布的“左尾長(zhǎng)右尾短”;當(dāng)g1<0時(shí),樣本分布是右偏態(tài)分布,此時(shí)分布的“左尾短右尾長(zhǎng)”.圖4.2.1不同偏態(tài)的分布曲線
當(dāng)g2>0時(shí),表示樣本值標(biāo)準(zhǔn)化后的分布比標(biāo)準(zhǔn)正態(tài)分布更尖峭和(或)尾部更粗;當(dāng)g2=0時(shí),表示樣本值標(biāo)準(zhǔn)化后的分布與標(biāo)準(zhǔn)正態(tài)分布在尖峭程度和尾部粗細(xì)程度上相當(dāng);當(dāng)g2<0時(shí),表示樣本值標(biāo)準(zhǔn)化后的分布比標(biāo)準(zhǔn)正態(tài)分布更平坦和(或)尾部更細(xì).4.2.1樣本數(shù)字特征
(10)峰度系數(shù):(4.2.7)
峰度系數(shù)用來(lái)描述樣本值分布的和尖峭程度.如圖4.2.2所示,三個(gè)均值、方差相等、偏度皆為0的密度函數(shù),峰度有很大區(qū)別.4.2樣本的描述性統(tǒng)計(jì)
g2>0g2<0g2=0圖4.2.2不同峰度的分布曲線
4.2.1樣本數(shù)字特征
(11)樣本協(xié)方差與相關(guān)系數(shù):設(shè)x=(x1,x2,…,xn)和y=(x1,x2,…,xn)是分別來(lái)自總體
X和Y的樣本.兩樣本的協(xié)方差定義為
(4.2.8)樣本相關(guān)系數(shù):
(4.2.9)樣本協(xié)方差與相關(guān)系數(shù)用來(lái)描述兩個(gè)樣本的線性相關(guān)程度.4.2樣本的描述性統(tǒng)計(jì)4.2.1樣本數(shù)字特征例4.2.1下列數(shù)據(jù)是來(lái)自某總體的一個(gè)樣本值,試求其樣本眾數(shù)、樣本中位數(shù)、樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本偏態(tài)系數(shù)、樣本峰態(tài)系數(shù).解利用Excel計(jì)算得:
平均中位數(shù)眾數(shù)標(biāo)準(zhǔn)差方差峰度偏度2.99003.10003.10000.60820.36993.9513–1.79854.2樣本的描述性統(tǒng)計(jì)1.53.12.63.43.13.02.83.63.53.34.2.1樣本數(shù)字特征
例4.2.1下列數(shù)據(jù)分別是來(lái)自兩個(gè)總體的樣本值,
試求兩樣本的協(xié)方差與相關(guān)系數(shù).
解
將樣本值代入式(4.2.8)和式(4.2.9)計(jì)算得,
4.2樣本的描述性統(tǒng)計(jì)樣本1516423樣本22333584.2.2頻率分布與直方圖樣本值分組是將全部樣本值依次劃分為若干個(gè)區(qū)間,并將這一區(qū)間的樣本值作為一組.一個(gè)組的最小值稱為下限,最大值稱為上限,上限與下限之差稱為組距.
樣本值組距式分組方法的一般步驟:步驟1確定是等距分組,還是異距分組.步驟2確定組數(shù),組距,組上限和下限.(4.2.10)
若用公式(4.2.10)得出的組距不是有理數(shù),或小數(shù)位數(shù)太多,則可四舍五入,或?qū)⒆畲笾颠m當(dāng)放大,或?qū)⒆钚≈颠m當(dāng)縮小,或調(diào)整組數(shù),得到理想的組距.4.2樣本的描述性統(tǒng)計(jì)4.2.2頻率分布與直方圖步驟3將數(shù)據(jù)由小到大排序,進(jìn)行分組和組頻數(shù)統(tǒng)計(jì).各組內(nèi)的樣本值的個(gè)數(shù)稱為頻數(shù).組頻數(shù)占樣本容量的比例稱為頻率.將組頻數(shù)或組頻率累加可以計(jì)算出累積頻數(shù)或累積頻率.
步驟4繪制直方圖.在平面直角坐標(biāo)中,橫軸表示數(shù)據(jù)分組區(qū)間,縱軸表示頻數(shù)或頻率÷組距.這樣各組的分組區(qū)間與相應(yīng)的頻數(shù)或頻率÷組距就形成了一個(gè)矩形,即為直方圖.
例4.2.3下列數(shù)據(jù)是來(lái)自某總體的一個(gè)容量為120的樣本值,試將數(shù)據(jù)等距分為10組,計(jì)算累積頻率并畫出直方圖.4.2樣本的描述性統(tǒng)計(jì)4.2.2頻率分布與直方圖
解
樣本數(shù)據(jù)的最小值為141,最大值為237.為了計(jì)算方便,將數(shù)據(jù)范圍擴(kuò)至140~240,分成10個(gè)組,分組上限分別為:150160170180190200210220230240
按“下限不在組內(nèi)”,計(jì)算得頻數(shù)、頻率、累積頻率見(jiàn)表4.2.1.4.2樣本的描述性統(tǒng)計(jì)4.2.2頻率分布與直方圖表4.2.1頻率分布表分組組頻數(shù)組頻率累積頻率(140,150]50.04174.17%(150,160]110.083313.33%(160,170]170.125027.50%(170,180]200.233344.17%(180,190]210.166761.67%(190,200]170.133375.83%(200,210]130.091786.67%(210,220]80.050093.33%(220,230]50.033397.50%(230,240]30.0417100.00%4.2樣本的描述性統(tǒng)計(jì)4.2.2頻率分布與直方圖
用Excel制作的直方圖為4.2樣本的描述性統(tǒng)計(jì)4.3.1三大抽樣分布4.3.2正態(tài)總體下的常用統(tǒng)計(jì)量4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布
統(tǒng)計(jì)量的分布稱為抽樣分布.數(shù)理統(tǒng)計(jì)中常用的抽樣分布有c2分布,t分布和F分布.1)卡方分布定義4.3.1設(shè)x1,x2,…,xn為來(lái)自總體X~N(0,1)的一個(gè)樣本,則統(tǒng)計(jì)量
(4.3.1)服從自由度為的n卡方分布,記作X~c2(n).c2(n)分布的偏度系數(shù)大于0,是右偏態(tài)分布,自由度越小分布形態(tài)越往右偏.4.3.1三大抽樣分布定理4.3.1設(shè)隨機(jī)變量X~c2(m),Y~c2(n),X和Y獨(dú)立,則X+Y~c2(m+n).定義4.3.2稱滿足條件P{c2(n)>ca2(n)}=a(0<a<1)的數(shù)ca2(n)為c2(n)的右尾a分位數(shù)或左尾1-a分位數(shù).
卡方分布的密度函數(shù)比較復(fù)雜,人們編制了卡方分布表(見(jiàn)本書附表),供計(jì)算卡方分布的概率或分位數(shù)時(shí)參考.
例4.3.2查c2分布表求右尾分位數(shù)c0.0252(15).
解
右尾分位數(shù)c0.0252(15)即左尾c0.9752(15),查表得c0.0252(15)≈27.4884.
4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布例4.3.1設(shè)x1,x2,…,x20是來(lái)自正態(tài)總體N(m,s2)的樣本,試求概率
解4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布2)t分布t分布是皮爾遜(KarlPearson,1857-1936)的學(xué)生英國(guó)統(tǒng)計(jì)學(xué)家戈賽特(W.S.Gosset)發(fā)現(xiàn)的,故也稱學(xué)生t分布.
定義4.3.3設(shè)X~N(0,1),Y~c2(n),
X且Y與相互獨(dú)立,則隨機(jī)變量
(4.3.2)服從自由度為n的t分布,記作t~t(n).4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量t(n)分布的密度函數(shù)關(guān)于原點(diǎn)對(duì)稱,與標(biāo)準(zhǔn)正態(tài)分布的密度函數(shù)形狀類似,只是峰比標(biāo)準(zhǔn)正態(tài)分布低一些,尾部概率比標(biāo)準(zhǔn)正態(tài)分布的大一些.當(dāng)自由度充分大(一般大于30)時(shí),分布接近于標(biāo)準(zhǔn)正態(tài)分布.
圖4.3.2t分布的密度函數(shù)圖像
4.3.1三大抽樣分布定義4.3.4稱滿足條件P{t(n)>ta(n)}=a(0<a<1)的數(shù)ta(n)為t(n)的右尾a分位數(shù)或左尾1-a分位數(shù).t分布的密度函數(shù)比較復(fù)雜,人們編制了t分布表(見(jiàn)本書附表),供計(jì)算t分布的概率或分位數(shù)時(shí)參考.
例4.3.3查t分布表求P{t(10)>2.2881}和P{|t(10)|>2.2881}.
解
查表得
P{t(10)>2.2881}=1-P{t(10)≤2.2881}≈1-0.975=0.025.由t
分布的對(duì)稱性,P{|t(10)|>2.2881}=2P{t(10)>2.2881}=0.05.例4.3.4查t分布表求右尾分位數(shù)t0.05(10).
解
右尾分位數(shù)t0.05(10)等于左尾t0.95(10),查表得
t0.05(10)=1.8125.
4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布3)F分布
F分布是英國(guó)統(tǒng)計(jì)與遺傳學(xué)家,現(xiàn)代統(tǒng)計(jì)科學(xué)的奠基人之一費(fèi)歇爾(R.A.Fisher,1890-1962)首先提出的,是以費(fèi)歇爾的姓氏的第一個(gè)字母命名的.定義4.3.5設(shè)X~c2(m),Y~c2(n),且X與Y相互獨(dú)立,則隨機(jī)變量
(4.3.3)服從第一自由度為m,第二自由度為n的F分布,記作F~F(m,n).F分布是右偏態(tài)分布.4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量圖4.3.3F分布的密度函數(shù)圖像
4.3.1三大抽樣分布定義4.3.6稱滿足條件P{F(m,n)>Fa(m,n)}=a(0<a<1)的數(shù)Fa(m,n)為F(m,n)的右尾a分位數(shù)或左尾1-a分位數(shù).若F~F(m,n),則1/F~F(n,m),故對(duì)于給定的a(0<a<1),這說(shuō)明
(4.3.4)F分布的密度函數(shù)比較復(fù)雜,人們編制了F分布表(見(jiàn)本書附表),供計(jì)算F分布的概率或分位數(shù)時(shí)參考.4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布例4.4.5查F分布表求P{F(10,16)>2.99}和右尾分位數(shù)F0.05(10,16).
解
查表得,P{F(10,16)>2.99}=1-P{F(10,16)<2.99}=1-0.975=0.025.右尾分位數(shù)F0.05(10,16)等于左尾F0.95(10.16),查表得F0.05(10,16)=2.49.例4.4.6設(shè)x1,x2,…,x15是來(lái)自正態(tài)總體N(0,32)的樣本,試求
的分布.
解由于樣本中的個(gè)體與總體服從相同的分布且相互獨(dú)立,所以4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.1三大抽樣分布
由于樣本中個(gè)體相互獨(dú)立,所以x12+x22+…+x102與x112+x122+…+x152也相互獨(dú)立,由F分布的定義,得4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.2正態(tài)總體下的常用統(tǒng)計(jì)量
正態(tài)分布是常用分布,下面介紹正態(tài)總體下的一些常用統(tǒng)計(jì)量,這些統(tǒng)計(jì)量在區(qū)間估計(jì),假設(shè)檢驗(yàn),方差分析等方面有著重要應(yīng)用.定理4.3.2設(shè)x1,x2,…,xn是來(lái)自總體X的樣本,
是樣本均值.
(1)若總體X~(m,s2)
,則
(4.3.5)
(2)若總體分布未知或不是正態(tài)分布,但E(X)=m,D(X)=s2,則n充分大時(shí)
的漸近分布為正態(tài)分布,記作
(4.3.6)這里的漸近分布是指n充分大時(shí)的近似分布.
4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.2正態(tài)總體下的常用統(tǒng)計(jì)量例4.3.7設(shè)x1,x2,…,x9是來(lái)自總體N(8,22)的樣本,試求.解由定理4.3.2知,
故4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.2正態(tài)總體下的常用統(tǒng)計(jì)量例4.3.8在天平上重復(fù)稱量一質(zhì)量為a的物品,假設(shè)各次稱得結(jié)果相互獨(dú)立,且都服從正態(tài)分布N(a,0.22),若以
表示n次稱重結(jié)果的算術(shù)平均值,為使,n的最小值應(yīng)取多少?解將n次稱重結(jié)果x1,x2,…,xn
視作一個(gè)樣本,則xi~N(a,0.04),由定理4.3.2知,表得,
所以n的最小值應(yīng)取16.4.3抽樣分布與正態(tài)總體下的常用統(tǒng)計(jì)量4.3.2正態(tài)總體下的常用統(tǒng)計(jì)量定理4.3.3設(shè)x1,x2,…,xn是來(lái)自總體X~N(m,s2)的一
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 國(guó)際會(huì)議組織籌備方案
- 安全生產(chǎn)隱患排查與獎(jiǎng)勵(lì)制度詳解
- 2025-2030清潔能源行業(yè)市場(chǎng)供需現(xiàn)狀行業(yè)投資機(jī)會(huì)評(píng)估分析課題
- 2025-2030消防救援無(wú)人機(jī)載通信平臺(tái)技術(shù)測(cè)試及應(yīng)急響應(yīng)體系優(yōu)化規(guī)
- 2025-2030消防安全監(jiān)測(cè)系統(tǒng)技術(shù)應(yīng)用與建筑安全管理方案
- 2025-2030消費(fèi)級(jí)機(jī)器人產(chǎn)品功能迭代與市場(chǎng)教育策略研究
- 2025-2030消費(fèi)級(jí)無(wú)人機(jī)法規(guī)環(huán)境與市場(chǎng)增長(zhǎng)瓶頸分析研究報(bào)告
- 2025-2030消費(fèi)級(jí)VR設(shè)備內(nèi)容生態(tài)建設(shè)瓶頸與用戶留存策略優(yōu)化報(bào)告
- 2025-2030消費(fèi)級(jí)3D打印設(shè)備市場(chǎng)教育周期與渠道拓展報(bào)告
- 2025-2030消費(fèi)電子散熱材料技術(shù)迭代與市場(chǎng)需求變化趨勢(shì)研究報(bào)告
- 石子廠規(guī)范管理制度
- 大數(shù)據(jù)驅(qū)動(dòng)下的塵肺病發(fā)病趨勢(shì)預(yù)測(cè)模型
- 成都2025年四川成都市新津區(qū)招聘衛(wèi)生專業(yè)技術(shù)人才21人筆試歷年參考題庫(kù)附帶答案詳解
- 2026屆廣東省高考英語(yǔ)聽(tīng)說(shuō)考試備考技巧講義
- 炎德英才大聯(lián)考雅禮中學(xué)2026屆高三月考試卷英語(yǔ)(五)(含答案)
- 2026年經(jīng)營(yíng)人員安全生產(chǎn)責(zé)任制范文
- 2026年及未來(lái)5年中國(guó)鍛造件行業(yè)市場(chǎng)深度分析及發(fā)展前景預(yù)測(cè)報(bào)告
- 2026年及未來(lái)5年市場(chǎng)數(shù)據(jù)中國(guó)大型鑄鍛件行業(yè)市場(chǎng)深度分析及投資戰(zhàn)略數(shù)據(jù)分析研究報(bào)告
- 林草濕地生態(tài)調(diào)查監(jiān)測(cè)技術(shù)探索
- 兒科2025年終工作總結(jié)及2026年工作計(jì)劃匯報(bào)
- 2025赤峰市敖漢旗就業(yè)服務(wù)中心招聘第一批公益性崗位人員112人(公共基礎(chǔ)知識(shí))測(cè)試題附答案解析
評(píng)論
0/150
提交評(píng)論