版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第五章樣本及抽樣分布從本章開始,我們將講述數(shù)理統(tǒng)計(jì)的基本內(nèi)容.數(shù)理統(tǒng)計(jì)作為一門學(xué)科誕生于19世紀(jì)末20世紀(jì)初,是具有廣泛應(yīng)用的一個(gè)數(shù)學(xué)分支,它以概率論為基礎(chǔ),根據(jù)試驗(yàn)或觀察得到的數(shù)據(jù),來研究隨機(jī)現(xiàn)象,以便對研究對象的客觀規(guī)律性作出合理的估計(jì)和判斷.由于大量隨機(jī)現(xiàn)象必然呈現(xiàn)出它的規(guī)律性,故理論上只要對隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察,則研究對象的規(guī)律性就一定能清楚地呈現(xiàn)出來,但實(shí)際上人們常常無法對所研究的對象的全體(或總體)進(jìn)行觀察,而只能抽取其中的部分(或樣本)進(jìn)行觀察或試驗(yàn)以獲得有限的數(shù)據(jù).數(shù)理統(tǒng)計(jì)的任務(wù)包括:怎樣有效地收集、整理有限的數(shù)據(jù)資料;怎樣對所得的數(shù)據(jù)資料進(jìn)行分析、研究,從而對研究對象的性質(zhì)、特點(diǎn),作出合理的推斷,此即所謂的統(tǒng)計(jì)推斷問題,本課程主要講述統(tǒng)計(jì)推斷的基本內(nèi)容.第一節(jié)數(shù)理統(tǒng)計(jì)的基本概念內(nèi)容分布圖示總體與總體分布例1總體與總體分布例1例3 ★例4★例5例6樣本的數(shù)字特征★例8 ★例9★樣本與樣本分布★例2統(tǒng)計(jì)推斷問題簡述分組數(shù)據(jù)統(tǒng)計(jì)表和頻率直方圖經(jīng)驗(yàn)分布函數(shù)統(tǒng)計(jì)量★例7★內(nèi)容小結(jié) ★課堂練習(xí)★習(xí)題5-1 ★返回內(nèi)容要點(diǎn):一、總體與總體分布總體是具有一定共性的研究對象的全體,其大小與范圍隨具體研究與考察的目的而確定.例如,考察某大學(xué)一年級新生的體重情況,則該校一年級全體新生就構(gòu)成了待研究的總體.總體確定后,我們稱總體的每一個(gè)可觀察值為個(gè)體.如前述總體(一年級新生)中的每一個(gè)個(gè)體即為每個(gè)新生的體重.總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量.容量為有限的稱為有限總體,容量為無限的稱為無限總體.數(shù)理統(tǒng)計(jì)中所關(guān)心的并非每個(gè)個(gè)體的所有性質(zhì),而僅僅是它的某一項(xiàng)或某幾項(xiàng)數(shù)量指標(biāo).如前述總體(一年級新生)中,我們關(guān)心的是個(gè)體的體重,進(jìn)而也可考察該總體中每個(gè)個(gè)體的身高和數(shù)學(xué)高考成績等數(shù)量指標(biāo).總體中的每一個(gè)個(gè)體是隨機(jī)試驗(yàn)的一個(gè)觀察值,故它是某一隨機(jī)變量X的值,于是,一個(gè)總體對應(yīng)于一個(gè)隨機(jī)變量X,對總體的研究就相當(dāng)于對一個(gè)隨機(jī)變量X的研究,X的分布就稱為總體的分布函數(shù),今后將不區(qū)分總體與相應(yīng)的隨機(jī)變量,并引入如下定義:定義統(tǒng)計(jì)學(xué)中稱隨機(jī)變量(或向量)X為總體,并把隨機(jī)變量(或向量)的分布稱為總體分布.注(i)有時(shí)個(gè)體的特性很難用數(shù)量指標(biāo)直接描述,但總可以將其數(shù)量化,如檢驗(yàn)?zāi)硨W(xué)校全體學(xué)生的血型,試驗(yàn)的結(jié)果有O型、A型、B型、AB型4種,若分別以1,2,3,4依次記這4種血型,則試驗(yàn)的結(jié)果就可以用數(shù)量來表示了;(ii)總體的分布一般來說是未知的,有時(shí)即使知道其分布的類型(如正態(tài)分布、二項(xiàng)分布等),但不知這些分布中所含的參數(shù)等(如上。2,p等).數(shù)理統(tǒng)計(jì)的任務(wù)就是根據(jù)總體中部分個(gè)體的數(shù)據(jù)資料對總體的未知分布進(jìn)行統(tǒng)計(jì)推斷.
二、樣本與樣本分布由于作為統(tǒng)計(jì)研究對象的總體分布一般來說是未知的,為推斷總體分布及其各種特征,般方法是按一定規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察,通過觀察可得到關(guān)于總體X的一組數(shù)值(x1,%,…,x),其中每一x是從總體中抽取的某一個(gè)體的數(shù)量指標(biāo)X的觀察值.上述抽取過程為抽樣,硝由取的部分個(gè)‘體稱為樣本.樣本中所含個(gè)體數(shù)目稱為樣本’的容量.為對總體進(jìn)行合理的統(tǒng)計(jì)推斷,我們還需在相同的條件下進(jìn)行多次重復(fù)的、獨(dú)立的抽樣觀察故樣本是一個(gè)隨機(jī)變量(或向量).容量為n的樣本可視為n維隨機(jī)向量(X1,X2,…,X),一旦具體取定一組樣本,便得到樣本的一次具體的觀察值 12n(X1,x2,…,x),稱其為樣本值.全體樣本值組成的集合稱為樣本空間.為了使抽取的樣本能很好地反映總體的信息,必須考慮抽樣方法,最常用的一種抽樣方法稱為簡單隨機(jī)抽樣,它要求抽取的樣本滿足下面兩個(gè)條件:.代表性:X1,X2,…,Xn與所考察的總體具有相同的分布;.獨(dú)立性:X1,X2,…,X是相互獨(dú)立的隨機(jī)變量.由簡單隨機(jī)抽樣得到的樣本稱為簡單隨機(jī)樣本,它可用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量X,X,…,X表示.顯然,簡單隨機(jī)樣本是一種非常理想化的樣本,在實(shí)際應(yīng)用中要獲得嚴(yán)格意義下的簡單隨機(jī)樣本并不容易.對有限總體,若采用有放回抽樣就能得到簡單隨機(jī)樣本,但有放回抽樣使用起來不方便,故實(shí)際操作中通常采用的是無放回抽樣,當(dāng)所考察的總體很大時(shí),無放回抽樣與有放回抽樣的區(qū)別很小,此時(shí)可近似把無放回抽所得到的樣本看成是一個(gè)簡單隨機(jī)樣本.對無限總體,因抽取一個(gè)個(gè)體不影響它的分布,故采用無放回抽樣即可得到的一個(gè)簡單隨機(jī)樣本.注:今后假定所考慮的樣本均為簡單隨機(jī)樣本,簡稱為樣本.設(shè)總體X的分布函數(shù)為F(x),則簡單隨機(jī)樣本(X1,X2,…,Xn)的聯(lián)合分布函數(shù)為F(x1,x2,…,xn)=I^F(x.)i=1并稱其為樣本分布.特別地,若總體X為連續(xù)型隨機(jī)變量,其概率密度為f(x),則樣本的概率密度為f(x1,x2,…,xn)=口〃%,)i=1分別稱f(x)與f(x1,x2,…,x)為總體密度與樣本密度.…,X=xn}=FIp(x.),若總體X為離散型隨機(jī)變量,其概率分布為p(x.)=P…,X=xn}=FIp(x.),P(x1,x2,…,xn)=p{X=x1,X=x2i=1分別稱P(xi)與p(x1,x2,…,xn)為離散總體密度與離散樣本密度.三、統(tǒng)計(jì)推斷問題簡述總體和樣本是數(shù)理統(tǒng)計(jì)中的兩個(gè)基本概念.樣本來自總體,自然帶有總體的信息,從而可以從這些信息出發(fā)去研究總體的某些特征(分布或分布中的參數(shù)).另一方面,由樣本研究總體可以省時(shí)省力(特別是針對破壞性的抽樣試驗(yàn)而言).我們稱通過總體X的一個(gè)樣本X1,X2,…,X對總體X的分布進(jìn)行推斷的問題為統(tǒng)計(jì)推斷問題.總體、樣本、樣本值的關(guān)系:總體/、推斷(個(gè)體)樣本f樣本值抽樣在實(shí)際應(yīng)用中,總體的分布一般是未知的,或雖然知道總體分布所屬的類型,但其中包
含著未知參數(shù).統(tǒng)計(jì)推斷就是利用樣本值對總體的分布類型、未知參數(shù)進(jìn)行估計(jì)和推斷為對總體進(jìn)行統(tǒng)計(jì)推斷,還需借助樣本構(gòu)造一些合適的統(tǒng)計(jì)量,即樣本的函數(shù),下面將對相關(guān)統(tǒng)計(jì)量進(jìn)行深入的討論.四、分組數(shù)據(jù)統(tǒng)計(jì)表和頻數(shù)直方圖通過觀察或試驗(yàn)得到的樣本值,一般是雜亂無章的,需要進(jìn)行整理才能從總體上呈現(xiàn)其統(tǒng)計(jì)規(guī)律性.分組數(shù)據(jù)統(tǒng)計(jì)表或頻率直方圖是兩種常用整理方法.分組數(shù)據(jù)表:若樣本值較多時(shí),可將其分成若干組,分組的區(qū)間長度一般取成相等,稱區(qū)間的長度為組距.分組的組數(shù)應(yīng)與樣本容量相適應(yīng).分組太少,則難以反映出分布的特征,若分組太多,則由于樣本取值的隨機(jī)性而使分布顯得雜亂因此,分組時(shí),確定分組數(shù)(或組距)應(yīng)以突出分布的特征并沖淡樣本的隨機(jī)波動(dòng)性為原則.區(qū)間所含的樣本值個(gè)數(shù)陳為該區(qū)間的組頻數(shù).組頻數(shù)與總的樣本容量之比稱為組頻率..頻數(shù)直方圖:頻率直方圖能直觀地表示出頻數(shù)的分布,其步驟如下:設(shè)4%,…,xn是樣本的n個(gè)觀察值.(i)求出%],%2,…,xn中的最小者x⑴和最大者x(n);(ii)選取常數(shù)a(略小于x⑴)和b(略大于x(n)),并將區(qū)間[a,b]等分成m個(gè)小區(qū)間(一般取m使m在工左右):n10b-aTOC\o"1-5"\h\z\o"CurrentDocument"[t,t+At),i=1,2,…,m,At= ,ii m一般情況下,小區(qū)間不包括右端點(diǎn).(iii)求出組頻數(shù)n,組頻率n=f,以及n1h,=4,(i=1,2,…,n)iAt(iv)在[ti/i+At)上以hi為高,At為寬作小矩形,其面積恰為fi,所有小矩形合在一起就構(gòu)成了頻率直方圖 ' ‘五、經(jīng)驗(yàn)分布函數(shù)樣本的直方圖可以形象地描述總體的概率分布的大致形態(tài),而經(jīng)驗(yàn)分布函數(shù)則可以用來描述總體分布函數(shù)的大致形狀。x(1)<x(若x(k)<x<x(1)<x(若x(k)<x<x(k+1),則不大于x的2)<…<x(n).樣本值的頻率為-.因而函數(shù)n0,F(xF(x)=歸若x(k)<x<x(卜+1),1,若x>x(n)與事件{X<x}在n次獨(dú)立重復(fù)試驗(yàn)中的頻率是相同的,我們稱Fn(x)為經(jīng)驗(yàn)分布函數(shù)。對于經(jīng)驗(yàn)分布函數(shù)F(x),格里汶科(Glivenko)在1933年證明了以下的結(jié)果:對于任一實(shí)數(shù)x,當(dāng)nT0時(shí)Fn(x)n以概率1一致收斂于分布函數(shù)F(x),即口limsupIF(x)-F(x)1=0}=1.nnT9-8<x<8因此,對于任一實(shí)數(shù)x當(dāng)n充分大時(shí),經(jīng)驗(yàn)分布函數(shù)的任一個(gè)觀察值F(x)與總體分布函數(shù)F(x)只有微小的差別,從而在實(shí)際中可當(dāng)作F(x)來使用.這就是由樣本推斷總體其可行性的最基本的理論依據(jù).六、統(tǒng)計(jì)量為由樣本推斷總體,要構(gòu)造一些合適的統(tǒng)計(jì)量,再由這些統(tǒng)計(jì)量來推斷未知總體.這里,樣本的統(tǒng)計(jì)量即為樣本的函數(shù).廣義地講,統(tǒng)計(jì)量可以是樣本的任一函數(shù),但由于構(gòu)造統(tǒng)計(jì)量的目的是為推斷未知總體的分布,故在構(gòu)造統(tǒng)計(jì)量時(shí),就不應(yīng)包含總體的未知參數(shù),為此引入下列定義.定義設(shè)(X,X,…,X)為總體X的一個(gè)樣本,稱此樣本的任一不含總體分布未知參數(shù)的函數(shù)為該樣本的統(tǒng)計(jì)量:七、樣本的數(shù)字特征以下設(shè)X1X2,…,Xn為總體X的一個(gè)樣本.1.樣本均值 X」Exnii=1. —.樣本方差S2= E(X-X)2n—1ii=1.樣本標(biāo)準(zhǔn)差S=1-^―X(X—X)2nn—1ii=1.樣本(左階)原點(diǎn)矩A=1EXk,k=1,2,…kni=15 —.樣本(k階)中心矩B=—E(X—X)k,k=2,3,…kn1i=1注:上述五種統(tǒng)計(jì)量可統(tǒng)稱為矩統(tǒng)計(jì)量,簡稱為樣本矩,它們都是樣本的顯示函數(shù),它們的觀察值仍分別稱為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣楸階)原點(diǎn)矩、樣本(k階)中心矩..順序統(tǒng)計(jì)量將樣本中的各分量按由小到大的次序排列成X⑴<X(2)<…<X(n),則稱X⑴,X⑵,…,X(n)為樣本的一組順序統(tǒng)計(jì)量,X⑺稱為樣本的第i個(gè)順序統(tǒng)計(jì)量.特別IJ地,稱X⑴與X(n)分別為樣本極小值與樣本極大值,并稱X(n)-X⑴為樣本的極差.例題選講:1(講義例1)樣本的一些例子與觀察值的表示方法:(1)某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為345克的午餐肉罐頭,由于隨機(jī)性,每個(gè)罐頭的凈重都有差別.現(xiàn)在從生產(chǎn)線上隨機(jī)抽取10個(gè)罐頭,秤其凈重,得如下結(jié)果:344336345342340338344343344343這是一個(gè)容量為10的樣本的觀察值,它是來自該生產(chǎn)線罐頭凈重這一總體的一個(gè)樣本的觀察值.(2)對某型號的20輛汽車記錄每加侖汽油各自行駛的里程數(shù)(單位:公里)如下:29.827.628.328.727.930.129.928.028.727.928.529.527.226.928.427.828.030.029.629.1這是一個(gè)容量為20的樣本的觀察值,對應(yīng)的總體是該型號汽車每加侖汽油行駛的里程.(3)對363個(gè)零售商店調(diào)查周售額(單位:元)的結(jié)果如下:零售額 |-1000 (1000,5000] (5000,10000] (10000,20000] (20000,30000]商店數(shù)61 135 110 42 15這是一個(gè)容量為363的樣本的觀察值,對應(yīng)的總體是所有零售店的周零售額.不過這里沒有給出每一個(gè)樣品的具體的觀察值,而是給出了樣本觀察值所在的區(qū)間,稱為分組樣本的觀察值.這樣一來當(dāng)然會(huì)損失一些信息,但是在樣本量較大時(shí),這種經(jīng)過整理的數(shù)據(jù)更能使人們對總體有一個(gè)大致的印象.例2(講義例2)稱總體X為正態(tài)總體,如它服從正態(tài)分布.正態(tài)總體是統(tǒng)計(jì)應(yīng)用中最常見的總體.現(xiàn)設(shè)總體X服從正態(tài)分布N⑴,。2),則其樣本密度由下式給出:…,xn)=…,xn)=呵111 exp<一oJ2兀i=1 iexp12o2工(x-N)2ii=1 J例3(講義例3)稱總體X為伯努利總體,如果它服從以p(0<p<1)為參數(shù)的伯努利分布,即P[X=1}=p, P{X=0}=1一p.不難算出其樣本(X],X2,…,Xn)的概率分布為P{X1=i1,X2="…,X=i}=psn(1一p)sn其中i(1<k<1)取1或0,而s=i+i+???+i:它恰等于樣本中取值為1的分量之總數(shù).服從伯努利分布的總體也具有較廣泛的應(yīng)用背臬概率p通??梢暈槟硨?shí)際總體(如工廠的某一批產(chǎn)品)中具有一特征(如廢品)的個(gè)體所占的比例,稱為比率.從總體中隨機(jī)抽取一個(gè)個(gè)體,可視為一個(gè)隨機(jī)試驗(yàn),試驗(yàn)結(jié)果可用一隨機(jī)變量X來刻畫:若恰好抽到具有該特征的個(gè)體,記X=1;否則,記X=0.這樣,X便服從以p為參數(shù)的伯努利分布.通常參數(shù)p是未知的,故需通過抽樣對其作統(tǒng)計(jì)推斷.例4設(shè)總體X服從參數(shù)為九的泊松分布,X1X2,…,Xn為其樣本,則樣本的概率分布為P{X=i,X=i,…,X=i}=lnlp{X=i}=口叢e一入= 乞 e一〃九,1 1 2 2'nn' kJi!i!i!…i!,,,?k=1 k=1k 1 2n其中ik(1<k<n)取非負(fù)整數(shù),而sn=i1+i2+…+in.例5(講義例4)從某廠生產(chǎn)的某種零件中隨機(jī)抽取120個(gè),測得其質(zhì)量(單位:g)如表5.1所示.列出分組表,并作頻率直方圖.表5-1-1200202203208216206222213209219216203197208206209206208202203206213218207208202194203213211193213208208204206204206208209213203206207196201208207213208210208211211214220211203216221211209218214219211208221211218218190219211208199214207207214206217214201212213211212216206210216204221208209214214199204211201216211209208209202211207220205206216213206206207200198例6(講義例5)隨機(jī)觀察總體X,得到一個(gè)容量為10的樣本值:3.2,2.5, -2,2.5,0,3,2,2.5,2,4求X經(jīng)驗(yàn)分布函數(shù).例7(講義例6)某廠實(shí)行計(jì)件工資制,為及時(shí)了解情況,隨機(jī)抽取30名工人,調(diào)查各自在一周內(nèi)加工的零件數(shù),然后按規(guī)定算出每名工人的周工資如下:(單位:元)156134160141159141161157171155149144169138168147153156125156135156151155146155157198161151這便是一個(gè)容量為30的樣本觀察值,其樣本均值為:元=30(156+134++161+151)=153.5它反映了該廠工人周工資的一般水平.試計(jì)算其樣本方差與樣本標(biāo)準(zhǔn)差.例8(講義例7)(分組樣本均值的近似計(jì)算)如果在例7中收集得到的樣本觀察值用分組樣本形式給出(見表4.2.1),此時(shí)樣本均值可用下面方法近似計(jì)算:以%,表示第,個(gè)組的組中值(即區(qū)間的中點(diǎn)),”,為第,組的頻率,i=1,2,,k£nrn,則i=1xq'Enx (4.2.3)nii=1表4.2.1某廠30名工人周平均工資額周工資額區(qū)間工人數(shù)n L-組中值x L-nx(120,130]1125125(130,140]3135405(140,150]6145870(150,160]141552170(160,170]4165660(170,180]1175175(180,190]01850(190,200]1195195合計(jì)304600則本例中4600=153.3330這與例4.2.2的完全樣本結(jié)果差不多.注:在樣本容量較大時(shí),給出分組樣本是常用的一種方法,雖然會(huì)損失一些信息,但對總體數(shù)學(xué)期望給出的信息還是十分接近的.例9(講義例8)設(shè)我們獲得了如下三個(gè)樣本:樣本A:3,4,5,6,7;樣本B:1,3,5,7,9;樣本C:1,5,9如果將它們畫在數(shù)軸上(圖5-1-3),明顯可見它們的“分散”程度是不同的:樣本A在這三個(gè)樣本中比較密集,而樣本C比較分散.TOC\o"1-5"\h\z這一直覺可以用樣本方差來表示.這三個(gè)樣本的均值都是5,即Xa=Xb=Xc=5,而樣本容量nA=5,nB=5,nC=3,從而它們的樣本方差分別為: “''s2=-[(3—5)2+(4—5)2+(5—5)2+(6—5)2+(7—5)2]=10=2.5A 5-1 41 40s2='」(1-5)2+(3-5)2+(5-5)2+(7-5)2+(9-5)2]=,=10B 5-1 41 32sC=a_J(1-5)2+(5-5)2+(9-5)2= =16.乙由此可見s2>s2〉s2,這與直覺是一致的,它們反映了取值的分散程度.由于樣本方差CBA的量綱與樣品的量綱不一致,故常用樣本標(biāo)準(zhǔn)差表示分散程度,這里有sa=1.58,sb=3.16,sC=4,同樣有sc>sb>sa.由于樣本方差(或樣本標(biāo)準(zhǔn)差)很好地反映了總體方差(或標(biāo)準(zhǔn)差)的信息,因此若當(dāng)方差。2未知時(shí),常用s2去估計(jì),而總體標(biāo)準(zhǔn)差。常用樣本標(biāo)準(zhǔn)差S去估計(jì).課堂練習(xí)1.一組工人完成某一裝配工序所需的時(shí)間(分)分別如下:3538443344434840453045324239493745373642354145463430433744493646323637374536464238433438473529414041(1)將上述數(shù)據(jù)整理成組距為3的頻數(shù)表,第一組以27為起點(diǎn);(2)繪制樣本直方圖;(3)寫出經(jīng)驗(yàn)分布函數(shù).第二節(jié)常用統(tǒng)計(jì)分布取得總體的樣本后,通常是借助樣本的統(tǒng)計(jì)量對未知的總體分布進(jìn)行推斷,為此須進(jìn)一步確定相應(yīng)的統(tǒng)計(jì)量所服從的分布,除在概率論中所提到的常用分布外,本節(jié)還要介紹幾個(gè)在統(tǒng)計(jì)學(xué)中常用的統(tǒng)計(jì)分布:X2分布t分布F分布內(nèi)容分布圖示引言TOC\o"1-5"\h\z分位數(shù) ★例1X2分布 ★例2t分布 ★例3F分布 ★例4內(nèi)容小結(jié) ★課堂練習(xí)習(xí)題5-2返回內(nèi)容要點(diǎn):一、分位數(shù)設(shè)隨機(jī)變量X的分布函數(shù)為F(%),對給定的實(shí)數(shù)a(0<a<1),若實(shí)數(shù)勺滿足不等式P{X>F}=a, 0則稱F為隨機(jī)變量X的分布的水平a的上側(cè)分位數(shù).若實(shí)數(shù)t滿足不等式P{lXl>Ta}=a,則稱T為隨機(jī)變量X的分布的水平a的雙側(cè)分位數(shù).二、X2分布定義1設(shè)X1,X2,…,Xn是取自總體N(0,1)的樣本,則稱統(tǒng)計(jì)量X2=X2+X2H FX2 (1)服從自由度為n的X2分布,記為X2?X2(n). n這里,自由度是指(1)式右端所包含的獨(dú)立變量的個(gè)數(shù).%2(n)分布的概率密度:f(x)f(x)=1—x2-12n/2r(n/2)0,1一—xe2,x>0.其中「(?)為Gamma函數(shù),f(x)的圖形如5-2-3.%2分布的數(shù)學(xué)期望與方差:若%2~%2(n),則E(%2)=n,D(%2)=2n.%2分布的可加性:若%2?%2(m),%2?%2(n),且%2,%2相互獨(dú)立1 2 1 2%2分布的分位數(shù):設(shè)%2~%a(n),對給定的實(shí)數(shù)a(0<a<1),稱滿足條件P{%2>%a(n)}=』+8f(x)dx=a%&n)的點(diǎn)%a(n)為%2(n)分布的水平a的上側(cè)分位數(shù).簡稱為上側(cè)a分位數(shù).對不同的a與n,分位數(shù)的值已經(jīng)編制成表供查用(參見附表).三、t分布定義2設(shè)X?N(0,1),Y?%2(n),且X與Y相互獨(dú)立,則稱X
t=?
xY/n服從自由度為n的t分布,記為t~t(n),t(n)分布的概率密度:f(X)二3型“九nr(nf(X)二3型“九nr(n/2)(Q-1+一InJn^L2,一8<t<+8t分布具有如下性質(zhì):f(x)的圖形關(guān)于y軸對稱,且limf(x)=0;X-8當(dāng)n充分大時(shí),t分布近似于標(biāo)準(zhǔn)正態(tài)分布;t分布的分位數(shù):設(shè)T?t&(n),對給定的實(shí)數(shù)a(0<a<1),稱滿足條件P[T>ta(n)}=』+8f(x)dx=a
ta(n)的點(diǎn)ta(n)為t(n)分布的水平a的上側(cè)分位數(shù).由密度函數(shù)f(x)的對稱性,可得t (n)=-1(n).山類似地我們可以給出t分布的雙側(cè)分位數(shù)-ta/2(n)f(x)dx+J+8 f(x)dx=a,-8 t(n)顯然有a aP{T>t (n)}=-;P{T<-1 (n)}=-.a/2 2 a/2 2對不同的a與n,t分布的雙側(cè)分位數(shù)可從附表查得.四、F分布定義3設(shè)X?%2(m),7?%2(n),且X與丫相互獨(dú)立,則稱TOC\o"1-5"\h\zX/m nXF= =Y/n mY服從自由度為(m,n)的F分布,記為F~F(m,n).F(m,n)分布的概率密度:f(%f(%)=<r[(m+n)/2]一1(r(m/2)r(n/2)ln人[0,F(xiàn)分布具有如下性質(zhì):若X~t若X~t(n),則X2~F(1,n);若F~F(m,n),則U—~F(n,m).FF分布的分位數(shù):設(shè)F?Fa(n,m),對給定的實(shí)數(shù)a(0<a<1),稱滿足條件P[F>F(n,m)}二』” f(%)d%=aFan,m)的點(diǎn)心(n,m)為F(n,m)分布的水平a的上側(cè)分位數(shù).F分布的上側(cè)分位數(shù)的可自附表查得.aF分布的一個(gè)重要性質(zhì):L, 、 1F(m,n)= .aF(n,m)此式常常用來求F分布表中沒有列出的某些上側(cè)分位數(shù).例題選講:分位數(shù)例1(講義例1)設(shè)a=0.05,求標(biāo)準(zhǔn)正態(tài)分布的水平0.05的上側(cè)分位數(shù)和雙側(cè)分位數(shù).X2分布例2(講義例2)設(shè)X廠…,X6是來自總體N(0,1)的樣本,又設(shè)Y=(X1+X2+X3)2+(X4+X5+X6)2試求常數(shù)。,使CY服從X2分布.t分布例3(講義例3)設(shè)隨機(jī)變量X?N(2,1),隨機(jī)變量Y,'均服從N(0,4),且X,Y(i=1,2,3,4)都相互獨(dú)立,令 1234iT4(X—2)
二,
Ji試求T的分布,并確定10的值,使P{lTl>10}=0.01.F分布例4(講義例4)設(shè)總體X服從標(biāo)準(zhǔn)正態(tài)分布,X/X2,…,X是來自總體X的一個(gè)簡單隨機(jī)樣本,試問統(tǒng)計(jì)量 12n5-112X:?X2,n>5服從何種分布?
課堂練習(xí)1.設(shè)X1,X2,X3,X4,X5是來自正態(tài)總體N(0,22)的樣本.⑴求C使統(tǒng)計(jì)量y= C(X1+X2)服從t(m)分布.VX2+X42+X5(2)求y=(xi+X2)2所服從的分布.(X—X)24 3第三節(jié)抽樣分布內(nèi)容分布圖示★抽樣分布★單正態(tài)總體的抽樣分布TOC\o"1-5"\h\z★例1 ★例2 ★例3★例4 ★例5★雙正態(tài)總體的抽樣分布★例6 ★例7一般總體抽樣分布的極限分布內(nèi)容小結(jié) ★課堂練習(xí)習(xí)題5-3 ★返回內(nèi)容要點(diǎn):一、抽樣分布有時(shí),總體分布的類型雖然已知,但其中含有未知參數(shù),此時(shí)需對總體的未知參數(shù)或?qū)傮w的重要數(shù)字特征(如數(shù)學(xué)期望、分差等)進(jìn)行統(tǒng)計(jì)推斷,此類問題稱為參數(shù)統(tǒng)計(jì)推斷.在參數(shù)統(tǒng)計(jì)推斷問題中,常需利用總體的樣本構(gòu)造出合適的統(tǒng)計(jì)量,并使其服從或漸近地服從已知的總體分布.統(tǒng)計(jì)學(xué)中泛稱統(tǒng)計(jì)量分布為抽樣分布.討論抽樣分布的途徑有兩個(gè).一是精確地求出抽樣分布,并稱相應(yīng)的統(tǒng)計(jì)推斷為小樣本統(tǒng)計(jì)推斷;另一種方式是讓樣本容量趨于無窮,并求出軸樣分布的極限分布.然后,在樣本容量充分大時(shí),再利用該極限分布作為抽樣分布的近似分布,進(jìn)而對未知參數(shù)進(jìn)行統(tǒng)計(jì)推斷,稱與此相應(yīng)的統(tǒng)計(jì)推斷為大樣本統(tǒng)計(jì)推斷.這里重點(diǎn)討論正態(tài)總體的抽樣分布,屬小樣本統(tǒng)計(jì)范疇;此外,也簡要介紹一般總體的某些抽樣分布的極限分布,屬大樣本統(tǒng)計(jì)范疇。二、單正態(tài)總體的抽樣分布設(shè)總體X的均值R,方差為。2,X1,X2,…,X是取自X的一個(gè)樣本,X與S2分別為該樣本的樣本均值與樣本方差,則有 12 "E(X)=N,D(X)=。2,EE(S2)=E—)X2-nX2i)=Xe(=Xe(X2)-nE(X2)n-1 i-i=1故有下列定理:1n-1工92+N2)-n92/n+R2)-i=1=o2.定理1設(shè)總體X?N(也。2), X1,X2,…,X”是取自X的一個(gè)樣本,X與S2分別為該樣本的樣本均值與樣本方差,則有X?N(N22/n);U=王^?N(0,1).o/-nn定理2設(shè)總體X?N(N,o2),X,X,…,X是取自X的一個(gè)樣本,X與S2分別為該樣本的樣本均值與樣本方差,則有12nX2=s2=—x(X,-X)2?X2(n-1);O2O2ii=1X與S2相互獨(dú)立.定理3設(shè)總體X?N(N,o2),XX2,…,X是取自X的一個(gè)樣本,X與S2分別為該樣本的樣本均值與樣本方差,則有X2=XX(X.-N)2?X2(n)O2i] 1X-NT=一N-t(n-1).S/v'n三、雙正態(tài)總體的抽樣分布TOC\o"1-5"\h\z定理4設(shè)X?N(N1,02)與y?N(go;)是兩個(gè)相互獨(dú)立的正態(tài)總體,又設(shè)X,X,…,X是取自總體1X1的樣本,X與s22分別為該樣本的樣本均值與樣本方差 .2 n 1y,y,…,y是取自總體y的樣本,y與s2分別為此樣本的樣本均值與樣本方差.再記s2是1 2n2 2 WS2與S2的加權(quán)平均,即1 2(n-1)S2+(n-1)S2S2= ^2w n+n-2(又一y)-(N「NJ?n(0,1);\:o2/n+02/n11 1 2 2] —F(n-1,n-1);[o1)S2 1 2當(dāng)o2=02=02時(shí),T=(X~y)(N1 N2)?t(n+n-2).1 2 2〃1+1/n2 1 2四、一般總體抽樣分布的極限分布定義1設(shè)F(x)為隨機(jī)變量X的分布函數(shù),F(xiàn)(%)為隨機(jī)變量X的分布函數(shù),并記C(F)為由F(x)的全體連續(xù)點(diǎn)組成的集合:若limF(x)=F(x),VxeC(F),nn-8則稱隨機(jī)變量Xn依分布收斂于X,簡記為" X-X或F(x)-F(x).命題設(shè)隨機(jī)變量X有連續(xù)的分布函數(shù),且有x—d-x,y—p-1,則Xy-——X. nn定銀5設(shè)X1,X2,…,Xn為總體X的樣本,并設(shè)總體X的數(shù)學(xué)期望與方差均存在,記為EX=N;DX=o2.記統(tǒng)計(jì)量U=O,T==,
noEnnS/vn
其中又與S分別表示上述樣本的樣本均值與樣本方差,則有(i)FU(%)-^①0a), (2)ft(%)-^①0a),以上FU(%),FT(%)與Q(%)分別表示Un,仆與標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù).n n注:定理4成立的條件只是總體的方差存在,這樣當(dāng)樣本的容量n充分大時(shí),Un和9都近似地服從標(biāo)準(zhǔn)正態(tài)分布,因此在o2已知時(shí),可用U”對口進(jìn)行統(tǒng)計(jì)推斷;在o2未知時(shí):可用T對口進(jìn)行統(tǒng)計(jì)推斷。 nn例題選講:單正態(tài)總體的抽樣分布例1(講義例1)設(shè)X?N(21,22),X1,X2,…,X25為X的一個(gè)樣本,求:(1)樣本均值X的數(shù)學(xué)期望與方差;(2)P{IX-211<0.24).例2(講義例2)假設(shè)某物體的實(shí)際重量為日,但它是未知的.現(xiàn)在用一架天平去稱它,共稱了n次,得到X1,X2,…,Xn.假設(shè)每次稱量過程彼此獨(dú)立且沒有系統(tǒng)誤差,則可以認(rèn)為這些測量值都服從正態(tài)分布N(、,o2),方差o2反映了天平及測量過程的總精度,通常我們用(.再從正態(tài)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年勞資專員試題及答案
- 年度保密工作總結(jié)
- 糖尿病??谱o(hù)士考試試題(附答案)
- 選礦集控工操作考核試卷及答案
- 建設(shè)工程施工合同糾紛要素式起訴狀模板資深律師修訂版
- 保溫防腐工程糾紛專用!建設(shè)工程施工合同糾紛要素式起訴狀模板
- 2026 年離婚協(xié)議書 2026 版專業(yè)規(guī)范版
- 鐘山風(fēng)景名勝區(qū)旅游服務(wù)中心項(xiàng)目塔式起重機(jī)基礎(chǔ)專項(xiàng)施工方案
- 定制家居員工年終總結(jié)(3篇)
- 電石生產(chǎn)副總年終總結(jié)(3篇)
- 第四單元地理信息技術(shù)的應(yīng)用課件 【高效課堂+精研精講】高中地理魯教版(2019)必修第一冊
- 魯科版高中化學(xué)必修一教案全冊
- 管理養(yǎng)老機(jī)構(gòu) 養(yǎng)老機(jī)構(gòu)的服務(wù)提供與管理
- 提高隧道初支平整度合格率
- 2022年環(huán)保標(biāo)記試題庫(含答案)
- 2023年版測量結(jié)果的計(jì)量溯源性要求
- 建筑能耗與碳排放研究報(bào)告
- GB 29415-2013耐火電纜槽盒
- 中國古代經(jīng)濟(jì)試題
- 真空采血管的分類及應(yīng)用及采血順序課件
- 軟件定義汽車:產(chǎn)業(yè)生態(tài)創(chuàng)新白皮書
評論
0/150
提交評論