統(tǒng)計(jì)學(xué)抽樣與抽樣分布_第1頁(yè)
統(tǒng)計(jì)學(xué)抽樣與抽樣分布_第2頁(yè)
統(tǒng)計(jì)學(xué)抽樣與抽樣分布_第3頁(yè)
統(tǒng)計(jì)學(xué)抽樣與抽樣分布_第4頁(yè)
統(tǒng)計(jì)學(xué)抽樣與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩108頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)抽樣與抽樣分布第1頁(yè),共113頁(yè),2023年,2月20日,星期二

抽樣與抽樣分布1抽樣基本知識(shí)2抽樣分布3樣本統(tǒng)計(jì)量的抽樣分布(一個(gè)總體參數(shù)推斷時(shí))4樣本統(tǒng)計(jì)量的抽樣分布(兩個(gè)總體參數(shù)推斷時(shí))第2頁(yè),共113頁(yè),2023年,2月20日,星期二學(xué)習(xí)目標(biāo)了解概率抽樣方法區(qū)分總體分布、樣本分布、抽樣分布理解抽樣分布與總體分布的關(guān)系掌握單總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的分布第3頁(yè),共113頁(yè),2023年,2月20日,星期二

抽樣基本知識(shí)

總體與樣本抽樣方法抽樣框抽樣誤差第4頁(yè),共113頁(yè),2023年,2月20日,星期二總體和參數(shù)總體(Population),是指所要研究的對(duì)象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全部單位所組成的集合體??傮w單位總數(shù)用N表示。參數(shù)(parameter)。用來(lái)反映總體數(shù)量特征的指標(biāo)稱。研究目的一經(jīng)確定,總體也唯一地確定了,所以總體指標(biāo)的數(shù)值是客觀存在的、確定的,但又是未知的,需要用樣本資料去估計(jì)。第5頁(yè),共113頁(yè),2023年,2月20日,星期二總體和參數(shù)(續(xù))通常所要估計(jì)的總體指標(biāo)有變量總體屬性總體總體平均數(shù)(或記為μ)總體比例(成數(shù))π總體標(biāo)準(zhǔn)差σ或方差σ2總體比例標(biāo)準(zhǔn)差σP或方差σP2總體標(biāo)志總量()總體中具有某一屬性的單位總數(shù)(NP)等。第6頁(yè),共113頁(yè),2023年,2月20日,星期二樣本和統(tǒng)計(jì)量樣本(Sample),它是從總體中抽取的部分總體單位的集合體。樣本容量。樣本中所包含的個(gè)體的數(shù)量,一般用n表示。在實(shí)際工作中,人們通常把n≥30的樣本稱為大樣本,而把n<30的樣本稱為小樣本。對(duì)于某一既定的總體,由于抽樣的方式方法不同,樣本容量也可大可小,因而,樣本是不確定的、可變的。抽樣的目的就是為要用樣本的特征去估計(jì)總體特征,但樣本只是總體的一部分,而且樣本的抽取又具有隨機(jī)性,因此,樣本的內(nèi)部構(gòu)成與總體的內(nèi)部構(gòu)成總是具有一定的差異,樣本不能完全代表總體,抽樣估計(jì)總是存在一定的代表性誤差。第7頁(yè),共113頁(yè),2023年,2月20日,星期二樣本和統(tǒng)計(jì)量(續(xù))統(tǒng)計(jì)量(statistic)。在抽樣估計(jì)中,用來(lái)反映樣本總體數(shù)量特征的指標(biāo)稱為樣本指標(biāo),也稱為樣本統(tǒng)計(jì)量或估計(jì)量,是根據(jù)樣本資料計(jì)算的、用以估計(jì)或推斷相應(yīng)總體指標(biāo)的綜合指標(biāo)。常見(jiàn)的樣本統(tǒng)計(jì)量有:

樣本統(tǒng)計(jì)量不含未知參數(shù),它是隨樣本不同而不同的隨機(jī)變量。變量總體屬性總體樣本平均數(shù)樣本比例(樣本成數(shù))p樣本標(biāo)準(zhǔn)差s或方差s2樣本比例標(biāo)準(zhǔn)差sP或方差sP2第8頁(yè),共113頁(yè),2023年,2月20日,星期二樣本統(tǒng)計(jì)量一、統(tǒng)計(jì)量隨機(jī)抽樣每次抽取的結(jié)果Xi,可能是總體中任何一個(gè)個(gè)體。因此可以看成是一個(gè)隨機(jī)變量。n次抽取形成的樣本X1,X2,…,Xn可以看成是一組隨機(jī)變量。設(shè)X1,X2,…,Xn是來(lái)自總體X的一個(gè)樣本,g(X1,X2,…,Xn)是X1,X2,…,Xn的一個(gè)函數(shù)。若g是連續(xù)函數(shù),且g中不含任何未知參數(shù),則稱g(X1,X2,…,Xn)是一個(gè)統(tǒng)計(jì)量。統(tǒng)計(jì)量也是一個(gè)隨機(jī)變量。設(shè)x1,x2,…,xn是相應(yīng)于樣本X1,X2,…,Xn的一個(gè)樣本值,則稱g(x1,x2,…,xn)是統(tǒng)計(jì)量g(X1,X2,…,Xn)的一個(gè)觀測(cè)值。統(tǒng)計(jì)量作為一個(gè)隨機(jī)變量,它的分布稱為抽樣分布。第9頁(yè),共113頁(yè),2023年,2月20日,星期二第10頁(yè),共113頁(yè),2023年,2月20日,星期二設(shè)X1,X2,…,Xn是來(lái)自總體X的一個(gè)樣本。x1,x2,…,xn是這個(gè)樣本的一個(gè)樣本值。則都是統(tǒng)計(jì)量,它們的觀測(cè)值分別是第11頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣方法第12頁(yè),共113頁(yè),2023年,2月20日,星期二概率抽樣

(probabilitysampling)概率抽樣也叫隨機(jī)抽樣,是指按隨機(jī)原則抽取樣本。隨機(jī)原則,就是排除主觀意識(shí)的干擾,使總體每一個(gè)單位都有一定的概率被抽選為樣本單位,每個(gè)單位能否入選是隨機(jī)的。

特點(diǎn)能有效地避免主觀選樣帶來(lái)的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠用于估計(jì)和推斷總體的數(shù)量特征,而且這種估計(jì)和推斷得以建立在概率論和數(shù)理統(tǒng)計(jì)的科學(xué)理論之上可以計(jì)算和控制抽樣誤差,說(shuō)明估計(jì)的可靠程度。作用:在不可能或不必要進(jìn)行全面調(diào)查時(shí),利用概率抽樣來(lái)推斷總體;利用概率抽樣修正或補(bǔ)充全面調(diào)查的不足。第13頁(yè),共113頁(yè),2023年,2月20日,星期二概率抽樣(probabilitysampling)(續(xù))統(tǒng)計(jì)上所指的抽樣一般都是指概率抽樣概率抽樣最基本的組織形式有:簡(jiǎn)單隨機(jī)抽樣、分層抽樣、等距抽樣和整群抽樣。第14頁(yè),共113頁(yè),2023年,2月20日,星期二簡(jiǎn)單隨機(jī)抽樣

(simplerandomsampling)從總體N個(gè)單位(元素)中隨機(jī)地抽取n個(gè)單位作為樣本,使得總體中每一個(gè)元素都有相同的機(jī)會(huì)(概率)被抽中抽取元素的具體方法有重復(fù)抽樣和不重復(fù)抽樣特點(diǎn)簡(jiǎn)單、直觀,在抽樣框完整時(shí),可直接從中抽取樣本用樣本統(tǒng)計(jì)量對(duì)目標(biāo)量進(jìn)行估計(jì)比較方便局限性當(dāng)N很大時(shí),不易構(gòu)造抽樣框抽出的單位很分散,給實(shí)施調(diào)查增加了困難沒(méi)有利用其他輔助信息以提高估計(jì)的效率第15頁(yè),共113頁(yè),2023年,2月20日,星期二簡(jiǎn)單隨機(jī)樣本

(simplerandomsample)由簡(jiǎn)單隨機(jī)抽樣形成的樣本從總體N個(gè)單位中隨機(jī)地抽取n個(gè)單位作為樣本,使得每一個(gè)容量為n樣本都有相同的機(jī)會(huì)(概率)被抽中參數(shù)估計(jì)和假設(shè)檢驗(yàn)所依據(jù)的主要是簡(jiǎn)單隨機(jī)樣本第16頁(yè),共113頁(yè),2023年,2月20日,星期二簡(jiǎn)單隨機(jī)抽樣

(用Excel對(duì)分類數(shù)據(jù)隨機(jī)抽樣)【例】某班級(jí)共有30名學(xué)生,他們的名單如右表。用Excel抽出一個(gè)由5個(gè)學(xué)生構(gòu)成的隨機(jī)樣本第17頁(yè),共113頁(yè),2023年,2月20日,星期二簡(jiǎn)單隨機(jī)抽樣

(用Excel對(duì)分類數(shù)據(jù)隨機(jī)抽樣)第1步:將30個(gè)學(xué)生的名單錄入到Excel工作表中的一列第2步:給每個(gè)學(xué)生一個(gè)數(shù)字代碼,分別為1,2…,30,并按順序排列,將代碼錄入到Excel工作表中的一列,與學(xué)生名單相對(duì)應(yīng)第3步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng),然后在【數(shù)據(jù)分析】選項(xiàng)中選擇【抽樣】第4步:在【抽樣】對(duì)話框中的【輸入?yún)^(qū)域】中輸入學(xué)生代碼區(qū)域,在【抽樣方法】中單擊【隨機(jī)】

。在【樣本數(shù)】中輸入需要抽樣的學(xué)生個(gè)數(shù)。在【輸出區(qū)域】中選擇抽樣結(jié)果放置的區(qū)域。【確定】后即得到要抽取的樣本用Excel對(duì)分類數(shù)據(jù)抽樣第18頁(yè),共113頁(yè),2023年,2月20日,星期二簡(jiǎn)單隨機(jī)抽樣

(用Excel對(duì)數(shù)值型數(shù)據(jù)隨機(jī)抽樣)第1步:將原始數(shù)據(jù)錄入到Excel工作表中的一列第2步:選擇【工具】下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng),然后在【數(shù)據(jù)分析】選項(xiàng)中選擇【抽樣】第3步:在【抽樣】對(duì)話框中的【輸入?yún)^(qū)域】中輸入原始數(shù)據(jù)區(qū)域,在【抽樣方法】中單擊【隨機(jī)】。在【樣本數(shù)】中輸入需要抽樣的數(shù)據(jù)個(gè)數(shù)。在【輸出區(qū)域】中選擇抽樣結(jié)果放置的區(qū)域?!敬_定】后即得到要抽取的樣本數(shù)據(jù)用Excel對(duì)數(shù)值型數(shù)據(jù)抽樣第19頁(yè),共113頁(yè),2023年,2月20日,星期二分層抽樣

(stratifiedsampling)又稱類型抽樣或分類抽樣。先對(duì)總體各單位按主要標(biāo)志加以分組(層),然后再?gòu)母鹘M(層)中按隨機(jī)原則獨(dú)立抽選一定單位構(gòu)成樣本。分層抽樣通過(guò)分類(組),把總體中標(biāo)志值比較接近的單位歸為一組,減少各組內(nèi)的差異程度,這樣再?gòu)母鹘M抽取樣本單位就更具有代表性,因而抽樣誤差也就相對(duì)縮小。特別是在標(biāo)志值相差懸殊時(shí),由于劃分了類型,一方面縮小了組內(nèi)方差,另一方面也保證各組都能抽取一定的樣本單位,所以,分層抽樣較之純隨機(jī)抽樣可以提高樣本的代表性,能獲得更為滿意的效果第20頁(yè),共113頁(yè),2023年,2月20日,星期二分層抽樣

(stratifiedsampling)續(xù)優(yōu)點(diǎn):除了可以對(duì)總體進(jìn)行估計(jì)外,還可以對(duì)各層的子總體進(jìn)行估計(jì)可以按自然區(qū)域或行政區(qū)域進(jìn)行分層,使抽樣的組織和實(shí)施都比較方便分層抽樣的樣本分布在各個(gè)層內(nèi),從而使樣本在總體中的分布比較均勻如果分層抽樣做得好,便可以提高估計(jì)的精度第21頁(yè),共113頁(yè),2023年,2月20日,星期二系統(tǒng)抽樣

(systematicsampling)將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位先從數(shù)字1到k之間隨機(jī)抽取一個(gè)數(shù)字r作為初始單位,以后依次取r+k,r+2k等單位優(yōu)點(diǎn):簡(jiǎn)便易行??商岣吖烙?jì)的精度缺點(diǎn):對(duì)估計(jì)量方差的估計(jì)比較困難第22頁(yè),共113頁(yè),2023年,2月20日,星期二等距抽樣(續(xù))間隔相等樣本數(shù)n第23頁(yè),共113頁(yè),2023年,2月20日,星期二整群抽樣

(clustersampling)將總體中若干個(gè)單位合并為組(群),抽樣時(shí)直接抽取群,然后對(duì)中選群中的所有單位全部實(shí)施調(diào)查特點(diǎn)抽樣時(shí)只需群的抽樣框,可簡(jiǎn)化工作量調(diào)查的地點(diǎn)相對(duì)集中,節(jié)省調(diào)查費(fèi)用,方便調(diào)查的實(shí)施缺點(diǎn)是估計(jì)的精度較差第24頁(yè),共113頁(yè),2023年,2月20日,星期二多階段抽樣

(multi-stagesampling)先抽取群,但并不是調(diào)查群內(nèi)的所有單位,而是再進(jìn)行一步抽樣,從選中的群中抽取出若干個(gè)單位進(jìn)行調(diào)查群是初級(jí)抽樣單位,第二階段抽取的是最終抽樣單位。將該方法推廣,使抽樣的段數(shù)增多,就稱為多階段抽樣具有整群抽樣的優(yōu)點(diǎn),保證樣本相對(duì)集中,節(jié)約調(diào)查費(fèi)用需要包含所有低階段抽樣單位的抽樣框;同時(shí)由于實(shí)行了再抽樣,使調(diào)查單位在更廣泛的范圍內(nèi)展開(kāi)在大規(guī)模的抽樣調(diào)查中,經(jīng)常被采用的方法

第25頁(yè),共113頁(yè),2023年,2月20日,星期二概率抽樣(小結(jié))抽樣方法特點(diǎn)簡(jiǎn)單隨機(jī)抽樣按照等概率的原則,直接從含有N個(gè)元素的總體中抽取n個(gè)元素組成的樣本(N>n)

分層抽樣把異質(zhì)性較強(qiáng)的總體分成一個(gè)個(gè)同質(zhì)性較強(qiáng)的子總體,再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。等距抽樣把總體的單位進(jìn)行排序,然后按照固定的抽樣距離抽取樣本。第一個(gè)樣本采用簡(jiǎn)單隨機(jī)抽樣的辦法抽取。整群抽樣抽樣的單位不是單個(gè)的個(gè)體,而是成群的個(gè)體。多階段抽樣把抽樣過(guò)程分為幾個(gè)階段進(jìn)行。適用于總體規(guī)模特別大,或者總體分布的范圍特別廣時(shí)第26頁(yè),共113頁(yè),2023年,2月20日,星期二非概率抽樣也叫非隨機(jī)抽樣,是指從研究目的出發(fā),根據(jù)調(diào)查者的經(jīng)驗(yàn)或判斷,從總體中有意識(shí)地抽取若干單位構(gòu)成樣本。重點(diǎn)調(diào)查、典型調(diào)查、配額抽樣(是按照一定標(biāo)準(zhǔn)或一定條件分配樣本單位數(shù)量,然后由調(diào)查者在規(guī)定的數(shù)額內(nèi)主觀地抽取樣本)、方便抽樣(指調(diào)查者按其方便任意選取樣本。如商場(chǎng)柜臺(tái)售貨員拿著廠家的調(diào)查表對(duì)顧客的調(diào)查)等就屬于非隨機(jī)抽樣。優(yōu)點(diǎn):及時(shí)了解總體大致情況,總結(jié)經(jīng)驗(yàn)教訓(xùn),在進(jìn)行大規(guī)模抽樣調(diào)查之前的試點(diǎn)。缺點(diǎn):非隨機(jī)抽樣容易產(chǎn)生傾向性誤差,并且誤差不能計(jì)算和控制,也就無(wú)法說(shuō)明調(diào)查結(jié)果的可靠程度。第27頁(yè),共113頁(yè),2023年,2月20日,星期二概率抽樣與非概率抽樣第28頁(yè),共113頁(yè),2023年,2月20日,星期二第29頁(yè),共113頁(yè),2023年,2月20日,星期二第30頁(yè),共113頁(yè),2023年,2月20日,星期二第31頁(yè),共113頁(yè),2023年,2月20日,星期二第32頁(yè),共113頁(yè),2023年,2月20日,星期二4.系統(tǒng)隨機(jī)抽樣先隨機(jī)地抽取一個(gè)樣本,然后按某種規(guī)律順次地得到全部樣本的抽取方法。系統(tǒng)隨機(jī)抽樣的實(shí)現(xiàn)方法:對(duì)容量為N的總體,先將總體中各個(gè)個(gè)體按某種順序從1到N編號(hào)。設(shè)要從中抽取出容量為n的樣本,設(shè)N

/n=k,則先從編號(hào)為1到k的k個(gè)個(gè)體中隨機(jī)地抽取一個(gè),然后每隔k個(gè)抽取一個(gè),順次得到容量為n的樣本。系統(tǒng)隨機(jī)抽樣也稱為系統(tǒng)抽樣、等距抽樣或機(jī)械抽樣。第33頁(yè),共113頁(yè),2023年,2月20日,星期二重復(fù)抽樣與非重復(fù)抽樣重復(fù)抽樣,又稱回置抽樣,是指從總體的N個(gè)單位中,每次抽取一個(gè)單位后,再將其放回總體中參加下一次抽選,連續(xù)抽n次,即得到一個(gè)樣本。特點(diǎn):樣本是由n次相互獨(dú)立的連續(xù)試驗(yàn)構(gòu)成的,每次試驗(yàn)是在完全相同的條件下進(jìn)行,每個(gè)單位中選的機(jī)會(huì)在各次都完全相等?!爸爻椤保紤]順序)可能的樣本數(shù)目(從總體中可能抽取的樣本個(gè)數(shù),用M表示)為:Nn個(gè)。第34頁(yè),共113頁(yè),2023年,2月20日,星期二重復(fù)抽樣與非重復(fù)抽樣不重復(fù)抽樣,也叫不回置抽樣,是指抽中的單位不再放回總體中,下一個(gè)樣本單位只能從余下的總體單位中抽取。特點(diǎn):樣本由n次連續(xù)抽取的結(jié)果構(gòu)成,實(shí)際上等于一次同時(shí)從總體中抽取n個(gè)樣本單位。n次抽取結(jié)果不是獨(dú)立的可能的樣本數(shù)目(考慮順序):N(N-1)(N-2)…(N-n+1)個(gè)。第35頁(yè),共113頁(yè),2023年,2月20日,星期二重復(fù)抽樣與非重復(fù)抽樣設(shè)有4名學(xué)生的月消費(fèi)支出分別為:240,280,360,400元。我們分別用A、B、C、D替代。若從中抽取兩個(gè)單位構(gòu)成樣本,則全部可能的樣本數(shù)目為:重復(fù):42=16個(gè)。它們是

AAABACAD;BABBBCBDCACBCCCD;DADBDCDD不重復(fù):4×3=12。它們是

ABACAD;BABCBDCACBCD;DADBDC第36頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣框調(diào)查目的確定之后,抽樣總體(目標(biāo)總體)也就隨之確定。但實(shí)際進(jìn)行抽樣的總體范圍與目標(biāo)總體有時(shí)是不一致的。所以,有了目標(biāo)總體,還必須明確實(shí)際進(jìn)行抽樣的總體范圍和抽樣單位,這就需要編制一個(gè)抽樣框。抽樣框是包括全部抽樣單位的名單框架。編制抽樣框是實(shí)施抽樣的基礎(chǔ)。抽樣框的好壞通常會(huì)直接影響到抽樣調(diào)查的隨機(jī)性和調(diào)查效果。第37頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣框名單抽樣框。列出全部總體單位的名錄一覽表。區(qū)域抽樣框。按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域?yàn)槌闃訂挝?。時(shí)間表抽樣框。將總體全部單位按時(shí)間順序排列,把總體的時(shí)間過(guò)程分為若干個(gè)小的時(shí)間單位,以此時(shí)間單位為抽樣單位。理想的抽樣框:不重復(fù)、不遺漏。第38頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣誤差統(tǒng)計(jì)調(diào)查誤差,是指調(diào)查所得結(jié)果與總體真實(shí)數(shù)值之間的差異。

登記性誤差。是任何一種統(tǒng)計(jì)調(diào)查都可能產(chǎn)生。

代表性誤差系統(tǒng)性誤差:是由于非隨機(jī)因素引起的樣本代表性不足而產(chǎn)生的誤差,表現(xiàn)為樣本估計(jì)量的值系統(tǒng)性偏高或偏低,故也稱偏差;隨機(jī)誤差:又稱偶然性誤差,是指遵循隨機(jī)原則抽樣,但由于樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu)而引起的樣本估計(jì)量與總體參數(shù)之間的誤差。這就是抽樣估計(jì)中所謂的抽樣誤差。第39頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念實(shí)際抽樣誤差

某一具體樣本的樣本估計(jì)值與總體參數(shù)真實(shí)值之間的離差??傮w參數(shù)未知,每次抽樣的實(shí)際抽樣誤差是無(wú)法計(jì)算的。樣本是隨機(jī)抽取,樣本估計(jì)量是隨樣本不同而不同的隨機(jī)變量,隨機(jī)抽樣誤差也是隨機(jī)變量,但樣本估計(jì)量的所有可能取值總有一定的分布規(guī)律,抽樣誤差也就有一定的規(guī)律可循。抽樣誤差可以計(jì)算和控制,并不是指某次具體抽樣的實(shí)際誤差,而是從所有可能樣本來(lái)考察的抽樣平均誤差和抽樣極限誤差。第40頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念抽樣平均誤差(抽樣標(biāo)準(zhǔn)誤)是反映抽樣誤差一般水平的指標(biāo)(因?yàn)槌闃诱`差是一個(gè)隨機(jī)變量,它的數(shù)值隨著可能抽取的樣本不同而或大或小,為了總的衡量樣本代表性的高低,就需要計(jì)算抽樣誤差的一般水平)。通常用樣本估計(jì)量的標(biāo)準(zhǔn)差來(lái)反映所有可能樣本估計(jì)值與其中心值的平均離散程度。可以證明,對(duì)于既定的總體和樣本容量,樣本估計(jì)量是以相應(yīng)總體參數(shù)為分布中心的。統(tǒng)計(jì)上把樣本估計(jì)量的標(biāo)準(zhǔn)差定義為抽樣平均誤差第41頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念抽樣平均誤差(抽樣標(biāo)準(zhǔn)誤)抽樣平均誤差可衡量樣本對(duì)總體的代表性大小。抽樣平均誤越小,則樣本估計(jì)量的分布就越集中在總體參數(shù)的附近,平均來(lái)說(shuō),樣本估計(jì)值與總體參數(shù)之間的抽樣誤差越小,樣本對(duì)總體的代表性越大。第42頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念實(shí)際中,抽樣平均誤差不可能按定義式來(lái)計(jì)算,只能根據(jù)概率論和數(shù)理統(tǒng)計(jì)的有關(guān)理論來(lái)推導(dǎo)其計(jì)算公式。在總體方差已知,總體單位總數(shù)為N,樣本容量為n,簡(jiǎn)單隨機(jī)抽樣條件下,抽樣平均誤的計(jì)算公式為:第43頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念抽樣極限誤差一定概率下抽樣誤差的可能范圍,也稱為允許誤差。用Δ表示,由定義知其表達(dá)式:在一定概率下,

上式表示,在一定概率下可認(rèn)為樣本估計(jì)量與相應(yīng)的總體參數(shù)的誤差的絕對(duì)值不超過(guò)。用、分別表示平均數(shù)和比例(成數(shù))的抽樣極限誤差,則在一定概率下有:

第44頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念抽樣極限誤差估計(jì)均值的置信區(qū)間:估計(jì)成數(shù)(比例)的置信區(qū)間:第45頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念抽樣極限誤差是抽樣誤差的可能范圍,而不是完全肯定的范圍。所以,這一可能范圍的大小是與其估計(jì)的可靠程度的大?。锤怕剩┚o密聯(lián)系的。在抽樣估計(jì)中,這個(gè)概率叫置信度,習(xí)慣上也稱為可靠程度、把握程度或概率保證程度等,用1-α表示。顯然在其他條件不變的情況下,抽樣極限誤差越大,相應(yīng)的置信度也就越大。與抽樣極限誤差相關(guān)的兩個(gè)概念是:抽樣誤差率和抽樣估計(jì)精度。抽樣誤差率=(抽樣極限誤差/估計(jì)量)×100%抽樣估計(jì)精度=100%-抽樣誤差率第46頁(yè),共113頁(yè),2023年,2月20日,星期二三個(gè)誤差概念估計(jì)精度與估計(jì)的可靠程度是矛盾的。也就是說(shuō),如果精度很高,則會(huì)由于估計(jì)區(qū)間太窄而使錯(cuò)誤估計(jì)的可能性大增,從而大大降低估計(jì)的可靠程度,使估計(jì)結(jié)果沒(méi)有多大的作用;如果置信度很高,則意味著允許誤差范圍較大,而使估計(jì)精度太低,這時(shí)盡管估計(jì)的可靠程度接近或等于100%,但抽樣估計(jì)本身也會(huì)失去意義。實(shí)際中,只能依據(jù)具體情況,先滿足一方面,然后確定另一方面。抽樣極限誤差與抽樣平均誤差的關(guān)系?第47頁(yè),共113頁(yè),2023年,2月20日,星期二

三種不同性質(zhì)的分布1總體分布2樣本分布3抽樣分布第48頁(yè),共113頁(yè),2023年,2月20日,星期二總體分布

(populationdistribution)總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體第49頁(yè),共113頁(yè),2023年,2月20日,星期二樣本分布

(sampledistribution)一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本第50頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布

(samplingdistribution)樣本統(tǒng)計(jì)量的概率分布,是一種理論分布在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值及出現(xiàn)的概率分布樣本統(tǒng)計(jì)量(樣本均值,樣本比例,樣本方差等)是隨機(jī)變量,它有若干可能取值,每個(gè)可能取值都有一定的可能性(即概率),從而形成它的概率分布,即統(tǒng)計(jì)上所謂的抽樣分布。樣本統(tǒng)計(jì)量是由n個(gè)隨機(jī)變量構(gòu)成的函數(shù),故抽樣分布屬于隨機(jī)變量函數(shù)的分布。結(jié)果來(lái)自容量相同的所有可能樣本第51頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布

(samplingdistribution)抽樣分布反映了樣本指標(biāo)的分布特征,是抽樣推斷的重要依據(jù)。根據(jù)樣本分布的規(guī)律,可揭示樣本指標(biāo)與總體指標(biāo)之間的關(guān)系,估計(jì)抽樣誤差,并說(shuō)明抽樣推斷的可靠程度。尋求抽樣分布的方法:精確分布,小樣本方法漸進(jìn)分布,大樣本方法第52頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布的形成過(guò)程

(samplingdistribution)總體計(jì)算樣本統(tǒng)計(jì)量如:樣本均值、比例、方差樣本1樣本2樣本3第53頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布(例證)四名學(xué)生的月消費(fèi)支出(240,280,360,400元)?,F(xiàn)按重復(fù)取樣的方法,隨機(jī)抽取兩位構(gòu)成一個(gè)樣本,則全部可能的樣本及其各樣本的均值如下表所示:第54頁(yè),共113頁(yè),2023年,2月20日,星期二樣本單位樣本平均1240,2402402240,2802603240,3603004240,4003205280,2402606280,2802807280,3603208280,4003409360,24030010360,28032011360,36036012360,40038013400,24032014400,28034015400,36038016400,400400合計(jì)5120均值頻數(shù)240126022801300232043402360138024001第55頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布(例證)第56頁(yè),共113頁(yè),2023年,2月20日,星期二

樣本統(tǒng)計(jì)量的抽樣分布

(一個(gè)總體參數(shù)推斷時(shí))

樣本均值的抽樣分布樣本比例的抽樣分布樣本方差的抽樣分布第57頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布第58頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布推斷總體均值的理論基礎(chǔ) 第59頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w的均值、方差及分布如下總體分布14230.1.2.3均值和方差第60頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

(例題分析)

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))第61頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

(例題分析)計(jì)算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5第62頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的分布與總體分布的比較

(例題分析)=2.5σ2=1.25總體分布14230.1.2.3抽樣分布P(x)1.00.1.2.31.53.04.03.52.02.5x第63頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

與中心極限定理=50

=10X總體分布n=4抽樣分布xn=16當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)第64頁(yè),共113頁(yè),2023年,2月20日,星期二中心極限定理

(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:設(shè)從均值為,方差為

2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x第65頁(yè),共113頁(yè),2023年,2月20日,星期二第66頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值和樣本方差的分布

1.一般情況設(shè)總體X的均值為,方差為2,X1,X2,…,Xn是X的一個(gè)樣本,則有E(Xi)=,D(Xi)=2(i=1,2,…,n)。由數(shù)學(xué)期望和方差的性質(zhì),有第67頁(yè),共113頁(yè),2023年,2月20日,星期二中心極限定理

(centrallimittheorem)x的分布趨于正態(tài)分布的過(guò)程第68頁(yè),共113頁(yè),2023年,2月20日,星期二2.正態(tài)總體情況定理1設(shè)隨機(jī)變量X1,X2,…,Xn相互獨(dú)立,且服從正態(tài)分布N(i,i2),則它們的線性組合該定理說(shuō)明相互獨(dú)立的正態(tài)分布隨機(jī)變量的線性組合仍是正態(tài)分布。推論1

設(shè)X1,X2,…,Xn為來(lái)自正態(tài)總體X~N(,

2)的一個(gè)樣本,則第69頁(yè),共113頁(yè),2023年,2月20日,星期二定理2定理3第70頁(yè),共113頁(yè),2023年,2月20日,星期二定理4設(shè)X1,X2,…,Xn1與Y1,Y2,…,Yn2分別是來(lái)自具有相同方差的兩個(gè)正態(tài)總體N(μ1,σ2)與N(μ2,σ2)的樣本,且這兩個(gè)樣本相互獨(dú)立,則第71頁(yè),共113頁(yè),2023年,2月20日,星期二3.中心極限定理第72頁(yè),共113頁(yè),2023年,2月20日,星期二正態(tài)總體方差未知,小樣本設(shè)總體X~N(μ,σ2),(x1,x2,……xn)是其簡(jiǎn)單隨機(jī)樣本,則統(tǒng)計(jì)量第73頁(yè),共113頁(yè),2023年,2月20日,星期二第74頁(yè),共113頁(yè),2023年,2月20日,星期二抽樣分布與總體分布的關(guān)系總體分布正態(tài)分布未知大樣本小樣本樣本均值正態(tài)分布樣本均值正態(tài)分布樣本均值t分布方差已知方差未知第75頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣第76頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值的抽樣分布

(數(shù)學(xué)期望與方差)比較及結(jié)論:1.樣本均值的均值(數(shù)學(xué)期望)等于總體均值

2.樣本均值的方差等于總體方差的1/n第77頁(yè),共113頁(yè),2023年,2月20日,星期二統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤

(standarderror)樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,稱為統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤,也稱為標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤衡量的是統(tǒng)計(jì)量的離散程度,它測(cè)度了用樣本統(tǒng)計(jì)量估計(jì)總體參數(shù)的精確程度以樣本均值的抽樣分布為例,在重復(fù)抽樣條件下,樣本均值的標(biāo)準(zhǔn)誤為第78頁(yè),共113頁(yè),2023年,2月20日,星期二估計(jì)的標(biāo)準(zhǔn)誤

(standarderrorofestimation)當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤以樣本均值的抽樣分布為例,當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,則在重復(fù)抽樣條件下,樣本均值的估計(jì)標(biāo)準(zhǔn)誤為第79頁(yè),共113頁(yè),2023年,2月20日,星期二樣本比例的抽樣分布第80頁(yè),共113頁(yè),2023年,2月20日,星期二比例

(proportion)總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比不同性別的人與全部人數(shù)之比合格品(或不合格品)與全部產(chǎn)品總數(shù)之比總體比例可表示為樣本比例可表示為

第81頁(yè),共113頁(yè),2023年,2月20日,星期二樣本比例的抽樣分布在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布一種理論概率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似推斷總體比例P的理論基礎(chǔ) 第82頁(yè),共113頁(yè),2023年,2月20日,星期二樣本比例的抽樣分布當(dāng)從總體中抽取一個(gè)樣本容量為n的樣本時(shí),樣本中具有某種特征的單位數(shù)X服從二項(xiàng)分布,即有X~B(n,π)E(X)=nπVar(X)=nπ(1-π)第83頁(yè),共113頁(yè),2023年,2月20日,星期二樣本比例的抽樣分布

(數(shù)學(xué)期望與方差)樣本比例p=x/n也服從二項(xiàng)分布樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣第84頁(yè),共113頁(yè),2023年,2月20日,星期二樣本比例的抽樣分布根據(jù)中心極限定理,當(dāng)n→∞時(shí),二項(xiàng)分布趨近于正態(tài)分布。所以,在大樣本下,若nP和n(1-P)皆大于5,樣本比例近似服從正態(tài)分布第85頁(yè),共113頁(yè),2023年,2月20日,星期二樣本方差的抽樣分布第86頁(yè),共113頁(yè),2023年,2月20日,星期二樣本方差的分布在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即第87頁(yè),共113頁(yè),2023年,2月20日,星期二2分布

(2

distribution)由阿貝(Abbe)

于1863年首先給出,后來(lái)由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)

分別于1875年和1900年推導(dǎo)出來(lái)設(shè),則令,則Y服從自由度為1的2分布,即

當(dāng)總體,從中抽取容量為n的樣本,則第88頁(yè),共113頁(yè),2023年,2月20日,星期二2分布

(性質(zhì)和特點(diǎn))分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為E(2)=n,方差為D(2)=2n(n為自由度)可加性:若U和V為兩個(gè)獨(dú)立的服從2分布的隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布第89頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(圖示)

選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差s2計(jì)算卡方值2=(n-1)s2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體第90頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(例題的圖示)16個(gè)樣本方差的分布樣本方差s2s2取值的概率0.04/160.56/1624/164.52/16第91頁(yè),共113頁(yè),2023年,2月20日,星期二第92頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(用Excel計(jì)算c2分布的概率)利用Excel提供的CHIDIST統(tǒng)計(jì)函數(shù),計(jì)算c2分布右單尾的概率值語(yǔ)法為CHIDIST(x,df),其中df為自由度,x是隨機(jī)變量的取值給定自由度和統(tǒng)計(jì)量取值的右尾概率,也可以利用“插入函數(shù)”命令來(lái)實(shí)現(xiàn)計(jì)算自由度為8,統(tǒng)計(jì)量的取值大于10的概率用Excel計(jì)算c2

分布的概率第93頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(用Excel計(jì)算c2分布的臨界值)利用Excel提供的CHIINV統(tǒng)計(jì)函數(shù),計(jì)算分布右單尾的概率值為的臨界值語(yǔ)法為CHIINV(,df),其中df為自由度給定自由度和分布右尾概率為的臨界值也可以利用“插入函數(shù)”命令來(lái)實(shí)現(xiàn)計(jì)算自由度為10,右尾概率為0.1的臨界值用Excel計(jì)算c2

分布的臨界值第94頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(用Excel生成c2分布的臨界值表)第一步:將c2分布自由度df的值輸入到工作表的

A列,將右尾概率的取值輸入到第1行第二步:在B2單元格輸入公式

“=CHIINV(B$1,$A2)”

然后將其向下、向右復(fù)制即可得到分布的臨界值表

用Excel生成c2

分布的臨界值表第95頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(用Excel繪制c2分布圖)第1步:在工作表的第1列A2:A62輸入應(yīng)一個(gè)等差數(shù)列,初始值為“0”,步長(zhǎng)為“1”,終值為“60”第2步:在單元格B1輸入c2分布自由度(如“15”)第3步:在單元格B2輸入公式“=CHIDIST(A2,$B$1)”,并將其復(fù)制到B3:B62區(qū)域第4步:在單元格C2輸入公“=B2-B3”,并將其復(fù)制到C3:C62

區(qū)域第5步:將A2:A62作為橫坐標(biāo)、C2:C62作為縱坐標(biāo),根據(jù)“圖表向?qū)А崩L制折線圖

用Excel繪制c2分布圖第96頁(yè),共113頁(yè),2023年,2月20日,星期二c2分布

(用Excel繪制c2分布圖)第97頁(yè),共113頁(yè),2023年,2月20日,星期二樣本均值樣本比例樣本方差分布未知大樣本正態(tài)總體方差已知正態(tài)總體方差未知小樣本大樣本正態(tài)分布t分布χ2分布樣本統(tǒng)計(jì)量第98頁(yè),共113頁(yè),2023年,2月20日,星期二

樣本統(tǒng)計(jì)量的抽樣分布

(兩個(gè)總體參數(shù)推斷時(shí))兩個(gè)樣本均值之差的抽樣分布兩個(gè)樣本比例之差的抽樣分布兩個(gè)樣本方差比的抽樣分布第99頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本均值之差的抽樣分布第100頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本均值之差的抽樣分布兩個(gè)總體都為正態(tài)分布,即,兩個(gè)樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差方差為各自的方差之和 第101頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本均值之差的抽樣分布

m1s1總體1s2

m2總體2抽取簡(jiǎn)單隨機(jī)樣樣本容量n1計(jì)算x1抽取簡(jiǎn)單隨機(jī)樣樣本容量n2計(jì)算x2計(jì)算每一對(duì)樣本的x1-x2所有可能樣本的x1-x2m1-m2抽樣分布第102頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本比例之差的抽樣分布第103頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本比例之差的抽樣分布兩個(gè)總體都服從二項(xiàng)分布分別從兩個(gè)總體中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個(gè)樣本都為大樣本時(shí),兩個(gè)樣本比例之差的抽樣分布可用正態(tài)分布來(lái)近似分布的數(shù)學(xué)期望為方差為各自的方差之和 第104頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本方差比的抽樣分布第105頁(yè),共113頁(yè),2023年,2月20日,星期二兩個(gè)樣本方差比的抽樣分布

兩個(gè)總體都為正態(tài)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論