概率分布與抽樣課件_第1頁
概率分布與抽樣課件_第2頁
概率分布與抽樣課件_第3頁
概率分布與抽樣課件_第4頁
概率分布與抽樣課件_第5頁
已閱讀5頁,還剩91頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第四章概率分布與抽樣從這一章開始便進(jìn)入推斷統(tǒng)計(jì)學(xué)的內(nèi)容,它會(huì)節(jié)省人們的時(shí)間和財(cái)物最佳限度地認(rèn)識(shí)研究對(duì)象?,F(xiàn)實(shí)世界包含的素材集合非常龐大,從中提取需要的信息非常困難。如:選民人數(shù):每個(gè)候選人的支持率是多少?產(chǎn)品:不合格率是多少?環(huán)境:污染程度如何?市場(chǎng):品種、價(jià)格、質(zhì)量、購(gòu)買力等情況的了解。在這一章里,你將會(huì)了解到樣本是怎樣抽取的,樣本統(tǒng)計(jì)量是怎樣分布的,如何根據(jù)樣本統(tǒng)計(jì)量對(duì)總體參數(shù)做估計(jì)。6/11/20231主要內(nèi)容

4.1抽樣的一般問題4.2三種不同性質(zhì)的分布4.3一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布4.4兩個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布4.5其他抽樣方法█6/11/202324.1抽樣的一般問題4.1.1一個(gè)例子4.1.2統(tǒng)計(jì)抽樣的幾個(gè)基本概念4.1.3簡(jiǎn)單隨機(jī)抽樣6/11/202334.1.1一個(gè)例子本例中存欄肉豬10000頭組成的集合,則稱為總體,它是指在統(tǒng)計(jì)抽樣中所要了解的研究對(duì)象全體,又稱為母體,當(dāng)確定了研究目標(biāo)時(shí),它具有惟一性。一般總體的單位總數(shù)用N表示,稱作總體容量。本例中所抽出的100頭肉豬組成的集合,則稱為樣本,它是指在統(tǒng)計(jì)抽樣中按照“隨機(jī)原則”從總體N(10000)中抽出的部分單位(每個(gè)單位稱作樣本單位)所組成的整體,又稱子樣。一般樣本的單位總數(shù)用n(100)表示,稱作樣本容量。樣本不具惟一性,它的可能個(gè)數(shù)與N、n及抽樣方法有關(guān)。通常n<30稱為小樣本,n≥30稱為大樣本,在抽樣調(diào)查中取大或小樣本會(huì)直接影響到抽樣分布的特征。[例]

某養(yǎng)豬廠共有存欄肉豬10000頭,現(xiàn)欲了解這批肉豬平均每頭毛重(設(shè)為),如果將每頭肉豬過稱去獲取數(shù)據(jù)將是不合算的。我們可以按照“隨機(jī)原則”從中抽出100頭稱重量,計(jì)算這100頭的平均每頭毛重,以達(dá)到我們期望的目的。6/11/202341、總體和樣本

總體:研究對(duì)象全體,又稱母體。容量用N表示。具備惟一性。樣本:按隨機(jī)原則從總體中抽出的部分單位的全體,被抽出的每個(gè)單位稱樣本單位。樣本容量用n表示。樣本不具惟一性。 當(dāng)n<30時(shí),為小樣本。 當(dāng)n≥30時(shí),為大樣本。4.1.2統(tǒng)計(jì)抽樣的幾個(gè)基本概念6/11/202352、總體參數(shù)和樣本統(tǒng)計(jì)量根據(jù)全及總體各單位變量值計(jì)算的反映全及總體某數(shù)量特征的綜合指標(biāo),由于總體唯一確定,故稱總體參數(shù)。如上例中的根據(jù)樣本各單位變量值計(jì)算的反映樣本某方面數(shù)量特征的綜合指標(biāo),由于樣本不具惟一性,故稱為樣本統(tǒng)計(jì)量,它是一個(gè)隨機(jī)變量。如上例中的抽出100頭肉豬的平均每頭毛重4.1.2統(tǒng)計(jì)抽樣的幾個(gè)基本概念6/11/202363、重復(fù)抽樣與不重復(fù)抽樣從總體中抽取樣本有兩種方法:重復(fù)抽樣和不重復(fù)抽樣。重復(fù)抽樣,抽樣安排---對(duì)每次被抽到的單位經(jīng)登記后再放回總體,重新參與下一次抽選的抽樣方法。在每次的抽取中樣本單位被抽中的概率都相等,統(tǒng)計(jì)中稱這樣的抽樣為相互獨(dú)立的試驗(yàn)。不重復(fù)抽樣,抽樣安排---對(duì)被抽到的單位登記后不再放回總體的抽樣方法。不重復(fù)抽樣與重復(fù)抽樣比較,每次抽樣的條件是不同的,前一次的抽取結(jié)果會(huì)對(duì)后一次的抽取產(chǎn)生影響,統(tǒng)計(jì)中稱這樣的抽樣為相互不獨(dú)立的試驗(yàn)。4.1.2統(tǒng)計(jì)抽樣的幾個(gè)基本概念6/11/202374.1.3

簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣也稱為純隨機(jī)抽樣。它是對(duì)總體單位不做任何分類或排隊(duì),直接從總體中按“隨機(jī)原則”抽取樣本單位的調(diào)查方式。為了便于抽取樣本單位,一般在明確抽樣框的條件下,對(duì)總體的每個(gè)單位都要編號(hào),然后用抽簽式或利用《隨機(jī)數(shù)字表》進(jìn)行抽取。例如:N=500n=10編碼從1-500號(hào)在隨機(jī)數(shù)表中隨意選取二個(gè)數(shù)字,假如得到4行,43列。則選取的號(hào)碼從這個(gè)被選中的數(shù)開始,由于500是個(gè)三位數(shù),則小于500的連續(xù)三位數(shù)即為中選號(hào)碼,見表中所示。6/11/202384.1.3

簡(jiǎn)單隨機(jī)抽樣█6/11/202394.2三種不同性質(zhì)的分布4.2.1幾種常見分布4.2.2總體分布4.2.3樣本分布4.2.4抽樣分布4.2.5樣本推斷總體的理論依據(jù)這些內(nèi)容與前面內(nèi)容有什么關(guān)系?6/11/202310一、隨機(jī)變量的概率分布(一)概率分布的含義1、在隨機(jī)試驗(yàn)中,若X隨著試驗(yàn)結(jié)果的不同而隨機(jī)地取各種不同的數(shù)值,并且對(duì)取每一個(gè)數(shù)值或某一范圍內(nèi)的值都有相應(yīng)的概率,則稱X為一個(gè)隨機(jī)變量,按其取值特點(diǎn)可分為離散型隨機(jī)變量和連續(xù)型隨機(jī)變量。2、隨機(jī)變量在其取值范圍內(nèi),取值與取值概率間一一對(duì)應(yīng)的關(guān)系,稱為隨機(jī)變量的概率分布(probabilitydistribution,簡(jiǎn)稱分布)。3、概率分布可以用各種圖表來表示,一些也可以用公式來表示。意義:描述隨機(jī)變量變化的統(tǒng)計(jì)規(guī)律;方便地計(jì)算某一事件發(fā)生的概率。4.2.1幾種常見分布6/11/202311(二)離散型隨機(jī)變量的概率分布

離散型隨機(jī)變量概率分布的兩種表現(xiàn)形式1.分布列(律)2.概率函數(shù)6/11/202312

概率函數(shù)p(xi)的數(shù)學(xué)性質(zhì)6/11/202313(三)連續(xù)型隨機(jī)變量的概率分布(1/3)

1.連續(xù)型隨機(jī)變量的表現(xiàn)方式--密度函數(shù)6/11/202314(三)連續(xù)型隨機(jī)變量的概率分布(2/3)2.密度函數(shù)的數(shù)學(xué)性質(zhì)3.事件“”發(fā)生的概率的計(jì)算方法6/11/202315(三)連續(xù)型隨機(jī)變量的概率分布(3/3)4.事件“”發(fā)生的概率的幾何意義5.連續(xù)型隨機(jī)變量的期望值和方差分別為6/11/202316(四)隨機(jī)變量的分布函數(shù)

1.分布函數(shù)的來源如前所述,離散型隨機(jī)變量的分布用概率函數(shù)來描述,連續(xù)型隨機(jī)變量的分布用密度函數(shù)來描述,兩者形式不同,表現(xiàn)各異。為了更方便地表現(xiàn)隨機(jī)變量的分布,下面引入分布函數(shù)。

2.分布函數(shù)的定義6/11/2023173.分布函數(shù)的幾何意義及數(shù)學(xué)性質(zhì)1)幾何意義2)數(shù)學(xué)性質(zhì)6/11/2023184.隨機(jī)變量分布函數(shù)的具體表現(xiàn)6/11/202319二、正態(tài)分布4.2.1幾種常見分布1.定義6/11/202320正態(tài)分布的密度函數(shù)圖形是一條以均值為中心的對(duì)稱鐘型曲線二、正態(tài)分布4.2.1幾種常見分布6/11/2023212.正態(tài)分布密度函數(shù)的數(shù)學(xué)性質(zhì)

二、正態(tài)分布4.2.1幾種常見分布6/11/2023223.標(biāo)準(zhǔn)正態(tài)分布及其重要意義二、正態(tài)分布4.2.1幾種常見分布6/11/2023234.標(biāo)準(zhǔn)化法二、正態(tài)分布4.2.1幾種常見分布6/11/202324標(biāo)準(zhǔn)化法的幾何意義

標(biāo)準(zhǔn)化變換實(shí)質(zhì)上是作了一個(gè)坐標(biāo)軸的平移和尺度變換,使正態(tài)分布的平均數(shù),標(biāo)準(zhǔn)差。二、正態(tài)分布4.2.1幾種常見分布6/11/2023255.正態(tài)分布表及上側(cè)分位數(shù)二、正態(tài)分布4.2.1幾種常見分布6/11/2023266.

準(zhǔn)則

二、正態(tài)分布4.2.1幾種常見分布6/11/202327準(zhǔn)則示意圖二、正態(tài)分布4.2.1幾種常見分布6/11/2023287.正態(tài)分布的重要意義

在隨機(jī)理論中,正態(tài)分布是最重要的一種分布,理由如下:⑴它是最常見的一種分布,現(xiàn)實(shí)中許多隨機(jī)變量服從或近似服從正態(tài)分布。⑵在一定的條件下,正態(tài)分布是其他分布的近似分布。⑶許多有用的分布,特別是小樣本的精確分布是由正態(tài)分布推導(dǎo)出來的。二、正態(tài)分布4.2.1幾種常見分布6/11/202329三、小樣本(n<30)的精確分布1、2分布2、t分布3、F分布均由正態(tài)分布導(dǎo)出的分布4.2.1幾種常見分布6/11/2023301、2分布(2

distribution)

(1)推導(dǎo)說明①由阿貝(Abbe)

于1863年首先給出,后來由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)分別于1875年和1900年推導(dǎo)出來。②設(shè),則③構(gòu)造,則Yi服從自由度為1的2分布,即④當(dāng)總體,從中抽取容量為n的樣本,則4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/2023311、2分布

(2)性質(zhì)和特點(diǎn)①由于2

分布變量為正態(tài)變量的平方和,故分布的變量值始終為正。②可加性:若U和V為兩個(gè)獨(dú)立的服從2分布的隨機(jī)變量,U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布。③n個(gè)獨(dú)立正態(tài)變量平方和稱為有n個(gè)自由度的c2-分布,記為c2(n)。c2-分布為一族分布,成員由自由度區(qū)分。④分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱。⑤期望為E(2)=n,方差為D(2)=2n(n為自由度)4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/2023321、c2分布

(3)圖示

選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差s2計(jì)算卡方值2=(n-1)s2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20

ms總體4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/2023331、c2分布

(4)c2分布的上分位點(diǎn)

分位點(diǎn)設(shè)X

~2(n),若對(duì)于:0<<1,存在,滿足則稱為分布的上分位點(diǎn)。4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/202334

①由統(tǒng)計(jì)學(xué)家哥賽特(W.S.Gosset)于1908年提出,并以其筆名命名。2、t-分布(t-distribution)

(1)t分布的構(gòu)造及性質(zhì)4.2.1幾種常見分布三、小樣本(n<30)的精確分布②構(gòu)造:若~N(0,1),~2(n),與獨(dú)立,則

t(n)稱為自由度為n的t分布。③基本性質(zhì):

(1)f(t)關(guān)于t=0(縱軸)對(duì)稱。

(2)f(t)的極限為N(0,1)的密度函數(shù),即6/11/202335t(n)分布的圖形為2、t-分布(t-distribution)

(2)t分布的圖示4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/202336對(duì)于給定的:0<<1,稱滿足條件P(t>ta)=a的點(diǎn)ta為t(n)分布的上a分位點(diǎn)。2、t-分布(t-distribution)

(3)t分布的上a分位點(diǎn)4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/202337①由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)

提出的,以其姓氏的第一個(gè)字母來命名②構(gòu)造:設(shè)若U為服從自由度為n1的2分布,即U~2(n1),V為服從自由度為n2的2分布,即V~2(n2),且U和V相互獨(dú)立,則稱F為服從自由度n1和n2的F分布,記為3、F分布(F

distribution)

(1)F分布的構(gòu)造4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/202338F分布

(圖示)

不同自由度的F分布F(1,10)(5,10)(10,10)3、F分布(Fdistribution)

(2)F分布的圖示4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/202339F分布的分位點(diǎn):對(duì)于:0<<1,若滿足條件:

P{FF(n1,n2)}=,則稱F(n1,n2)為

F(n1,n2)的上分位點(diǎn)3、F分布(Fdistribution)

(3)F分布的上a分位點(diǎn)4.2.1幾種常見分布三、小樣本(n<30)的精確分布6/11/2023401)總體中各元素的觀察值所形成的相對(duì)頻數(shù)(頻率)分布2)分布通常是未知的(因?yàn)閹缀醯貌坏娇倛D所有觀察值)3)可以根據(jù)理論分析假定它服從某種分布總體4.2.2總體分布6/11/2023411)一個(gè)樣本中各觀察值形成的相對(duì)頻數(shù)(頻率)分布2)也稱經(jīng)驗(yàn)分布3)當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本4.2.3樣本分布6/11/2023421、統(tǒng)計(jì)量與參數(shù)1)在抽樣推斷中,無論是總體還是樣本,都可以用均值、比例(或成數(shù))、標(biāo)準(zhǔn)差和方差等指標(biāo)來描述它們的特征。當(dāng)它們用來描述樣本的特征時(shí),稱為樣本統(tǒng)計(jì)量;當(dāng)它們用來描述總體特征時(shí),稱為總體參數(shù)。2)樣本統(tǒng)計(jì)量是樣本的函數(shù),依據(jù)不同的樣本計(jì)算出來的值是不同的,所以統(tǒng)計(jì)量是隨機(jī)變量,如樣本均值,樣本比例,樣本方差等。4.2.4抽樣分布6/11/2023432、抽樣分布的含義1)含義:樣本統(tǒng)計(jì)量的概率分布,是一種理論分布,在重復(fù)選取容量為n的樣本時(shí),由該統(tǒng)計(jì)量的所有可能取值形成的相對(duì)頻數(shù)分布。2)構(gòu)造抽樣分布包括以下幾個(gè)步驟:(1)從容量為N的有限總體中隨機(jī)抽出容量為n的所有可能樣本;(2)算出每個(gè)樣本的統(tǒng)計(jì)量數(shù)值;(3)算出與每個(gè)樣本統(tǒng)計(jì)量數(shù)值相對(duì)應(yīng)的概率,作頻數(shù)分布表。4.2.4抽樣分布6/11/2023443、總體分布、樣本均值的抽樣分布(例題分析)【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體)

,即總體單位數(shù)N=4。4

個(gè)個(gè)體分別為x1=1,x2=2,x3=3,x4=4

??傮w分布、總體均值、總體方差如下。總體分布14230.1.2.3總體均值和方差4.2.4抽樣分布6/11/202345

現(xiàn)從總體中抽取n=2的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))4.2.4抽樣分布6/11/202346x樣本均值的抽樣分布1.000.10.20.3P

(x)1.53.04.03.52.02.5

計(jì)算出各樣本的均值,如下表,并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)4.2.4抽樣分布6/11/202347樣本均值的分布與總體分布的比較

(例題分析)

=2.5σ2=1.25

的分布形式與原有總體的分布和樣本容量n的大小等因素有關(guān)總體分布抽樣分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x4.2.4抽樣分布6/11/2023484、抽樣分布的意義因?yàn)闃颖揪凳且粋€(gè)隨機(jī)變量,因此,與其他隨機(jī)變量一樣,具有平均數(shù)(期望)、方差和概率分布。因?yàn)榈母鞣N可能取值是多次簡(jiǎn)單隨機(jī)抽樣的結(jié)果,所以的概率分布稱為的抽樣分布。對(duì)于這個(gè)抽樣分布及其特征的了解,可以使我們能夠?qū)颖揪蹬c總體均值的接近程度進(jìn)行概率描述。4.2.4抽樣分布意義:抽樣分布一方面描述了樣本的隨機(jī)性,提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)而穩(wěn)定的信息即變化規(guī)律;另一方面建立了樣本與總體的聯(lián)系,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)。 6/11/202349一、大數(shù)定律1、是關(guān)于均值具有穩(wěn)定性的一類定律。2、以切比雪夫大數(shù)定律為例。設(shè)隨機(jī)變量相互獨(dú)立,且具有相同的有限數(shù)學(xué)期望和方差:

則對(duì)于任意正數(shù),都有3、若把()看作是來自期望為μ

、方差為σ2

總體的一個(gè)容量為n的樣本,隨著n的充分增大,樣本均值依概率收斂于總體均值。4、大數(shù)定律為統(tǒng)計(jì)量估計(jì)參數(shù)提供了理論上的依據(jù)。即統(tǒng)計(jì)量推斷參數(shù)是可行的。但大數(shù)定律沒有提供統(tǒng)計(jì)量推斷參數(shù)時(shí)誤差的計(jì)算方法。4.2.5樣本推斷總體的理論依據(jù)6/11/202350二、中心極限定理(centrallimittheorem)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布1.中心極限定理:從均值為,方差為2的一個(gè)任意總體中重復(fù)抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個(gè)任意分布的總體x4.2.5樣本推斷總體的理論依據(jù)6/11/2023512.x的分布趨于正態(tài)分布的過程4.2.5樣本推斷總體的理論依據(jù)6/11/2023523.中心極限定理的重要意義1)確定了正態(tài)分布在各種分布中的首要地位。也回答了正態(tài)分布是最重要、最常見的分布。2)揭示了正態(tài)分布的形成機(jī)制。如果某一個(gè)量的變化受到許多種隨機(jī)因素的影響,這種影響的總后果是各個(gè)因素的迭加,而且,這些因素中沒有任何一個(gè)是起主導(dǎo)作用的,那么,這個(gè)量就是一個(gè)服從正態(tài)分布的隨機(jī)變量。3)提供了推斷誤差的計(jì)算思想方法,特別是大樣本處理方法。但沒有提供小樣本下推斷誤差的計(jì)算方法。4.2.5樣本推斷總體的理論依據(jù)█6/11/2023534.3一個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布4.3.1樣本均值的抽樣分布4.3.2樣本比例的抽樣分布4.3.3樣本方差的抽樣分布6/11/2023541、樣本均值抽樣分布的含義1)在重復(fù)選取容量為n的樣本時(shí),由樣本均值的所有可能取值形成的相對(duì)頻數(shù)分布2)一種理論概率分布3)是推斷總體均值的理論基礎(chǔ)4.3.1樣本均值的抽樣分布6/11/2023552、樣本均值抽樣分布的形式(1)總體分布為正態(tài)分布=50

=10X總體分布n=4抽樣分布xn=16

當(dāng)總體服從正態(tài)分布N(μ,σ2)時(shí),來自該總體的所有容量為n的樣本的均值x也服從正態(tài)分布,x

的數(shù)學(xué)期望為μ,方差為σ2/n。即x~N(μ,σ2/n)4.3.1樣本均值的抽樣分布6/11/2023562、樣本均值抽樣分布的形式(2)總體分布為非正態(tài)分布(n≥30,大樣本情形)當(dāng)樣本容量足夠大時(shí)(n

30),樣本均值的抽樣分布逐漸趨于正態(tài)分布從均值為,方差為2的一個(gè)非正態(tài)分布總體中抽取容量為n的樣本,當(dāng)n充分大時(shí),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布一個(gè)任意分布的總體x4.3.1樣本均值的抽樣分布6/11/2023571)總體分布為非正態(tài)分布且為小樣本(n<30)2)樣本均值的分布為非正態(tài)分布2、樣本均值抽樣分布的形式(3)總體分布為非正態(tài)分布(n<30,小樣本情形)4.3.1樣本均值的抽樣分布6/11/202358總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布2、樣本均值抽樣分布的形式(4)小結(jié)4.3.1樣本均值的抽樣分布6/11/202359樣本均值的數(shù)學(xué)期望樣本均值的方差(方差的概率意義在于刻畫了隨機(jī)變量取值的分散程度。方差越小,隨機(jī)變量的取值越集中在期望值附近。)

重復(fù)抽樣不重復(fù)抽樣3、樣本均值抽樣分布的特征設(shè)總體共有N個(gè)元素,其均值為μ,方差為σ2,從中抽取容量為n的樣本,則4.3.1樣本均值的抽樣分布6/11/2023601)總體(或樣本)中具有某種屬性的單位數(shù)與全部單位總數(shù)之比①不同性別的人與全部人數(shù)之比②合格品(或不合格品)與全部產(chǎn)品總數(shù)之比2)總體比例可表示為3)樣本比例可表示為

4.3.2樣本比例(成數(shù))的抽樣分布1、比例(成數(shù))的含義6/11/202361在重復(fù)選取容量為n的樣本時(shí),由樣本比例的所有可能取值形成的相對(duì)頻數(shù)分布。一種理論概率分布。當(dāng)樣本容量很大時(shí)(np≥5和n(1-p)≥5),樣本比例的抽樣分布可用正態(tài)分布近似。推斷總體比例的理論基礎(chǔ)。

4.3.2樣本比例的抽樣分布2、樣本比例抽樣分布的含義及形式6/11/202362樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣4.3.2樣本比例的抽樣分布3、樣本比例抽樣分布的特征6/11/202363調(diào)查誤差登記性誤差代表性誤差系統(tǒng)性誤差(偏差)抽樣平均誤差實(shí)際誤差

抽樣誤差主要是指在用樣本數(shù)據(jù)進(jìn)行推斷時(shí)所產(chǎn)生的隨機(jī)誤差。統(tǒng)計(jì)推斷中的抽樣誤差通常是指抽樣平均誤差,它是抽樣調(diào)查所固有的,是對(duì)抽樣推斷精確度的量度。

4.3.2樣本比例的抽樣分布4、抽樣誤差(1)調(diào)查誤差的分類抽樣極限誤差抽樣誤差(隨機(jī)誤差)6/11/2023644.3.2樣本比例的抽樣分布(2)統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤()定義:樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,測(cè)度所有樣本統(tǒng)計(jì)量的離散程度,也稱標(biāo)準(zhǔn)誤差或抽樣平均誤差。A:樣本均值的抽樣誤差B:樣本成數(shù)P的抽樣誤差4、抽樣誤差6/11/202365

樣本平均數(shù)的抽樣平均誤差A(yù)、重復(fù)抽樣4、抽樣誤差(3)標(biāo)準(zhǔn)誤差的計(jì)算4.3.2樣本比例的抽樣分布6/11/202366B、不重復(fù)抽樣4、抽樣誤差(3)標(biāo)準(zhǔn)誤差的計(jì)算4.3.2樣本比例的抽樣分布6/11/202367不重復(fù)抽樣有限總體重復(fù)抽樣或無限總體有限總體中為校正因子,一般可簡(jiǎn)寫為一般當(dāng)抽樣比小于等于5%時(shí),校正因子可忽略不計(jì)。標(biāo)準(zhǔn)誤差就是樣本統(tǒng)計(jì)量的抽樣分布的標(biāo)準(zhǔn)差,也稱抽樣平均誤差,其計(jì)算公式如下:4.3.2樣本比例的抽樣分布4、抽樣誤差(3)標(biāo)準(zhǔn)誤差的計(jì)算6/11/202368①當(dāng)計(jì)算標(biāo)準(zhǔn)誤時(shí)涉及的總體參數(shù)未知時(shí),用樣本統(tǒng)計(jì)量代替計(jì)算的標(biāo)準(zhǔn)誤,稱為估計(jì)的標(biāo)準(zhǔn)誤。②以樣本均值的抽樣分布為例,當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),可用樣本標(biāo)準(zhǔn)差s代替,則在重復(fù)抽樣條件下,樣本均值的估計(jì)標(biāo)準(zhǔn)誤為:標(biāo)準(zhǔn)差=標(biāo)準(zhǔn)誤=估計(jì)標(biāo)準(zhǔn)誤=抽樣誤差?4.3.2樣本比例的抽樣分布4、抽樣誤差(4)估計(jì)的標(biāo)準(zhǔn)誤

(standarderrorofestimation)6/11/202369總體各單位的差異程度(即標(biāo)準(zhǔn)差的大?。涸酱螅闃诱`差越大;樣本單位數(shù)的多少:越大,抽樣誤差越??;抽樣方法:不重復(fù)抽樣的抽樣誤差比重復(fù)抽樣的抽樣誤差??;抽樣組織方式:簡(jiǎn)單隨機(jī)抽樣的誤差最大。4.3.2樣本比例的抽樣分布4、抽樣誤差(5)影響抽樣誤差的因素6/11/202370在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值的抽樣分布服從自由度為(n-1)的2分布,即4.3.3樣本方差的抽樣分布█6/11/2023714.4兩個(gè)總體參數(shù)推斷時(shí)樣本統(tǒng)計(jì)量的抽樣分布4.4.1兩個(gè)樣本均值之差的抽樣分布4.4.2兩個(gè)樣本比例之差的抽樣分布4.4.3兩個(gè)樣本方差比的抽樣分布6/11/202372兩個(gè)總體都為正態(tài)分布,即,兩個(gè)樣本均值之差的抽樣分布服從正態(tài)分布,其分布的數(shù)學(xué)期望為兩個(gè)總體均值之差方差為各自的方差之和

4.4.1兩個(gè)樣本均值之差的抽樣分布即:6/11/202373兩個(gè)總體都服從二項(xiàng)分布分別從兩個(gè)總體中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個(gè)樣本都為大樣本時(shí),兩個(gè)樣本比例之差的抽樣分布可用正態(tài)分布來近似分布的數(shù)學(xué)期望為方差為各自的方差之和

4.4.2兩個(gè)樣本比例之差的抽樣分布即:6/11/202374

兩個(gè)總體都為正態(tài)分布,即X1~N(μ1,σ12),X2~N(μ2,σ22)從兩個(gè)總體中分別抽取容量為n1和n2的獨(dú)立樣本兩個(gè)樣本方差比的抽樣分布,服從分子自由度為(n1-1),分母自由度為(n2-1)的F分布,即4.4.3兩個(gè)樣本方差比的抽樣分布█6/11/2023754.5其他抽樣方法4.5.1概率抽樣

1、分層抽樣

2、系統(tǒng)抽樣

3、整群抽樣

4、多階段抽樣4.5.2非概率抽樣

1、方便抽樣

2、判斷抽樣

3、自愿樣本

4、滾雪球抽樣

5、配額抽樣4.5.3概率抽樣和非概率抽樣的比較4.5.4抽樣調(diào)查實(shí)例6/11/202376根據(jù)一個(gè)已知的概率來抽取樣本單位,也稱隨機(jī)抽樣,概率抽樣有簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣、多階段抽樣等。特點(diǎn)按一定的概率以隨機(jī)原則抽取樣本抽取樣本時(shí)使每個(gè)單位都有一定的機(jī)會(huì)被抽中每個(gè)單位被抽中的概率是已知的,或是可以計(jì)算出來的當(dāng)用樣本對(duì)總體目標(biāo)量進(jìn)行估計(jì)時(shí),要考慮到每個(gè)樣本單位被抽中的概率4.5.1概率抽樣6/11/2023771.分層抽樣(stratifiedsampling)1、定義:將總體單位按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨(dú)立、隨機(jī)地抽取樣本單位的方法,又稱類型抽樣或分類抽樣。2、特點(diǎn):先分層(對(duì)總體),后抽樣(對(duì)層)3、分層要求:層間差別大,層內(nèi)差別小4、抽樣方法:(見下張幻燈片)5、適用:總體單位在總體內(nèi)部分布不均勻且變異程度大的總體。6、優(yōu)點(diǎn):保證樣本的結(jié)構(gòu)與總體的結(jié)構(gòu)比較相近,從而提高估計(jì)的精度;組織實(shí)施調(diào)查方便;既可以對(duì)總體參數(shù)進(jìn)行估計(jì),也可以對(duì)各層的目標(biāo)量進(jìn)行估計(jì)。6/11/202378總體N樣本n等額等比例不等比例······1.分層抽樣(stratifiedsampling)6/11/202379[例]10人年齡資料如下。N=10n=3,推斷總體平均年齡。人:ABC

DEFG

HIJ年齡:5811

39424548

707376[簡(jiǎn)單隨機(jī)抽樣](B

、H、I),(

C、D

、E

),(F

、G

、

I)結(jié)論:總體變異較大時(shí)分層抽樣。[分層抽樣](B

、E、I),(

C、D

、H

),(A

、G

J)1.分層抽樣(stratifiedsampling)6/11/202380······隨機(jī)起點(diǎn)半距起點(diǎn)對(duì)稱起點(diǎn)(總體單位按某一標(biāo)志排序)

按無關(guān)標(biāo)志排序,其抽樣效果相當(dāng)于簡(jiǎn)單隨機(jī)抽樣;按有關(guān)標(biāo)志排序,其抽樣效果相當(dāng)于分層抽樣。2、系統(tǒng)抽樣(機(jī)械抽樣或等距抽樣)

(systematicsampling)——將總體中的所有單位(抽樣單位)按一定順序排列,在規(guī)定的范圍內(nèi)隨機(jī)地抽取一個(gè)單位作為初始單位,然后按事先規(guī)定好的規(guī)則確定其他樣本單位。6/11/202381系統(tǒng)抽樣可以分為無關(guān)標(biāo)志排序抽樣和有關(guān)標(biāo)志排序抽樣兩類。

無關(guān)標(biāo)志排序抽樣是指排序的標(biāo)志與被研究的標(biāo)志無關(guān)。如:觀察學(xué)生考試成績(jī)用姓氏筆劃;觀察產(chǎn)品質(zhì)量按生產(chǎn)的先后順序等。無關(guān)標(biāo)志排序可以保證抽樣的隨機(jī)性,它實(shí)質(zhì)上相當(dāng)于簡(jiǎn)單隨機(jī)抽樣。

有關(guān)標(biāo)志排序抽樣是指排序的標(biāo)志與被研究標(biāo)志相關(guān)。在對(duì)總體各單位的變異情況有所了解的情況下,也可以采用有關(guān)標(biāo)志進(jìn)行總體單位排列,使各單位的排列順序和它的變量數(shù)值大小保持密切的關(guān)系。如:農(nóng)產(chǎn)量抽樣調(diào)查,可利用各縣或各鄉(xiāng)當(dāng)年估計(jì)畝產(chǎn)或最近三年平均畝產(chǎn)標(biāo)志排隊(duì),抽取調(diào)查單位。由此可見,按有關(guān)標(biāo)志排序?qū)嵸|(zhì)上是運(yùn)用系統(tǒng)抽樣的一些特點(diǎn),有利于提高樣本的代表性,它實(shí)質(zhì)上相當(dāng)于分層抽樣。但也必須注意到,系統(tǒng)抽樣在排序時(shí),第一個(gè)樣本單位的位置確定后,其余單位也隨之確定,因此要避免抽樣間隔和現(xiàn)象本身的周期性節(jié)奏相重合,引起系統(tǒng)性的影響。2、系統(tǒng)抽樣

(systematicsampling)6/11/2023823、整群抽樣

(clustersampling)1、定義:將總體中各單位按一定標(biāo)準(zhǔn)分成若干群(組),再?gòu)目傮w中隨機(jī)抽取一定數(shù)量的群,對(duì)抽中群的所有單位全部實(shí)施調(diào)查。2、特點(diǎn):先分群(對(duì)總體),后抽樣(對(duì)總體)3、群的類型:自然形成的群;人為劃分的群4、分群原則:群間差別小,群內(nèi)差別大5、抽樣方法:(見下張幻燈片)6、適用:在大規(guī)模的抽樣調(diào)查中,如果總體單位多且分布區(qū)域廣,缺少進(jìn)行抽樣的抽樣框,或者在按經(jīng)濟(jì)效益原則不宜編制這種抽樣框的情況下,宜采用整群抽樣方式。6/11/202383例:總體群數(shù)R=16樣本群數(shù)r=4ABCDEFGHIJKLMNOPLHPD樣本容量簡(jiǎn)單、方便,能節(jié)省人力、物力、財(cái)力和時(shí)間,但其樣本代表性可能較差3、整群抽樣

(clustersampling)6/11/202384例:在某省100多萬農(nóng)戶抽取1000戶調(diào)查農(nóng)戶生產(chǎn)性投資情況。第一階段:從該省所有縣中抽取5個(gè)縣第二階段:從被抽中的5個(gè)縣中各抽4個(gè)鄉(xiāng)第三階段:從被抽中的20個(gè)鄉(xiāng)中各抽5個(gè)村第四階段:從被抽中的100個(gè)村中各抽10戶樣本n=100×10=1000(戶)——又稱多級(jí)抽樣,它是將抽取樣本單位的過程劃分為幾個(gè)階段,然后逐階段抽取樣本單位的抽樣組織方式。4、多階段抽樣6/11/202385其優(yōu)點(diǎn)在于:

首先,便于組織抽樣。它可以按現(xiàn)有的行政區(qū)劃或地理區(qū)域劃分各階段的抽樣單元,從而簡(jiǎn)化抽樣框的編制。其次,可以獲得各階段單元的調(diào)查資料,即根據(jù)最初級(jí)資料可進(jìn)行逐級(jí)抽樣推斷,得到各級(jí)的調(diào)查資料。如農(nóng)產(chǎn)量調(diào)查,可根據(jù)樣本推斷地塊資料,根據(jù)地塊資料可推斷村的資料,然后依次推斷鄉(xiāng)、縣等。第三,多階段抽樣的方式比較靈活,各階段抽樣的組織方式可以前述四種為依據(jù)進(jìn)行選擇。一般在初級(jí)階段抽樣時(shí)多用類型抽樣和等距抽樣,在次級(jí)階段抽樣時(shí)多用等距抽樣和簡(jiǎn)單隨機(jī)抽樣。同時(shí),還可以根據(jù)各階段的不同特點(diǎn),采用不同的抽樣比。如方差大的階段,抽樣比大一些;方差小的階段,抽樣比小一些。而且多階段抽樣在簡(jiǎn)化抽樣工作的同時(shí),抽樣單位的分布較廣,具有較強(qiáng)的代表性。4、多階段抽樣6/11/2023864.5.2非概率抽樣

(non-probabilitysampling)相對(duì)于概率抽樣而言抽取樣本時(shí)不是依據(jù)隨機(jī)原則,而是根據(jù)研究目的對(duì)數(shù)據(jù)的要求,采用某種方式從總體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論