第7章統(tǒng)計(jì)學(xué)抽樣推斷_第1頁(yè)
第7章統(tǒng)計(jì)學(xué)抽樣推斷_第2頁(yè)
第7章統(tǒng)計(jì)學(xué)抽樣推斷_第3頁(yè)
第7章統(tǒng)計(jì)學(xué)抽樣推斷_第4頁(yè)
第7章統(tǒng)計(jì)學(xué)抽樣推斷_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 7章 抽樣推斷統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué)原理與原理與SPSS應(yīng)用應(yīng)用統(tǒng)計(jì)學(xué)第 7章 抽樣推斷7.1 抽樣調(diào)查的意義抽樣調(diào)查的意義7.2 抽樣調(diào)查的組織設(shè)計(jì)抽樣調(diào)查的組織設(shè)計(jì)7.3 抽樣調(diào)查的梳理基礎(chǔ)抽樣調(diào)查的梳理基礎(chǔ)7.4 抽樣誤差的計(jì)算抽樣誤差的計(jì)算7.5 參數(shù)估計(jì)參數(shù)估計(jì)7.6 抽樣數(shù)目的確定抽樣數(shù)目的確定抽樣調(diào)查的含義和特點(diǎn) 抽樣調(diào)查是一種科學(xué)的非全面調(diào)查。它是按照隨機(jī)原則從調(diào)查對(duì)象的總體中抽取部分單位進(jìn)行調(diào)查,并根據(jù)這部分單位的調(diào)查結(jié)果推斷總體的數(shù)量特征。 節(jié)省人力、費(fèi)用和時(shí)間 調(diào)查結(jié)果比全面調(diào)查準(zhǔn)確 隨機(jī)原則最主要 抽樣誤差可以計(jì)算,也可以加以控制抽樣調(diào)查的應(yīng)用范圍 用于不可能進(jìn)行全面調(diào)查的對(duì)

2、象 用于進(jìn)行全面調(diào)查就會(huì)失去現(xiàn)實(shí)意義的對(duì)象 用于經(jīng)濟(jì)上不允許或精度上不必要進(jìn)行全面調(diào)查的現(xiàn)象 用于時(shí)效性要求較強(qiáng)的調(diào)查抽樣調(diào)查的作用 有些現(xiàn)象是無(wú)法進(jìn)行全面調(diào)查的 有些現(xiàn)象是實(shí)際上沒(méi)有必要或者很難進(jìn)行全面調(diào)查的 抽樣調(diào)查的結(jié)果可以驗(yàn)證全面調(diào)查的結(jié)果 用于工業(yè)生產(chǎn)過(guò)程的質(zhì)量控制 進(jìn)行假設(shè)檢驗(yàn)抽樣的基本概念 總體和樣本 參數(shù)和統(tǒng)計(jì)量 樣本容量和樣本個(gè)數(shù)抽樣調(diào)查的組織設(shè)計(jì)簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣 等距抽樣等距抽樣分層抽樣分層抽樣整群抽樣整群抽樣簡(jiǎn)單隨機(jī)抽樣 簡(jiǎn)單隨機(jī)抽樣是指從總體的全部單位中按簡(jiǎn)單隨機(jī)抽樣是指從總體的全部單位中按隨機(jī)原則直接抽取隨機(jī)原則直接抽取n n個(gè)單位組成樣本進(jìn)行個(gè)單位組成樣本進(jìn)

3、行調(diào)查。通常采用信手抽取法、抽簽法、隨調(diào)查。通常采用信手抽取法、抽簽法、隨機(jī)數(shù)表法、計(jì)算機(jī)隨機(jī)函數(shù)法抽取樣本。機(jī)數(shù)表法、計(jì)算機(jī)隨機(jī)函數(shù)法抽取樣本。簡(jiǎn)單隨機(jī)抽樣只適用于總體單位數(shù)不多,簡(jiǎn)單隨機(jī)抽樣只適用于總體單位數(shù)不多,總體單位標(biāo)志變異度較小的情形。總體單位標(biāo)志變異度較小的情形。隨機(jī)數(shù)表法 現(xiàn)在要從現(xiàn)在要從8080戶居民中抽取戶居民中抽取1010戶進(jìn)行收入調(diào)戶進(jìn)行收入調(diào)查,現(xiàn)將查,現(xiàn)將8080戶居民從戶居民從1 1到到8080進(jìn)行編號(hào),然后進(jìn)行編號(hào),然后假設(shè)從隨機(jī)數(shù)表中第一行的第六列開(kāi)始自假設(shè)從隨機(jī)數(shù)表中第一行的第六列開(kāi)始自左向右、自上而下取樣,則順序取得的樣左向右、自上而下取樣,則順序取得的樣

4、本號(hào)是?本號(hào)是?隨機(jī)數(shù)表法28465335747213452067421520578090043628192664371555012664985671497258435789642754分層抽樣 等距抽樣整群抽樣 整群抽樣是將總體按某一標(biāo)志分組后形成的整群抽樣是將總體按某一標(biāo)志分組后形成的每個(gè)群視為單位進(jìn)行隨機(jī)抽樣,然后對(duì)抽中每個(gè)群視為單位進(jìn)行隨機(jī)抽樣,然后對(duì)抽中的每個(gè)群體進(jìn)行全面調(diào)查。整群抽樣的特點(diǎn)的每個(gè)群體進(jìn)行全面調(diào)查。整群抽樣的特點(diǎn)是先分群,后抽群作為樣本單位,在抽中的是先分群,后抽群作為樣本單位,在抽中的群內(nèi)實(shí)行全面調(diào)查,不再?gòu)闹谐闃?。群?nèi)實(shí)行全面調(diào)查,不再?gòu)闹谐闃?。多階段抽樣 總體分

5、布(population distribution)總體中各元素的觀察值所形成的分布總體中各元素的觀察值所形成的分布 分布通常是未知的分布通常是未知的可以假定它服從某種分布可以假定它服從某種分布 樣本分布(sample distribution)一個(gè)樣本中各觀察值的分布一個(gè)樣本中各觀察值的分布 也稱經(jīng)驗(yàn)分布也稱經(jīng)驗(yàn)分布 當(dāng)樣本容量當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸逐漸增大時(shí),樣本分布逐漸接近總體的分布接近總體的分布 抽樣分布 (sampling distribution)樣本統(tǒng)計(jì)量的概率分布樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布是一種理論概率分布隨機(jī)變量是隨機(jī)變量是 樣本統(tǒng)計(jì)量樣本統(tǒng)計(jì)量樣本

6、均值樣本均值, 樣本比例,樣本方差等樣本比例,樣本方差等結(jié)果來(lái)自結(jié)果來(lái)自容量相同容量相同的的所有所有可能樣本可能樣本提供了樣本統(tǒng)計(jì)量穩(wěn)定的信息,是進(jìn)行推斷的提供了樣本統(tǒng)計(jì)量穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù) 抽樣分布 (sampling distribution)樣本均值的抽樣分布樣本均值的抽樣分布容量相同的所有可能樣本的樣本均值的概容量相同的所有可能樣本的樣本均值的概率分布率分布一種理論概率分布一種理論概率分布進(jìn)行推斷總體總體均值進(jìn)行推斷總體總體均值 的理論基礎(chǔ)的理論基礎(chǔ)樣本均值的抽樣分布(例題分析)5 . 21NxNii25

7、. 1)(122NxNii樣本均值的抽樣分布 (例題分析)u3,4u3,3u3,2u3,1u3u2,4u2,3u2,2u2,1u2u4,4u4,3u4,2u4,1u4u1,4u4u1,3u3u2u1u1,2u1,1u1u第二個(gè)觀察值第二個(gè)觀察值u第一個(gè)第一個(gè)u觀察值觀察值樣本均值的抽樣分布 (例題分析)u3.5u3.0u2.5u2.0u3u3.0u2.5u2.0u1.5u2u4.0u3.5u3.0u2.5u4u2.5u4u2.0u3u2u1u1.5u1.0u1u第二個(gè)觀察值第二個(gè)觀察值u第第一一個(gè)個(gè)u觀觀察察值值樣本均值的抽樣分布(數(shù)學(xué)期望與方差)為樣本數(shù)目MnMXnixiX222122625

8、. 016)5 . 20 . 4()5 . 20 . 1 ()(5 . 2160 . 4.5 . 10 . 11MXniiX樣本均值的分布與總體分布的比較 (例題分析)5 . 2X625. 02X樣本均值的抽樣分布與中心極限定理X5x50 x5 . 2x中心極限定理(central limit theorem) xn x 中心極限定理 (central limit theorem)X樣本均值的抽樣分布(數(shù)學(xué)期望與方差)樣本均值的數(shù)學(xué)期望樣本均值的數(shù)學(xué)期望樣本均值的方差樣本均值的方差重復(fù)抽樣重復(fù)抽樣不重復(fù)抽樣不重復(fù)抽樣)(XEnX22122NnNnX樣本比例的抽樣分布比例(proportion)

9、總體總體(或樣本或樣本)中具有某種屬性的單位與全部單中具有某種屬性的單位與全部單位總數(shù)之比位總數(shù)之比不同性別的人與全部人數(shù)之比不同性別的人與全部人數(shù)之比合格品合格品(或不合格品或不合格品) 與全部產(chǎn)品總數(shù)之比與全部產(chǎn)品總數(shù)之比總體比例可表示為總體比例可表示為樣本比例可表示為樣本比例可表示為NNPNNP101或nnpnnp101或樣本比例的抽樣分布容量相同的所有可能樣本的樣本比例的概容量相同的所有可能樣本的樣本比例的概率分布率分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布當(dāng)樣本容量很大時(shí),樣本比例的抽樣分布可用正態(tài)分布近似可用正態(tài)分布近似 一種理論概率分布一種理論概率分布推斷總體比例推斷總體比例P的理

10、論基礎(chǔ)的理論基礎(chǔ)樣本比例的抽樣分布(數(shù)學(xué)期望與方差)樣本比例的數(shù)學(xué)期望樣本比例的數(shù)學(xué)期望樣本比例的方差樣本比例的方差重復(fù)抽樣重復(fù)抽樣不重復(fù)抽樣不重復(fù)抽樣PpE)(nPPp)1 (21)1 (2NnNnPPp樣本方差的抽樣分布樣本方差的分布) 1() 1(222nsn22) 1(sn 2分布(2 distribution)由阿貝由阿貝(Abbe) 于于1863年首先給出,后來(lái)由海爾墨特年首先給出,后來(lái)由海爾墨特(Hermert)和卡和卡皮爾遜皮爾遜(KPearson) 分別于分別于1875年和年和1900年推導(dǎo)出來(lái)年推導(dǎo)出來(lái)設(shè)設(shè) ,則,則令令 ,則,則 Y 服從自由度為服從自由度為1的的 2分布

11、,即分布,即 當(dāng)總體當(dāng)總體 ,從中抽取容量為,從中抽取容量為n的樣本,則的樣本,則),(2NX) 1 , 0 ( NXZ2ZY ) 1 (2Y),(2NX) 1()(2212nxxnii?2分布(性質(zhì)和特點(diǎn))分布的變量值始終為正分布的變量值始終為正 分布的形狀取決于其自由度分布的形狀取決于其自由度n的大小,通常為不的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱于對(duì)稱 期望為:期望為:E( 2)=n,方差為:,方差為:D( 2)=2n(n為自由度為自由度) 可加性:若可加性:若U和和V為兩個(gè)獨(dú)立的為兩個(gè)獨(dú)立的 2分布隨機(jī)變量,分布隨機(jī)變量,

12、U 2(n1), V 2(n2),則則U+V這一隨機(jī)變量服從自這一隨機(jī)變量服從自由度為由度為n1+n2的的 2分布分布 2分布(圖示) 選擇容量為選擇容量為n 的的簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差計(jì)算樣本方差S2計(jì)算卡方值計(jì)算卡方值 2 = (n-1)S2/2計(jì)算出所有的計(jì)算出所有的 2值值總體總體評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)無(wú)偏性(unbiasedness) 無(wú)偏性:無(wú)偏性:估計(jì)量抽樣分布的數(shù)學(xué)期望等于估計(jì)量抽樣分布的數(shù)學(xué)期望等于被被 估計(jì)的總體參數(shù)估計(jì)的總體參數(shù) 有效性(efficiency)12一致性(consistency) 一致性:一致性:隨著樣本容量的增大,估計(jì)量隨著樣本容量的增大,估計(jì)量

13、的的 值越來(lái)越接近被估計(jì)的總體參數(shù)值越來(lái)越接近被估計(jì)的總體參數(shù)點(diǎn)估計(jì)與區(qū)間估計(jì)點(diǎn)估計(jì) (point estimate)1.用樣本的估計(jì)量直接作為總體參數(shù)的估計(jì)值用樣本的估計(jì)量直接作為總體參數(shù)的估計(jì)值例如:用樣本均值直接例如:用樣本均值直接作為作為總體均值的估計(jì)總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接例如:用兩個(gè)樣本均值之差直接作為作為總體均總體均值之差的估計(jì)值之差的估計(jì)2.沒(méi)有給出估計(jì)值接近總體參數(shù)程度的信息沒(méi)有給出估計(jì)值接近總體參數(shù)程度的信息3.點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、點(diǎn)估計(jì)的方法有矩估計(jì)法、順序統(tǒng)計(jì)量法、最大似然法、最小二乘法等最大似然法、最小二乘法等區(qū)間估計(jì) (inter

14、val estimate)在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間在點(diǎn)估計(jì)的基礎(chǔ)上,給出總體參數(shù)估計(jì)的一個(gè)區(qū)間范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的范圍,該區(qū)間由樣本統(tǒng)計(jì)量加減抽樣誤差而得到的根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總根據(jù)樣本統(tǒng)計(jì)量的抽樣分布能夠?qū)颖窘y(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量體參數(shù)的接近程度給出一個(gè)概率度量區(qū)間估計(jì)的圖示XXzX2置信水平 將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平比例稱為置信水平 表示為表示為 (1 - 為是總體參數(shù)為是總

15、體參數(shù)未在未在區(qū)間內(nèi)的比例區(qū)間內(nèi)的比例 常用的置信水平值有常用的置信水平值有 99%, 95%, 90%相應(yīng)的相應(yīng)的 為為0.01,0.05,0.10置信區(qū)間 (confidence interval)由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間稱為置信區(qū)間區(qū)間稱為置信區(qū)間統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)統(tǒng)計(jì)學(xué)家在某種程度上確信這個(gè)區(qū)間會(huì)包含真正的總體參數(shù),所以給它取名為包含真正的總體參數(shù),所以給它取名為置信區(qū)間置信區(qū)間 用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)用一個(gè)具體的樣本所構(gòu)造的區(qū)間是一個(gè)特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所特定的區(qū)間,我們無(wú)法知道這個(gè)樣本所產(chǎn)生的區(qū)

16、間是否包含總體參數(shù)的真值產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值置信區(qū)間與置信水平 xxX一個(gè)總體參數(shù)的區(qū)間估計(jì)2Xp2SP總體均值的區(qū)間估計(jì) (正態(tài)總體、已知,或非正態(tài)總體、大樣本)總體均值的區(qū)間估計(jì)(大樣本)假定條件假定條件總體服從正態(tài)分布總體服從正態(tài)分布, ,且方差且方差( ) 已知已知如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似如果不是正態(tài)分布,可由正態(tài)分布來(lái)近似 (n 30)使用正態(tài)分布統(tǒng)計(jì)量使用正態(tài)分布統(tǒng)計(jì)量)1 , 0( NnXZ)(22未知或nSzXnzX總體均值的區(qū)間估計(jì)(例題分析)112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.01

17、23.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體均值的區(qū)間估計(jì)(例題分析)28.109,44.10192.336.105251096.136.1052nzx36.105x總體均值的區(qū)間估計(jì)(例題分析)233539273644364246433133425345544724342839364440394938344850343945484532總體均值的區(qū)間估計(jì)(例題分析)63.41,37.3713.25.393677.7645.15.392nszx5 .39x77. 7s總體均值的區(qū)間估計(jì) (正態(tài)總體、未知、

18、小樣本)總體均值的區(qū)間估計(jì) (小樣本)假定條件假定條件總體服從正態(tài)分布總體服從正態(tài)分布, ,且方差且方差( ) 未知未知小樣本小樣本 (n 30) 使用使用 t 分布統(tǒng)計(jì)量分布統(tǒng)計(jì)量) 1(ntnSXtnStX2t 分布總體均值的區(qū)間估計(jì)(例題分析)1510152014801500145014801510152014801490153015101460146014701470總體均值的區(qū)間估計(jì)(例題分析)2.1503, 8.14762.1314901677.24131.214902ntx1490 x77.24s總體比例的區(qū)間估計(jì)總體比例的區(qū)間估計(jì)假定條件假定條件可以由正態(tài)分布來(lái)近似可以由正態(tài)分

19、布來(lái)近似 使用正態(tài)分布統(tǒng)計(jì)量使用正態(tài)分布統(tǒng)計(jì)量) 1 , 0()1 (NnPPPpZ)()-1 ()1 (22未知時(shí)或PnppzpnPPzp總體比例的區(qū)間估計(jì)(例題分析)%35.74%,65.55%35. 9%65100%)651%(6596. 1%65)1 (2nppzp總體方差的區(qū)間估計(jì)總體方差的區(qū)間估計(jì)估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差估計(jì)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體服從正態(tài)分布假設(shè)總體服從正態(tài)分布總體方差總體方差 2 的點(diǎn)估計(jì)量為的點(diǎn)估計(jì)量為S2,且且11222nSn122122122211nnSnSn總體方差的區(qū)間估計(jì)(圖示)總體方差的區(qū)間估計(jì)(例題分析)112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3總體方差的區(qū)間估計(jì)(例題分析)401.12

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論