7.1《基礎(chǔ)統(tǒng)計》(第7版) 抽樣推斷基礎(chǔ)_第1頁
7.1《基礎(chǔ)統(tǒng)計》(第7版) 抽樣推斷基礎(chǔ)_第2頁
7.1《基礎(chǔ)統(tǒng)計》(第7版) 抽樣推斷基礎(chǔ)_第3頁
7.1《基礎(chǔ)統(tǒng)計》(第7版) 抽樣推斷基礎(chǔ)_第4頁
7.1《基礎(chǔ)統(tǒng)計》(第7版) 抽樣推斷基礎(chǔ)_第5頁
已閱讀5頁,還剩21頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章抽樣推斷《基礎(chǔ)統(tǒng)計》高等職業(yè)教育財經(jīng)商貿(mào)類專業(yè)基礎(chǔ)課“十四五”職業(yè)教育國家規(guī)劃教材第七章抽樣推斷前幾章的分析方法是建立在已有全面資料的基礎(chǔ)之上。但在統(tǒng)計實(shí)踐活動中,我們常常會遇到某些資料的局限性,即只能掌握部分資料,但又希望了解總體狀況,因此,推斷統(tǒng)計應(yīng)運(yùn)而生。抽樣推斷是統(tǒng)計推斷的一個重要內(nèi)容?!痘A(chǔ)統(tǒng)計》“十三五”職業(yè)教育國家規(guī)劃教材抽樣推斷§3

抽樣組織與誤差控制§1抽樣推斷基礎(chǔ)§2統(tǒng)計估計和推算§4顯著性假設(shè)檢驗(yàn)

第一節(jié)抽樣推斷基礎(chǔ)01抽樣推斷的意義02抽樣推斷中的基本概念03抽樣推斷的理論依據(jù)第一節(jié)一、抽樣推斷的意義(一)抽樣推斷的概念和作用抽樣推斷指按照隨機(jī)原則,從總體中抽取一部分單位組成樣本,根據(jù)樣本調(diào)查資料計算特征值,對總體特征值做出具有一定可靠程度的估計,是以認(rèn)識總體數(shù)量特征為目的的統(tǒng)計方法。抽樣推斷的特點(diǎn)01.以部分特征值推斷整體特征值02.按照隨機(jī)原則抽選被調(diào)查單位03.抽樣誤差可以事先計算和控制抽樣推斷的作用01.解決無法或難以全面調(diào)查的問題02.可以補(bǔ)充或修正全面調(diào)查的數(shù)據(jù)03.可以節(jié)省調(diào)查費(fèi)用和調(diào)查時間第一節(jié)一、抽樣推斷的意義(二)抽樣推斷的研究內(nèi)容隨機(jī)抽樣是指按隨機(jī)的原則從總體中抽取部分單位構(gòu)成樣本的過程。隨機(jī)抽樣的中心是抽樣調(diào)查方案的設(shè)計,主要包括抽樣技術(shù)和試驗(yàn)設(shè)計兩項(xiàng)重要內(nèi)容。統(tǒng)計估計是根據(jù)樣本的特性來對總體的分布函數(shù)、分布參數(shù)或數(shù)字特征等進(jìn)行推測估算。其基本思想是對不同的估計問題構(gòu)造不同的函數(shù),進(jìn)而對總體作出推算和分析。假設(shè)檢驗(yàn)是指根據(jù)經(jīng)驗(yàn)或不成熟的認(rèn)識,對總體的有關(guān)分布函數(shù)、分布參數(shù)或數(shù)字特征等信息作出某種假設(shè),再利用樣本與總體的關(guān)系來對假設(shè)的可靠性作出判斷。第一節(jié)二、抽樣推斷中的基本概念(一)樣本及相關(guān)概念樣本和樣本單位也稱子樣、抽樣總體,是指總體推斷中,在總體中抽取一定數(shù)量的個體(總體單位)構(gòu)成的對總體具有代表性的集合體。構(gòu)成樣本的每一個單位稱為樣本單位,也是總體單位。樣本容量是指一個樣本中所包含的個體單位數(shù)量,一般用n表示。樣本容量的大小與推斷估計的準(zhǔn)確性有著直接的聯(lián)系,其值越大估計量的代表性誤差就越小,反之,則誤差越大。樣本個數(shù)是指在一個抽樣方案中所有可能被抽取的樣本的總量,確切地說它是樣本的可能個數(shù),其具體數(shù)值隨抽樣的方式而表現(xiàn)不同。例如:假設(shè)總體有A、B、C、D四個單位,現(xiàn)純隨機(jī)可重復(fù)抽取2個單位組成樣本,則有16個樣本(即Nn=4×4=16)。第一節(jié)二、抽樣推斷中的基本概念(一)樣本及相關(guān)概念樣本統(tǒng)計量是指反映樣本特征的數(shù)值,簡稱為統(tǒng)計量。統(tǒng)計量一方面表示樣本自身的分布狀況和特征;另一方面又是總體對應(yīng)指標(biāo)的估計依據(jù),一定程度上反映了總體的分布狀況和類型。樣本統(tǒng)計量的對應(yīng)指標(biāo)是總體指標(biāo)(或稱“全及指標(biāo)”),反映總體特征的數(shù)值。假設(shè)有一樣本,其各單位的取值分別為x1、x2、…、xn,則有如下常見的統(tǒng)計量:樣本均值:樣本方差:樣本方差的分母在數(shù)理統(tǒng)計學(xué)中叫做自由度,即能夠自由取值的變量的數(shù)目。容量為n的樣本,在任何統(tǒng)計量都沒有確定時,其自由度為n;在計算方差時由于樣本均值已定,其自由度為n-1。第一節(jié)二、抽樣推斷中的基本概念特征值樣本(抽樣總體)總體(全及總體)單位容量平均數(shù)成數(shù)平均數(shù)標(biāo)準(zhǔn)差平均數(shù)方差成數(shù)標(biāo)準(zhǔn)差成數(shù)方差(一)樣本及相關(guān)概念樣本統(tǒng)計量與總體指標(biāo)常用符號第一節(jié)二、抽樣推斷中的基本概念(二)隨機(jī)變量與概率分布1.隨機(jī)變量與隨機(jī)向量抽樣推斷以隨機(jī)原則抽選樣本單位,概率論是描述隨機(jī)性問題的最好工具。在概率論中將樣本里各單位量化的某種標(biāo)志稱為隨機(jī)變量。將多個同類的隨機(jī)變量構(gòu)成一個集合就叫做隨機(jī)向量。在抽樣推斷中由n個單位組成的樣本就構(gòu)成了一個集合,該集合中的各單位的某種標(biāo)志值用x1、x2、…、xn來表示,就可以看作是n個隨機(jī)變量組成的同分布的n維隨機(jī)向量。其中每一個隨機(jī)變量xi的可能取值(即變量值)會有多個或無窮多個,但在一次抽樣中只能獲取其中的一個值。隨機(jī)變量根據(jù)其量化特征分為離散型和連續(xù)型兩類。第一節(jié)二、抽樣推斷中的基本概念(二)隨機(jī)變量與概率分布2.概率及其屬性概率是指某隨機(jī)事件發(fā)生或出現(xiàn)的可能性的概念,即在隨機(jī)變量中某種變量值出現(xiàn)的可能性或機(jī)會。樣本中某標(biāo)志值出現(xiàn)的頻數(shù)和頻率是確定的。對于總體來說,可能的樣本個數(shù)很多,因此,在隨機(jī)抽樣分析時,某標(biāo)志可能出現(xiàn)的頻數(shù)和頻率是隨機(jī)的。頻數(shù)與頻率確定性與隨機(jī)性隨著樣本容量的增大,各標(biāo)志出現(xiàn)的頻率值將以總體的頻率真值為極限,該極限就是統(tǒng)計概率。樣本容量與統(tǒng)計概率第一節(jié)二、抽樣推斷中的基本概念(二)隨機(jī)變量與概率分布2.概率及其屬性為研究某工廠的產(chǎn)品質(zhì)量情況,采用隨機(jī)抽樣檢查,各次檢查的數(shù)量(即樣本容量)不同,其結(jié)果記錄如表7.1所示。抽查件數(shù)510501003006001000500010000合格頻數(shù)58449127254289945108999合格頻率10.80.880.910.9070.8920.8990.9020.8997表7.1各次質(zhì)量抽查結(jié)果表中數(shù)據(jù)顯示:隨著樣本單位數(shù)的擴(kuò)大,其合格率穩(wěn)定地趨向0.9左右。即合格頻率總是圍繞著一個固定常數(shù)p=0.9擺動??梢妏可以表明一次檢查中合格品出現(xiàn)的可能性,即概率。實(shí)驗(yàn)觀察第一節(jié)二、抽樣推斷中的基本概念(二)隨機(jī)變量與概率分布2.概率及其屬性統(tǒng)計概率定義:在大量重復(fù)試驗(yàn)中,事件A發(fā)生的頻率穩(wěn)定地接近于一個固定的常數(shù)p,它表明事件A出現(xiàn)的可能性大小,則稱此常數(shù)p為事件A發(fā)生的概率,記為P(A),即:(1)必然會發(fā)生的事件的概率為1;(2)不可能發(fā)生的事件的概率為0;(3)任何隨機(jī)事件A的概率為不大于1的非負(fù)實(shí)數(shù),即0<P(A)<1;(4)如果α代表非A事件發(fā)生的概率,則A事件發(fā)生的概率為1-α,即:p=P(A)=1-α。概率就是頻率的穩(wěn)定中心概率具有如下性質(zhì)第一節(jié)二、抽樣推斷中的基本概念(二)隨機(jī)變量與概率分布3.統(tǒng)計量的概率分布例1假設(shè)一個由5人(A,B,C,D,E)構(gòu)成的總體,他們的日產(chǎn)量分別是12,14,16,18,20件;現(xiàn)從5人中隨機(jī)抽取2人進(jìn)行平均產(chǎn)量的調(diào)查,并用它來推斷總體平均數(shù)。這樣,可能的樣本個數(shù)共有52=25個,每個可能樣本被抽取的概率都為1/25。將各樣本的平均數(shù)和與之對應(yīng)的概率依次排列,便構(gòu)成了樣本平均數(shù)的概率分布表。見表7.2所示。是指與樣本統(tǒng)計量的各種可能取值相對應(yīng)的概率構(gòu)成的分布數(shù)列。它是聯(lián)接樣本統(tǒng)計量與總體統(tǒng)計指標(biāo)的重要橋梁,是統(tǒng)計推斷的重要理論依據(jù)。統(tǒng)計量的概率分布第一節(jié)二、抽樣推斷中的基本概念所有可能的樣本樣本平均數(shù)各組樣本數(shù)概率累計概率(1)(2)(3)(4)(5)(A,A)1211/251/25(A,B)(B,A)1322/253/25(A,C)(B,B)(C,A)1433/256/25(A,D)(B,C)(C,B)(D,A)1544/2510/25(A,E)(B,D)(C,C)(D,B)(E,A)1655/2515/25(B,E)(C,D)(D,C)(E,B)1744/2519/25(C,E)(D,D)(E,C)1833/2522/25(D,E)(E,D)1922/2524/25(E,E)2011/2525/25(二)隨機(jī)變量與概率分布3.統(tǒng)計量的概率分布表7.2樣本平均數(shù)(人均產(chǎn)量)的概率分布表樣本平均數(shù)——均值的隨機(jī)變量;各組樣本數(shù)——各種平均水平的可能樣本數(shù);概率——各種均值在一次抽樣中可能被抽到的概率,它等于所有可能樣本范圍內(nèi)的頻率;累計概率”——各組均值及以下水平在一次抽樣中被抽取的概率分布。表7.2中:第一節(jié)二、抽樣推斷中的基本概念(三)隨機(jī)變量的常用特征值(1)離散型隨機(jī)變量的數(shù)學(xué)期望如果離散型隨機(jī)變量X有概率函數(shù):樣本的數(shù)學(xué)期望實(shí)質(zhì)上就是總體的平均值隨機(jī)變量的數(shù)學(xué)期望指隨機(jī)變量以概率為權(quán)數(shù)的加權(quán)算術(shù)平均數(shù)1.數(shù)學(xué)期望(2)連續(xù)性隨機(jī)變量的數(shù)學(xué)期望第一節(jié)二、抽樣推斷中的基本概念(三)隨機(jī)變量的常用特征值2.方差隨機(jī)變量的方差是其標(biāo)準(zhǔn)差的平方,它是隨機(jī)變量與其數(shù)學(xué)期望的離差平方的數(shù)學(xué)期望。因其計算上的方便,方差較標(biāo)準(zhǔn)差應(yīng)用更廣。常用D(X)或σ2表示方差。(1)離散型隨機(jī)變量的方差計算公式:(2)連續(xù)型隨機(jī)變量的方差計算公式:第一節(jié)三、抽樣推斷的理論依據(jù)抽樣推斷是通過樣本對總體進(jìn)行估算,這樣,統(tǒng)計量與被估算的總體指標(biāo)之間的關(guān)系,就是估算的關(guān)鍵。這兩者的關(guān)系主要通過統(tǒng)計量的分布來反映,并且因樣本量的大小而有所差別。隨機(jī)變量的正態(tài)分布小樣本統(tǒng)計量的分布規(guī)律大樣本統(tǒng)計量的分布規(guī)律第一節(jié)三、抽樣推斷的理論依據(jù)(一)隨機(jī)變量的正態(tài)分布正態(tài)分布反應(yīng)正常情況下絕大多數(shù)事件的分布規(guī)律,所以也叫常態(tài)分布。隨機(jī)變量X如果服從正態(tài)分布,則簡記作X~N(μ,σ2),其中μ是X的期望值,σ2是X的方差。其分布圖形如圖7.1所示:pp(a)普通正態(tài)分布(b)標(biāo)準(zhǔn)正態(tài)分布圖7.1兩種正態(tài)分布圖第一節(jié)三、抽樣推斷的理論依據(jù)(一)隨機(jī)變量的正態(tài)分布(1)正態(tài)分布的概率分布曲線關(guān)于X=μ為對稱軸的鐘形分布;1.普通正態(tài)分布(主要特征)(2)概率分布曲線在μ-σ和μ+σ處是拐點(diǎn),即在X<(μ-σ)和X>(μ+σ)區(qū)間是凹形的(凸向橫軸);在(μ-σ)<X<(μ+σ)區(qū)間是凸形的(即凹向橫軸)。概率分布曲線的陡緩程度由方差σ2決定,σ2越大曲線越平緩;σ2越小曲線越陡峭。(3)概率分布曲線向±∞延伸,并以橫軸為漸近線。這樣,在概率分布曲線和橫軸構(gòu)成的封閉區(qū)間的面積就是1(即概率的總和為100%)。(4)變量值X在區(qū)間[μ-σ,μ+σ]的概率等于68.26%;在[μ-1.96σ,μ+1.96σ]的概率為95%;在[μ-2σ,μ+2σ]的概率為95.45%;在[μ-3σ,μ+3σ]的概率為99.73%。p第一節(jié)三、抽樣推斷的理論依據(jù)(一)隨機(jī)變量的正態(tài)分布2.標(biāo)準(zhǔn)正態(tài)分布當(dāng)正態(tài)分布的兩個參數(shù)μ=0和σ2=1時,就叫做標(biāo)準(zhǔn)正態(tài)分布,簡記作u~N(0,1)?!揪捣植级ɡ?】如果樣本中的某隨機(jī)變量來自正態(tài)總體,只要數(shù)學(xué)期望μ和方差σ2存在,則樣本平均數(shù)的所有可能值構(gòu)成的隨機(jī)變量也服從數(shù)學(xué)期望為μ,方差為σ2/n的正態(tài)分布。樣本平均數(shù)構(gòu)成的隨機(jī)變量經(jīng)標(biāo)準(zhǔn)化后將服從標(biāo)準(zhǔn)正態(tài)分布。即:標(biāo)準(zhǔn)正態(tài)分布轉(zhuǎn)化公式:p第一節(jié)三、抽樣推斷的理論依據(jù)(二)小樣本統(tǒng)計量的分布規(guī)律1.小樣本均值的分布律——t分布形態(tài)上與標(biāo)準(zhǔn)正態(tài)分布很類似,是關(guān)于t=0的對稱分布,其概率分布曲線與正態(tài)分布相比,一般中心部分比正態(tài)分布低、兩邊比正態(tài)分布高,且取值也是在-∞到+∞之間。對于不同的自由度都有相應(yīng)的t分布值,并且隨著樣本容量的增大,其自由度的增加到一定量(n>30)時,t分布就近似于標(biāo)準(zhǔn)正態(tài)分布N(0,1)。t分布一般簡記作t~t(n),t分布與標(biāo)準(zhǔn)正態(tài)分布的比較如右圖所示:αPt分布正態(tài)分布【均值分布定理2】如果從均值為μ,方差未知的正態(tài)分布總體中隨機(jī)抽取n個單位組成樣本,則所有可能的樣本平均數(shù)構(gòu)成的隨機(jī)變量在標(biāo)準(zhǔn)化時,由于采用樣本的標(biāo)準(zhǔn)差s替代總體的標(biāo)準(zhǔn)差σ,這時標(biāo)準(zhǔn)化的統(tǒng)計量t將服從于自由度為n-1的t分布。即:第一節(jié)三、抽樣推斷的理論依據(jù)(二)小樣本統(tǒng)計量的分布律2.小樣本方差的分布律——

分布是一個以自由度n為參數(shù)的分布族,自由度的大小決定分布形狀,即不同的自由度有不同的卡方分布。

分布是個非對稱分布,隨自由度的增大,卡方分布漸變?yōu)閷ΨQ形分布,當(dāng)自由度達(dá)到相當(dāng)大時,卡方分布接近于正態(tài)分布??ǚ椒植甲鍒D【方差分布定理】設(shè)來自一般正態(tài)總體的隨機(jī)樣本,其樣本方差為s2,總體的方差為σ2,則統(tǒng)計量:服從自由度為n-1的χ2分布,簡記為:“方差分布定理”為總體方差的推斷提供了理論依據(jù)χα2

χ2Pn=4n=8n=15n=25α0第一節(jié)三、抽樣推斷的理論依據(jù)(二)小樣本統(tǒng)計量的分布

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論