版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
概率概率分布與抽樣分布第1頁,共32頁,2023年,2月20日,星期五第三章概率、概率分布與抽樣分布第一節(jié)常用的抽樣方法第二節(jié)抽樣分布第2頁,共32頁,2023年,2月20日,星期五1、理解常用的概率抽樣方法概念2、掌握抽樣分布的概念3、掌握單一總體的樣本統(tǒng)計量的分布及特征4、理解中心極限定理的內(nèi)涵學(xué)習(xí)目標(biāo)與要求第3頁,共32頁,2023年,2月20日,星期五第一節(jié)常用的抽樣方法簡單隨機抽樣分層抽樣整群抽樣系統(tǒng)抽樣概率抽樣非概率抽樣抽樣方法第4頁,共32頁,2023年,2月20日,星期五一、概率抽樣(probabilitysampling)1、含義:根據(jù)一個已知的概率來抽取樣本單位,也稱隨機抽樣。2、特點:按隨機原則抽取樣本:每個單位都有機會每個單位被抽取的概率是已知或可計算的當(dāng)用樣本對總體估計時,要考慮每個樣本單位被抽中的概率隨機原則:在從總體中抽取樣本單位時,每一個單位被抽中的可能性相等,且不被人為確定。第5頁,共32頁,2023年,2月20日,星期五3、常用的概率抽樣方法(1)簡單隨機抽樣(simplerandomsampling)從總體N個單位中隨機抽取n個單位作為樣本,使得每一個單位都有相同的概率被抽中的抽樣方式。兩種抽取方法:重復(fù)抽樣(samplingwithreplacement)不重復(fù)抽樣(samplingwithoutreplacement優(yōu)點:簡單、直觀用樣本統(tǒng)計量對總體參數(shù)進(jìn)行估計比較方便局限性:當(dāng)N和n很大時,工作量太大抽出的單位分散,給實施調(diào)查增加了困難第6頁,共32頁,2023年,2月20日,星期五(2)分層抽樣(stratifiedsampling)將總體單位按某種特征劃分為若干不同的層,然后從各個層中抽取一定數(shù)量的單位共同構(gòu)成樣本的抽樣方式。優(yōu)點:保證樣本與總體結(jié)構(gòu)相近,可提高估計精度組織實施調(diào)查方便既可估計總體,也可估計各層子總體分層注意事項:層的劃分應(yīng)盡可能符合數(shù)據(jù)規(guī)律,使樣本很好代表總體,應(yīng)遵循“層間差異大,層內(nèi)差異小”。第7頁,共32頁,2023年,2月20日,星期五(3)系統(tǒng)抽樣(systematicsampling)將總體所有單位按一定順序排列后,按某種規(guī)則隨機地確定一個單位為抽樣起點,每間隔一定距離抽取一個單位組成樣本的抽樣方式。也稱等距抽樣或機械抽樣實施方法:排序后,將單位編號1,2,…,N;確定距離k=N/n,隨機取r∈[1,k]作為初始位置;
依次取r+k,r+2k,…,r+(n-1)k等位置單位,組成樣本?!駌●r+k●r+(n-1)k123Nk2k(n-1)k第8頁,共32頁,2023年,2月20日,星期五優(yōu)點:操作簡便;總體數(shù)量均勻分布時可提高估計精度缺點:對估計量方差的估計比較困難第9頁,共32頁,2023年,2月20日,星期五(4)整群抽樣(clustersampling)將總體劃分為若干個組(群),隨機抽取部分群,然后對中選群中的所有單位進(jìn)行調(diào)查的抽樣方式。優(yōu)點:抽樣時只需群的抽樣框,簡化工作量調(diào)查相對集中,節(jié)省調(diào)查費用,方便調(diào)查實施缺點:估計的精度較差整群抽樣注意事項:組群的劃分應(yīng)盡可能符合數(shù)據(jù)規(guī)律,體現(xiàn)出“群內(nèi)差異大,群間差異小”的原則。第10頁,共32頁,2023年,2月20日,星期五二、非概率抽樣(non-probabilitysampling)1、含義:抽取樣本時不是依據(jù)隨機原則,而是根據(jù)研究目的的要求,采用從總體中人為的選取部分單位實施調(diào)查。2、主要抽樣方式:方便抽樣:確定樣本單位時主要考慮到方便抽取的因素。判斷抽樣:研究人員根據(jù)研究內(nèi)容和以往的經(jīng)驗來確定所抽取的樣本單位。3、特點:不能對總體進(jìn)行推斷第11頁,共32頁,2023年,2月20日,星期五第二節(jié)抽樣分布一、參數(shù)與統(tǒng)計量二、抽樣分布的概念三、樣本均值的抽樣分布四、樣本比率的抽樣分布五、樣本方差的抽樣分布第12頁,共32頁,2023年,2月20日,星期五一、參數(shù)與統(tǒng)計量1、參數(shù)(Parameter)用來描述總體特征的綜合指標(biāo)?;诳傮w資料計算:2、統(tǒng)計量(Statistic)用來描述樣本特征的指標(biāo)。基于樣本資料計算得到:或、、相關(guān)提示:統(tǒng)計量是根據(jù)具體樣本數(shù)據(jù)計算而得的一個函數(shù)統(tǒng)計量中不包含任何未知參數(shù)第13頁,共32頁,2023年,2月20日,星期五3、參數(shù)與統(tǒng)計量的關(guān)系對于一個既定總體來說,參數(shù)是確定的、唯一的。而從同一個總體由于抽取的樣本組成單位不同,由此計算出的統(tǒng)計量則是隨機變量。實踐工作中,總體特征往往未知,需要由樣本資料進(jìn)行估計,即由統(tǒng)計量來估計參數(shù)。第14頁,共32頁,2023年,2月20日,星期五1、總體分布:總體各元素的觀察值所形成的分布。2、樣本分布:一個樣本容量為n的樣本中n個觀察值的分布。3、抽樣分布:統(tǒng)計量所有可能取值形成的概率分布。1)是一種理論概率分布2)樣本統(tǒng)計量是隨機變量樣本均值,樣本比例等3)結(jié)果來自容量相同的所有可能樣本二、抽樣分布第15頁,共32頁,2023年,2月20日,星期五三、樣本均值的抽樣分布1、概念要點1)在重復(fù)選取容量為n的樣本時,由樣本均值的所有可能取值形成的概率分布。2)一種理論概率分布3)是推斷總體均值的理論基礎(chǔ)第16頁,共32頁,2023年,2月20日,星期五2、形成過程(一個例子)【例】設(shè)一個總體,含有4個元素(個體),即總體單位數(shù)N=4。4個個體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下均值和方差總體分布14230.1.2.3第17頁,共32頁,2023年,2月20日,星期五
現(xiàn)從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本的結(jié)果如下表3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第一個觀察值所有可能的n=2的樣本(共16個)第18頁,共32頁,2023年,2月20日,星期五計算出各樣本的均值,如下表。并給出樣本均值的抽樣分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)樣本均值的抽樣分布1.00.1.2.3P(x)1.53.04.03.52.02.5x第19頁,共32頁,2023年,2月20日,星期五3、抽樣分布形式抽樣分布=2.5σ2=1.25總體分布14230.1.2.3P(x)1.00.1.2.31.53.04.03.52.02.5x的分布形式與原有總體和樣本容量n的大小有關(guān)第20頁,共32頁,2023年,2月20日,星期五=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布N~(μ,σ2)時,來自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)。第21頁,共32頁,2023年,2月20日,星期五中心極限定理當(dāng)樣本容量足夠大時(n
30),樣本均值的抽樣分布逐漸趨于正態(tài)分布中心極限定理:從均值為,方差為
2的總體中抽取容量為n的樣本,當(dāng)n充分大時(通常n>=30),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n的正態(tài)分布。一個任意分布的總體X第22頁,共32頁,2023年,2月20日,星期五中心極限定理x的分布趨于正態(tài)分布的過程第23頁,共32頁,2023年,2月20日,星期五樣本均值的抽樣分布
與總體分布的關(guān)系總體分布正態(tài)分布非正態(tài)分布大樣本小樣本正態(tài)分布正態(tài)分布非正態(tài)分布大樣本小樣本第24頁,共32頁,2023年,2月20日,星期五4、樣本均值抽樣分布的特征1.樣本均值的數(shù)學(xué)期望2.樣本均值的方差重復(fù)抽樣不重復(fù)抽樣第25頁,共32頁,2023年,2月20日,星期五
從總體中抽取n=2的簡單隨機樣本,在重復(fù)抽樣條件下,共有42=16個樣本。所有樣本均值的結(jié)果如下表:3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第一個觀察值16個樣本的均值(x)第26頁,共32頁,2023年,2月20日,星期五式中:M為可能樣本數(shù)目,是指從一個有N個單位的總體中抽取容量為n的樣本時,出現(xiàn)的所有可能樣本的個數(shù)。結(jié)論:1)樣本均值的均值(數(shù)學(xué)期望)等于總體均值2)樣本均值的方差等于總體方差的1/n
第27頁,共32頁,2023年,2月20日,星期五三、樣本比率的抽樣分布(適于研究品質(zhì)數(shù)據(jù))1、比率的概念:比率:又叫成數(shù),總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比。①不同性別的人與全部人數(shù)之比②合格品(或不合格品)與全部產(chǎn)品總數(shù)之比1)總體比率可表示為2)樣本比率可表示為
第28頁,共32頁,2023年,2月20日,星期五2、概念要點1)在重復(fù)選取容量為n的樣本時,由樣本比率的所有可能取值形成的概率分布。2)一種理論概率分布。3)當(dāng)樣本容量很大時(np≥5和n(1-p)≥5)樣本比率的抽樣分布可用正態(tài)分布近似。4)推斷總體比例的理論基礎(chǔ)。
第29頁,共32頁,2023年,2月20日,星期五3、樣本比例的抽樣分布特征1)樣本比例的數(shù)學(xué)期望2)樣本比例的方差重復(fù)抽樣不重復(fù)抽樣第30頁,共32頁,2023年,2月20日,星期五四、樣本方差的抽樣分布1.在重
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026國家稅務(wù)總局廣西壯族自治區(qū)稅務(wù)系統(tǒng)招聘事業(yè)單位人員20人參考考試題庫附答案解析
- 園林局安全生產(chǎn)培訓(xùn)制度
- 2026福建福州市平潭綜合實驗區(qū)黨工委黨校(區(qū)行政學(xué)院、區(qū)社會主義學(xué)院)招聘編外工作人員1人備考考試試題附答案解析
- 閉環(huán)生產(chǎn)防疫制度及流程
- 2026北京航空航天大學(xué)計算機學(xué)院聘用編科研助理F崗招聘1人備考考試題庫附答案解析
- 2026中央機關(guān)遴選和選調(diào)公務(wù)員調(diào)劑參考考試題庫附答案解析
- 2026廣東廣州市增城區(qū)荔江小學(xué)編外聘用制教師招聘3人備考考試試題附答案解析
- 2026福建宏業(yè)交通服務(wù)有限公司招聘1人備考考試題庫附答案解析
- 2026北京航空航天大學(xué)集成電路科學(xué)與工程學(xué)院聘用編科研助理F崗招聘1人備考考試題庫附答案解析
- 2026廣西崇左市疾病預(yù)防控制中心(崇左市衛(wèi)生監(jiān)督所)招聘編外人員3人備考考試題庫附答案解析
- 2026年開封大學(xué)單招職業(yè)傾向性考試題庫及答案1套
- 2025年CFA二級考試綜合試卷(含答案)
- 2025上海開放大學(xué)(上海市電視中等專業(yè)學(xué)校)工作人員招聘3人(二)考試筆試參考題庫附答案解析
- 急性闌尾炎與右側(cè)輸尿管結(jié)石鑒別診斷方案
- 公司網(wǎng)絡(luò)團隊介紹
- 路虎攬勝購買合同
- 2025年文化旅游活動效果評估計劃可行性研究報告
- 塑木地板銷售合同范本
- 《青島市中小學(xué)心理危機干預(yù) 指導(dǎo)手冊》
- 三北工程林草濕荒一體化保護(hù)修復(fù)(2025年度退化草原修復(fù))監(jiān)理方案投標(biāo)文件(技術(shù)方案)
- 2024江蘇省常熟市中考物理試卷【歷年真題】附答案詳解
評論
0/150
提交評論