CH04資料的收集和抽樣.ppt

上傳人：x*** IP屬地：河南上傳時(shí)間：2020-07-08 格式：PPT 頁數(shù)：17 大?。?.11MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩12頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 4 章,資料的蒐集和抽樣,4.1,4.1 蒐集資料的方法,有許多方法用來蒐集或取得統(tǒng)計(jì)分析的資料。三種最普遍/常使用的方法是：直接觀察 (例，每小時(shí)進(jìn)入銀行的顧客數(shù)量) 實(shí)驗(yàn) (例，新的製造物品的方法以最小化成本) 調(diào)查,第4章資料的蒐集和抽樣第106-107頁,4.2,調(diào)查,調(diào)查(survey)向人們徵求資訊；例如：蓋洛普民意測(cè)驗(yàn)(Gallup Poll)；哈瑞斯(Harris Survey)調(diào)查。回收率(response rate)(是指被選出的受訪者中，完成調(diào)查的人數(shù)比例。) 是調(diào)查的重要參數(shù)之一。調(diào)查可能以多種方式實(shí)施，例如：個(gè)人訪談電話訪談自填式問卷調(diào)查,第4章

2、資料的蒐集和抽樣第107-108頁,4.3,問卷設(shè)計(jì),基本問卷設(shè)計(jì)的要點(diǎn)：問卷必須儘可能簡(jiǎn)短。問題本身應(yīng)該用簡(jiǎn)短、簡(jiǎn)單與清楚的文字陳述。以簡(jiǎn)單的人口統(tǒng)計(jì)問題為開端，以協(xié)助受訪者快速進(jìn)入填寫狀況。使用二分法的問題(是與否)以及選擇題。謹(jǐn)慎使用開放式問題。避免使用引導(dǎo)式問題。先對(duì)一小群人進(jìn)行預(yù)試。準(zhǔn)備問卷時(shí)，思考你要如何分析回應(yīng)的答案。,第4章資料的蒐集和抽樣第108-109頁,4.4,4.2 抽樣,統(tǒng)計(jì)推論允許我們根據(jù)一個(gè)比母體小很多的樣本擷取對(duì)母體參數(shù)的結(jié)論。如果目標(biāo)母體 (target population)( 我們想推論的母體) 與抽樣母體(sample popul

3、ation) ( 實(shí)際取樣的母體) 是相同的，則樣本統(tǒng)計(jì)量可以和所估計(jì)的參數(shù)相當(dāng)接近。,第4章資料的蒐集和抽樣第110頁,4.5,4.3 抽樣計(jì)畫,我們的目的是介紹三種不同的抽樣計(jì)畫：簡(jiǎn)單隨機(jī)抽樣(simple random sample) 分層隨機(jī)抽樣(stratified random sampling) 集群抽樣(cluster sample),第4章資料的蒐集和抽樣第112頁,4.6,簡(jiǎn)單隨機(jī)抽樣,一個(gè)簡(jiǎn)單隨機(jī)樣本(simple random sample )是一個(gè)以下述方法抽出的樣本：每一個(gè)有相同觀測(cè)值個(gè)數(shù)的樣本皆有均等的機(jī)率會(huì)被抽出。,第4章資料的蒐集和抽樣第112頁

4、,4.7,簡(jiǎn)單隨機(jī)抽樣,範(fàn)例4.1：一位政府的稅務(wù)稽核人員必須抽樣 l,000件申請(qǐng)退稅的案件中的40件進(jìn)行審查。,如果產(chǎn)生重複的數(shù)字，可能使用額外的數(shù)字,第4章資料的蒐集和抽樣第113頁,4.8,分層隨機(jī)抽樣,一個(gè)分層隨機(jī)樣本(stratified random sample)的取得是將母體區(qū)分成互斥的群組，或?qū)?，然後從每一層中抽取隨機(jī)樣本。,分層 1 : 性別男性女性,分層 2 : 年齡 20歲以下 20-30歲 31-40歲 41-50歲 51-60歲 60歲以上,分層 3 : 職業(yè) 專業(yè)人員白領(lǐng)階級(jí) 藍(lán)領(lǐng)階級(jí) 其他,分層的一個(gè)優(yōu)點(diǎn)是除了獲得全部母體的資料外，我們也可以在每一

5、分層中做推論或比較資料。,第4章資料的蒐集和抽樣第113-114頁,4.9,分層 4 : 家庭收入 $25,000 以下 $25,000-$39,999 $40,000-$60,000 $60,000 以上,分層隨機(jī)抽樣,母體以這種方式被分層後，我們可以用簡(jiǎn)單隨機(jī)抽樣來產(chǎn)生完整的樣本：,如果我們有充足的資源抽取400位民眾的樣本，我們可以從低收入群組中選取100位,如果我們要選取1000位民眾的樣本，我們可以從高收入群組中選取50位,第4章資料的蒐集和抽樣第115頁,4.10,集群抽樣,集群樣本(cluster sample) 是一個(gè)由母體元素的群組(groups) 或集群(clu

6、sters)所組成之簡(jiǎn)單隨機(jī)樣本。當(dāng)發(fā)展一份完整的母體成員名單是困難的或耗費(fèi)成本的情況下，或者當(dāng)母體元素廣泛的分散在各地時(shí)，集群抽樣很有用。,第4章資料的蒐集和抽樣第115-116頁,4.11,樣本大小,決定適當(dāng)?shù)臉颖敬笮?huì)在第9 與10 章中詳細(xì)說明。在那之前，我們可以依賴直覺，它告訴我們樣本越大，我們可以期望越精確的樣本估計(jì)。,第4章資料的蒐集和抽樣第116頁,4.12,抽樣與非抽樣誤差,從母體中取出一個(gè)觀測(cè)值的樣本時(shí)，兩種主要的誤差可能發(fā)生：抽樣誤差與非抽樣誤差。抽樣誤差(sampling error)是指因樣本觀測(cè)值的隨機(jī)性所造成樣本與母體間的差異。唯一可以降低這類誤

7、差期望大小的方法是使用較大的樣本數(shù)。,第4章資料的蒐集和抽樣第117頁,4.13,非抽樣誤差,非抽樣誤差(nonsampling error )比抽樣誤差的問題更嚴(yán)重，它是由於在取得資料時(shí)發(fā)生錯(cuò)誤，或是因?yàn)闃颖居^測(cè)值被不適當(dāng)?shù)倪x取。三種非抽樣誤差：取得資料時(shí)的誤差無回應(yīng)誤差取樣偏差取用較大的樣本不會(huì)降低非抽樣誤差發(fā)生的大小或機(jī)率。,第4章資料的蒐集和抽樣第118頁,4.14,取得資料時(shí)的誤差,誤差來自於不正確的回應(yīng)記錄，可能來自於：錯(cuò)誤的設(shè)備所造成的錯(cuò)誤測(cè)量。轉(zhuǎn)換原始資料時(shí)所犯的錯(cuò)誤。名詞誤解而導(dǎo)致記錄不正確的資料，或者敏感問題所做的不正確回應(yīng)。,第4章資料的蒐集和抽樣第118頁,4.15,無回應(yīng)誤差,無回應(yīng)誤差(nonresponse error)指當(dāng)無法從樣本成員取得某些調(diào)查回應(yīng)而產(chǎn)生的誤差或偏差(bias)。此時(shí)，所蒐集的樣本觀

人人文庫(kù)> 全部分類> 應(yīng)用文書 > 技術(shù)指導(dǎo)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

CH04資料的收集和抽樣.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

CH04資料的收集和抽樣.ppt

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔