CH04資料的收集和抽樣.ppt_第1頁
CH04資料的收集和抽樣.ppt_第2頁
CH04資料的收集和抽樣.ppt_第3頁
CH04資料的收集和抽樣.ppt_第4頁
CH04資料的收集和抽樣.ppt_第5頁
已閱讀5頁,還剩12頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第 4 章,資料的蒐集和抽樣,4.1,4.1 蒐集資料的方法,有許多方法用來蒐集或取得統(tǒng)計(jì)分析的資料。三種最普遍/常使用的方法是: 直接觀察 (例,每小時(shí)進(jìn)入銀行的顧客數(shù)量) 實(shí)驗(yàn) (例,新的製造物品的方法以最小化成本) 調(diào)查,第4章 資料的蒐集和抽樣 第106-107頁,4.2,調(diào)查,調(diào)查(survey)向人們徵求資訊;例如:蓋洛普民意測(cè)驗(yàn)(Gallup Poll);哈瑞斯(Harris Survey)調(diào)查。 回收率(response rate)(是指被選出的受訪者中,完成調(diào)查的人數(shù)比例。) 是調(diào)查的重要參數(shù)之一。 調(diào)查可能以多種方式實(shí)施,例如: 個(gè)人訪談 電話訪談 自填式問卷調(diào)查,第4章

2、資料的蒐集和抽樣 第107-108頁,4.3,問卷設(shè)計(jì),基本問卷設(shè)計(jì)的要點(diǎn): 問卷必須儘可能簡(jiǎn)短。 問題本身應(yīng)該用簡(jiǎn)短、簡(jiǎn)單與清楚的文字陳述。 以簡(jiǎn)單的人口統(tǒng)計(jì)問題為開端,以協(xié)助受訪者快速進(jìn)入填寫狀況。 使用二分法的問題(是與否)以及選擇題。 謹(jǐn)慎使用開放式問題。 避免使用引導(dǎo)式問題。 先對(duì)一小群人進(jìn)行預(yù)試。 準(zhǔn)備問卷時(shí),思考你要如何分析回應(yīng)的答案。,第4章 資料的蒐集和抽樣 第108-109頁,4.4,4.2 抽樣,統(tǒng)計(jì)推論允許我們根據(jù)一個(gè)比母體小很多的樣本擷取對(duì)母體參數(shù)的結(jié)論。 如果目標(biāo)母體 (target population)( 我們想推論的母體) 與抽樣母體(sample popul

3、ation) ( 實(shí)際取樣的母體) 是相同的,則樣本統(tǒng)計(jì)量可以和所估計(jì)的參數(shù)相當(dāng)接近。,第4章 資料的蒐集和抽樣 第110頁,4.5,4.3 抽樣計(jì)畫,我們的目的是介紹三種不同的抽樣計(jì)畫: 簡(jiǎn)單隨機(jī)抽樣(simple random sample) 分層隨機(jī)抽樣(stratified random sampling) 集群抽樣(cluster sample),第4章 資料的蒐集和抽樣 第112頁,4.6,簡(jiǎn)單隨機(jī)抽樣,一個(gè)簡(jiǎn)單隨機(jī)樣本(simple random sample )是一個(gè)以下述方法抽出的樣本:每一個(gè)有相同觀測(cè)值個(gè)數(shù)的樣本皆有均等的機(jī)率會(huì)被抽出。,第4章 資料的蒐集和抽樣 第112頁

4、,4.7,簡(jiǎn)單隨機(jī)抽樣,範(fàn)例4.1:一位政府的稅務(wù)稽核人員必須抽樣 l,000件申請(qǐng)退稅的案件中的40件進(jìn)行審查。,如果產(chǎn)生重複的數(shù)字,可能使用額外的數(shù)字,第4章 資料的蒐集和抽樣 第113頁,4.8,分層隨機(jī)抽樣,一個(gè)分層隨機(jī)樣本(stratified random sample)的取得是將母體區(qū)分成互斥的群組,或?qū)?,然後從每一層中抽取隨機(jī)樣本。,分層 1 : 性別 男性 女性,分層 2 : 年齡 20歲以下 20-30歲 31-40歲 41-50歲 51-60歲 60歲以上,分層 3 : 職業(yè) 專業(yè)人員 白領(lǐng)階級(jí) 藍(lán)領(lǐng)階級(jí) 其他,分層的一個(gè)優(yōu)點(diǎn)是除了獲得全部母體的資料外, 我們也可以在每一

5、分層中做推論或比較資料。,第4章 資料的蒐集和抽樣 第113-114頁,4.9,分層 4 : 家庭收入 $25,000 以下 $25,000-$39,999 $40,000-$60,000 $60,000 以上,分層隨機(jī)抽樣,母體以這種方式被分層後,我們可以用簡(jiǎn)單隨機(jī)抽樣來產(chǎn)生完整的樣本:,如果我們有充足的資源抽取400位民眾的樣本, 我們可以從低收入群組中選取100位,如果我們要選取1000位民眾的樣本, 我們可以從高收入群組中選取50位,第4章 資料的蒐集和抽樣 第115頁,4.10,集群抽樣,集群樣本(cluster sample) 是一個(gè)由母體元素的群組(groups) 或集群(clu

6、sters)所組成之簡(jiǎn)單隨機(jī)樣本。 當(dāng)發(fā)展一份完整的母體成員名單是困難的或耗費(fèi)成本的情況下,或者當(dāng)母體元素廣泛的分散在各地時(shí),集群抽樣很有用。,第4章 資料的蒐集和抽樣 第115-116頁,4.11,樣本大小,決定適當(dāng)?shù)臉颖敬笮?huì)在第9 與10 章中詳細(xì)說明。在那之前,我們可以依賴直覺,它告訴我們樣本越大,我們可以期望越精確的樣本估計(jì)。,第4章 資料的蒐集和抽樣 第116頁,4.12,抽樣與非抽樣誤差,從母體中取出一個(gè)觀測(cè)值的樣本時(shí),兩種主要的誤差可能發(fā)生: 抽樣誤差與非抽樣誤差。 抽樣誤差(sampling error)是指因樣本觀測(cè)值的隨機(jī)性所造成樣本與母體間的差異。 唯一可以降低這類誤

7、差期望大小的方法是使用較大的樣本數(shù)。,第4章 資料的蒐集和抽樣 第117頁,4.13,非抽樣誤差,非抽樣誤差(nonsampling error )比抽樣誤差的問題更嚴(yán)重,它是由於在取得資料時(shí)發(fā)生錯(cuò)誤,或是因?yàn)闃颖居^測(cè)值被不適當(dāng)?shù)倪x取。三種非抽樣誤差: 取得資料時(shí)的誤差 無回應(yīng)誤差 取樣偏差 取用較大的樣本不會(huì)降低非抽樣誤差發(fā)生的大小或機(jī)率。,第4章 資料的蒐集和抽樣 第118頁,4.14,取得資料時(shí)的誤差,誤差來自於不正確的回應(yīng)記錄,可能來自於: 錯(cuò)誤的設(shè)備所造成的錯(cuò)誤測(cè)量。 轉(zhuǎn)換原始資料時(shí)所犯的錯(cuò)誤。 名詞誤解而導(dǎo)致記錄不正確的資料,或者 敏感問題所做的不正確回應(yīng)。,第4章 資料的蒐集和抽樣 第118頁,4.15,無回應(yīng)誤差,無回應(yīng)誤差(nonresponse error)指當(dāng)無法從樣本成員取得某些調(diào)查回應(yīng)而產(chǎn)生的誤差或偏差(bias)。此時(shí),所蒐集的樣本觀

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論