版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、.,抽樣方法和樣本量估計(jì),報(bào)告人:常 捷,.,關(guān)于抽樣的概念,研究對象(unit of analysis) 根據(jù)研究目的確定研究對象。 總體(population) 在明確研究對象的基礎(chǔ)上,確定其同質(zhì)范圍。 調(diào)查對象(sampling element)被抽中的研究對象。 抽樣單位(sampling unit) (如縣、鄉(xiāng)、村、醫(yī)療機(jī)構(gòu)等等) 觀察對象(observation unit) 如調(diào)查戶主,戶主填寫戶中各個(gè)家庭成員情況 抽樣表(sampling frame)列出所有抽樣單位的名冊 抽樣方法(sampling design) 抽樣誤差(sampling error)只是因?yàn)槌闃觽€(gè)體差異產(chǎn)
2、生的隨機(jī)誤差 抽樣偏移(sampling bias)造成系統(tǒng)誤差,樣本層面的系統(tǒng)的偏差,對總體的代表性偏差,.,抽樣方法可分為概率抽樣法與非概率抽樣法兩類 概率抽樣法(probability sampling ) 總體中每個(gè)個(gè)體被抽中的概率是已知且不為零的,可以計(jì)算抽樣誤差并在此基礎(chǔ)上做統(tǒng)計(jì)推斷。 主要包括:簡單隨機(jī)抽樣;系統(tǒng)抽樣;整群抽樣;分層抽樣 非概率抽樣法(non-probability sampling) 不知道總體中每個(gè)個(gè)體被抽中的概率,選擇樣本的過程往往不是隨機(jī)的。抽樣誤差無法計(jì)算,選擇偏移無法控制。 主要包括:方便抽樣;配額抽樣;目的抽樣;滾雪球抽樣,.,單純隨機(jī)抽樣 simp
3、le random sampling,單純隨機(jī)抽樣就是在總體中以完全隨機(jī)的方法抽取一部分觀察單位組成樣本。常見的辦法是先對總體中全部觀察單位編號,然后用抽簽、隨機(jī)數(shù)字表或計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)字的方法從中抽取一部分觀察單位組成樣本。但是當(dāng)總體例數(shù)較多時(shí),這種方法不太適用。 單純隨機(jī)抽樣法是其他概率抽樣法的基礎(chǔ)。 Random Number Generator ,.,系統(tǒng)抽樣 systematic sampling,系統(tǒng)抽樣又稱機(jī)械抽樣或等距抽樣,先將總體的觀察單位按某一順序分成n個(gè)部分,再從第一部分隨機(jī)抽取k號觀察單位,一次用相等間隔,從每一部分各抽取一個(gè)觀察單位。 系統(tǒng)抽樣常作為單純隨機(jī)抽樣的替
4、代。,.,整群抽樣 cluster sampling,整群抽樣是先將總體按照某種與主要研究指標(biāo)無關(guān)的特征劃分為K個(gè)群,每個(gè)群包含若干觀察單位,然后再隨機(jī)抽取k個(gè)群,由抽取的各個(gè)群的全部觀察單位組成樣本。 與前兩種方法不同在于抽樣單位不同,不是直接抽取個(gè)體,而是抽群。 單層整群抽樣single-stage cluster sampling 多層整群抽樣multi-stage cluster sampling 群的變異越小,群越多,抽樣誤差越小 樣本量一定情況下,增加群、減少每群中樣本數(shù),能提高總樣本的代表性 成本低 代表性差,.,分層抽樣 stratified sampling,分層抽樣是先按照
5、對研究指標(biāo)影響較大的某個(gè)特征將總體分成若干類別(即“層”),再從每一層內(nèi)抽取觀察單位,合起來組成樣本。 優(yōu)點(diǎn)1)相同樣本量,抽樣誤差最小 優(yōu)點(diǎn)2)不同的層中,根據(jù)實(shí)際情況可以選擇不同的抽樣方法 各層觀察單位數(shù)的分配:等比例分配;最優(yōu)分配 1) 2) ;,.,非概率抽樣法(non-probability sampling) 雖然在對總體的代表性上很差,在此基礎(chǔ)上做統(tǒng)計(jì)推斷也不科學(xué),但在很多情況下,也是適用的。,.,方便抽樣 Convenience Sampling,方便獲得的個(gè)體即選為樣本,樣本中每個(gè)個(gè)體的獲得都是偶然性的。最終,樣本不能夠代表總體。不能在此基礎(chǔ)上做統(tǒng)計(jì)推斷??梢杂糜谘芯康某跏茧A
6、段,目的可以是為了發(fā)現(xiàn)了解相關(guān)信息,發(fā)現(xiàn)值得研究的問題,為下一步提出假設(shè)準(zhǔn)備信息。,.,配額抽樣 Quota Sampling,配額抽樣為保證樣本的代表性,其樣本中具有某種特征的比例幾乎和母體中具有此種特征的比例相等。譬如某大學(xué)有10000名學(xué)生,我們要抽取1000名。將學(xué)生依年級分成如下四個(gè)子母體。 年級 學(xué)生數(shù) 在母體之百分比 樣本人數(shù) 一 3200 32% 320 二 2600 26% 260 三 2200 22% 220 四 2000 20% 200 與分層抽樣區(qū)別在于,分層抽樣是按隨機(jī)原則在層內(nèi)抽選樣本,而配額抽樣則是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。,.,目的抽樣 Purposi
7、ve Sampling,總體量很小時(shí),比如總體中只有三個(gè)個(gè)體,此時(shí),隨機(jī)抽樣并不一定能抽到具有代表性的樣本。這種情況下,還不如根據(jù)自己的專業(yè)知識或者通過咨詢專家借助他們的專業(yè)知識人為選出最有代表性的樣本。,.,滾雪球抽樣 Snowball Sampling,通過總體中的一個(gè)個(gè)體提供的線索找到其他的幾個(gè)個(gè)體,再通過其他幾個(gè)個(gè)體提供的線索找到更多的個(gè)體。 適用于難以找尋、獲得的研究對象 如 HIV/AIDS 其抽樣的代表性也局限于被調(diào)查者的提供的社會網(wǎng)絡(luò)。,.,第四次衛(wèi)生服務(wù)總調(diào)查家庭健康詢問調(diào)查樣本住戶的抽取方法,將樣本村(居委會)內(nèi)全部住戶(包括非本地戶口住戶)按名單順序編號(Sampling
8、 Frame) ; 根據(jù)本村(居委會)應(yīng)抽取的樣本戶數(shù)確定抽樣間隔。 國家樣本點(diǎn)抽樣間隔 = 本村(居委會)內(nèi)戶數(shù) / 60(四舍五入,取整數(shù)) 西部擴(kuò)點(diǎn)抽樣間隔 = 本村(居委會)內(nèi)戶數(shù) / 33 (四舍五入,取整數(shù)) 確定抽樣住戶:首先隨機(jī)抽一張人民幣,取其末四位數(shù),該數(shù)除以抽樣間隔后的余數(shù)確定為K值,則K抽樣間隔。K值為被抽第1個(gè)住戶編號,K 值加抽樣間隔為被抽中的第2個(gè)住戶編號,K值加兩個(gè)抽樣間隔為第3個(gè)被抽住戶編號,以此類推。 (Systematic Sampling),.,第四次衛(wèi)生服務(wù)總調(diào)查醫(yī)務(wù)人員調(diào)查樣本抽取方法,一、調(diào)查對象 調(diào)查對象為被抽中的臨床醫(yī)生和護(hù)理人員。被調(diào)查人員將
9、在家庭健康詢問調(diào)查的樣本縣(市、區(qū))中抽取,涉及到的機(jī)構(gòu)包括樣本縣(市、區(qū))中的所有三級綜合醫(yī)院、部分二級綜合醫(yī)院及樣本鄉(xiāng)鎮(zhèn)及街道中的所有社區(qū)衛(wèi)生服務(wù)中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院。 二、調(diào)查對象的選取 (一)綜合醫(yī)院 1、開展家庭健康調(diào)查的樣本縣(市、區(qū))中的所有三級綜合醫(yī)院及部分縣(市、區(qū))醫(yī)院參與調(diào)查,參與調(diào)查的機(jī)構(gòu)名單見培訓(xùn)光盤; 2、每所醫(yī)院選取臨床醫(yī)務(wù)人員30名,其中醫(yī)生20名,護(hù)理人員10名。 (二)社區(qū)衛(wèi)生服務(wù)中心及鄉(xiāng)鎮(zhèn)衛(wèi)生院 樣本街道、樣本鄉(xiāng)鎮(zhèn)中所有的社區(qū)衛(wèi)生服務(wù)中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院均參與調(diào)查; 每所社區(qū)衛(wèi)生服務(wù)中心和鄉(xiāng)鎮(zhèn)衛(wèi)生院選取臨床醫(yī)務(wù)人員10名,其中醫(yī)生7名,護(hù)理人員3名。如機(jī)構(gòu)內(nèi)人員數(shù)
10、量不滿足樣本需求時(shí),按實(shí)際人數(shù)進(jìn)行調(diào)查。 三、樣本個(gè)體選取原則(Quota Sampling) 1、全院所有臨床科室均要抽到; 2、樣本選取要求職稱分布均勻,兼顧高、中、初級職稱。,.,中國健康與養(yǎng)老追蹤調(diào)查抽樣設(shè)計(jì),2008預(yù)調(diào)查抽樣介紹 CHARLS預(yù)調(diào)查抽樣程序:縣級單位的選取是按區(qū)域以及城鄉(xiāng)分層,然后依照PPS(Probability Proportional to Size)方法隨機(jī)選取的。在每個(gè)縣級單位中,CHARLS再依照PPS方法隨機(jī)抽取3個(gè)村級單位(或是一個(gè)城鎮(zhèn)社區(qū)),在每一個(gè)村或社區(qū)中,再從地圖上隨機(jī)抽取25-36處住所;然后決定每個(gè)住所中家庭戶的樣本個(gè)數(shù)。CHARLS隨機(jī)
11、選取其中一個(gè)符合年齡條件的家庭,然后確定該家庭中符合年齡條件的家庭成員個(gè)數(shù)并隨機(jī)抽取一人作為主要受訪者?;谶@樣的隨機(jī)抽樣過程,每個(gè)村或社區(qū)會產(chǎn)生25-36個(gè)樣本家庭,每戶家庭產(chǎn)生的受訪者有1名(單身、離婚或喪偶)或2名(主要受訪者及其配偶)。,.,中國健康與養(yǎng)老最總調(diào)查抽樣方法,2011年全國基線調(diào)查抽樣介紹 CHARLS 抽樣以保證樣本的無偏和代表性為宗旨,通過四個(gè)階段,分別在縣(區(qū))-村(居)-家戶-個(gè)人層面上進(jìn)行抽樣。具體而言,在縣(區(qū))-村(居)兩級抽樣中,CHARLS均采用按人口規(guī)模成比例的概率抽樣,簡稱為PPS抽樣(probabilities proportional to si
12、ze)。在縣級抽樣階段,按照PPS方法,以每個(gè)區(qū)縣2009年人口數(shù)量為基礎(chǔ),使用地區(qū)、城鄉(xiāng)和GDP為分層指標(biāo),直接從全國30個(gè)省級行政單位(不包括西藏自治區(qū)、臺灣省以及香港和澳門特別行政區(qū))范圍內(nèi)隨機(jī)抽取150個(gè)區(qū)縣;在村級抽樣階段,按照PPS方法,以每個(gè)村或社區(qū)2009年常住人口為基礎(chǔ),從上述150個(gè)區(qū)縣中各隨機(jī)抽取3個(gè)村或社區(qū),最后得到450個(gè)村/社區(qū)。以上抽樣過程均在STATA軟件環(huán)境中進(jìn)行,不允許換樣本。 為了避免人口信息的偏差,抽樣時(shí)我們對450個(gè)村級單位的2009年常住人口數(shù)據(jù)與2007年數(shù)據(jù)進(jìn)行了比對。對于兩年人口數(shù)據(jù)差別超過一定限度的村或社區(qū),向統(tǒng)計(jì)局進(jìn)行了核實(shí)。同時(shí),對于抽中
13、的村或社區(qū),通過中國疾控中心發(fā)文到全國進(jìn)行核實(shí),進(jìn)一步保證了抽樣的質(zhì)量。 在村/社區(qū)抽樣完成后,為得到準(zhǔn)確的家戶樣本抽樣框,中國健康與養(yǎng)老追蹤調(diào)查項(xiàng)目設(shè)計(jì)并開發(fā)了專用的繪圖軟件(簡稱CHARLS-GIS)以進(jìn)行實(shí)地繪圖并搜集住戶信息。該軟件利用清晰的Google Earth影像圖或者其它途徑的圖片作為底圖。在實(shí)地工作中,繪圖員首先攜帶GPS在村的邊界外走一圈來確定樣本村/居委會的邊界;其次,根據(jù)實(shí)地情況依次在底圖上勾畫建筑物,導(dǎo)入建筑物GPS位置并進(jìn)行拍照;之后,填寫建筑物內(nèi)住戶信息列表。在繪圖和列表工作完成后,CHARLS北京總部與每個(gè)村(居)聯(lián)絡(luò)人聯(lián)系,并對以下三方面進(jìn)行審核:(1)邊界是
14、否準(zhǔn)確;(2)是否所有建筑物都包括在內(nèi);(3)住戶列表是否準(zhǔn)確(通過隨機(jī)抽取住戶核對他們的地址進(jìn)行)。 通過審核后,從每個(gè)樣本村/居委會的所有住戶信息列表中隨機(jī)抽取80戶樣本家戶,并對這80戶進(jìn)行入戶詢問、核實(shí)家里最長家戶成員的年齡、戶主的姓名、聯(lián)系方式、家戶狀態(tài)(是否空戶、無法聯(lián)系)。之后,根據(jù)2008年CHARLS甘肅和浙江試調(diào)查的拒訪率,按照每個(gè)村(居)24戶有效家戶估算需要抽中的樣本戶數(shù)量并在80戶內(nèi)進(jìn)行相應(yīng)數(shù)量的樣本抽取。最終在450個(gè)村、居抽取的樣本戶為23590戶。抽樣完成后,抽中的住戶會在地圖上自動(dòng)顯示,繪圖員會重新訪問這些戶,對住戶門口拍照,取GPS位置,送致居民的一封信。
15、在個(gè)人層面,我們利用過濾問卷進(jìn)行調(diào)查,在每個(gè)樣本戶中隨機(jī)選擇一位年齡大于45歲的家庭成員作為主要受訪者,對他(她)及其配偶進(jìn)行訪問。,.,樣本含量(sample size),為了保證研究結(jié)論的可靠性,確定的實(shí)驗(yàn)研究或調(diào)查研究所需要的最低觀察對象的數(shù)量。 樣本含量少,研究結(jié)論不可靠(accuracy) 樣本含量過多,造成人財(cái)物的不必要浪費(fèi)(efficiency)還有可能引入不必要的混雜因素。,.,影響所需樣本量的因素,總體特征 (, the size of population) 分析方法 (比較和同時(shí)分析的變量) 對估計(jì)精度的要求 ( ) 財(cái)力、時(shí)間和人力 研究設(shè)計(jì) (如實(shí)驗(yàn)研究;準(zhǔn)實(shí)驗(yàn)研究) 回應(yīng)率 (1回應(yīng)率;2問卷合格率),.,樣本量估計(jì)時(shí)考慮的因素,第一類錯(cuò)誤概率大小(或置信度1-),越小,所需要的樣本含量越大,根據(jù)研究問題的性質(zhì)和研究目的決定I型錯(cuò)誤的概率值,通常情況下,取0.05,可取單側(cè)或雙側(cè)。 第二類錯(cuò)誤概率大小,越小,檢驗(yàn)效能1-越大,所需樣本量也越大,一般要求檢驗(yàn)效能不低于0.80。一般只取單側(cè)。在參數(shù)估計(jì)的樣本量估計(jì)中不涉及,在假設(shè)檢驗(yàn)的樣本量估計(jì)中涉及。,.,樣本量估計(jì)時(shí)考慮的因素,容許誤差,是指研究者要求的或客觀實(shí)際存在的樣本統(tǒng)計(jì)量與總體參數(shù)間或樣本統(tǒng)計(jì)量間的差值,容許誤差值越小,所需樣
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 17910-2025工業(yè)車輛叉車貨叉在使用中的檢查和修復(fù)
- 2025年高職幼兒保育(幼兒教育趨勢分析)試題及答案
- 2025年中職藥劑(藥物咨詢)試題及答案
- 2025年中職(新能源汽車運(yùn)用與維修)充電系統(tǒng)檢測試題及答案
- 2025年高職(植物保護(hù)與檢疫技術(shù))病蟲害監(jiān)測階段測試題及答案
- 2025年中職醫(yī)療社會工作(醫(yī)療社工基礎(chǔ))試題及答案
- 2025年中職鐵道運(yùn)輸服務(wù)(安全管理)試題及答案
- 2025年中職機(jī)械設(shè)計(jì)(零件設(shè)計(jì))試題及答案
- 2025年高職無人機(jī)應(yīng)用技術(shù)(測繪應(yīng)用)模擬試題
- 2025年高職航空安全技術(shù)管理(航空安全方案)技能測試題
- 2025至2030中國背板連接器行業(yè)發(fā)展趨勢分析與未來投資戰(zhàn)略咨詢研究報(bào)告
- T/CCMA 0173-2023流動(dòng)式起重機(jī)用高性能平衡閥
- GB/T 18910.103-2025液晶顯示器件第10-3部分:環(huán)境、耐久性和機(jī)械試驗(yàn)方法玻璃強(qiáng)度和可靠性
- 夢雖遙追則能達(dá)愿雖艱持則可圓模板
- 配件售后管理制度規(guī)范
- 勵(lì)志類的美文欣賞范文(4篇)
- 浙江省紹興市上虞區(qū)2024-2025學(xué)年七年級上學(xué)期期末語文試題(解析版)
- 廣東省廣州市白云區(qū)2024-2025學(xué)年六年級(上)期末語文試卷(有答案)
- GB/T 45166-2024無損檢測紅外熱成像檢測總則
- 山東省菏澤市東明縣2024-2025學(xué)年七年級上學(xué)期考試生物試題
- 二零二四年醫(yī)院停車場建設(shè)及運(yùn)營管理合同
評論
0/150
提交評論