下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、捕獲再捕獲模型的一個應(yīng)用胡桂華 *,!(*(天津財經(jīng)大學(xué),天津 !;!(廣西財經(jīng)學(xué)院,南寧 6)摘 要:! 世紀 $ 年代初,捕獲再捕獲模型首次用來估計某一地區(qū)吸毒者總體規(guī)模。如同其它統(tǒng)計模型一樣,它也是建立在一些假設(shè)條件的基礎(chǔ)之上,如兩樣本獨立,總體封閉,總體中的每一個個體 有相同的捕獲概率等。關(guān)鍵詞:吸毒者;捕獲再捕獲模型;總體規(guī)模估計中圖分類號:10*文獻標識碼:2 文章編號:*!3#405(!#)$3*03!1 模型構(gòu)建設(shè)吸毒者總體規(guī)模為 7,從中不重復(fù)隨機抽取兩個獨立 樣本,第一樣本記作 2 樣本,第二樣本記作 8 樣本。第 9(9:*/!/ /7&個體落入兩樣本的概率見表 *。 按
2、個體落入兩樣本的實際情況,將個體分為四類:僅落入 2 樣本;僅落入 8 樣本;同時出現(xiàn)在 2 樣本和 8 樣本中;未落入 2 樣本和 8 樣本中。表 ! 中,;*:同時出現(xiàn)在 2 樣本和 8 樣本中的個體數(shù);;*!:僅出現(xiàn)在 2 樣本中的個體數(shù);;!*:僅在 8 樣本中的個體數(shù);;!:未出現(xiàn)在 2 樣本和 8 樣本中的個體數(shù)。除 ;! 和含它的 ;!(,;(! 和 ;(外,其它所有單元都是可以觀 察到的。為估計 7,需要引入多項分布函數(shù) :%;*/;*!/;!*/;!&, 并且規(guī)定約束條件:型決策問題。決策者是決策問題的主體,因而風(fēng)險型決策評價準則應(yīng)將決策者對待風(fēng)險的態(tài)度考慮在內(nèi);決策目標有兩
3、 重含義:一是客觀的指標%通常為最大收益或最小損失&;二是 決策者對客觀指標的滿意程度,即決策目標的客觀指標數(shù)值 在決策者心目中的綜合效用的大小。效用值是后果值在決策 者心目中所對應(yīng)的的綜合效用,它既代表決策者對待風(fēng)險的 態(tài)度,又說明決策者對于收益或損失的獨特興趣、感受或取 舍反應(yīng)。因此,從決策的本質(zhì)來看,應(yīng)提倡使用期望效用值決 策評價準則。( 從利用信息角度看,三種決策評價準則對新信息的利 用方向不同由于對每一實際決策問題,貝葉斯決策評價準則或選擇 期望后果值最優(yōu)或選擇期望效用值最大來評判決策方案的 優(yōu)劣,因此我們可將貝葉斯決策評價準則劃分為兩種:貝葉 斯決策評價準則 ) (期望后果值)和貝
4、葉斯決策評價準則 )(期望效用值)。從信息角度來看,獲取表 * 中的信息是風(fēng)險型決策分析 必備的基礎(chǔ)信息。期望后果值決策評價準則在此基礎(chǔ)信息下 便可進行決策分析,即不利用新信息。而其它決策評價準則 卻需要補充新的信息后才能進行決策分析,但利用新信息的 方向各不相同:期望效用值決策評價準則利用的新信息是決 策者對待風(fēng)險的態(tài)度;貝葉斯決策評價準則 )(期望后果值) 利用了狀態(tài)概率分布的新信息;而貝葉斯決策評價準則 )(期望效用值)既利用了決策者對待風(fēng)險的態(tài)度的新信息,又圖 ! 風(fēng)險型決策評價準則利用新信息的方向利用了狀態(tài)概率分布的新信息。具體情況見圖 !。在風(fēng)險型決策中,一般來說,因為后驗概率分布
5、是對先 驗概率分布和關(guān)于多種自然狀態(tài)概率分布的補充信息進行 科學(xué)綜合的結(jié)果,所以后驗概率分布較先驗概率分布更接近 實際情況,也就是說,從狀態(tài)概率分布這一信息角度來看,貝 葉斯決策評價準則 )(期望后果值)優(yōu)于期望后果值決策評價 準則。綜上所述,從利用信息量的角度來看,貝葉斯決策評價 準則 )(期望效用值)將是其中的最佳者。參考文獻:+*,涂葆林(統(tǒng)計與管理決策%上冊& +-,( 武漢.中國地質(zhì)大學(xué)出版社/*$0$((責(zé)任編輯 ! 亦 民)%&%&!%!&%! +!/ 0+8/6$#%&(%&!)%!&)%!*+$%&*,&! ,-./0%&1%1&2%&1,然后使用似然函數(shù) b(+)*是二項分
6、布的反問題。/70+8/670&85! 6 5!估計 +,這表 &個體落入兩樣本概率+ 理解為多項分布+h *%h 11* /5!*/&80&85&160&851&6;(#)r在 s 樣本中不在 s 樣本中總和在 樣本中5.&5.&!5.&1不在 r 樣本中5.!&5.!5.!1總和5.1&5.1!5.11在 s 樣本中不在 s 樣本中總和在 r 樣本中%&%&!%&1不在 r 樣本中%!&%!%!1總和%1&%1!%11表 !個體落入兩樣本數(shù)目%&%&!%!&%!的 + 次 獨 立實驗,%&%&!%!&%! 理 解 為 + 次獨立實驗中 落 入 四 類的 個 體 數(shù)目。將5h &1*%& c
7、 %1&,5h 1&*%& c %&1代入(#)式,得+h *%h 11*%&1%1& c %&(i) 希爾和戴明還使用 法推導(dǎo)出%h 11的漸近方差: jkl0+h 6*%&1%1&%&!%!& c %&(m) 查普曼 &$f& 年對(i)式估計的+h 的分布特性作了詳細的討論。他指出,當 +(n 時,+h 是 + 的最佳漸近正態(tài)估計量, 但卻是有偏的,并且樣本規(guī)模很小時,偏差很大。然而,當 %&1(+75& 5&! 5!& 5!,%&時,并且第二個樣本不重復(fù)抽取,它的修正估計30%&%&!%!&%!4+5&5&!5!&5!6* %7% 7% 7%(&)7%1&!+!m如果兩樣本獨立,那么5
8、&*5&151&5&!*5&151!*5&10&851&65!&*5!151&*0&85&1651&5!*5!151!*0&85&160&851&6& &! !& !量幾乎是無偏的,即+h o* g%&1)&6g%1&)&6 8& ($)g%&)&6+h o 服從漸近正態(tài)分布,希伯(&$i 年)建議使用區(qū)間估 計法估計 +,$fp概率把握程度下的 + 的置信區(qū)間為:代入(&)式,得:+h oq&1$# )jklg+h 6e(&)30%&,%&!,%!&,%!9+,3&,5&!,5!&,5!6其中,jklg+h 6e*g%&1)&6g%1&)&6g%&18%&6g%1&8%&6 c g%&)&6
9、!g%&)!6%&* +705&151& 6%&!:5&10&851& 6;%!&0&85&1651& =%!?%&,%!,%,%a95&,5&!,5!&,5!6*5& 5&! 5!& 5!%&,%!,%,%a* 或 &抽取容量為 + 的簡單隨機樣本 !&,!, ,!+,建立似然函 數(shù):+!+.&2 模型假設(shè)像許多其它統(tǒng)計模型一樣,捕獲再捕獲模型也是建立 在一些假設(shè)條件的基礎(chǔ)之上。在所有科學(xué)研究領(lǐng)域中,為便 于研究問題,經(jīng)常做出某些假設(shè)。受各種條件限制,研究者 常常只能假設(shè)他們所看到的和沒有看到的情況是一樣的。 當然,假設(shè)不能完全脫離實際,應(yīng)該與現(xiàn)實情況盡可能吻合,否則,建立在假設(shè)基礎(chǔ)之上的理
10、論模型就失去存在的意. * &b0!&,!+95&,5&!,5!&,5!6* &0!&,!+95&,5&!,5!&,5!6*5 & 5. * &義。+!.!. * &+!. * &+!.a. * &%&%&!%!&!%()在吸毒者規(guī)模估計問題研究中,應(yīng)用上述兩樣本捕獲再&! 5!&5!*5& 5&! 5!& 5!捕獲模型或其估計量公式應(yīng)該滿足下面條件:()右邊乘以(+8/)!%&7%&!7%!&7%!7 c +7bd0!&, ,!+95&,5&!,5!&,5!6(&)同質(zhì)性,即在吸毒者總體中,每個吸毒者有相等的捕 獲或再捕獲概率,也就是說,有相同的機會進入 r 樣本或 s%&%&!%!&%!*
11、+75& 5&! 5!& 5! c 0+8/67%&7%&!7%!&7%!7(a)樣本容量為 +,但我們已經(jīng)知道的樣本容量 /*%&)%&!)%!&,于是落入第四類的個體數(shù)目是 %!*+8/,相應(yīng)概率 5!*&805&)5&!)5!&6,代入(a)式,得bd0!&, ,!+95&,5&!,5!&,5!6樣本,當然不要求進入這兩樣本的概率相等。(!)獨立性,即吸毒者進入 s 樣本的概率,與他們是否已 經(jīng)進入 r 樣本無關(guān),換句話說,進入或未進入 r 樣本的個體 有相同的機會進入 s 樣本。()記錄能夠保留下來。出現(xiàn)在第一樣本中的吸毒者被* +7 0& 85/0+8/6 /7 %65ee登記后,調(diào)
12、查員應(yīng)該將登記的個人記錄檔案妥善保管,不要%&/70+8/67%&!%!&!&7%&!7%!&7%! 7丟失。如果丟失,就無法確認同時進入 r 樣本和 s 樣本的個體數(shù)(%&)。05&151& 65&10&851& 6;0&85&1651& ;/(f)(a)抽取兩樣本必須有時間間隔,使出現(xiàn)在第一樣本中0&85! 6若要同時估計出 +,5&1,51& 的最大似然估計量,需要對(f) 求最大值。雖然求最大值能做到,但很繁雜,因而采用一個相對簡單的方法,即先使用似然函數(shù) bg5&1,51&6*/7e%& 7%&! 7%!& 7%! 7的吸毒者有足夠長的時間與其他未出現(xiàn)在第一樣本中的吸 毒者在吸毒者總
13、體中混合均勻。(f)總體封閉,也就是說,在第一次抽樣、調(diào)查、登記后,沒有新生或遷入的吸毒者進入該總體,也沒有死亡或遷出的 吸毒者離開該總體。如果新生或遷入吸毒者人數(shù)等于或近似%&05&151& 6%&!5&10&851& 6;%!&0&85&1651& ;估計 5 ,5 。5hh于死亡或遷出的吸毒者人數(shù),也認為總體封閉。/0&85! 6&1 1&1*%& c %1&,51&*%& c統(tǒng)計與決策 !# 年 $ 月(下)!#如果這些假設(shè)條件與研究問題的現(xiàn)實情況完全吻合,只 要不出現(xiàn)其它誤差,使用捕獲再捕獲模型得到的估計結(jié)果將 是非常準確的。但是,現(xiàn)實情況與上述假設(shè)總是存在或多或少的差異。在這樣的情
14、況下,是否就不能夠使用上述模型呢%這要看這 個差異的程度,還要看研究總體規(guī)模的大小,比如說,如果在日)! 年 & 月 *& 日。(()估計總體規(guī)模和標準差。第一樣本吸毒者人數(shù)用 3&2 表示,第二樣本用 32& 表示,同時出現(xiàn)在兩次捕獲中的吸毒人 數(shù)用 3& 表示,3&24+&,32&4&$&,3&4*。根據(jù)公式($)和(&),得56 74 ,3&28&-,32&9&- )&4 ,+&9&-,&$&9&- )&4*.(研究期間有 &( 名吸毒者新生或從外地遷入,有 !)* 名死亡,3&9&-=,*9&-或遷出,而研究總體估計大概有 & 名左右的吸毒者,那么,可以使用該模型。 但是,如果差異超出
15、模型使用的臨界標準,就要另行考慮。比如說,如果總體封閉假設(shè)不成立,就使用開放式的 喬利)希伯捕獲再捕獲模型;如果同質(zhì)性假設(shè)不成立,就先 對總體分層,將捕獲概率相同或相近的吸毒者歸入同一層,然后在各層內(nèi)獨立使用捕獲再捕獲模型;如果獨立性 假設(shè)不成立,就使用多樣本對數(shù)線性捕獲再捕獲模型,等 等。3 模型應(yīng)用&$+ 年以來,四川利山地區(qū)吸毒情況十分嚴重,引起四 川省省政府的高度重視。!& 年 & 月)! 年 & 月,四川 大學(xué)公共健康流行病研究所受省政府委托,奔赴該地區(qū)實地 調(diào)查吸毒情況。在當?shù)亟涠局行呢撠?zé)人的幫助下,從戒毒中 心抽取兩個獨立樣本。兩樣本抽取的時間,即捕獲期-均為四 個月,抽取的時間
16、間隔,即間隔期-為八個月。第一樣本有 +& 名吸毒者,第二樣本 &$& 名,另外發(fā)現(xiàn) * 名吸毒者同時出現(xiàn) 在兩樣本中。(&)確定估計目標。估計的是 !& 年 & 月 & 日!年 & 月 *& 日四川利山地區(qū)吸毒者人數(shù)。(!)收集吸毒者個人資料。每名吸毒者的個人資料應(yīng)該 包括:姓名、年齡、性別、職業(yè)、出生年月、出生地、當前所在 地、婚姻狀況、經(jīng)濟收入水平,以及進出戒毒中心的時間,等 等。(*)依據(jù)利山地區(qū)戒毒中心 &$+ 年 . 月 & 日)! 年& 月 *& 日提供的吸毒者進出或停留在戒毒中的時間和人 次確定間隔期,/-和捕獲期,0-。表 * 表明,&$+ 年 . 月 & 日)! 年 & 月
17、 *& 日,共有表 * 吸毒者 ! 次或多次進出戒毒中心時間間隔分布:; ,3&8&-!,3&8!-4,+&8&-,&$&8&-,+&)*-,&$&)*- ,*8&-!,*8!-4!1(*+=!:;,5 -7 4&.1# =$(?置信區(qū)間56 7&2$# !:;,5 -a 4,(.! #*#1-該估計結(jié)果準確嗎%回答是肯定的。理由有下面幾點:第一,在 !& 年 & 月 & 日)! 年 & 月 *& 日期間,在利山 地區(qū),沒有發(fā)現(xiàn)吸毒者死亡或遷出,也沒有發(fā)現(xiàn)新生或從其 它地區(qū)遷入的吸毒者。第二,調(diào)查前,進行了宣傳,消除了吸毒者心理上的顧慮,積極主動到戒毒中心戒毒,這樣一來,就保證了吸毒者進入戒毒
18、中的概率相等。第三,捕獲期及捕獲 間隔期是依據(jù)實際調(diào)查數(shù)據(jù)確定的。第四,該估計結(jié)果與當 地警察局掌握的數(shù)據(jù)基本一致。值得說明的是,為什么不使用傳統(tǒng)的全面調(diào)查和抽樣調(diào)查呢%主要原因是吸毒人群是一個特殊群體,不被社會所接 納,調(diào)查員難以接近他們,此外,抽樣框也很難建立,不具備 進行抽樣調(diào)查的基本條件。4 結(jié)論 捕獲再捕獲模型估計公式是依據(jù)抽樣理論推導(dǎo)出來的,因而是可信的。如同任何其他統(tǒng)計模型一樣,捕獲再捕獲模 型也是建立在一些假設(shè)條件的基礎(chǔ)上。如果模型中的假設(shè)與 所研究問題的現(xiàn)實情況不相吻合,模型使用的效果就比較 差。從國外實踐的情況來看,估計某一地區(qū)的交通事故人 數(shù)、無家可歸人數(shù)和吸毒人數(shù),基本上都是在捕獲再捕獲模型所需要的假設(shè)條件未得到完全滿足的情況之下進行的,而 本文吸毒人數(shù)估計,假設(shè)條件得到了很好的滿足,因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026浙江臺州市新府城科技傳媒有限公司招聘編外人員2人備考題庫及答案詳解1套
- 2025貴州貴陽觀山湖人力資源服務(wù)有限公司招聘從事矛盾糾紛調(diào)解相關(guān)工作人員1人備考題庫參考答案詳解
- 2025浙江思睿觀通展覽展示有限公司招聘8人備考題庫及答案詳解(易錯題)
- 2025下半年四川巴中市南江縣考核招聘高中緊缺學(xué)科教師44人備考題庫(含答案詳解)
- 2026新疆昆東經(jīng)濟技術(shù)開發(fā)區(qū)管委會招聘19人備考題庫及參考答案詳解
- 2026云南保山市人力資源市場招聘城鎮(zhèn)公益性崗位人員1人備考題庫及一套參考答案詳解
- 2026中國能建葛洲壩集團黨群工作部主任崗位招聘1人備考題庫帶答案詳解
- 2026年昆明市五華區(qū)龍翔街道社區(qū)衛(wèi)生服務(wù)中心工作人員招聘備考題庫(3人)及完整答案詳解
- 2025福建廈門外代國際貨運有限公司海峽快線單證業(yè)務(wù)員崗社會招聘1人備考題庫及一套答案詳解
- 2026廣東深圳南山區(qū)朗麓家園第一幼兒園招聘1人備考題庫附答案詳解
- 辦公用品、耗材采購服務(wù)投標方案
- 遼寧省大連市2026屆高三上學(xué)期1月雙基模擬考試語文試題(含答案)
- 2025年腫瘤科年度工作總結(jié)匯報
- (正式版)DB51∕T 3336-2025 《零散天然氣橇裝回收安全規(guī)范》
- 初三數(shù)學(xué)備課組年終工作總結(jié)
- 2025年高職工業(yè)機器人(機器人編程調(diào)試)試題及答案
- 湖南名校聯(lián)考聯(lián)合體2026屆高三年級1月聯(lián)考物理試卷+答案
- 《陸上風(fēng)電場工程可行性研究報告編制規(guī)程》(NB/T 31105-2016)
- 京瓷哲學(xué)手冊樣本
- 五年級簡便計算100題
- 三年級作文寫小狗海灘冬天童話故事
評論
0/150
提交評論