版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第 PAGE56 頁 共 NUMPAGES56 頁中國人民大學題庫答案詳解抽樣技術中 國 人 民 大 學 同等學力申請碩士學位課程考試試題 課程代碼:123105 課程名稱:抽樣技術與方法 試題卷號:1 名詞解釋 非概率抽樣 非概率抽樣又稱為非隨機抽樣,是調(diào)查者根據(jù)自己的方便或主觀判斷抽取樣本的方法,其最主要的特征是抽取樣本時并不依據(jù)隨機原則。包含有判斷選樣、方便抽樣、自愿樣本、配額抽樣等。最優(yōu)分配 在分層隨機抽樣中,對于給定的費用,使估計量的方差V(y(_)st)達到最小,或者對于給定的估計量方差V,使總費用達到最小的各層樣本量的分配,稱為最優(yōu)分配。PPS抽樣 是有放回的按規(guī)模大小成比例的概
2、率抽樣。其抽選樣本的方法有代碼法、拉希里方法等。PPS 抽樣是按概率比例抽樣,屬于概率抽樣中的一種。是指在多階段抽樣中,尤其是二階段抽樣中,初級抽樣單位被抽中的機率取決于其初級抽樣單位的規(guī)模大小,初級抽樣單位規(guī)模越大,被抽中的機會就越大,初級抽樣單位規(guī)模越小,被抽中的機率就越小。就是將總體按一種準確的標準劃分出容量不等的具有相同標志的單位在總體中不同比率分配的樣本量進行的抽樣。自加權樣本 指調(diào)查中每個樣本單元的設計權數(shù)是相同的,也就是說每個單元最終入樣的概率是相等的。在不考慮非抽樣誤差的情況下,可以認為自加權樣本完全代表總體,因為每個樣本單元都代表了總體中相同數(shù)目的單元。(此時可以使用標準統(tǒng)計
3、方法來進行點估計。此外,自加權樣本往往方差較小,樣本統(tǒng)計量更穩(wěn)?。┖喪鲱} 有人認為“抽樣調(diào)查除了調(diào)查誤差以外,還有抽樣誤差,因此抽樣調(diào)查不如全面調(diào)查準確”,請對此加以評價。一項調(diào)查的誤差來自多個方面,抽樣調(diào)查因為只調(diào)查總體中的一小部分,用部分的調(diào)查結(jié)果推斷總體,所以存在著抽樣誤差,但這只是所有誤差中的一部分。對于抽樣調(diào)查,誤差包括抽樣誤差和非抽樣誤差。有些情況下,全面調(diào)查由于參與的人員眾多、涉及范圍大,因此雖然沒有抽樣誤差,但在數(shù)據(jù)采集和數(shù)據(jù)匯總整理的過程中卻有產(chǎn)生其他誤差的更大可能性,所以調(diào)查規(guī)模并不是越大越好。與全面調(diào)查相比,抽樣調(diào)查的工作量小,這就為使用素質(zhì)較高的工作人員并對他們進行深入
4、的培訓創(chuàng)造了條件。此外,如果能對調(diào)查過程實施更為細致的監(jiān)督、檢查和指導,可以使抽樣調(diào)查所得到的數(shù)據(jù)質(zhì)量比同樣的全面調(diào)查數(shù)據(jù)質(zhì)量更高,從而使調(diào)查的總誤差更小。試對分層抽樣中的聯(lián)合比率估計和分別比率估計方法進行比較。如果每一層都滿足比率估計量有效的條件,則除非Rh=R,都有分別比率估計量的方差小于聯(lián)合比率估計量的方差。但當每層的樣本量不太大時,還是采用聯(lián)合比率估計量更可靠些,因為這時分別比率估計量的偏倚很大,從而使總的均方誤差增大。實際使用時,如果各層的樣本量都較大,且有理由認為各層的比率Rh差異較大,則分別比率估計優(yōu)于聯(lián)合比率估計。當各層的樣本量不大,或各層比率Rh差異很小,則聯(lián)合比率估計更好些
5、。此外,聯(lián)合比估計不像分別比那樣需要已知每層的輔助信息_h。計算題 某住宅區(qū)調(diào)查居民的用水情況,該區(qū)共有=1000戶,調(diào)查了=100戶,得y(_)=12.5噸,s2 =1252,有40戶用水超過了規(guī)定的標準。要求計算:(1)該住宅區(qū)總的用水量及95%的置信區(qū)間;(2)若要求估計的相對誤差不超過10%,應抽多少戶作為樣本? (3)以95%的可靠性估計超過用水標準的戶數(shù);(4)若認為估計用水超標戶的置信區(qū)間過寬,要求縮短一半應抽多少戶作為樣本? 【解】已知N=1000,n=100,f=nN=1001000 =0.1, y(_)=12.5, s2 =1252 (1)估計該住宅區(qū)總的用水量Y為:Y()
6、=Ny(_)=1000_12.5=12500噸 估計該住宅區(qū)總的用水量Y的方差和標準差為:V(Y()=N2v(y(_)=N21-fns2=10002_1-0.1100_1252=11268000 s(Y()=SQRT(v(Y()=11268000 3356.7842 因此,在95%的置信度下,該住宅總的用水量的置信區(qū)間估計為:Y()z0.025s(Y()=125001.96_3356.7842125006579 即,我們可以以95%的把握認為該住宅總的用水量在5921噸19079噸之間。(2)根據(jù)題意,要求估計的相對誤差不超過10%,即r0.1,假定置信度為95% 根據(jù)公式:n0=z2s2r2
7、y2=1.96212520.1212.523078 由于n0N=3.0780.05,所以需要對n0進行修正:n=n01+n0/N=30781+3.078755 若要求估計的相對誤差不超過10%,應抽不少于755戶作為樣本?;颍簄0=1/(1/N+d2/(z/22s2) 755 (d=ry(_)=1.25)(3)令超過用水標準的戶數(shù)為A,樣本中超過用水標準的戶數(shù)為a=40,估計超過用水標準的比例p為:p=a/n=40/100=40% 估計超過用水標準的比例p的方差和標準差為:v(p)=1-fn-1p(1-p)=1-0.1100-1_40%_60%0.002182 s(p)=v(p)=0.0021
8、824.67% 在95%的可靠性下,超過用水標準的比例p的估計區(qū)間為:pz0.025 s(p)=40%1.96_4.67% 因此,我們有95%的把握認為,超過用水標準的比例p在30.85%-49.15%之間,超過用水標準的戶數(shù)的點估計為:1000_40%=400戶,超過用水標準的戶數(shù)在1000_30.85%戶1000_49.15%戶之間,即309戶492戶之間?;颍簆z0.025(1-fn-1p(1-p)代入得(0.3089,0.4911) (4)若要置信區(qū)間的寬度縮小為原來一半,即要求應抽取的戶數(shù)n滿足方程 z0.0251-fn-1p(1-p) = 1/2 _z0.025v(p)0.0457
9、66代入數(shù)據(jù)解得 n=306.25306戶。為估計市區(qū)人均居住面積,按與各區(qū)人數(shù)呈比例的概率從12個區(qū)中抽了4個區(qū),經(jīng)調(diào)查的數(shù)據(jù)如下:樣本區(qū)號 區(qū)居住面積(米2)人口數(shù) 1 2835326 604746 2 1670996 456035 3 1835226 470981 4 2895058 585257 試對市區(qū)人均居住面積作點估計和置信度為95%的區(qū)間估計。2 名詞解釋 概率抽樣 也稱隨機抽樣,是指依據(jù)隨機原則,按照某種事先設計的程序,從總體中抽取部分單元的抽樣方法。(概率抽樣就是使總體中的每一個單位都有一個已知的、不為零的概率進入樣本的抽樣方法。)具體說來,概率抽樣具有以下幾個特點:(1)
10、按一定的概率以隨機原則抽取樣本。(2)每個單元被抽中的概率是已知的,或是可以計算出來的。(3)當用樣本對總體目標量進行估計時,要考慮到該樣本(或每個樣本單元)被抽中的概率。也就是說,估計量不僅與樣本單元的觀測值有關,也與其入樣概率有關。概率抽樣最主要的優(yōu)點是,可以依據(jù)調(diào)查結(jié)果計算抽樣誤差,從而得到對總體目標量進行推斷的可靠程度。從另一方面講,也可以按照要求的精確度,計算必要的樣本單元數(shù)目。因此,概率抽樣可以排除調(diào)查者的主觀影響,抽選出較其他方法更具代表性的樣本。事后分層 又稱抽樣后分層,是對一個總體先進行簡單隨機抽樣或系統(tǒng)抽樣,抽取一個樣本量為n的樣本然后對樣本中的單元按某些特征進行分層并進行
11、分層抽樣估計。PS抽樣 是不放回的與單元大小成比例的概率抽樣(該抽樣方法是在總體抽取樣本時,借助總體單元大小或規(guī)模(Mi)的輔助變量來確定單元入樣概率(Zi)或包含概率(i, ij)的方法)隨機化回答 在調(diào)查中當一個問題是敏感性的或高度私人機密性的,則就會發(fā)生拒絕回答或回避回答的情況。為了獲得對這類問題總體比例進行估計的資料,就需要采用隨機化的方式來獲取回答信息并進行估計的技術,我們稱之為隨機化回答。簡述題 什么是抽樣框?簡述抽樣框的類型和作用,以及良好抽樣框的標志??傮w的具體表現(xiàn)是抽樣框。通常,抽樣框是一份包含所有抽樣單元的,給每一個抽樣單元編上一個號碼,就可以按一定的隨機化程序進行抽樣。抽
12、樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號,以確定總體的抽樣范圍和結(jié)構(gòu)。設計出了抽樣框后,便可采用抽簽的方式或按照隨機數(shù)表來抽選必要的單位數(shù)。若沒有抽樣框,則不能計算樣本單位的概率,從而也就無法進行概率選樣。抽樣框有不同類型:名錄框(總體中所有單元實際的名錄清單,如在校學生、企業(yè)名冊、電話號碼簿等)、區(qū)域框(其單元由地理區(qū)域構(gòu)成的集合,抽樣總體由這些地理區(qū)域組成)、自然框(把相關的自然現(xiàn)象概念(如時間、距離等)作為抽樣框使用)。抽樣框?qū)Τ闃诱{(diào)查具有十分重要的作用。1)首先,抽樣框是代表總體進行抽樣的,抽樣框的缺陷會造成目標總體與調(diào)查總體不一致,在估計
13、中出現(xiàn)偏差;2)其次,抽樣框中的聯(lián)系資料是用來確定總體單元所在的位置和聯(lián)系地址的,如果出現(xiàn)錯誤,可能會產(chǎn)生無法聯(lián)系而造成無回答;3)抽樣框中的輔助資料可以用來進行分層等以改進抽樣設計或改進估計方法,以提高抽樣效率。因此完備的抽樣框是做好抽樣調(diào)查的前提條件。良好抽樣框的標志是具有充分的輔助信息、目標總體和抽樣總體完全重合,也就是目標總體單元和抽樣總體單元完全呈一一對應的關系。具體來講:1)關聯(lián)性,指抽樣框與目標總體的對應程度,要求兩者之間盡可能地關聯(lián);2)準確性,涵蓋誤差盡可能小,分類是否準確?聯(lián)系資料是否完整?輔助資料是否齊全等;3)時效性,抽樣框是否及時更新;4)最后還可以從建立抽樣框的費用
14、進行評估。對多階段抽樣中自加權的有關問題進行論述。由于不等概率抽樣往往不滿足自加權,因此在多階段抽樣中,最后一階按等概率(如SRS等)抽取最終單元(USU),其它階段采用PPS,且各階段樣本量對不同單元都等于常數(shù),則所得樣本是自加權的。計算題 從某農(nóng)村的20_戶中隨機等概率(無放回)抽取50戶,發(fā)現(xiàn)其中8戶有自行車,這8戶人數(shù)分別為3,5,3,4,7,4,4,5人。根據(jù)這一資料要求:(1)估計該村具有自行車的戶數(shù)及其估計精度;(2)估計該村具有自行車的總?cè)藬?shù)及其估計精度?!窘狻坑梢阎茫篘=20_,n=50,f=n/N=0.25總體中具有自行車戶數(shù)的比例為P (1)這次簡單隨機抽樣得到的P的估
15、計值=8/50=0.16,即具有自行車的戶數(shù)估計值Y()=Np=0.16_20_=32.所以總體比例P在95%情況下的置信區(qū)間可以寫為: pz0.025v(p) 其中v(p)=1-fn-1p(1-p) 0.002057,v(Y()=v(Np)=N2v(p)=82.28 故P的置信區(qū)間:0.161.96_0.002057=0.160.0889。所以戶數(shù)的置信區(qū)間為:20_(0.160.0889)即14,50 (2)有自行車家庭人數(shù)M,則n0=8, m(_)=1n018mi=4.375, 從而具有自行車的總?cè)藬?shù)估計值為M()=Y()m(_)=32_4.375=140。s2=1n0-11n0(mi-
16、m)21.696 則V(m(_)=1-fns2=1-0.258_1.696=0.159,因此V(M()=V(Y()m(_)=Y()2V(m(_)=322_0.159=162.816 s(M()=162.81613 某城市共有1000家餐館,分為大中小三層,現(xiàn)預估計在餐館就餐的人數(shù),采用抽樣調(diào)查,根據(jù)以往資料 層 Nh Sh2 中 300 2500 小 600 400 大 100 1000 (1)若欲估計就餐總?cè)藬?shù)的誤差不超過4000人,可靠性為95%,采用最優(yōu)分配應抽多少家餐館作為樣本(假設每層每戶的調(diào)查費用相等);(2)若不按比例抽樣在數(shù)據(jù)上比較復雜,其費用相當于調(diào)查50家餐館,因此從效益上
17、看改為按比例抽樣是否值得? 【解】根據(jù)如上表格按中、小、大依次分層:N1=300,N2=600,N3=100,N=1000,S12=2500,S22=400,S32=1000 (1)總?cè)藬?shù)絕對誤差限dy=4000,所以y(_)st的絕對誤差限為d=dy/N=4.W1=0.3,W2=0.6,W3=0.1考慮每層每戶調(diào)查費用相等,所以使用內(nèi)曼分配,從而抽取餐館數(shù):n=(1LWhSh)2d2(z/2)2+ 1N1LWhSh2 = (0.350+0.620+0.11000)2421.962+ 11000 (0.32500+0.6400+0.11000) 30.162324.165+1.09 173 即
18、應抽取173家餐館作為樣本。(2)如果采用比例分配,則 n0=1LWhSh2d2(z/2)2+ 1N1LWhSh2=0.3_2500+0.6_400+0.1_1000421.962+ 11000 (0.32500+0.6400+0.11000)10904.165+1.09207 由于n0-n=207-173=341,則所考慮的抽樣設計比比簡單隨機抽樣的效率低。deff對復雜抽樣時確定樣本量有很大作用,在一定精度條件下,簡單隨機抽樣所需的樣本量n比較容易得到,如果可以估計復雜抽樣的deff,那么復雜抽樣所需的樣本量為:n=n_deff 整群抽樣 將總體中若干個基本單元合并為組,這樣的組稱為群。抽
19、樣時直接抽取群,然后對中選群中的所有基本單元全部實施調(diào)查,這樣的抽樣方法稱為整群抽樣。沃納模型 沃納模型論及總體是簡單的二元總體,即總體中的每個單元或者屬于A類或者不屬于A類(即基于敏感特征設立兩個對立的問題),除此之外,別無他屬。我們向被調(diào)查人員提出兩個問題,要求其回答“是”或者“不是”,調(diào)查人員并不知道被調(diào)查者回答了哪個問題,只知道兩個問題被提出的概率為P和1-P,這樣就可以使被調(diào)查者確信其回答不會泄露本人隱私。簡述題 試述概率抽樣,非概率抽樣各自的特點、作用和局限。概率抽樣也稱隨機抽樣,是指依據(jù)隨機原則,按照某種事先設計的程序,從總體中抽取部分單元的抽樣方法。概率抽樣包括等概率抽樣(單元
20、之間被抽中的概率相等)與不等概率抽樣兩種。概率抽樣有幾個特點:1)按一定的概率以隨機原則抽取樣本。2)每個單元被抽中的概率是已知的,或是可以計算出來的。3)當用樣本對總體目標量進行估計時,要考慮到該樣本(或每個樣本單元)被抽中的概率。估計量不僅與樣本單元的觀測值有關,也與其入樣概率有關。概率抽樣的優(yōu)點:能得到總體目標量的估計值,并能計算出每個估計值的抽樣誤差,從而得到對總體目標量進行推斷的可靠程度。另外,也可以按照要求的精確度,計算必要的樣本單元數(shù)目。這兩大優(yōu)點為調(diào)查方案的評估提供了有力的依據(jù)。與非概率抽樣相比,概率抽樣比較復雜,對調(diào)查人員的專業(yè)技術要求高,調(diào)查費用較高,但其優(yōu)點是其他調(diào)查方法
21、無可替代的,所以概率抽樣成為抽樣調(diào)查中最主要的方式。非概率抽樣:抽取樣本時不依據(jù)隨機原則。常見的非概率抽樣方法有:判斷選樣(由調(diào)查人員人為確定樣本單元)、方便抽樣(例如“攔截式”調(diào)查,比較適合探索性研究)、自愿樣本(比如網(wǎng)上調(diào)查)、配額抽樣(將總體中的各單元按一定標準化分為若干類型,將樣本數(shù)額分配到各類型中,從各類型中抽取樣本的方法則沒有嚴格限制,一般采用方便抽樣的方法抽取樣本單元)。非概率抽樣的優(yōu)點是操作簡單,不需要抽樣框,經(jīng)濟、快速,調(diào)查數(shù)據(jù)的處理也容易,所以有廣闊的應用空間。非概率抽樣的局限是不能計算抽樣誤差,不能從概率的意義上控制誤差,樣本數(shù)據(jù)不能對總體情況進行推斷。同時由于抽取樣本時
22、具有較大的隨意性,從而導致被調(diào)查單元間存在系統(tǒng)性差異。簡述輔助信息在抽樣調(diào)查中的作用。在抽樣調(diào)查中,輔助信息可以用于抽樣的設計、目標量的估計,還可以用于調(diào)查數(shù)據(jù)的處理。1)抽樣設計:在抽樣設計階段,許多抽樣方法都需要利用輔助信息。如分層抽樣需要利用輔助信息進行分層,把總體各單元按相應規(guī)則分到各個層中。好的分層應該做到去定合理的層數(shù)、層界,單元應該分別歸屬于哪層,每層樣本量多少等(如不等概抽樣中單元規(guī)模這個輔助信息)。可以說,進行任何抽樣設計都需要輔助信息,抽樣框是輔助信息集中的體現(xiàn),輔助信息內(nèi)容越多、質(zhì)量越高,就為進行良好的抽樣設計提供更多更好的素材,具有充分的輔助信息也是良好抽樣框的重要標志
23、。(有些輔助信息在抽樣前不知道,事后分層等)2)估計:在抽樣估計階段(即估計量設計階段),可以利用輔助信息改進估計方法,提高估計的精度,這一點在比率估計和回歸估計中表現(xiàn)明顯(舉例,如比率估計等引入輔助變量_;事后分層等)3)關于數(shù)據(jù)調(diào)整:一個是對入樣單元進行權數(shù)的計算和調(diào)整;另一個是利用輔助信息減小調(diào)查中無回答的偏差,提高了估計的精度。(如調(diào)查中男女比率差異,按性別輔助信息引入分層等)計算題 為了解某小區(qū)住戶的平均月支出(單位:元),在7000戶家庭中按不放回簡單隨機抽樣抽出20_戶進行調(diào)查,并得到樣本均值y(_)=1800,樣本方差s2=640000。(1)試估計該小區(qū)住戶的平均月支出,并給
24、出95%置信度下的區(qū)間估計。(2)若要求估計的相對誤差不超過10%,則需抽出多少戶家庭進行調(diào)查? _640000 3108.576 95%置信度下的區(qū)間估計為:y(_)z0.025v(y) = 18001.96_3108.576 = 1800109.28 因此區(qū)間估計為:1690.72, 1909.28 (2)n0= z0.0252 _s2/(r2y(_)2) = 1.9626400000.1218002 = 2388381.1123232400 75.88 則需抽取76戶家庭進行調(diào)查。有下列數(shù)據(jù) 層 Wh y(_)h sh ph 1 0.35 3.1 2 0.54 2 0.55 3.9 3.
25、3 0.39 3 0.1 7.8 11.3 0.24 設n=1000 (1)采用按比例分層抽樣的方法估計Y(_)和P并計算其標準誤;(2)采用奈曼分配的方法估計Y(_)和P并計算標準誤;(3)將按比例分配和奈曼分配與簡單隨機抽樣相比能提高效率多少?!窘狻?(1)根據(jù)題中已知條件,采用按比例分層抽樣的方法估計Y(_)為:Y=y(_)prop=1LWhyh=0.35_3.1+0.55_3.9+0.1_7.8=4.01 估計Y(_)的方差和標準誤差為 :vprop(y(_)st)=1-fnSw2=1-fn1LWhSh211000(0.35_22+0.55_3.32+0.1_11.32)0.020_8
26、5 sprop(y(_)st)=v(yst)=0.020_850.141981 估計P及其方差和標準誤差為:pprop=1LWhph=0.35_0.54+0.55_0.39+0.1_0.24=0.4275 v(pprop)1-fn1LWhphqh11000(0.35_0.54_0.46+0.55_0.39_0.61+0.1_0.24_0.76)0.000218 s(pprop)=v(pprop)=0.0002180.014765 (2)采用Neyman分配的方法估計Y(_)和P的方法和與(1)是一樣的,即 Y=y(_)st=1LWhyh=0.35_3.1+0.55_3.9+0.1_7.8=4.
27、01 pprop=1LWhph=0.35_0.54+0.55_0.39+0.1_0.24=0.4275 但是采用Neyman分配估計Y(_)和P的方差的方法不同,分別為:v(y(_)st)=1n(1LWhSh) 2 - 1N1LWhSh211000(0.35_2+0.55_3.3+0.1_11.3)20.013286 s(y(_)st)=v(yst)=0.0132860.115265 v(pst)1n(1LWhphqh)2=11000(0.35_0.540.46 + 0.55_0.390.61 + 0.1_0.240.76)0.000236 s(pst)=v(pprop)=0.000236=0
28、.015362 (3)由于Vsrs(y(_)=1-fnS211000(1LWhSh2+1LWh(Yh-Y)2)0.020_85+0.0017329=0.0218914 比例分配的設計效應為deffprop= v(y(_)prop)/ Vsrs(y(_)=0.020_850.02189140.9208,所以與簡單隨機抽樣相比比例分配能提高效率1-deffprop=7.92%;內(nèi)曼分配的設計效應為deffopt= v(y(_)st)/ Vsrs(y(_)=0.0132860.02189140.6069,所以與簡單隨機抽樣相比內(nèi)曼分配能提高效率1-deffopt=39.31%.試題卷號:4 名詞解釋
29、 目標總體和抽樣總體 目標總體也可簡稱為總體,是指所有研究對象的總體,或者是研究人員希望從中獲取信息的總體,它是研究對象中所有性質(zhì)相同的個體所組成。抽樣總體是指從中抽取樣本的總體。通常情況下,抽樣總體應該與目標總體完全一致,但實踐中兩者不一致的情況卻時常發(fā)生。分層抽樣 也叫類型抽樣法,是將抽樣單元按某種特征或某種規(guī)則劃分為不同的層,然后從不同的層中獨立、隨機地抽取樣本將各層的樣本結(jié)合起來,對總體的目標量進行估計。交叉子樣本 在抽樣時,對同一個總體按照同樣的抽樣方法,獨立或非獨立地來進行兩個或兩個以上樣本的抽取,并使得每個子樣本對總體參數(shù)都提供一個有用的估計,則被抽取的子樣本稱為交叉子樣本。交叉
30、子樣本方法最早是由印度統(tǒng)計學家馬哈拉諾比斯(P.C.Mahalanobis,193_年)所提出,最初用于總體參數(shù)的估計,以后擴大應用于抽樣和非抽樣誤差的估計。逆抽樣方法 針對樣本中含有稀少項目很少或沒有(設比例為P)的情況(調(diào)查產(chǎn)生比較大的偏差),事先根據(jù)調(diào)查精度和成本的要求,制定出樣本中出現(xiàn)稀少項目的單元個數(shù)為n,然后一個一個地隨機抽取樣本直到樣本中具有這種屬性的單元個數(shù)為n為止,然后對樣本容量_的分布及P的估計的方法。簡述題 說明總體方差和估計量方差各自的作用,以及它們之間的相互關系??傮w方差是未知的,但是確定存在的。估計量方差可以由樣本數(shù)據(jù)計算出來,但只是總體的近似反映,未必等于真實值。
31、試述隨機化回答技術作用、特點,談談你對隨機化回答技術的理解。在調(diào)查中當一個問題是敏感性的或高度私人機密性的,則就會發(fā)生拒絕回答或回避回答的情況。為了獲得對這類問題總體比例進行估計的資料,就需要采用隨機化回答技術。其基本特點是1)被調(diào)查者對所調(diào)查的問題采取隨機回答的方式,調(diào)查人員無法從被調(diào)查者的回答中得知對方是否具有某種特征。這樣,就可以在一定程度上消除被調(diào)查者的擔心和顧慮,使他們參與調(diào)查,并提供真實情況。2)另一方面,調(diào)查人員通過對所有調(diào)查結(jié)果的匯總。利用概率原理進行推算,又可以得到總體中具有該特征人數(shù)比例的估計值,從而實現(xiàn)調(diào)查的目的。因而,隨機化回答技術被認為是對敏感性問題進行調(diào)查,并對總體
32、的特征比例進行數(shù)量推算的有效方法。個人對隨機化回答技術有如下理解:1)從理論上講,隨機化回答技術既可以用于訪問調(diào)查,也可以用于郵寄問卷等其他方式的調(diào)查。但是,隨機化回答問卷的設計比其他一般性調(diào)查問卷的設計要復雜。例如,在郵寄問卷調(diào)查中,被調(diào)查者很可能因為看不懂問卷而不知如何回答,在訪問調(diào)查中,調(diào)查人員可以詳細地向被調(diào)查者說明隨機化回答技術的原理,并講解如何回答這種類型的問卷,必要時還可以進行示范,幫助被調(diào)查者理解和掌握。所以,與其他調(diào)查方法相比,訪問調(diào)查在使用隨機化回答技術方面有更多的便利條件。2) 傳統(tǒng)的隨機化回答技術(如Warner)都是針對單變量數(shù)據(jù)的,其主要目的是為了獲得具有敏感特性回
33、答的概率估計。然而,被調(diào)查者的輔助信息卻在一些情況下格外有用,以至于可以將其與肯定回答相聯(lián)系。Maddala( 1983)以及Scheers和Dayton (1988)便將這些帶有輔助信息的解釋變量納入隨機化回答模型中。其優(yōu)點在于可以減少標準誤差,并可以確立協(xié)變量信息與敏感特性的總體概率之間關系。傳統(tǒng)的隨機化回答模型的另一個主要缺點是只能獲得與總體水平有關的結(jié)論總體概率的估計和相關置信區(qū)間。這與當時僅對單變量數(shù)據(jù)進行相關與無關隨機化回答方法的發(fā)展目的一致,但卻不能滿足于調(diào)查者對單位水平參數(shù)的研究,這也導致無法對一些產(chǎn)生敏感特性的原因進行剖析。此外在具體設計與操作上應該注意:1)要使被調(diào)查者充分
34、理解這種方法的特點,特別是一定要讓被調(diào)查者明白,他究竟回答的是哪一個問題,別人是不知道的,因此在正式抽取并回答問題前,要讓被調(diào)查者作幾次試驗;2)所提問題必須簡單明了,防止有不同的理解。3)在應用西蒙斯模型時,無關問題的選擇特別重要。一定要隱蔽性強的,即調(diào)查人無從猜測被調(diào)查人對該問題回答的答案。計算題 有下列數(shù)據(jù) 層 Nh Sh Y(_)h 1 60 2 3 2 30 4 5 3 10 15 12 現(xiàn)令n=40,要求 (1)樣本在各層中進行的按比例分配;(2)樣本在各層中進行的最優(yōu)分配;(3)計算最優(yōu)分配較按比例分配的得益;(4)計算按比例分配較簡單隨機抽樣的得益。【解】由已知得:L=3,n=
35、40,N=1LNh=100, f=n/N=40/100=0.4 (1)由nh=nNh/N=Nhf 得n1=0.4_60=24, n2=0.4_30=12, n3=0.4_10=4, Vprop(y(_)st)= 1-fnSw2=1-fn1LWhSh2=1-0.440_(0.6_4+0.3_16+0.1_225)=0.4455 (2)由內(nèi)曼分配nh= NhSh1LNhSh _n,代入得1LNhSh=60_2+30_4+10_15=390 n1=120390_40 12.30 12 n2=120390_40 12.30 12 n3=150390_40 15.38 15 Vopt(y(_)st)=1
36、n(1LWhSh)2-1N1LWhSh2= 140_(0.6_2+0.3_4+0.1_15)2-1100_(0.6_4+0.3_16+0.1_225)= 0.38025-0.297=0.08325 (3)由1,2得最優(yōu)分配較按比例分配的得益為1- Vopt(y(_)st)/ Vprop(y(_)st)=1-0.083250.445581.31% (4)由于S21LWhSh2+1LWh(Yh-Y)2,y(_)= 1LWhyh=(0.6_3+0.3_5+0.1_12)=4.5從而簡單隨機抽樣方差 Vsrs(y(_)st)=1-fnS2=1-fn1LWhSh2+1-fn1LWh(Yh-Y)2= Vp
37、rop(y(_)st)+ 1-fn1LWh(Yh-Y)2 =0.4455+1-0.440_(0.6_1.52+0.3_0.52+0.1_7.52)= 0.4455+0.10575=0.55125 按比例分配較簡單隨機抽樣的得益為:1- Vprop(y(_)st)/ Vsrs(y(_)st)=19.18% 要調(diào)查學生對某課程的興趣問題,設我們將問題陳述為“我對該課程感興趣”和“我對該課程不感興趣”,對此問題我們采用沃納模型處理,預先設定P=4/5,在接受調(diào)查并作出明確回答的320人中(假定被調(diào)查者如實回答問題),結(jié)果統(tǒng)計出回答“是”的人數(shù)為156人,請估計對該課程感興趣學生比例的置信區(qū)間?!窘狻?/p>
38、按Warner模型,我們假定(p:卡片A的比例;1-p:卡片B的比例;n:樣本量;n1:回答是的人數(shù);n2:回答否的人數(shù);A:總體中具有卡片A特征的人數(shù)的比例;)由已知得P=4/5, n=320,則 點估計式:()A= 12P-1(n1n) (1-P2P-1) = 53_156320 - 15_53=1316-13=2348 0.4792 A的方差估計量:V()A)= ()A (1-()A)/n + P(1-P)n(2P-1)2 0.000780+0.001389 = 0.002169 從而95%的區(qū)間估計式為()AZ0.0250.002169 = ()A1.96_0.002169= 0.47
39、920.09128,因此該比例的置信區(qū)間為0.3879,0.5705 試題卷號:5 名詞解釋 抽樣框 抽樣框又稱“抽樣框架”、“抽樣結(jié)構(gòu)”,是指對可以選擇作為樣本的總體單位列出名冊或排序編號,以確定總體的抽樣范圍和結(jié)構(gòu)。設計出了抽樣框后,便可采用抽簽的方式或按照隨機數(shù)表來抽選必要的單位數(shù)。若沒有抽樣框,則不能計算樣本單位的概率,從而也就無法進行概率選樣。比例分配 在分層抽樣中,若每層的樣本量nh都與層的大小Nh成比例,即nhNh = nN 或記為fh=f,h=1,2,L 則稱樣本量的這種分配方式為比例分配。(比例分配的分層抽樣是一種等概率抽樣)系統(tǒng)抽樣 將總體中的所有單元(抽樣單元)按一定順序
40、排列,在規(guī)定的范圍內(nèi)隨機抽取一個單元作為初始單元,然后按事先規(guī)定好的規(guī)則確定其他樣本單元,這種抽樣方法稱為系統(tǒng)抽樣。(典型的系統(tǒng)抽樣是先從數(shù)字1k中隨機抽取一個數(shù)字r作為初始單元,以后依次取第r+k,r+2k,單元。)西蒙斯模型 是1967年由西蒙斯(Simmons)提出的。其設計思想仍是基于沃納的相關問題隨機化選答的思想,只是在設計中,改用無關的問題代替了沃納模型中的敏感性問題的對立問題。通常選用與敏感性問題無關并且容易獲得的樣本特點作為無關問題進行提問(如生日、性別等)。比傳統(tǒng)的去敏感化技術更具有保密性,因此更容易獲得調(diào)查者的配合,適宜于調(diào)查敏感性程度很高的問題。簡述題 什么是樣本量?試對
41、影響樣本量的因素進行分析p 。樣本量又稱“樣本容量”,指一個樣本的必要抽樣單位數(shù)目。在組織抽樣調(diào)查時,抽樣誤差的大小直接影響樣本指標代表性的大小,而必要的樣本單位數(shù)目是保證抽樣誤差不超過某一給定范圍的重要因素之一。(樣本量直接影響抽樣誤差、調(diào)查的費用、調(diào)查所需的時間、調(diào)查訪員的數(shù)量以及其他一些重要的現(xiàn)場操作的限制條件。樣本量過大,會造成人力、物力和財力的浪費;樣本量過小,會造成抽樣誤差增大,影響抽樣推斷的可靠程度。)因此,在抽樣設計時,必須決定樣本單位數(shù)目,因為適當?shù)臉颖締挝粩?shù)目是保證樣本指標具有充分代表性的基本前提。影響樣本容量的因素:研究目的、個體變異、檢驗水準、對精確度的要求、(把握度/
42、置信度)等。具體描述為:1)抽樣推斷的可靠程度。要求推斷的可靠程度越高,概率度的數(shù)值越大,抽樣單位數(shù)也就要求多些;反之,則可少抽一些。2)總體標志變異程度。方差大,需要多抽一些;方差小,可少抽一些。3)極限誤差的大小。極限誤差大可以少抽些,極限誤差小則應多抽些。4)抽樣方法與組織方式。在相同條件下,重復抽樣需要多抽一些,不重復抽樣可少抽一些。5)實際調(diào)查運作的限制(人力、物力和財力的可能條件)。客戶提供的經(jīng)費能支持多大的樣本?調(diào)查持續(xù)的時間有多長?需要多少訪員?能招聘到的訪員有多少? 在確定調(diào)查最終所需的樣本量時,還必須考慮樣本量計算統(tǒng)計科普公式?jīng)]有涉及到的這些限制。試述在什么情況下需要采用不
43、等概率抽樣,并舉例說明。不等概抽樣適用于如下情況:1)抽樣單元在總體中所占的地位不一致。例如,對某市商業(yè)銷售額進行調(diào)查時,以商場為抽樣單元。雖然大型或特大型的商場數(shù)量不多,但占總銷售額的份額較大;而小商店數(shù)量多,市場份額卻不大。對于這種情況,將大型商場和小商店同等對待并不合理;另外,由于規(guī)模和管理水平的原因,對大型商場的調(diào)查往往比較容易,可以做得細致一些,而對小商店的調(diào)查往往比較困難,也沒有必要對占市場份額不大的這部分單元花太大的精力做過多的調(diào)查,因此在調(diào)查時,大型商場應該處于更重要的地位。2)調(diào)查的總體單元與抽樣總體的單元不一致。例如某大型單位準備對職工家庭情況進行調(diào)查,一種自然的辦法是以人
44、事部門的職工花名冊作為抽樣框進行抽樣,該單位中的少數(shù)家庭有兩名職工在該單位工作,如果對職工進行簡單隨機抽樣,則雙職工家庭被抽中的概率大,而調(diào)查者希望對家庭進行等概率抽樣。除了對抽樣框進行整理,將雙職工家庭中的一名成員從抽樣框中剔除,還可以對職工采用不等概抽樣,一種做法是對每名職工記錄其家庭成員在該單元工作的人數(shù),然后對每名職工按與人數(shù)成反比的概率進行抽樣。3)改善估計量。不等概抽樣可用于對估計量進行改善,例如簡單隨機抽樣比率估計量是漸進無偏的,要使其成為無偏估計,只要每個大小為n的樣本被抽中的概率與其輔助變量的和1n_i成比例(例如水野法),這時的比率估計量就是無偏估計量,這個樣本并不是簡單隨
45、機樣本而是一個不等概抽樣獲得的樣本。不等概抽樣除了應用于上述幾種情況,還廣泛應用于整群抽樣、多階段抽樣中初級單元規(guī)模相差較大的情形。不等概抽樣的優(yōu)點主要是大大提高了估計精度,但使用它有前提條件,即必須要有說明每個單元規(guī)模大小的輔助變量來確定每個單元入樣的概率,這在抽樣設計及估計時都是必須的。計算題 某住宅區(qū)調(diào)查居民的用水 某鎮(zhèn)在20_0戶家庭中隨機抽選36戶家庭調(diào)查生活費用支出,以y表示食物支出費用,_表示總支出費用,得恩格爾系數(shù)(食物支出在總支出中所占的比例),r=y(_)/_(_)=41.7%,y與_的樣本變異系數(shù)分別是cy=0.09,c_=0.085,y與_的相關系數(shù)()=0.79,給定
46、置信度95%,求恩格爾系數(shù)的區(qū)間估計?!窘狻坑梢阎茫簉=0.417,cy=0.09,c_=0.085, ()=0.79,N=20_0,n=36,f=n/N=36/20_0=0.018 V(R()=V(r)1-fnr2(c_2+cy2-2cyc_)=1-0.018360.4172(0.092+0.0852-20.790.090.085) 0.00001536 從而恩格爾系數(shù)95%置信度的區(qū)間估計為:rz0.025V(r)=0.4171.96_0.00001536 即0.4093, 0.5478 試題卷號:6 名詞解釋 總體參數(shù) 描述總體特性的指標稱為總體參數(shù),簡稱參數(shù)??傮w的均值、方差等都是總
47、體參數(shù)。(總體參數(shù)4種類型總體均值、總體總值、總體比例、總體比率等)內(nèi)曼分配 分層隨機抽樣中,各層中每個單位費用一樣(即Ch=C)時樣本單位的最優(yōu)分配方法。設nh為各層的樣本含量,Nh為h層單位總數(shù),Sh為h層標準差,n為樣本總含量(固定),內(nèi)曼(Neyman)1934年證明,當nh=nNhSh/ hNhSh 時,這種分配為最優(yōu)分配即V(y(_)st) 達到最小值。不等概抽樣 不等概率抽樣是指在抽取樣本之前給總體的每一個單元賦予一定的被抽中概率(最常用的是按總體單元的規(guī)模大小來確定抽選的概率)。不等概率抽樣分為放回與不放回兩種情況。直線等距抽樣 假設總體單元數(shù)為N,樣本容量為n,N=nk,且總
48、體中的N個單元已按某種確定順序編號為1,2,N。抽樣程序是先從k個單元編號中隨機抽出一個單元編號,然后每隔k個單元編號抽出一個單元編號,直到抽出n個單元編號為止,則這種等距抽樣稱為直線等距抽樣。簡述題 什么是不完備抽樣框,列舉各種可能出現(xiàn)的情況以及對抽樣推斷的影響。不完備抽樣框是指抽樣框中包含的單元與目標總體的單元不一致,例如屬于調(diào)查對象的單元在抽樣框中不存在,不屬于調(diào)查對象的單元卻出現(xiàn)在抽樣框中。不完善抽樣框還包括這樣的情況,抽樣框中的輔助信息與現(xiàn)實情況嚴重偏離,造成樣本抽取的誤導。使用不完善的抽樣框是產(chǎn)生非抽樣誤差的一個重要原因??赡艿那闆r及影響包含:1)丟失目標總體單元。指抽樣框沒能覆蓋
49、所有總體單元。丟失單元會造成總量估計偏低,也會造成均值(或比例)估計的偏差。2)包含非目標總體單元。指抽樣框中包含一些本不屬于調(diào)查對象的非目標總體單元。包含非目標單元使得抽樣總體單元個數(shù)大于目標總體單元個數(shù),造成總量估計偏高。3)復合聯(lián)結(jié)。指抽樣框中的單元與目標總體單元不完全呈一一對應關系,一個抽樣框單元聯(lián)結(jié)多個目標單元的情形,或一個目標單元聯(lián)結(jié)多個抽樣框單元。如果復合聯(lián)結(jié)的情況嚴重,將會造成樣本的實際抽取與設計要求發(fā)生偏離,從而對估計結(jié)果產(chǎn)生影響。4)不正確的輔助信息。有些抽樣設計需要抽樣框提供輔助信息,如分層抽樣、不等概抽樣、比率估計和回歸估計等。如果這些輔助信息不完全或不正確,不僅不能提
50、高估計的效率,有時反而會降低估計的準確性。試述抽樣調(diào)查中產(chǎn)生偏差的原因以及如何對待這些偏差。抽樣調(diào)查中產(chǎn)生偏差的原因主要有抽樣誤差(隨機誤差)及非抽樣誤差(或系統(tǒng)性誤差)兩大類。前者是由樣本結(jié)構(gòu)與總體結(jié)構(gòu)的隨機差異而導致產(chǎn)生的,它雖然不可避免,但可以用公式計算,其大小可以通過調(diào)整樣本容量或改變抽樣方式加以控制。后者按來性質(zhì)不同分為三種:1)抽樣框誤差:即由不完善的抽樣框引起的誤差。首先把握抽樣框誤差的類型,在此基礎上探討減少抽樣框誤差的途徑。對不完善抽樣框進行補救大致分為三種類型:第一種利用核查或其它有關資料,掌握誤差情況,對不完善的抽樣框進行調(diào)整,或?qū)Σ煌晟瞥闃涌蛩玫墓烙嬃窟M行調(diào)整;第二種
51、是事先制定一些規(guī)則,對發(fā)現(xiàn)的抽樣框問題進行現(xiàn)場處理;第三種是使用多個抽樣框進行抽樣。2)無回答誤差:即由于種種原因沒有從被調(diào)查單元獲得調(diào)查結(jié)果,造成調(diào)查數(shù)據(jù)缺失??梢圆捎么胧┯校簡柧碓O計具有吸引力,引起被調(diào)查者參與的興趣;充分利用調(diào)查組織者的權威性和社會影響力,激發(fā)被調(diào)查者的參與意識;確定準確的調(diào)查方位;采取有助于消除被調(diào)查者冷漠、擔心或懷疑的措施(如預先通知、調(diào)查前解釋說明等);注意調(diào)查人員挑選;做好調(diào)查人員培訓,增強調(diào)查人員責任心;注意調(diào)查過程的監(jiān)控;獎勵措施;再次調(diào)查;替換被調(diào)查單元。此外,盡量避免敏感問題的調(diào)查,如無法避免,可采用隨機化回答技術(如Warner、Simons模型等)。對
52、無回答數(shù)據(jù)采用再抽樣調(diào)查、加權調(diào)整、相關推估法、插補調(diào)整等方式進行數(shù)據(jù)調(diào)整。3)計量誤差:即所獲得的調(diào)查數(shù)據(jù)與其真值之間不一致造成的誤差。減少計量誤差需要對調(diào)查全過程進行質(zhì)量控制。包含有調(diào)查設計方面(設計出更好的調(diào)查問卷和抽樣程序);現(xiàn)場準備方面(招聘訪問員、培訓訪問員、編寫調(diào)查手冊);調(diào)查結(jié)果審核方面(有效性審核、一致性審核、數(shù)據(jù)分布審核,審核工作可以在搜集數(shù)據(jù)、數(shù)據(jù)搜集完畢后(重點在一致性審核和離群值的檢測)等任何階段進行)計算題 從某農(nóng)村的20_戶 有下列總體分為三層 層 各單元標志值 1 2 4 5 5 6 8 2 8 8 10 14 14 18 3 16 16 16 18 22 26
53、 令n=10,設各層中每單元的費用相等。(1)按最優(yōu)分配抽取樣本計算y(_)st及v(y(_)st);(2)計算Deff因子;(3)若達到以上同樣的精度采用簡單隨機抽樣的樣本量應為多少? 【解】由已知得N=18,n=10, L=3,W1,2,3=6/18=1/3,Y(_)1=5,Y(_)2=12,Y(_)3=19,S12=4,S22=16,S32=17.2,f=10/18=0.556 (1)由于W相同,所以nk=nSh/1LShnSh10.147 從而n1=10_2/10.1471.972 n2=10_4/10.1473.944 n3=10_17.2/10.1474.084 y(_)st=1L
54、WhYh = (5+12+19)/3=12 V(y(_)st)=1n(1LWhSh)2-1N1LWhSh2 = 10.1472/90-(4+16+17.2)/540.4551 (2)由1得S2=1N-11N(Yi-Y)2 = 117 _774 45.53 Deff = Var(y(_)st)/(1-f)S2/n) = 0.455110(1-0.556)45.53 0.225 (3)設簡單隨機抽樣的樣本量為n,則n=n.deff,因此 n=n/deff=10/0.22544.44即簡單隨機抽樣的樣本量應為44. 試題卷號:7 名詞解釋 統(tǒng)計量 統(tǒng)計量是統(tǒng)計理論中用來對數(shù)據(jù)進行分析p 、檢驗的變量
55、。統(tǒng)計量根據(jù)樣本的n個單元值計算出一個量,也叫估計量,用于對總體參數(shù)的估計。(與總體參數(shù)相對應,常用估計量有均值估計、總值估計、比例估計、比率估計等)目錄抽樣 是全面調(diào)查和抽樣調(diào)查相結(jié)合的一種新型的調(diào)查方法,也可以說是一種特殊的分層抽樣。目錄抽樣是一種對高度偏斜總體(總體次數(shù)分布呈高度偏態(tài)分布,總體內(nèi)部差異較大,由指標值較大而數(shù)目較少單位(通常稱為重點單位)和指標值較小而數(shù)目較多單位兩部分組成)實施抽樣調(diào)查的有效方法。目錄抽樣主張按上述兩部分分為兩層,少數(shù)指標值較大單位構(gòu)成重點單位層,大量指標值較小單位構(gòu)成抽樣調(diào)查層。前者進行全面調(diào)查,后者進行抽樣調(diào)查,最后綜合使用兩層的調(diào)查結(jié)果給出總體目標量
56、的估計。循環(huán)等距抽樣 假設總體單元數(shù)為N,樣本容量為n,Nnk,總體中的N個單元已按某種確定順序編號為1,2,N,如將這些編號看成首尾相連的一個環(huán),并從1到N中按簡單隨機抽樣方式抽取一個單元編號作為隨機起點r,然后每隔k抽取一個單元編號,直到抽滿n個單元為止,則這種等距抽樣稱為循環(huán)等距抽樣,又稱圓形等距抽樣。隨機化回答 簡述題 介紹簡單隨機抽樣,包括特點,作用和應用場合。簡單隨機抽樣也稱為單純隨機抽樣、純隨機抽樣、SRS抽樣 ,是指從總體N個單位中任意抽取n個單位作為樣本使每個可能的樣本被抽中的概率相等的一種抽樣方式。簡單隨機抽樣的特點是:每個樣本單位被抽中的概率相等,樣本的每個單位完全獨立,
57、彼此間無一定的關聯(lián)性和排斥性。(1)簡單隨機抽樣要求被抽取的樣本的總體個數(shù)N是有限的。(2)簡單隨機樣本數(shù)n小于等于樣本總體的個數(shù)N。(3)簡單隨機樣本是從總體中逐個抽取的。(4)簡單隨機抽樣是一種不放回的抽樣。(5)系統(tǒng)抽樣的每個單元入樣的可能性均為n/N。簡單隨機抽樣具有一定局限性:1、事先要把研究對象編號,比較費時、費力。2、總體分布較為分散,會使抽取的樣本的分布也比較分散,給研究帶來困難 3、當樣本容量較小時,可能發(fā)生偏向,影響樣本的代表性。4、當已知研究對象的某種特征將直接影響研究結(jié)果時,要想對其加以控制,就不能采用簡單隨機取樣法。簡單隨機抽樣(Simple random sling
58、)是其它抽樣方法的基礎,因為它在理論上最容易處理,而且當總體單位數(shù)N不太大時,實施起來并不困難。但在實際中,若N相當大時,簡單隨機抽樣就不是很容易辦到的。首先它要求有一個包含全部N個單位的抽樣框;其次用這種抽樣得到的樣本單位較為分散,調(diào)查不容易實施。因此,在實際中直接采用簡單隨機抽樣的并不多。通常適用于總體個數(shù)較少的情況。對多階段抽樣中自加權 計算題 為了解某小區(qū)住戶 調(diào)查某條街的居民居住條件,從該街道的100個居民小組隨機抽取了8個居民小組,取得以下數(shù)據(jù) 樣本居民小組 1 2 3 4 5 6 7 8 居民數(shù) 40 39 12 52 37 33 41 14 房間數(shù) 58 72 26 98 74
59、 57 76 48 要求:(1)估計平均每個居民擁有的房間數(shù)并計算估計精度;(2)該條街共有多少房間及其估計的精度;說明你上述使用的估計量是有偏的還是無偏的。【解】由已知設房間數(shù)為Y,居民數(shù)為_,n=8,N=100,f=n/N=0.08,_(_)=33.5,y(_)=63.625 (1)平均每個居民擁有的房間數(shù)估計值為R()=r=1nyi1n_i=509/2681.90 V(R()=V(r)1_21-fn1n-11n(Yi-R_i)2=134.62521-0.08818-158-1.9402+72-1.9392+26-1.9122+98-1.9522+74-1.9372+57-1.9332+7
60、6-1.9412+(48-1.914)2 0.0008208 從而95%置信度下區(qū)間估計為1.901.96_0.0008208,即1.844,1.956 (2)Y()=Ny(_)=Nn1nyi=12.5_(58+72+26+98+74+57+76+48)=6362.5 V(Y()=N21-fn1n-11n(yi-y)2 10000_0.928_17_3247.875 533579.4643 從而95%置信度下區(qū)間估計為6362.51.96_533579.4643,即4930.79,7794.21 由于使用了有偏(漸進無偏)的比率估計,因此上述使用的估計量是有偏的。試題卷號:8 名詞解釋 估計量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 31455.5-2025快速公交(BRT)智能系統(tǒng)第5部分:調(diào)度中心與車載智能終端通信數(shù)據(jù)接口規(guī)范
- 2026屆高三物理二輪復習課件:專題四 計算題培優(yōu)練7 電磁感應中的綜合問題
- 快看宣傳活動策劃方案(3篇)
- 電梯改造項目現(xiàn)場管理制度(3篇)
- 礦井機電修理管理制度范文(3篇)
- 補胎店員工管理制度表(3篇)
- 郵政行業(yè)統(tǒng)計報表管理制度(3篇)
- 銀行的管理制度怎么查看(3篇)
- 高處吊籃維護保養(yǎng)管理制度(3篇)
- 《GAT 1393-2017信息安全技術 主機安全加固系統(tǒng)安全技術要求》專題研究報告
- 鼻竇炎的護理講課課件
- 腸系膜脂膜炎CT診斷
- 體外膜肺氧合技術ECMO培訓課件
- 老年醫(yī)院重點??平ㄔO方案
- 銀行解封協(xié)議書模板
- 超星爾雅學習通《學術規(guī)范與學術倫理(華東師范大學)》2025章節(jié)測試附答案
- GB 17440-2025糧食加工、儲運系統(tǒng)粉塵防爆安全規(guī)范
- 《綠色農(nóng)產(chǎn)品認證》課件
- 衛(wèi)生院、社區(qū)衛(wèi)生服務中心《死亡醫(yī)學證明書》領用、發(fā)放、管理制度
- 《金融科技概論》完整全套課件
- 康復治療技術歷年真題單選題100道及答案
評論
0/150
提交評論