版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
打開幾扇窗戶看世界
----如何做抽樣設計
1/1/20231知識目錄抽樣過程與選擇抽樣方法抽樣的基本條件*(選講)抽樣誤差抽樣容量1/1/20232目錄抽樣過程與選擇抽樣方法抽樣條件抽樣誤差案例研究1/1/20233提問:生活中個人決策使用小樣本例子?1/1/20234名詞庫:抽樣的專有名詞概念母體:研究調查對象?;締挝唬耗阁w中的個別單位。樣本:母體的一部分。參數(shù):母體某一屬性或變量數(shù)值。統(tǒng)計量:根據(jù)樣本數(shù)據(jù)求得,用以估計參數(shù)的數(shù)值抽樣框:可得之抽樣單位名冊。抽樣偏誤:抽到特殊特征之單位。抽樣誤差:減損樣本代表性。1/1/20235Lapin1978
(一)經(jīng)濟性(二)時效性(三)母體過大(四)母體中某些基本單位難以接觸(五)破壞性調查(六)正確性抽樣的原因1/1/20236抽樣的過程定義同質總體選擇資料收集方法購置抽樣框選擇抽樣方法決定樣本量建立和詳細選擇樣本的可操作性計劃執(zhí)行可操作性的樣本計劃評估抽樣結果1/1/20237二、抽樣框(Yates1953)
(一)足夠(二)完整(三)不重複(四)正確(五)便利1/1/20238目錄抽樣概論抽樣方法抽樣條件抽樣誤差案例研討1/1/20239抽樣方法抽樣方法(samplesurvey)非概率抽樣(probabilitysampling)概率抽樣方便抽樣判斷抽樣配額抽樣滾雪球抽樣簡單隨機抽樣系統(tǒng)抽樣分層抽樣整群抽樣多層抽樣1/1/20231012/24/202211抽樣方方法———總總論隨機抽抽樣12/24/202212抽樣樣方方法法————總總論論非隨隨機機抽抽樣樣12/24/202213抽樣樣方方法法————分分論論一、、簡簡單單隨隨機機抽抽樣樣SimplerandomSampling實施施方方法法優(yōu)缺缺點點適用用情情境境(BoyedJr.,Westfall,&Stasch1985))1.成成本本高高2.詳詳細細完完備備的的最最新新抽抽樣樣框框3.統(tǒng)統(tǒng)計計效效率率低低4.管管理理困困難難(補補))5。。無無法法排排除除極極具具代代表表性性的的樣樣本本(BoyedJr.,Westfall,&Stasch1985))1.母母體體小小2.有有適適當當?shù)牡某槌闃訕涌蚩?.單單位位訪訪問問成成本本不不受受距距離離影影響響4.無無其其它它有有關關母母體體的的信信息息12/24/202214手把把手手教教你你————隨隨機機數(shù)數(shù)表表依依機機率率抽抽取取。。假定定由由22000000名名調調查查對對象象,,以以隨隨機機數(shù)數(shù)表表隨隨機機抽抽取取115500名名樣樣本本,,其其抽抽樣樣步步驟驟如如下下::(11))將將22000000名名調調查查對對象象,,由由00000011編編至至22000000等等22000000個個連連續(xù)續(xù)編編號號。。(2)由由隨機數(shù)數(shù)表,利利用抽簽簽方法選選取號碼碼開始點點。例如如選取為為第十五五行第四四列。(3)由由設定之之起始點點,選取取號碼,,選取號號碼以調調查對象象之編號號位數(shù)相相同:即即14775,999388,44460,,06228,......,有效效號碼樣樣本20000以以下。(4)若若抽樣單單位與隨隨機數(shù)表表抽樣號號碼條件件相同即即為樣本本,大于于調查編編號,跳跳過不取取。(5)若若逢重復復號碼,,亦應跳跳過。(6)依依上述方方法,連連續(xù)采用用1500個號碼碼,即為為完成樣樣本選用用。12/24/202215抽樣方法法——分分論(二)機機械抽樣樣實施方法法優(yōu)缺點適用情境境限制:1.抽抽樣偏誤誤2.隨隨機偏誤誤適用情境境:抽樣單位位以隨機機次序編編列12/24/202216抽樣方法法——分分論(二)機機械抽樣樣實施方法法優(yōu)缺點適用情境境限制:1.抽抽樣偏誤誤2.隨隨機偏誤誤適用情境境:抽樣單位位以隨機機次序編編列12/24/202217抽樣方法法——分分論(三)分分層抽樣樣實施方法法【圖示】:分層抽抽樣方法法母體樣本********抽樣第一層第二層第三層12/24/202218抽樣方法法——分分論(三)分分層抽樣樣優(yōu)缺點優(yōu)點:1.可靠性高高2.利於比較較12/24/202219抽樣方方法———分分論(三))分層層抽樣樣StratifiedSampling關注要要素分層基基礎層級數(shù)數(shù)目——不不超超過六六層((Cochran1963)3.等等比比例或或不等等比例例樣本本12/24/20222012/24/202221抽樣方方法———分分論(四))整群群抽樣樣ClusterSampling實施方方法((圖示示)*******抽樣樣***12/24/202222案例:歌曲著作權權使用費的的分配12/24/202223抽樣方法———分論(四)整群群抽樣優(yōu)缺點(圖圖示)優(yōu)點:1.經(jīng)濟2.簡便缺點:抽樣樣偏差12/24/202224·(五)多級級抽樣12/24/202225非概率抽樣樣方便抽樣((任意抽樣))任意抽樣又又稱為便利利抽樣法。。它是調查查人員按工工作的方便便,隨意抽抽選樣本的的一種抽樣樣方法。運運用任意抽抽樣技術進進行抽樣,,一般由調調研人員從從工作方便便出發(fā),在在調研對象象范圍內隨隨意抽選一一定數(shù)量的的樣本進行行調查?!啊敖诸^攔人人法”和““空間抽樣樣法”是任任意抽樣的的兩種最常常見的方法法12/24/202226任意抽樣技技術簡便易易行,可以以及時取得得所需的資資料,節(jié)約約時間和費費用。這種種方法適用用于探測性性調查,或或調查前的的準備工作作。一般在在調查總體體中每一個個體都是同同質時,才才能采用此此類方法。。但是,實實踐中并非非所有總體體中每一個個體都是相相同的,所所以抽樣結結果偏差較較大,可信信程度較低低,它的樣樣本沒有足足夠的代表表性。12/24/202227判斷抽樣判斷抽樣又又稱為目的的抽樣法。。這是一種種根據(jù)調查查人員的經(jīng)經(jīng)驗或某些些有見解的的專家選定定樣本的抽抽樣方法。。12/24/202228判斷抽樣法法具有簡便便、易行、、及時,符符合調查目目的和特殊殊需要,可可以充分利利用調查樣樣本的已知知資料,被被調查者配配合較好,,資料回收收率高等優(yōu)優(yōu)點。但是是,這種方方法易發(fā)生生主觀判斷斷產(chǎn)生的抽抽樣誤差,,同時由于于判斷抽樣樣中各個調調查個體被被抽取的概概率不知道道,因而無無法計算抽抽樣誤差和和可信程度度。如果調調查者的經(jīng)經(jīng)驗豐富,,知識面廣廣,判斷能能力強,抽抽取的樣本本代表性就就大,反之之則小。12/24/202229(三)配額額抽樣配額抽樣是是按照一定定標準,分分配樣本數(shù)數(shù)額,然后后在規(guī)定數(shù)數(shù)額內由調調查人員任任意抽選樣樣本的一種種抽樣方法法。配額抽樣是是非概率抽抽樣中最流流行的一種種。運用配配額抽樣技技術進行抽抽樣,要按按照一定標標準分配樣樣本數(shù)額,,并在規(guī)定定數(shù)額內由由調查人員員任意抽選選樣本。12/24/202230案例例分分析析在某某項項調調查查中中,,確確定定樣樣本本總總數(shù)數(shù)為為180個個,,可可單單獨獨選選擇擇消消費費者者收收人人、、年年齡齡、、性性別別三三個個標標準準中中的的一一個個進進行行抽抽樣樣。。按按獨獨立立控控制制配配額額抽抽樣樣,,其其各各個個標標準準樣樣本本配配額額比比例例及及配配額額數(shù)數(shù)如如表表所所示示。。年齡人數(shù)18-294030-406041-557056以上30合計200性別人數(shù)男100女100合計200收入人數(shù)高36中74低90合計20012/24/202231最終終配配額額表表格格
高中低
合計男女男女男女18-2934789940(20%)30-40651111131460(30%)41-55661313161670(35%)56以上33657630(15%)小計181837374545
200合計36(18%)74(37%)90(45%)12/24/202232相互互控控制制配配額額抽抽樣樣對對每每一一個個控控制制特特性性所所需需分分配配的的樣樣本本數(shù)數(shù)都都做做了了具具體體規(guī)規(guī)定定,,調調查查者者必必須須按按規(guī)規(guī)定定在在總總體體中中抽抽取取調調查查個個體體,,由由于于調調查查面面較較廣廣,,從從而而克克服服了了獨獨立立控控制制配配額額抽抽樣樣的的缺缺點點,,提提高高了了樣樣本本的的代代表表性性。。七天天連連鎖鎖酒酒店店12/24/2022334、、滾滾雪雪球球抽抽樣樣滾雪雪球球抽抽樣樣的的主主要要目目標標是是分分析析調調研研總總體體的的稀稀有有特特征征。。滾雪雪球球技技術術的的主主要要優(yōu)優(yōu)點點表表現(xiàn)現(xiàn)在在,,通通過過對對調調研研總總體體設設定定期期望望的的特特征征,,從從而而增增強強了了樣樣本本個個體體的的相相似似性性。。因因此此,,采采用用這這種種方方法法所所產(chǎn)產(chǎn)生生的的抽抽樣樣誤誤差差比比較較小小,,成成本本比比較較低低。。12/24/202234走向向實實踐踐::央央視視收收視視率率網(wǎng)網(wǎng)的的建建設設≥1999年,,央視—索福福瑞公司為建建立一個收視視率調查網(wǎng)((人員測量儀儀技術),需需要調查一個個有代表性的的n=2000戶的樣本本,采用了分分層多級pps整群抽樣樣技術。根據(jù)據(jù)以往研究,,知道非農(nóng)業(yè)業(yè)人口的比例例是一個顯著著影響指標。。因此將電視觀觀眾分為三大大區(qū)域:(1)城市域域:行政區(qū)劃劃中的所有地地級市(只含含非農(nóng)業(yè)人口口在≥50%的市轄區(qū)的的家庭戶)(2)中間域域:行政區(qū)劃劃中的所有地地級市(只含含非農(nóng)業(yè)人口口在<50%的市轄區(qū)的的家庭戶)(3)農(nóng)村域域:行政區(qū)劃劃中的所有縣縣和縣級市的的家庭戶12/24/202235走向實踐:央央視收視率網(wǎng)網(wǎng)的建設然后,按對收收視率有顯著著影響的六大大指標進行聚聚類分析,將將城市區(qū)域分分成6小層,,中間域分成成4小層,農(nóng)農(nóng)村域分為10小層。分層指標分別別為:人口規(guī)規(guī)模,0-14歲少兒的的比例,65歲以上老人人的比例,非非農(nóng)業(yè)人口的的比例,識字字率和年平均均氣溫。七天連鎖酒店店12/24/202236動手實踐廈門商業(yè)銀行行廈門商業(yè)銀行行在廈門市的的各個區(qū)和街街道設立了分分支機構。這這家銀行提供供了全方位的的金融服務。。廈門市有112,500人使用的的白鷺信用卡卡。從最初的的申請開始,,銀行致力于于搜集客戶的的個人信息,,包括姓名、、地址、郵政政編碼、電話話號碼、收入入、文化程度度和資產(chǎn)等。。廈門商業(yè)銀銀行對信用持持有卡在信用用卡上的花費費和其人口統(tǒng)統(tǒng)計特征之間間是否有關聯(lián)聯(lián)感興趣,例例如在廈門某某個地方,客客戶是否是信信用卡最頻繁繁的使用者??他們的個人人收入與信用用卡的使用是是否有關系??12/24/202237動手實踐廈門商業(yè)銀行行問題:對于這樣的問問題,你將如如何定義總體體?你將在這個研研究中使用什什么樣的抽樣樣框?在選擇抽樣框框中,你將采采取什么樣的的步驟進行簡簡單隨機抽樣樣?在這樣情況下下,分成抽樣樣有意義么??為什么?如如何設計一個個分層抽樣程程序?你能使用你設設計的抽樣框框抽出一個整整群樣本么??為什么?你將選擇哪種種概率抽樣法法?為什么??12/24/202238思考簡單隨機抽樣樣極少采取挨挨家挨戶訪談談法,為什么么?那種概率率抽樣法可以以使用挨家挨挨戶法?假定電話號碼碼簿是某項研研究可接受的的抽樣框,你你能發(fā)現(xiàn)從電電話號碼簿中中抽取等距樣樣本有什么問問題么?給下列的情況況列舉概率抽抽樣框a讀來讀往往吧的顧客b便攜式電電腦持有者c蒼蠅拍的的持有者d在去年去去過一個或多多個歐洲國家家的人e居住在在廈門少于兩兩年的移民f長粉刺刺的人12/24/202239抽樣方方法———選選擇選擇概概率抽抽樣和和非概概率抽抽樣的的條件件基本抽抽樣方方法的的優(yōu)缺缺點比比較應用抽抽樣方方法應應考慮慮的因因素12/24/202240隨機抽抽樣與與非隨隨機抽抽樣的的比較較一、樣樣本本效度度(一))正確確性(二))精確確性二、抽抽樣樣方法法的比比較(一))估計計值的的可信信性——機機率率抽樣樣(二))統(tǒng)計計效率率之評評估——機機率率抽樣樣(三))母母體信信息——機機率率抽樣樣(四))經(jīng)經(jīng)驗技技巧——非非機機率抽抽樣(五))時時間——非非機機率抽抽樣(六))成成本——非非機機率抽抽樣12/24/20224112/24/202242實踐::美國國282家家企業(yè)業(yè)抽樣樣方法法的應應用參考消消息::《市市場調調查的的管理理要點點》先先鋒企企管中中心市市場調調查小小組譯譯犬犬田充充著臺北先先鋒企企業(yè)管管理發(fā)發(fā)展中中心出出版版注:單單純隨隨機抽抽樣==簡單單隨機機抽樣樣集團抽抽樣==群集集抽樣樣12/24/202243教你一一招::電話訪訪問抽抽樣方方法一、電電話話號碼碼簿抽抽樣法法(一))傳統(tǒng)統(tǒng)抽樣樣方法法(二))改良良抽樣樣方法法1.加加一一抽樣樣法2.加加十十抽樣樣法3.兩兩位位隨機機數(shù)字字法4.倒倒數(shù)數(shù)抽樣樣法二、、隨隨機數(shù)數(shù)字撥撥號法法12/24/202244目錄抽樣概概論抽樣方方法抽樣條條件(補充充)抽樣誤誤差與與容量量案例研研討12/24/202245溫故知新::抽樣樣本本使用方式式重復調查((RepeatedSurvey))每次調查均均重新抽樣樣,使用新新樣本(FreshSurvey))進行同樣樣調查,是是最常用之之方法。同樣本調查查(PanelSurvey)利用同一樣樣本作長期期的觀念調調查,以集集中力量于于樣本變化化研究上。。又稱追縱縱調查(LogitudiualSurvey)。研研究消費者者品牌忠誠誠度或消費費者購買行行為,多使使用此一方方式。輪換樣本調調查(RotatingPauelSurvey))每次換取部部份樣本,,以代表母母體變化;;維持部份份樣本的連連續(xù)性及穩(wěn)穩(wěn)定性又降降低成本。。分裂調查((SplitPauelSurvery))一部份每次次均采用新新樣本(重重復調查));一部份份均用相同同樣本(同同樣本調查查)。12/24/202246自習思考題題為什么隨機機抽樣能實實現(xiàn)對總體體參數(shù)的估估計?而非非隨機抽樣樣則不行??(自習課本第第五章和第第六章)12/24/202247基本符號及及含義參數(shù)統(tǒng)計量總體抽樣樣本均值μu
或X成數(shù)(比例)πРp方差δ2δ
2
或ss2標準差δss12/24/202248總體分布、、樣本分布布和抽樣分分布12/24/202249大數(shù)定律和和中心極限限定理12/24/202250中心極限定定理centrallimittheorem①即使從非正態(tài)總體體中抽取樣本本,所得均均數(shù)分布仍仍近似呈正態(tài)。②隨著樣本本量的增大大,樣本本均數(shù)的變異范圍也逐漸漸變窄。12/24/202251小結從正態(tài)總總體中隨隨機抽樣樣,其樣樣本均數(shù)數(shù)服從正正態(tài)分布布;從任意總總體中隨隨機抽樣樣,當樣樣本含量量足夠大大時,其其樣本均均數(shù)的分分布逐漸漸逼近正正態(tài)分布布;樣本均數(shù)數(shù)之均數(shù)數(shù)的位置置始終在在總體均均數(shù)的附附近;隨著樣本本含量的的增加,,樣本均均數(shù)的離離散程度度越來越越小,表表現(xiàn)為樣樣本均數(shù)數(shù)的分布布范圍越越來越窄窄,其高高峰越來來越尖。。12/24/202252(1)x~N(μ,σσ2)則~~N(μμ,σσ2/n)x是偏態(tài)態(tài)總體,,n>30近近似正態(tài)態(tài)(2)的的總總體均數(shù)數(shù)為μ,,標準差=σ/12/24/202253正態(tài)分布布與標準準正態(tài)分分布12/24/202254正態(tài)分布布的特點點呈鐘形且且只有一一個眾數(shù)數(shù)關于平均均值對稱稱一個正態(tài)態(tài)分布的的特殊性性是由平平均數(shù)和和標注差差決定的的正態(tài)曲線線下方的的面積等等于1,,表明它它包括的的所有的的調查結結果正態(tài)分布布下方在在任意兩兩個變量量值之間間的面積積,等于于在這個個范圍內內隨機抽抽取一個個觀察對對象的概概率。所有的正正態(tài)分布布在平均均數(shù)個個標標準差之之間的面面積相等等,都占占曲線下下方面積積的68.26%,或或者是占占全部調調查對象象總體結結果的68.26%。。這稱為為正態(tài)分布布的比例例性。這是統(tǒng)計計推斷的的基礎。。12/24/202255隨機變量量XN(m,s2)標準正態(tài)態(tài)分布N(0,12)Z變換均數(shù)標準正態(tài)態(tài)分布N(0,12)Studentt分布自由度::n-1t分布(t-distribution)12/24/202256抽樣推斷總體均數(shù)的點點估計(pointestimation))與區(qū)間估計計(intervalestimation)參數(shù)的估計點估計:由樣本統(tǒng)計計量直接估計總總體參數(shù)數(shù)區(qū)間估計:在一定可信度(Confidencelevel)下下,同時考考慮抽樣誤差差按預先給定的的概率(1),確定一個個包含未知總總體參數(shù)的范范圍。這一范范圍稱為參數(shù)數(shù)的可信區(qū)間間或置信區(qū)間間(confidenceinterval,CI)12/24/202257可信區(qū)間的定定義按一定的概率率或可信度(1-α)用用一個區(qū)間來來估計總體參參數(shù)所在的范范圍,該范圍圍通常稱為參參數(shù)的可信區(qū)間或者置信區(qū)間(confidenceinterval,CI),預先給定定的概率(1-α)稱為為可信度或者置信度(confidencelevel),常取95%或99%。可信區(qū)間(CL,CU)是一開區(qū)間CL、CU稱為可信限12/24/202258可信區(qū)間的的兩個要素素可信度(Confidence):準確性性,可靠性性,即1-α。一般取90%,95%,可人為控控制精確性(Precision):區(qū)間的大小小,越小越越好。必須二者兼兼顧12/24/20225995%可信信區(qū)間的含含義-2-1012按這種方法法構建的可可信區(qū)間,,理論上平平均每100次,有95次可以估計計到總體參參數(shù)。12/24/202260當總體方差差σ2已知時總體體均值的區(qū)區(qū)間估計對于給定的的顯著性水水平,可以以構造均值值的置信區(qū)區(qū)間為:12/24/202261總體方差未未知時(小小樣本)總總體均值的的區(qū)間估計計對于給定的的顯著性水水平,總體體均值的置置信區(qū)間為為:12/24/202262走進實踐從某地區(qū)5000名名消費者中中隨機拍出出100名名,對其生生活費支出出進行調查查,抽樣調調查結果為為平均生活活費支出為為200元元,平均抽抽樣誤差為為5元。要要求在95.45%的概率保保證下,推推算出全部部消費者的的生活費支支出總額。。12/24/202263問題簡述標準差差和標準誤誤的區(qū)別和和聯(lián)系簡述參考值值范圍與均均數(shù)的可信信區(qū)間的區(qū)區(qū)別和聯(lián)系系12/24/202264目錄抽樣概論抽樣方法抽樣條件抽樣誤差樣本容量的的確定案例研討12/24/202265認識識一一組組名名詞詞精確確度度((Precision))與與準準確確度度((Validity))精確確度度乃乃用用以以衡衡量量估估計計值值精精確確可可依依賴賴的的程程度度,,如如在在物物價價統(tǒng)統(tǒng)計計中中,,經(jīng)經(jīng)濟濟家家若若認認為為物物價價如如上上升升0.02將將影影向向經(jīng)經(jīng)濟濟決決策策,,則則精精確確度度即即須須訂訂在在0.02。。準確確度度乃乃衡衡量量母母全全體體特特性性與與實實際際母母全全體體特特性性間間之之差差異異。。兩兩者者之之差差異異愈愈小小,,代代表表準準確確度度愈愈高高。。抽樣樣誤誤差差((Samplingerror))因為為抽抽樣樣時時樣樣本本可可能能會會偏偏離離母母群群體體,,其其間間的的差差距距稱稱為為抽抽樣樣誤誤差差。。抽抽樣樣誤誤差差可可用用統(tǒng)統(tǒng)計計方方法法估估計計。。置信信水水平平((Confidencelevel))以樣樣本本估估計計數(shù)數(shù)推推論論母母群群體體大大小小時時,,正正確確估估計計的的概概率率有有多多少少。。信信賴賴水水準準是是9955﹪﹪,,即即正正確確估估計計概概率率為為9955%%,,調調查查者者以以此此來來表表示示其其正正確確估估計計程程度度。??稍试试S許誤誤差差((Toleratederro))在抽抽樣樣調調查查時時,,調調查查者者所所要要求求的的精精確確度度不不是是百百分分之之百百,,而而是是在在設設定定母母群群體體平平均均數(shù)數(shù)上上下下各各多多少少百百分分點點作作為為誤誤差差容容忍忍范范圍圍,,稱稱為為容容忍忍誤誤差差。。12/24/202266抽樣樣誤誤差差———由由于于隨隨機機抽抽樣樣的的偶偶然然周周素素使使樣樣本本各各單單位位的的結結構構對對總總體體各各單單位位結結構構的的代代表表性性差差別別,,而而引引起起的的抽抽樣樣指指標標和和全全及及指指標標之之間間的的絕絕對對離離差差。。如如抽抽樣樣平平均均數(shù)數(shù)與與總總體體平平均均數(shù)數(shù)的的絕絕對對離離差差,,抽抽樣樣成成數(shù)數(shù)與與總總體體成成數(shù)數(shù)的的絕絕對對離離差差等等等等。。必須須指指出出,,抽抽樣樣誤誤差差是是抽抽樣樣所所特特有有的的誤誤差差。。凡凡進進行行抽抽樣樣就就一一定定會會產(chǎn)產(chǎn)生生抽抽樣樣誤誤差差,,這這種種誤誤差差不不可可避避免免的的,,但但可可以以控控制制,,又又稱稱為為可可控控制制誤誤差差。。抽樣樣誤誤差差與與另另外外兩兩種種誤誤差差不不同同。。一一種種是是調調查查誤誤差差,,即即在在調調查查過過程程中中,,由由于于觀觀察察測測量量、、登登記記、、計計算算上上的的差差錯錯所所引引起起的的誤誤差差::另另一一種種是是系系統(tǒng)統(tǒng)偏偏誤誤,,即即由由于于違違反反隨隨機機原原則則,,有有意意地地選選擇擇較較好好或或較較差差單單位位進進行行調調查查,,造造成成樣樣本本代代表表性性不不足足所所引引起起的的誤誤差差。。這這兩兩種種誤誤差差是是可可防防止止和和避避免免的的。。12/24/202267影響抽抽樣誤誤差大大小的的因素素總體單單位的的標志志值的的差異異程度度。樣本單單位數(shù)數(shù)的多多少。。抽樣方方法。。七天連連鎖酒酒店抽樣調調查的的組織織形式式。12/24/202268重復抽抽樣當總體體為N,樣樣本容容量為為n時時,抽抽樣平平均誤誤差公公式為為:非重復復抽樣樣抽樣的的平均均誤差差成數(shù)的的抽樣樣平均均誤差差12/24/20226912/24/202270抽樣極極限誤誤差抽樣平平均誤誤差說說明某某一抽抽樣方方案總總的誤誤差情情況,,但在在實際際進行行抽樣樣調查查時,,只抽抽取一一個樣樣本。。那么么這個個樣本本的誤誤差,,可能能大于于或小小于平平均誤誤差。。對于于該項項抽樣樣調查查,一一定會會要求求有一一個允允許誤誤差的的范圍圍。這這一允允許誤誤差的的范圍圍,就就稱作作極限限誤差差。抽抽樣樣結果果的抽抽樣指指標與與總體體指標標之間間的離離差,,可能能是正正或是是負。。因此此允許許誤差差的范范圍采采取絕絕對值值形式式,用用△表表示,,即::12/24/202271非抽樣樣誤差差之避避免此種誤誤差只只有細細心設設計抽抽樣過過程及及正確確認真真執(zhí)行行抽樣樣工作作,方方可減減為最最低.1、未未能回回受問問卷或或填答答項目目不完完整,,遺漏漏數(shù)據(jù)據(jù)。2、測測量不不準::由測測量方方法及及測量量工具具不良良所導導致。。其主主要原原因之之乃::a設設計錯錯誤::對于于問題題的了了解不不夠深深入,,導致致觀念念及推推理邏邏輯偏偏離主主題,,整個個抽樣樣設計計錯誤誤,所所測量量對象象并非非母群群體真真正參參數(shù)。。b問問題偏偏激或或隱匿匿事實實,易易造成成受訪訪者不不安或或壓力力,不不愿給給予正正面答答案。。c更換換樣本本:抽抽樣訪訪問對對象與與原來來計劃劃不同同。d訪問問員之之錯誤誤,誤誤解問問題或或加入入自己己意見見。e方法法影向向答案案。即即訪問問者本本身影影向被被訪問問者狀狀況。。3、數(shù)數(shù)據(jù)處處理錯錯誤::如程程序設設計錯錯誤,,資料料牏入入錯誤誤。12/24/202272a.為為彌補遺遺漏數(shù)據(jù)據(jù)采用「「加權調調整法」」加以彌彌補。至至于問卷卷沒有回回收,問問項答不不完整。。采用「「設算法法」加以以彌補。。b.利利用手提提微電腦腦進行實實地訪問問;計算算機輔助助電話訪訪問(CATI)。c.統(tǒng)統(tǒng)計分析析利用計計算機處處理;抽抽樣調查查的結果果經(jīng)由計計算機通通訊網(wǎng)路路直接傳傳送結使使用者。。12/24/202273目錄抽樣概論論抽樣方法法抽樣條件件抽樣誤差差樣本容量量的確定定案例研討討12/24/202274走向實踐踐:學校校記者團團的煩惱惱廈門理工工學院是是廈門市市辦大學學,在校校學生有有1.5萬人,,分別住住在擁有有160萬人口口和40萬人口口的城區(qū)區(qū)里。學學校記者者團正努努力增加加廣告收收入,廣廣告人員員希望運運用宣傳傳工具,,是這座座城市的的商人們們相信這這所大學學對這個個城市有有著經(jīng)濟濟上的影影響。作作為主要要研究的的一部分分,需要要調查一一個學生生樣本以以確定這這些學生生在這個個學校中中每個月月的消費費額,調調查所得得的結果果,將用用來估計計全體學學生的消消費額。。調研者者面臨的的任務是是選取一一個相當當大的樣樣本,使使其能夠夠對總體體值提供供一個比比較精確確的的估估計,但但是他們們不愿意意將調查查資金浪浪費在一一個太大大而實際際又沒有有必要的的樣本上上。那么要抽抽取多少少個學生生?50?200?1000?3000??……12/24/202275樣本容量量的影響響因素_定性定性因素素12/24/202276樣本容量量的影響響因素——定量定量因素素12/24/202277定量因素素12/24/202278確定樣本本容量的的方法教條式的的方法約定式的的方法成本基礎礎法統(tǒng)計分析析法置信區(qū)間間法12/24/202279教條式方法以“經(jīng)驗性””為前提,認認為樣本容量量應該是“為為保證精確,,樣本至少應應該是總體的的5%”。但但是,教條式式方法忽略了了抽樣的精確確度問題。而而且,當被研研究的總體很很大時,這絕絕非時一種經(jīng)經(jīng)濟的方法。。約定式方法認為某一個約約定或者數(shù)量量就是正確的的樣容量。但但是,約定式式確定樣本容容量的方法忽忽略了與所要要進行的研究究相關的情況況,而且采用用約定的樣本本容量進行研研究所需的費費用可能比用用正確的樣本本容量進行研研究高許多。。12/24/202280成本基礎法將成本作為確確定樣本容量量的基礎。成成本將不不是確定樣本本容量的唯一一考慮因素,,但在確定樣樣本容量時也也應予必要的的考慮。統(tǒng)計分析用于分析樣本本中的各個子子集。在對子子集進行觀察察時有必要將將每個子集視視為一個單獨獨的總體,并并為每一個子子集確定樣本本容量,同時時運用恰當?shù)牡姆椒ㄒ约捌淦渌囟ǖ姆椒绞揭詮淖蛹蝎@取信息息。一旦完成成了上述工作作,就可以將將所有的子集集合并起來組組成一個大的的集合,以獲獲得對整個團團體的描述。。12/24/202281置信區(qū)間法置信區(qū)間法:運用差異性性置信區(qū)間、、樣本分布以以及平均數(shù)標標準誤差或百百分率標準誤誤差等概念來來創(chuàng)建一個有有效的樣本。。12/24/202282復習:一組概概念差異性標準差置信區(qū)間抽樣分布平均數(shù)或者百百分率標準誤誤差的概念12/24/202283樣本容量的確確定方法12/24/202284確定樣本大小小時實際操作作—案例講解解(一)如何估計計總體的差異異性調研人員就必必須考慮所有有與差異性有有關的信息,,甚至還可能能需要進行導導向性研究,,一在確定最最終樣本容量量之前,對總總體的性質有有更好的理解解。(二)如何確確定期望精確確度的值營銷項目主管管的任務是選選取營銷決策策人員允許誤誤差的可接受受范圍,以滿滿足其決策所所需。12/24/202285(三)如何何計算期望望置信度通常的方法法是運用99%或95%的標標準置信區(qū)區(qū)間。換算算成z分別別是2.58和1.96。(四)特殊殊的確定樣樣本容量情情況1、從小總總體中抽樣樣小總體情況況是指在其其樣本超過過總體總容容量的5%如果是小總總體,則樣樣本容量的的公式就需需要用有限限乘數(shù)來進進行調整。。有限乘數(shù)數(shù)是指近似似于不包括括樣本的總總體比率的的平方根的的一個調整整因素。12/24/2022862、運用非概率率抽樣確定定樣本容量量運用非概率率抽樣確定定樣本容量量的唯一合合理方法是是,衡量從從樣本中所所獲取信息息的利益或或價值與收收集這些信信息的成本本。12/24/202287實踐中的抽抽樣法查表方式12/24/202288手把手教你你:實際操操作根據(jù)調查研研究的目的的,確定研研究的置信信水平(α)和精度度(或最大大允許誤差差Δ)由α和精度根根據(jù)公式計計算或查表表,確定樣樣本的最低低容量n根據(jù)總體規(guī)規(guī)模對基本本樣本進行行調整在對研究精精度沒有太太大影響的的條件下,,根據(jù)經(jīng)費費來決定是是否減少某某些層的樣樣本量從統(tǒng)計分析析的角度考考慮是否增增加某些層層的樣本量量根據(jù)已有的的經(jīng)驗或對對答卷回收收率的預測測,考慮是是否增加樣樣本數(shù),增增加多少根據(jù)抽樣方方式的設計計效應調整整樣本量走向實踐12/24/202289附錄:樣本本容量與總總體規(guī)模、、精度要求求之間的對對應關系精度要求總體規(guī)模樣本容量總體比例未知,初步估計為0.5容許誤差為0.05(或5%)置信度為95%504410080500222100028650003701000038510000039810000004001000000040010000000040012/24/202290判斷斷思思考考題題樣本本量量越越大大,,代代表表性性越越好好。。樣本本量量越越大大,,精精度度越越大大樣本本量量越越大大,,統(tǒng)統(tǒng)計計量量越越接接近近于于正正態(tài)態(tài)分分布布總體體越越大大,,所所需需的的樣樣本本量量就就要要越越大大12/24/202291課后后作作業(yè)業(yè)一名名麥麥當當勞勞的的研研究究人人員員發(fā)發(fā)現(xiàn)現(xiàn),,在在廈廈門門人人們們在在快快餐餐后后的的平平均均消消費費為為3.30美美元元,,標標準準偏偏差差為為0.40美美元元,,而而在在福福州州,,人人們們的的平平均均消消費費為為3.25美美元元,,標標準準差差為為0.10美美元元。。((1))有有這這些些數(shù)數(shù)據(jù)據(jù)如如何何分分析析兩兩個個區(qū)區(qū)域域的的快快餐餐消消費費情情況況。。((2))同同時時,,還還發(fā)發(fā)現(xiàn)現(xiàn)80%的的顧顧客客喜喜歡歡法法式式薯薯條條,,調調查查人人員員希希望望誤誤差差低低于于6%,,置置信信度度為為95%,,求求出出需需要要的的樣樣本本量量。。雀巢巢公公司司去去年年在在全全國國10大大商商業(yè)業(yè)名名街街上上進進行行一一次次攔攔截截訪訪問問,,并并且且發(fā)發(fā)現(xiàn)現(xiàn)有有20%的的公公眾眾更更愿愿用用咖咖啡啡來來代代替替茶茶作作為為午午茶茶的的熱熱飲飲料料。。今今年年,,雀雀巢巢想想進進行行一一次次全全國國性性的的隨隨機機撥撥號號電電話話調調查查。。為為確確保保99%的的置置信信度度下下獲獲得得2.5%的的精精確確度度,,依依據(jù)據(jù)的的研研究究樣樣本本容容量量是是多多少少??動手手實實踐踐12/24/202292生產(chǎn)產(chǎn)某某些些型型號號的的電電池池進進行行電電流流強強度度檢檢驗驗。。根根據(jù)據(jù)以以往往正正常常生生產(chǎn)產(chǎn)經(jīng)經(jīng)驗驗,,電電流流強強度度的的標標準準差差為為0.4安安培培,,合合格格率率為為90%?!,F(xiàn)現(xiàn)在在用用重重復復抽抽樣樣的的方方法法,,要要求求在在95.45%概概率率保保證證下下,,抽抽樣樣平平均均電電流流強強度度的的極極限限誤誤差差不不超超過過0.08安安培培,,抽抽樣樣的的合合格格率率的的極極限限誤誤差差不不超超過過5%。。請請問問必必要要的的抽抽樣樣單單位位數(shù)數(shù)是是多多少少??(多指指標標抽抽樣樣時時,,應應該該采采用用其其中中較較多多的的單單位位數(shù)數(shù))12/24/202293調研研委委托托方方要要求求置置信信度度為為99%,,允允許許抽抽樣樣誤誤差差為為2%,,按按此此要要求求計計算算出出所所需需的的樣樣本本容容量量為為500,,而而這這需需要要委委托托方方支支付付調調查查費費用用是是20000美美元元,,但但委委托托方方用用于于此此項項目目的的預預算算只只有有17000美美元元。。有有沒沒有有其其他他方方案案可可供供選選擇擇??12/24/202294Thanks博客郵箱12/24/2022959、靜
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 床旁CRRT在危重癥患者中的應用
- 設計院技術培訓
- 阿里巴巴英文介紹
- 阿里巴巴公司介紹
- 阿瑪尼介紹目錄
- 2025-2030葡萄牙紡織機械制造行業(yè)競爭格局與出口現(xiàn)狀
- 2025-2030葡萄牙可再生能源產(chǎn)業(yè)政府扶持政策科研投入評估投資發(fā)展研究報告
- 2025-2030芹菜保鮮產(chǎn)業(yè)供需變化評價投資閉環(huán)獲取進行布局優(yōu)化發(fā)展研究
- 2025-2030舞蹈教學機構品牌傳播效果留存用戶評估與發(fā)展規(guī)劃
- 2025-2030能源證券行業(yè)市場發(fā)展深度洞察及未來綠色金融與碳交易模式創(chuàng)新報告
- 2024年執(zhí)業(yè)藥師《藥學專業(yè)知識(一)》試題及答案
- 統(tǒng)編版語文一年級上冊無紙化考評-趣味樂考 玩轉語文 課件
- 高壓氧進修課件
- 2025年第三類醫(yī)療器械經(jīng)營企業(yè)質量管理自查報告
- 2025無人機物流配送網(wǎng)絡建設與運營效率提升研究報告
- 人工智能倫理規(guī)范
- 校園禁毒管理辦法
- 飼料供應循環(huán)管理辦法
- 保險公司安責險
- 水泥穩(wěn)定碎石配合比驗證
- 尿路感染教學查房
評論
0/150
提交評論