第七章 樣本設(shè)計(jì) 樣本容量的確定_第1頁
第七章 樣本設(shè)計(jì) 樣本容量的確定_第2頁
第七章 樣本設(shè)計(jì) 樣本容量的確定_第3頁
第七章 樣本設(shè)計(jì) 樣本容量的確定_第4頁
第七章 樣本設(shè)計(jì) 樣本容量的確定_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章樣本設(shè)計(jì)樣本容量的確定1第1頁,課件共27頁,創(chuàng)作于2023年2月確定概率抽樣的樣本容量樣本容量不能決定代表性,但可影響結(jié)果的精度。樣本的精度樣本的統(tǒng)計(jì)量(如對一特定問題回答的平均數(shù))與其所代表的總體的值的接近程度。大樣本比小樣本更精確,但是沒有成倍的關(guān)系。財(cái)務(wù)和統(tǒng)計(jì)問題一般原則:樣本越大,抽樣誤差越小樣本大,耗費(fèi)的成本也高抽樣成本隨樣本容量直線遞增,抽樣誤差卻只是以樣本量增長速度的平方根遞減2第2頁,課件共27頁,創(chuàng)作于2023年2月確定概率抽樣的樣本容量樣本容量的確定通常是介于理論上的完善方案與實(shí)際上可行方案之間的一個(gè)折中方案教條式方法以“經(jīng)驗(yàn)性”為幌子,認(rèn)為樣本容量應(yīng)該是“為保證精度,一般至少應(yīng)該是總體的5%”例如關(guān)于鞋子的調(diào)查:1萬名鐵人三項(xiàng)運(yùn)動(dòng)員;耐克對“飛人喬丹”進(jìn)行調(diào)查,200萬名潛在的籃球鞋購買者簡單易行,但不是一種高效率、經(jīng)濟(jì)的方法,教條式方法忽略了抽樣的精確度問題。3第3頁,課件共27頁,創(chuàng)作于2023年2月確定概率抽樣的樣本容量約定式方法認(rèn)為某一個(gè)“約定”或某一個(gè)數(shù)量就是正確的樣本容量。樣本容量是一個(gè)恒量,不受總體容量的影響,但也是其缺點(diǎn),總體容量可能少于恒量;精度的要求也會(huì)發(fā)生變化。4第4頁,課件共27頁,創(chuàng)作于2023年2月確定概率抽樣的樣本容量成本基礎(chǔ)法將成本作為確定樣本容量的基礎(chǔ)。樣本容量的確定不是將調(diào)查所獲得的信息的價(jià)值作為首要考慮因素,而是把預(yù)算作為考慮因素,通常會(huì)忽視調(diào)查結(jié)果對管理決策的價(jià)值。如何才能在不考慮成本的情況下確定樣本容量?5第5頁,課件共27頁,創(chuàng)作于2023年2月確定概率抽樣的樣本容量傳統(tǒng)統(tǒng)計(jì)方法運(yùn)用以下概念來創(chuàng)見一個(gè)有效的樣本??傮w標(biāo)準(zhǔn)差的估計(jì)值抽樣誤差的允許范圍抽樣結(jié)果在特定范圍內(nèi)的預(yù)期置信度6第6頁,課件共27頁,創(chuàng)作于2023年2月傳統(tǒng)統(tǒng)計(jì)方法差異性指受訪者對某一特定問題的答案在相異性(或相似性)方面的總括。對于有明確答案選項(xiàng)的資料。你購買可樂是否選擇“可口可樂?”區(qū)間性資料、具有多種選項(xiàng)的資料汽車行駛的里程數(shù)。受訪者的回答可以制成圖表。7第7頁,課件共27頁,創(chuàng)作于2023年2月圖7.1年駕駛里程分布闡明了差異性如果多數(shù)回答都接近于同一個(gè)數(shù)字,而且大多數(shù)的回答者都集中在某一小范圍內(nèi),則差異性?。环粗?,則差異性就大8第8頁,課件共27頁,創(chuàng)作于2023年2月圖7.2分布的伸展反映了差異性總和9第9頁,課件共27頁,創(chuàng)作于2023年2月傳統(tǒng)統(tǒng)計(jì)方法差異性差異性的基本概念就是指回答的相似程度。差異性小意味著回答相當(dāng)相似,差異性大表示回答很不相似。如果答案曲線圖顯示十分集中或呈“尖峰”狀態(tài),則差異性小。如果曲線圖顯示受訪者在各種可能的答案選項(xiàng)間平均分布,則差異性大。測量差異性的指標(biāo)——標(biāo)準(zhǔn)差10第10頁,課件共27頁,創(chuàng)作于2023年2月如何運(yùn)用標(biāo)準(zhǔn)差來測定差異性呢?將兩個(gè)樣本的標(biāo)準(zhǔn)差進(jìn)行比較,以判定相關(guān)的差異性。11第11頁,課件共27頁,創(chuàng)作于2023年2月傳統(tǒng)統(tǒng)計(jì)方法比較兩個(gè)圖形,可以得出結(jié)論:在1955年汽車擁有者的駕駛里程較少(平均),而且差異性也不大(標(biāo)淮差),但現(xiàn)在的車主們年平均駕駛里程較多,差異性也較大。12第12頁,課件共27頁,創(chuàng)作于2023年2月正態(tài)分布的特征(根據(jù)以上圖形)正態(tài)分布呈鐘形且只有一個(gè)眾數(shù)關(guān)于均值對稱,集中趨勢的三個(gè)衡量標(biāo)準(zhǔn)(平均數(shù)、眾數(shù)、中位數(shù))相等一個(gè)正態(tài)分布的特殊性由其均值和標(biāo)準(zhǔn)差決定正態(tài)曲線下方的面積等于113第13頁,課件共27頁,創(chuàng)作于2023年2月5.正態(tài)曲線下方任意兩個(gè)變量值之間的面積,等于在這一范圍內(nèi)隨機(jī)抽取一個(gè)觀察對象的概率6.在均值的給定比例標(biāo)準(zhǔn)差范圍內(nèi)的概率為固定值。即所有的正態(tài)分布在平均數(shù)+-1個(gè)標(biāo)準(zhǔn)差之間的面積相同,都占曲線下方面積的68.26%,或者說占全部調(diào)查總體結(jié)果的68.26%。這叫正態(tài)分布的比例性。14第14頁,課件共27頁,創(chuàng)作于2023年2月正態(tài)分布重要的原因許多變量的概率分布趨于正態(tài)分布。愛吃快餐的人平均每月吃快餐的次數(shù),每星期看電視的小時(shí)數(shù),男性身高的分布等。中心極限定理—對于任何總體,不論其分布如何,隨著樣本容量的增加,抽樣平均數(shù)的分布趨近于正態(tài)分布15第15頁,課件共27頁,創(chuàng)作于2023年2月xf(x)f(x)=隨機(jī)變量X的頻數(shù)

=正態(tài)隨機(jī)變量X的均值

=正態(tài)隨機(jī)變量X的方差

=3.1415926;e=2.71828x=隨機(jī)變量的取值(-

<x<

)正態(tài)分布16第16頁,課件共27頁,創(chuàng)作于2023年2月正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布任何正態(tài)分布都可以轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布均值等于0標(biāo)準(zhǔn)差等于117第17頁,課件共27頁,創(chuàng)作于2023年2月置信區(qū)間的概念是一個(gè)范圍,其終點(diǎn)指定了對于一個(gè)問題的某一應(yīng)答百分率。正態(tài)曲線的屬性是,標(biāo)準(zhǔn)差的1.96倍從理論上表示95%的分布終點(diǎn),標(biāo)準(zhǔn)差的2.58倍表明了99%的分布終點(diǎn)。95%的置信區(qū)間=1.96個(gè)標(biāo)準(zhǔn)差(±)均值99%的置信區(qū)間=2.58個(gè)標(biāo)準(zhǔn)差(±)均值以95%來舉例說明。18第18頁,課件共27頁,創(chuàng)作于2023年2月抽樣分布的概念總體分布總體中全部單位的頻率分布,平均數(shù)為

,標(biāo)準(zhǔn)差樣本分布單個(gè)樣本中所有單位的頻率分布,具體的分布形式依賴于總體分布。抽樣分布一個(gè)總體中許多獨(dú)立樣本均值的理論分布。在大樣本的情況下,其分布近似服從于正態(tài)分布。19第19頁,課件共27頁,創(chuàng)作于2023年2月抽樣分布的概念如果樣本是隨機(jī)的且容量足夠大,則樣本均值的分布近似于正態(tài)分布理論基礎(chǔ)是中心極限定理:隨著樣本容量的增加,從任一總體中抽取的大量隨機(jī)樣本平均數(shù)的分布接近服從正態(tài)分布。其均值為

,且標(biāo)準(zhǔn)差等于:n為樣本容量,為總體的標(biāo)準(zhǔn)差20第20頁,課件共27頁,創(chuàng)作于2023年2月平均數(shù)或百分率標(biāo)準(zhǔn)誤差的概念實(shí)際總體值與所預(yù)期的典型樣本結(jié)果的差距。平均數(shù)標(biāo)準(zhǔn)誤差,即樣本均值的標(biāo)準(zhǔn)差(抽樣誤差)。由于總體標(biāo)準(zhǔn)差

是未知的,一般由樣本標(biāo)準(zhǔn)差s代替。例如:駕駛里程調(diào)查中,樣本容量n是100名駕駛者,標(biāo)準(zhǔn)差是3000公里,則平均數(shù)標(biāo)準(zhǔn)誤差=300。21第21頁,課件共27頁,創(chuàng)作于2023年2月平均數(shù)或百分率標(biāo)準(zhǔn)誤差的概念標(biāo)準(zhǔn)誤差還適用于研究百分率的調(diào)查,稱之為百分率標(biāo)準(zhǔn)誤差。Sp百分率標(biāo)準(zhǔn)誤差;p為樣本中的百分率;q=1-p;n為樣本容量。例:假設(shè)抽選中的100名駕駛者中有40%的人表示其汽車上配有輻射狀輪胎。則標(biāo)準(zhǔn)誤差為:=4.899

22第22頁,課件共27頁,創(chuàng)作于2023年2月計(jì)算樣本容量——均值問題23第23頁,課件共27頁,創(chuàng)作于2023年2月計(jì)算樣本容量——均值問題在簡單隨機(jī)抽樣的條件下,樣本容量為其中:Z=標(biāo)準(zhǔn)誤差的置信水平

=總體標(biāo)準(zhǔn)差h=允許誤差(可接受誤差水平)n=Z2

2h224第24頁,課件共27頁,創(chuàng)作于2023年2月計(jì)算樣本容量——均值問題置信水平Z和誤差E的確定需要由調(diào)研人員同客戶進(jìn)行磋商后確定,要在精確度、置信度和成本之間進(jìn)行衡量。估計(jì)總體標(biāo)準(zhǔn)誤差的四種方法利用以前的結(jié)果進(jìn)行試驗(yàn)性調(diào)查利用二手資料通過判斷,把許多管理人員的判斷集中起來進(jìn)行分析25第25頁,課件共27頁,創(chuàng)作于2023年2月例如:估計(jì)快餐族平均每月吃快餐的平均次數(shù):與公司的管理者進(jìn)行磋商后,市場調(diào)研經(jīng)理認(rèn)為有必要估計(jì)一下吃快餐的平均次數(shù)??紤]到管理者對精確度的要求,他規(guī)定估計(jì)值不得超過實(shí)際值的0.10。這個(gè)值將作為h帶入公式。此外,市場調(diào)研經(jīng)理還認(rèn)為,考慮全局,需要把實(shí)際總體平均值在區(qū)間以內(nèi)的置信度定為95%。而若要置信度為95%,就必須是在2倍標(biāo)準(zhǔn)誤差范圍內(nèi)(嚴(yán)格為1.96)。因此2作為Z值代入公式最后確定公式中的值,幸好公司做過類似的調(diào)查。調(diào)查對象是最近30天內(nèi)吃快餐的平均次數(shù)。標(biāo)準(zhǔn)差為1.39,帶入樣本

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論