六、旅游抽樣調(diào)查匯總.ppt_第1頁
六、旅游抽樣調(diào)查匯總.ppt_第2頁
六、旅游抽樣調(diào)查匯總.ppt_第3頁
六、旅游抽樣調(diào)查匯總.ppt_第4頁
六、旅游抽樣調(diào)查匯總.ppt_第5頁
已閱讀5頁,還剩106頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、旅游抽樣調(diào)查,第一節(jié) 抽樣調(diào)查的意義 第二節(jié) 抽樣調(diào)查的基本概念及理論依據(jù) 第三節(jié) 抽樣平均誤差 第四節(jié) 全及指標(biāo)的推斷 第五節(jié) 假設(shè)檢驗,為什么要抽樣? 為了收集必要的資料,對所研究對象(總體)的全部元素逐一進(jìn)行觀測,往往不很現(xiàn)實。,抽 樣 原因,元素多,搜集數(shù)據(jù)費 時、費用大,不及時而 使所得的數(shù)據(jù)無意義,總體龐大,難以對總體的全部元素進(jìn)行研究,檢查具有破壞性,炮彈、燈管、磚等,第一節(jié) 抽樣調(diào)查的意義,一、抽樣調(diào)查的概念 廣義:凡是抽取一部分單位進(jìn)行觀察,并根據(jù)觀察結(jié)果來推斷全體的都是抽樣調(diào)查。 可分為非隨機抽樣和隨機抽樣兩種。 狹義:隨機抽樣。按照隨機原則從總體中抽取一部分單位進(jìn)行觀察,

2、并運用數(shù)理統(tǒng)計的原理,以被抽取的那部分單位的數(shù)量特征為代表,對總體作出數(shù)量上的推斷分析。,我國的抽樣調(diào)查應(yīng)用主要有: 國家和地方統(tǒng)計部門 一系列抽樣調(diào)查制度:1%人口抽樣調(diào)查、城市和農(nóng)村住戶調(diào)查、農(nóng)產(chǎn)量抽樣調(diào)查等。 三支調(diào)查隊:城市社會經(jīng)濟(jì)調(diào)查總隊、農(nóng)村社會經(jīng)濟(jì)調(diào)查總隊、企業(yè)調(diào)查總隊。 其他政府部門、社會團(tuán)體和學(xué)術(shù)團(tuán)體 婦女生育力調(diào)查(國家計劃生育委員會) 公眾科學(xué)素養(yǎng)調(diào)查(全國科協(xié)) 語言與文字使用情況調(diào)查(教育部與國家語委) 專業(yè)調(diào)查咨詢機構(gòu) 央視調(diào)查咨詢中心、北京華通現(xiàn)代信息咨詢有限公司、北京零點市場調(diào)查與分析公司等。,二、抽樣調(diào)查的特點 (一)只抽取總體中的一部分單位進(jìn)行調(diào)查 (二)用

3、一部分單位的指標(biāo)數(shù)值去推斷總體的指標(biāo)數(shù)值 (三)抽選部分單位時要遵循隨機原則 (四)抽樣調(diào)查會產(chǎn)生抽樣誤差,抽樣誤差可以計算,并且可以加以控制,三、抽樣調(diào)查的范圍 有破壞性、不可能進(jìn)行全面調(diào)查的事物可進(jìn)行抽樣調(diào)查 全面調(diào)查實際辦不到的事物可進(jìn)行抽樣調(diào)查 節(jié)省人力、費用和時間,方式靈活 在有些情況下,抽樣調(diào)查的結(jié)果比全面調(diào)查要準(zhǔn)確 5.用抽樣調(diào)查的資料修正和補充全面調(diào)查資料 6.抽樣調(diào)查方法可以用于工業(yè)生產(chǎn)過程中的質(zhì)量控制 7.利用抽樣推斷的方法,可以對于某種總體的假設(shè)進(jìn)行檢驗,來判斷這種假設(shè)的真?zhèn)危詻Q定取舍,第二節(jié) 抽樣調(diào)查的基本概念及理論依據(jù),一、全及總體和抽樣總體 (1)全及總體,簡稱總

4、體 全及總體是指所要認(rèn)識對象的全體,總體是由具有某種共同性質(zhì)的許多單位組成,是具有同一性質(zhì)的許多單位的集合體。,按其各單位標(biāo)志性質(zhì)不同,可分為變量總體和屬性總體兩類。 變量總體:各單位可用數(shù)量標(biāo)志計量,變量總體是從研究數(shù)量標(biāo)志的角度而言的; 屬性總體:各單位用品質(zhì)標(biāo)志描述,屬性總體是從研究是非品質(zhì)標(biāo)志的角度而言的。 對于變量總體可分為無限總體和有限總體兩類。 可列的無限變量和不可列的無限變量。 全及總體通常用大寫字母N來表示。,(2)抽樣總體,簡稱樣本 是指從總體中按照隨機原則抽取的一部分單位所構(gòu)成的集合體。樣本中的各個單位稱樣本單位。通常用小寫字母n來表示。 樣本的大?。?根據(jù)樣本容量的大小

5、,可將樣本劃分為大樣本和小樣本。一般來說,當(dāng)30時,稱為大樣本;當(dāng)30時稱為小樣本。,二、全及指標(biāo)和抽樣指標(biāo) (1)全及指標(biāo) 根據(jù)全及總體各個單位的標(biāo)志值或標(biāo)志特征計算的、反映總體某種屬性的綜合指標(biāo)。唯一確定 變量總體 總體平均數(shù) 屬性總體 總體成數(shù),總體標(biāo)準(zhǔn)差和總體方差2,(2)抽樣指標(biāo) 由抽樣總體各個標(biāo)志值或標(biāo)志特征計算的綜合指標(biāo)。 抽樣平均數(shù) 抽樣成數(shù) 樣本標(biāo)準(zhǔn)差 樣本方差,是唯一確定的,是隨機變量,它會隨著樣本的不同而有不同的取值,(3)統(tǒng)計抽樣過程 總體N 樣本n (抽樣方式方法) (抽樣估計) (計算抽樣誤差),三、抽樣方法和樣本可能數(shù)目 根據(jù)取樣的方式不同,抽樣方式可分為重復(fù)抽樣

6、和不重復(fù)抽樣兩種。 重復(fù)抽樣的樣本是由n次相互獨立的連續(xù)試驗所組成的。每次試驗實在完全相同的條件下進(jìn)行的。每個單位中選或不中選機會在每次都完全一樣。 可見重置抽樣時: 總體單位數(shù)在抽選過程中始終不變; 總體中各單位被抽中的可能性前后相同; 總體中各單位有被重復(fù)抽中的可能。,不重復(fù)抽樣的樣本是由n次連續(xù)抽選的結(jié)果組成,實質(zhì)上等于一次同時從總體中抽n個組成抽樣樣本。連續(xù)n次抽選的結(jié)果不是相互獨立的。每個單位的中選或不中選機會在各次是不同的。 可見,不重置抽樣時: 總體單位數(shù)在抽選過程中逐漸減少; 總體中各單位被抽中的可能性前后不斷變化; 總體中各單位沒有被重復(fù)抽中的可能。,重復(fù)抽樣:又稱有放回抽樣

7、。,不重復(fù)抽樣:又稱不放回抽樣。,根據(jù)對樣本的要求不同,抽樣方式又有考慮順序抽樣和不考慮順序抽樣兩種。 以上抽樣方法兩種分類還存在交叉情況,因而有:考慮順序的不重復(fù)抽樣、考慮順序的重復(fù)抽樣、不考慮順序的不重復(fù)抽樣和不考慮順序的重復(fù)抽樣等四種。,考慮順序的不重復(fù)抽樣,不考慮順序的不重復(fù)抽樣,考慮順序的重復(fù)抽樣,不考慮順序的重復(fù)抽樣,四、抽樣調(diào)查的理論依據(jù),1、大數(shù)定律:隨著抽樣單位數(shù)的增加,抽樣平均數(shù) 有接近總體平均數(shù) 的趨勢。 2、中心極限定理:如果總體變量存在有限的平均數(shù)和方差,則不論這個總體變量的分布如何,隨著抽樣單位數(shù)n的增加,抽樣平均數(shù)的分布便趨于正態(tài)分布。,1、大數(shù)定律 (1)獨立同

8、分布大數(shù)定律 獨立的隨機變量x1,x2,具有相同分布,且存在有限的數(shù)學(xué)期望E(xi)=X和方差D(xi)=2,則對任意小的正數(shù),有 該定律表明,當(dāng)n足夠大時,獨立同分布的一系列隨機變量的算術(shù)平均數(shù)接近數(shù)學(xué)期望,即平均數(shù)具有穩(wěn)定性。,(2)伯努力大數(shù)定律 設(shè)m是n次獨立隨機試驗中事件A發(fā)生的次數(shù),p是事件A在每次試驗中發(fā)生的概率,則對于任意小的正數(shù),有 該定律表明,當(dāng)n足夠大時,事件A發(fā)生的頻率接近事件A發(fā)生的概率,即頻率具有穩(wěn)定性。,2、中心極限定理 (1)獨立同分布中心極限定理 隨機變量x1,x2,獨立且服從同一分布,若存在有限的數(shù)學(xué)期望E(xi)=X和方差D(xi)=2,當(dāng)n時,隨機變量的

9、總和 趨于均值為nx、方差為n2的正態(tài)分布。即n時 或 結(jié)論:不論總體服從何種分布,只要它的數(shù)學(xué)期望和方差存在,從中抽取容量為n的樣本,則這個樣本的總和或平均數(shù)是個隨機變量,當(dāng)n充分大時,趨于正態(tài)分布。,(2)德莫夫-拉普拉斯中心極限定理 如果用X表示n次獨立試驗中事件A發(fā)生的次數(shù),p是事件A在每次試驗中發(fā)生的概率,則X服從二項分布B(n,p),當(dāng)n時,X趨于均值為np、方差為npq的正態(tài)分布,即 在現(xiàn)實生活中,一個隨機變量服從于正態(tài)分布未必很多,但多個隨機變量和的分布趨近于正態(tài)分布則是普遍存在的。,樣本均值的抽樣分布,一般的,當(dāng)總體服從 N(,2 )時,來自該總體的容量為n的樣本的均值X也服

10、從正態(tài)分布,X 的期望為,方差為2/n。即XN(,2/n)。,第三節(jié) 抽樣平均誤差,一、抽樣誤差的概念 抽樣誤差是指樣本指標(biāo)和總體指標(biāo)之間數(shù)量上的差別。 以數(shù)學(xué)符號表示:| |、|p-P|,統(tǒng)計調(diào)查誤差種類,按產(chǎn)生的原因分,統(tǒng)計調(diào)查誤差可分為登記性誤差和代表性誤差。 1、登記性誤差 是指統(tǒng)計調(diào)查時,由于主觀原因在登記、匯總、計算、過錄中所產(chǎn)生的誤差。登記性誤差不論全面調(diào)查或非全面調(diào)查都可能產(chǎn)生。,2、代表性誤差又可分為兩種:系統(tǒng)性誤差和隨機誤差。 系統(tǒng)性誤差又稱偏差,它是由于抽樣調(diào)查沒有遵循隨機原則而產(chǎn)生的誤差。只要遵循隨機原則就可以避免。 隨機誤差又稱偶然的代表性誤差,它是指沒有登記性誤差的

11、前提下,又遵循了隨機原則所產(chǎn)生的誤差。隨機誤差是抽樣調(diào)查固有的誤差。抽樣誤差是指這種隨機誤差。,二、影響抽樣平均誤差的因素 (一)全及總體標(biāo)志的變動程度 全及總體標(biāo)志變動程度與抽樣平均誤差成正比關(guān)系。 (二)抽樣單位數(shù)的多少 樣本單位數(shù)與抽樣平均誤差的大小成反比關(guān)系。 (三)抽樣組織的方式,三、抽樣平均誤差的意義 抽樣平均誤差是一系列抽樣指標(biāo)(平均指標(biāo)或成數(shù))的標(biāo)準(zhǔn)差。 抽樣平均誤差既是實際可以運用于衡量抽樣指標(biāo)對于全及指標(biāo)代表性程度的一個尺度;也是計算抽樣指標(biāo)與全及指標(biāo)之間變異范圍的一個根據(jù);同時,在組織抽樣調(diào)查中,也是確定抽樣單位數(shù)多少的計算依據(jù)之一。,四、抽樣平均誤差的計算 (一)抽樣平

12、均數(shù)的抽樣平均誤差 抽樣平均誤差就是一系列抽樣指標(biāo)的標(biāo)準(zhǔn)差,通常用符號來表示。用 表示抽樣平均誤差。 -抽樣平均數(shù) -全及平均數(shù) K-抽樣平均數(shù)或抽樣成數(shù)的個數(shù) 上述公式一般不用于實際計算。,(1)重復(fù)抽樣抽樣平均數(shù)的抽樣平均誤差 在重復(fù)抽樣條件下,抽樣平均誤差與全及總體的標(biāo)準(zhǔn)差成正比關(guān)系;與抽樣總體單位數(shù)平方根成反比關(guān)系。 上式表明抽樣平均數(shù)的平均誤差僅為全及總體標(biāo)準(zhǔn)差的 。 上式還表明抽樣平均誤差華總體標(biāo)志變動度的大小成正比,而和樣本單位的平方根成反比。,例:從40、50、70、80中抽取3個組成樣本,在重復(fù)抽樣下,求抽樣平均誤差。 求總體標(biāo)準(zhǔn)差,直接用計算器統(tǒng)計功能鍵可以求出:,求抽樣平

13、均誤差,(2)不重復(fù)抽樣抽樣平均數(shù)的抽樣平均誤差 在不重復(fù)抽樣的情況下, 在總體單位數(shù)N很大的情況下,可以近似地表示為 即不重復(fù)抽樣平均方差等于重復(fù)抽樣平均方差乘以校正因子1-n/N。實際中,兩者很接近。,例:從40、50、70、80中抽取3個組成樣本,在不重復(fù)抽樣下,求抽樣平均誤差。 求總體標(biāo)準(zhǔn)差,直接用計算器統(tǒng)計功能鍵可以求出:,求抽樣平均誤差,(二)抽樣成數(shù)的抽樣平均誤差 全及成數(shù)標(biāo)準(zhǔn)差平方,也稱為“交替標(biāo)志的方差”。 為計算交替標(biāo)志的方差,必須將交替變異的標(biāo)志過渡到數(shù)量標(biāo)志。用x=1表示單位具有這一標(biāo)志,用x=0表示單位不具有這一標(biāo)志。 具有這一標(biāo)志的單位數(shù)占全及總體的比重 不具有這一

14、標(biāo)志的單位數(shù)占全及總體的比重 這兩個成數(shù)之和等于1,即 。,交替標(biāo)志的平均數(shù)和標(biāo)準(zhǔn)差計算表 交替標(biāo)志 單位數(shù) 變量x成數(shù) 離差 離差平方 離差平方 (變量)(成數(shù)) 乘權(quán)數(shù) x f xf 合格品 1 p p 1-p (1-p)2 (1-p)2p 不合格品 0 q 0 0-p (0-p)2 (0-p)2q 合計 - p+q=1 p - q2p+p2q=qp,交替標(biāo)志的標(biāo)準(zhǔn)差為 因為q+p=1 q=1-p 所以 可見,成數(shù)的平均數(shù)就是成數(shù)本身;成數(shù)的方差就是p(1-p)。,重復(fù)抽樣抽樣成數(shù)的平均誤差 不重復(fù)抽樣抽樣成數(shù)的平均誤差,取得的途徑有:,1. 用過去全面調(diào)查或抽樣調(diào)查的資料,若同時有n個的

15、資料,應(yīng)選用數(shù)值較大的那個; 2. 用樣本標(biāo)準(zhǔn)差S代替全及標(biāo)準(zhǔn)差; 3. 在大規(guī)模調(diào)查前,先搞個小規(guī)模的試驗性的調(diào)查來確定S,代替; 4. 用估計的方法。,求樣本平均數(shù)和樣本成數(shù)的抽樣平均誤差。,求燈泡平均使用時間、標(biāo)準(zhǔn)差和燈泡合格率(樣本),求燈泡使用時間抽樣平均誤差:,在不重復(fù)抽樣下抽樣平均誤差:,在重復(fù)抽樣下抽樣平均誤差:,求燈泡合格率的抽樣平均誤差:,在不重復(fù)抽樣下抽樣平均誤差:,在重復(fù)抽樣下抽樣平均誤差:,第四節(jié) 全及指標(biāo)的推斷,抽樣推斷要求 抽樣推斷是指按已經(jīng)抽定的樣本指標(biāo)(樣本平均數(shù)或樣本成數(shù))來估計總體指標(biāo)(總體平均數(shù)或總體成數(shù)),或其所在的區(qū)間范圍。,一、抽樣極限誤差,抽樣誤

16、差范圍就是指變動的抽樣指標(biāo)與確定的全及指標(biāo)之間離差的可能范圍。 統(tǒng)計上把這個給定的抽樣誤差范圍叫做抽樣極限誤差,也稱置信區(qū)間。 用 與 表示抽樣平均數(shù)與抽樣成數(shù)的抽樣極限誤差,則有,抽樣誤差范圍是以 或P為中心的兩個的距離,這抽樣誤差范圍的原意。 但由于全及指標(biāo)是個未知的數(shù)值,而抽樣指標(biāo)通過實測是可以求得的。 因此,抽樣誤差范圍的實際意義是要求被估計的全及指標(biāo) 或P,落在抽樣指標(biāo)一定范圍內(nèi)。 即全及指標(biāo) 、P的區(qū)間估計為,二、可信程度,抽樣平均誤差是表明抽樣估計的準(zhǔn)確度,抽樣極限誤差是表明抽樣估計準(zhǔn)確程度的范圍。在給定的準(zhǔn)確程度范圍內(nèi)的抽樣估計,還要研究其估計的可靠程度,即可信程度。 是用一定

17、倍數(shù)的表示的抽樣指標(biāo)與全及指標(biāo)之間的絕對離差。這里的倍數(shù)用t來表示,稱概率度,也稱置信度。,上述公式的意義在于,在一定的條件下,當(dāng)概率度t越大,則抽樣誤差范圍越大,可能樣本落在誤差范圍內(nèi)的概率越大,從而抽樣估計的可信程度也就越高;反之,當(dāng)t越小,則越小,可能樣本落在誤差范圍內(nèi)的概率越小,從而抽樣估計的可信程度也就越低。,概率度和概率之間保持一定的函數(shù)關(guān)系,即概率是概率度的函數(shù)。用P表示概率以說明抽樣估計的可靠程度,其函數(shù)關(guān)系可表示為 P=F(t) 在正態(tài)分布的情況下,從總體中隨機抽取一個樣本加以觀察,則該樣本抽樣指標(biāo)落在某一范圍 內(nèi)的概率,是用占正態(tài)曲線面積的大小表示的。即,例如,樣本平均數(shù)落

18、在總體平均數(shù)左右1個的范圍內(nèi)(t=1)的概率是68.27%; 2個的范圍內(nèi)(t=2)的概率是95.45%,正態(tài)分布曲線與橫軸圍成的面積等于1.置信度F(t)是概率度t的函數(shù),兩者是一一對應(yīng)的正比例關(guān)系。兩者常用的數(shù)值主要有: t=1 F(t)=68.27% t=1.96 F(t)=95% t=2 F(t)=95.45% t=3 F(t)=99.73%,68.27%,95.45%,99.73%,抽樣極限誤差,第五節(jié) 假設(shè)檢驗,一、假設(shè)檢驗的概念 二、假設(shè)檢驗的一般方法 三、正態(tài)總體參數(shù)的檢驗 四、總體成數(shù)的假設(shè)檢驗,例1 設(shè)某廠生產(chǎn)一種燈泡,其壽命服從正態(tài)分布,從過去較長一段時間的生產(chǎn)情況看,燈

19、泡的平均壽命為1500小時。標(biāo)準(zhǔn)差為100小時,現(xiàn)從新批量生產(chǎn)的燈泡中隨機抽取100只作試驗,測得平均壽命為1530小時。 問:新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命是否有顯著差異?,分析:從抽樣的結(jié)果上看,新批量生產(chǎn)的燈泡中100只燈泡平均壽命為1530小時,比以往的燈泡使用的平均壽命1500小時增加了30小時。這30小時的差異產(chǎn)生有二種情況。 A.新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差異,30小時的差異是抽樣的隨機性造成的。 B.抽樣的隨機性不可能造成30小時這么大的差異,新批量生產(chǎn)燈泡的平均壽命確實增加了。,可先假設(shè)新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差

20、異。然后利用抽樣100只燈泡的信息來檢驗我們的假設(shè)是否正確。 如果假設(shè)成立,說明新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命無顯著差異。 如果假設(shè)不成立,說明新批量生產(chǎn)燈泡的平均壽命與以往的燈泡使用壽命有否顯著的差異。,一、假設(shè)檢驗的概念,1.概念: 根據(jù)一定隨機樣本所提供的信息,用它來判斷總體位置參數(shù)事先的假設(shè)是否可信的統(tǒng)計分析方法。 2.基本思想: 為了判斷總體的某個特征,先根據(jù)決策要求,對總體特征做出一個原假設(shè),然后從總體中抽取一定容量的隨機樣本,計算和分析樣本數(shù)據(jù),對總體的原假設(shè)做假設(shè)檢驗,進(jìn)而作出接受或拒絕原假設(shè)的決策。,假設(shè)檢驗的基本思想,二、假設(shè)檢驗的一般方法,小概率原理是假設(shè)檢

21、驗的基本依據(jù),即認(rèn)為小概率事件在一次試驗中幾乎是不可能發(fā)生的。當(dāng)進(jìn)行假設(shè)檢驗時,先假設(shè)H0正確,在此假設(shè)下,若小概率事件A出現(xiàn)的概率很小,例如P(A)=0.01,經(jīng)過取樣試驗后,A出現(xiàn)了,則違反了上述原理,我們認(rèn)為這是一個不合理的結(jié)果。,這時,我們只能懷疑作為小概率事件A的前提假設(shè)H0的正確性,于是否定H0。反之,如果試驗中A沒有出現(xiàn),我們就沒有理由否定假設(shè)H0,從而做出接受H0的結(jié)論。下面我們通過實例來說明假設(shè)檢驗的基本思想及推理方法。,原假設(shè) 是關(guān)于總體均值而非樣本統(tǒng)計量的假設(shè) 總是假設(shè)原假設(shè)是正確的 原假設(shè)可能被接受也可能被拒絕 替代假設(shè) 是原假設(shè)的對立 替代假設(shè)可能被接受也可能被拒絕

22、替代假設(shè)是試圖要建立的檢驗,假設(shè)檢驗的步驟 提出原假設(shè)和替代假設(shè) 確定適當(dāng)?shù)臋z驗統(tǒng)計量 規(guī)定顯著性水平 計算檢驗統(tǒng)計量的值 作出統(tǒng)計決策,提出原假設(shè)和替代假設(shè), 什么是原假設(shè)?(Null Hypothesis) 1. 待檢驗的假設(shè),又稱“0假設(shè)” 2. 如果錯誤地作出決策會導(dǎo)致一系列后果 3. 總是有等號 , 或 4. 表示為 H0 H0: 某一數(shù)值 指定為 = 號,即 或 例如, H0: 3190(克),什么是替代假設(shè)?(Alternative Hypothesis) 1. 與原假設(shè)對立的假設(shè) 2. 總是有不等號: , 或 3. 表示為 H1 H1: 某一數(shù)值,或 某一數(shù)值 例如, H1:

23、3910(克),或 3910(克),提出原假設(shè)和替代假設(shè),假設(shè)檢驗分為雙側(cè)檢驗和單側(cè)檢驗,1. 雙側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)等于某一數(shù)值。如果樣本的統(tǒng)計量明顯大于或明顯小于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為雙側(cè)檢驗。,如原假設(shè)為H0 : , 那么只要 或 二者之一成立,就可以否定原假設(shè)H0 ,這種假設(shè)檢驗就是雙側(cè)檢驗。 當(dāng)我們所關(guān)心的問題是要檢驗樣本均值與總體均值或樣本比率與總體比率有沒有顯著性差異性,而不問差異的方向是正差或是負(fù)差時,可采用雙側(cè)檢驗。,總體均值的雙側(cè)檢驗的原假設(shè)和替代假設(shè)為:,原假設(shè)為: H0 : 替代假設(shè)為: H1 : 總體比率的雙側(cè)檢驗的原假設(shè)

24、和替代假設(shè)為: 原假設(shè)為: H0 : 替代假設(shè)為: H1 :,2. 單側(cè)檢驗,(1)左側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)不少于某一數(shù)值。 如果樣本的統(tǒng)計量明顯小于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為左單側(cè)檢驗。,例3 某外貿(mào)企業(yè)生產(chǎn)茶葉用于出口,其重量服從正態(tài)分布,根據(jù)以前的資料已知總體標(biāo)準(zhǔn)差是1克,按規(guī)定平均重量不低于150克,現(xiàn)從一批即將出口的茶葉從中抽取25包進(jìn)行檢驗,測得其平均重量149.35克,現(xiàn)問這一批茶葉是否符合規(guī)定? 這是一個左側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為: 原假設(shè): H0 :這批茶葉每包平均重量不低于150克; 替代假設(shè)為H1 :這批茶葉每包平均重

25、量少于150克; 原假設(shè): H0 : 替代假設(shè)為:H1 :,當(dāng)我們所關(guān)心的問題是要檢驗總體均值與總體比率是否低于預(yù)先的數(shù)值,此時應(yīng)采用左側(cè)檢驗。,總體均值的左側(cè)檢驗的原假設(shè)和替代假設(shè)為:,原假設(shè)為: H0 : 替代假設(shè)為: H1 : 總體比率的左側(cè)檢驗的原假設(shè)和替代假設(shè)為: 原假設(shè)為: H0 : 替代假設(shè)為: H1 :,(2)右側(cè)檢驗 如果提出的原假設(shè)是總體的參數(shù)不大于某一數(shù)值。 如果樣本的統(tǒng)計量明顯大于總體參數(shù)的這一數(shù)值,就可以拒絕原假設(shè),則稱這種檢驗為右單側(cè)檢驗。,例4 某企業(yè)大量生產(chǎn)袋裝食品,按規(guī)定每袋重量不得少于250克。今從一批該種食品中隨機抽取50袋,發(fā)現(xiàn)有5袋低于250克。若規(guī)定

26、不符合標(biāo)準(zhǔn)的比例超過5%就不得出廠,問這批食品能否出廠? 這是一個右單側(cè)檢驗問題。應(yīng)建立的原假設(shè)和備擇假設(shè)為: 原假設(shè): H0 :這批食品不符合標(biāo)準(zhǔn)的比例不超過5% 備擇假設(shè)為H1 :這批食品不符合標(biāo)準(zhǔn)的比例超過5% 即: H0: H1:,當(dāng)我們所關(guān)心的問題是要檢驗總體均值與總體比率是否超過預(yù)先的數(shù)值,此時應(yīng)采用右單側(cè)檢驗。,總體均值的右側(cè)檢驗的原假設(shè)和替代假設(shè)為:,原假設(shè)為: H0 : 替代假設(shè)為: H1 : 總體比率的右側(cè)檢驗的原假設(shè)和替代假設(shè)為: 原假設(shè)為: H0 : 替代假設(shè)為: H1 :,雙側(cè)檢驗與單側(cè)檢驗 (假設(shè)的形式),什么檢驗統(tǒng)計量? 用于假設(shè)檢驗問題的統(tǒng)計量 選擇統(tǒng)計量的方法

27、與參數(shù)估計相同,需考慮 是大樣本還是小樣本 總體方差已知還是未知 檢驗統(tǒng)計量的基本形式為,確定適當(dāng)?shù)臋z驗統(tǒng)計量,規(guī)定顯著性水平,什么是顯著性水平? 1. 是一個概率值 2. 原假設(shè)為真時,拒絕原假設(shè)的概率 被稱為抽樣分布的拒絕域 3. 表示為 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先確定,作出統(tǒng)計決策,計算檢驗的統(tǒng)計量 根據(jù)給定的顯著性水平,查表得出相應(yīng)的臨界值Z或Z/2 將檢驗統(tǒng)計量的值與 水平的臨界值進(jìn)行比較 得出接受或拒絕原假設(shè)的結(jié)論,兩類錯誤分析,小概率原理是假設(shè)檢驗的基本依據(jù),然而,對于小概率事件,無論其概率多么小,還是可能發(fā)生的,所以,利用小

28、概率原理為基礎(chǔ)的假設(shè)檢驗方法進(jìn)行檢驗,可能會做出錯誤的判斷,主要有兩種形式 (1)原假設(shè)H0實際是正確的,但卻錯誤地拒絕了H0,這樣就犯了“棄真”的錯誤,通常稱為第一類錯誤。由于僅當(dāng)所考慮的小概率事件A發(fā)生時才拒絕H0,所以犯第一類錯誤的概率就是條件概率: (2)原假設(shè)H0實際是不正確的,但是卻錯誤地接受了H0,這樣就犯了“取偽”的錯誤,通常稱為第二類錯誤。犯第二類錯誤的概率記為。,我們自然希望犯這兩類錯誤的概率越小越好。但當(dāng)樣本容量n確定后,犯這兩類錯誤的概率不可能同時被控制,通常在我們根據(jù)歷史經(jīng)驗選取恰當(dāng)?shù)娘@著性水平后,通過擴大樣本容量n的方式來使第二類錯誤的概率減小。,H0: 無罪,假設(shè)

29、檢驗中的兩類錯誤 (決策結(jié)果),假設(shè)檢驗就好像一場審判過程,統(tǒng)計檢驗過程, 錯誤和 錯誤的關(guān)系,三、正態(tài)總體參數(shù)的檢驗,1)方差已知時對一個正態(tài)總體均值的檢驗 正態(tài)總體的方差已知,要檢驗總體的均值,其原假設(shè)為:H1:X=X0。與之相對應(yīng)的替代假設(shè)可能有三種:XX0,X XO, XXO,1雙側(cè)檢驗 雙側(cè)檢驗中的決策規(guī)則為: 當(dāng) ,就拒絕原假設(shè)H0 ,接受備擇假設(shè)H1 ; 當(dāng) ,就不能拒絕原假設(shè)H0 ,即接受原假設(shè)H0 我們把這種根據(jù)計算Z值的大小而作出決策的假設(shè)檢驗,稱為Z檢驗法。雙側(cè)檢驗決策如圖81所示。,以下以例1為例,(假定顯著水平 =0.05)說明假設(shè)檢驗的過程。,1.建立原假設(shè)和備擇假

30、設(shè); 原假設(shè)H0: 備擇假設(shè)H1 : 2.確定檢驗統(tǒng)計量為: 3. 規(guī)定顯著性水平 =0.05,由于這是雙側(cè)檢驗,查標(biāo)準(zhǔn)正態(tài)分布表可以得臨界值;,4.根據(jù)樣本的數(shù)據(jù)計算檢驗統(tǒng)計量的實際值為:,5.作用統(tǒng)計決策并加以解釋。 由于 ,所以拒絕原假設(shè)H0 ,選擇備擇假設(shè)H1 ,即新批量生產(chǎn)燈泡的平均壽命與以往使用燈泡的平均壽命有顯著的差異。,2左單側(cè)檢驗 左單側(cè)檢驗中的決策規(guī)則為: 當(dāng) ,就拒絕原假設(shè)H0 ,接受備擇假設(shè)H1 ; 當(dāng) ,就不能拒絕原假設(shè)H0 ,即接受原假設(shè)H0,3右側(cè)檢驗 右側(cè)檢驗中的決策規(guī)則為: 當(dāng) ,就拒絕原假設(shè)H0 ,接受備擇假設(shè)H1 ; 當(dāng) ,就不能拒絕原假設(shè)H0 ,即接受原

31、假設(shè)H0 右單側(cè)檢驗決策如圖93所示。,1. 2已知,關(guān)于的檢驗(z檢驗),z檢驗法 在上一節(jié)例1中,已討論過正態(tài)總體 , 當(dāng)2已知時,關(guān)于=0的檢驗問題。在這些問題中,我們都是利用H0為真時服從N(0,1)分布的統(tǒng)計量 來確定拒絕域的,這種檢驗法常稱為z檢驗法。 (利用服從正態(tài)分布的統(tǒng)計量z 進(jìn)行的假設(shè)檢驗稱為z檢驗法) z檢驗的步驟(同前),z檢驗的決策準(zhǔn)則如下 (1)雙側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (2)左側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (3)右側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。,某機床廠加工一種零件,根據(jù)經(jīng)驗知道,該

32、廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為0=0.081mm,總體標(biāo)準(zhǔn)差為= 0.025 。今換一種新機床進(jìn)行加工,抽取n=200個零件進(jìn)行檢驗,得到的橢圓度為0.076mm。試問新機床加工零件的橢圓度的均值與以前有無顯著差異?(0.05),均值的雙尾 Z 檢驗(計算結(jié)果),H0: = 0.081 H1: 0.081 = 0.05 n = 200 臨界值(s):,檢驗統(tǒng)計量:,決策:,結(jié)論:,拒絕H0,有證據(jù)表明新機床加工的零件的橢圓度與以前有顯著差異,2)2未知,關(guān)于的 檢驗(t檢驗),t檢驗法 設(shè)總體 ,其中 2 未知, 是來自總體x的樣本。因為 未知,不能用統(tǒng)計量 進(jìn)行檢驗,當(dāng)H0

33、成立時,我們可以使用此統(tǒng)計量 來進(jìn)行在 未知的情況下 的檢驗。 利用服從正態(tài)分布的統(tǒng)計量t 進(jìn)行的假設(shè)檢驗稱為t檢驗法,t檢驗的決策準(zhǔn)則如下 (1)雙側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (2)左側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。 (3)右側(cè)檢驗: 當(dāng) 時,拒絕原假設(shè)H0;否則接受原假設(shè)H0。,均值的雙尾 t 檢驗 (實例),【例】某廠采用自動包裝機分裝產(chǎn)品,假定每包產(chǎn)品的重量服從正態(tài)分布,每包標(biāo)準(zhǔn)重量為1000克。某日隨機抽查9包,測得樣本平均重量為986克,樣本標(biāo)準(zhǔn)差為24克。試問在0.05的顯著性水平上,能否認(rèn)為這天自動包裝機工作正常?,均值的雙尾 t 檢驗 (計算結(jié)果),H0: = 1000 H1: 1000 = 0.05 df = 9 - 1 = 8 臨界值(s):,檢驗統(tǒng)計量:,在 = 0.05的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論