《應(yīng)用統(tǒng)計(jì)學(xué)(第六版)(微課版)》 課件 盧冶飛 第6-10章 假設(shè)檢驗(yàn) -統(tǒng)計(jì)指數(shù)_第1頁(yè)
《應(yīng)用統(tǒng)計(jì)學(xué)(第六版)(微課版)》 課件 盧冶飛 第6-10章 假設(shè)檢驗(yàn) -統(tǒng)計(jì)指數(shù)_第2頁(yè)
《應(yīng)用統(tǒng)計(jì)學(xué)(第六版)(微課版)》 課件 盧冶飛 第6-10章 假設(shè)檢驗(yàn) -統(tǒng)計(jì)指數(shù)_第3頁(yè)
《應(yīng)用統(tǒng)計(jì)學(xué)(第六版)(微課版)》 課件 盧冶飛 第6-10章 假設(shè)檢驗(yàn) -統(tǒng)計(jì)指數(shù)_第4頁(yè)
《應(yīng)用統(tǒng)計(jì)學(xué)(第六版)(微課版)》 課件 盧冶飛 第6-10章 假設(shè)檢驗(yàn) -統(tǒng)計(jì)指數(shù)_第5頁(yè)
已閱讀5頁(yè),還剩463頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第6章

假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)在統(tǒng)計(jì)方法中的地位統(tǒng)計(jì)方法描述統(tǒng)計(jì)推斷統(tǒng)計(jì)參數(shù)估計(jì)假設(shè)檢驗(yàn)學(xué)習(xí)內(nèi)容6.1假設(shè)檢驗(yàn)的基本問(wèn)題6.2一個(gè)總體參數(shù)的檢驗(yàn)6.3兩個(gè)總體參數(shù)的檢驗(yàn)學(xué)習(xí)目標(biāo)假設(shè)檢驗(yàn)的基本思想和原理假設(shè)檢驗(yàn)的步驟一個(gè)總體參數(shù)的檢驗(yàn)兩個(gè)總體參數(shù)的檢驗(yàn)P值的計(jì)算與應(yīng)用用Excel進(jìn)行檢驗(yàn)6.1假設(shè)檢驗(yàn)的基本問(wèn)題6.1.1假設(shè)的陳述6.1.2兩類(lèi)錯(cuò)誤與顯著性水平6.1.3統(tǒng)計(jì)量與拒絕域6.1.4利用P值進(jìn)行決策假設(shè)的陳述什么是假設(shè)?

(hypothesis)

對(duì)總體參數(shù)的具體數(shù)值所作的陳述總體參數(shù)包括總體均值、比例、方差等分析之前必須陳述我認(rèn)為這種新藥的療效比原有的藥物更有效!什么是假設(shè)檢驗(yàn)?

(hypothesistest)先對(duì)總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過(guò)程有參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)邏輯上運(yùn)用反證法,統(tǒng)計(jì)上依據(jù)小概率原理假設(shè)檢驗(yàn)的基本思想...因此我們拒絕假設(shè)

=50...如果這是總體的假設(shè)均值樣本均值m=50抽樣分布H0這個(gè)值不像我們應(yīng)該得到的樣本均值...20總體

假設(shè)檢驗(yàn)的過(guò)程抽取隨機(jī)樣本均值

x

=20

我認(rèn)為人口的平均年齡是50歲提出假設(shè)

拒絕假設(shè)別無(wú)選擇!

作出決策原假設(shè)與備擇假設(shè)原假設(shè)

(nullhypothesis)研究者想收集證據(jù)予以反對(duì)的假設(shè)又稱(chēng)“0假設(shè)”總是有符號(hào)

,

4. 表示為H0H0:

=某一數(shù)值指定為符號(hào)=,

例如,H0:

10cmnull為什么叫0假設(shè)?之所以用零來(lái)修飾原假設(shè),其原因是原假設(shè)的內(nèi)容總是表示沒(méi)有差異或沒(méi)有改變,或變量間沒(méi)有關(guān)系等等零假設(shè)總是一個(gè)與總體參數(shù)有關(guān)的問(wèn)題,所以總是用希臘字母表示。關(guān)于樣本統(tǒng)計(jì)量如樣本均值或樣本均值之差的零假設(shè)是沒(méi)有意義的,因?yàn)闃颖窘y(tǒng)計(jì)量是已知的,當(dāng)然能說(shuō)出它們等于幾或是否相等

也稱(chēng)“研究假設(shè)”總是有符號(hào)

,

表示為H1研究者想收集證據(jù)予以支持的假設(shè)H1:

<某一數(shù)值,或

某一數(shù)值例如,H1:

<10cm,或

10cm備擇假設(shè)(alternativehypothesis)【例】一種零件的生產(chǎn)標(biāo)準(zhǔn)是直徑應(yīng)為10cm,為對(duì)生產(chǎn)過(guò)程進(jìn)行控制,質(zhì)量監(jiān)測(cè)人員定期對(duì)一臺(tái)加工機(jī)床檢查,確定這臺(tái)機(jī)床生產(chǎn)的零件是否符合標(biāo)準(zhǔn)要求。如果零件的平均直徑大于或小于10cm,則表明生產(chǎn)過(guò)程不正常,必須進(jìn)行調(diào)整。試陳述用來(lái)檢驗(yàn)生產(chǎn)過(guò)程是否正常的原假設(shè)和備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以證明的假設(shè)應(yīng)該是“生產(chǎn)過(guò)程不正?!薄=⒌脑僭O(shè)和備擇假設(shè)為:

H0:

10cmH1:

10cm【例】某品牌洗滌劑在它的產(chǎn)品說(shuō)明書(shū)中聲稱(chēng):平均凈含量不少于500g。從消費(fèi)者的利益出發(fā),有關(guān)研究人員要通過(guò)抽檢其中的一批產(chǎn)品來(lái)驗(yàn)證該產(chǎn)品制造商的說(shuō)明是否屬實(shí)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者抽檢的意圖是傾向于證實(shí)這種洗滌劑的平均凈含量并不符合說(shuō)明書(shū)中的陳述。建立的原假設(shè)和備擇假設(shè)為

H0:

500H1:

<500500g綠葉洗滌劑【例】一家研究機(jī)構(gòu)估計(jì),某城市中家庭擁有汽車(chē)的比例超過(guò)30%。為驗(yàn)證這一估計(jì)是否正確,該研究機(jī)構(gòu)隨機(jī)抽取了一個(gè)樣本進(jìn)行檢驗(yàn)。試陳述用于檢驗(yàn)的原假設(shè)與備擇假設(shè)提出假設(shè)(例題分析)解:研究者想收集證據(jù)予以支持的假設(shè)是“該城市中家庭擁有汽車(chē)的比例超過(guò)30%”。建立的原假設(shè)和備擇假設(shè)為

H0:

30%H1:

30%原假設(shè)和備擇假設(shè)是一個(gè)完備事件組,而且相互對(duì)立在一項(xiàng)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)必有一個(gè)成立,而且只有一個(gè)成立先確定備擇假設(shè),再確定原假設(shè)等號(hào)“=”總是放在原假設(shè)上因研究目的不同,對(duì)同一問(wèn)題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)提出假設(shè)(結(jié)論與建議)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)備擇假設(shè)沒(méi)有特定的方向性,并含有符號(hào)“

”的假設(shè)檢驗(yàn),稱(chēng)為雙側(cè)檢驗(yàn)或雙尾檢驗(yàn)(two-tailedtest)備擇假設(shè)具有特定的方向性,并含有符號(hào)“>”或“<”的假設(shè)檢驗(yàn),稱(chēng)為單側(cè)檢驗(yàn)或單尾檢驗(yàn)(one-tailedtest)備擇假設(shè)的方向?yàn)椤?lt;”,稱(chēng)為左側(cè)檢驗(yàn)

備擇假設(shè)的方向?yàn)椤?gt;”,稱(chēng)為右側(cè)檢驗(yàn)

雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)

(假設(shè)的形式)假設(shè)雙側(cè)檢驗(yàn)單側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)原假設(shè)H0:m

=m0H0:m

m0H0:m

m0備擇假設(shè)H1:m

≠m0H1:m

<m0H1:m

>m0以總體均值的檢驗(yàn)為例兩類(lèi)錯(cuò)誤與顯著性水平假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤1. 第Ⅰ類(lèi)錯(cuò)誤(棄真錯(cuò)誤)原假設(shè)為正確時(shí)拒絕原假設(shè)第Ⅰ類(lèi)錯(cuò)誤的概率記為

被稱(chēng)為顯著性水平2. 第Ⅱ類(lèi)錯(cuò)誤(取偽錯(cuò)誤)原假設(shè)為錯(cuò)誤時(shí)未拒絕原假設(shè)第Ⅱ類(lèi)錯(cuò)誤的概率記為

(Beta)

H0:無(wú)罪假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤(決策結(jié)果)陪審團(tuán)審判裁決實(shí)際情況無(wú)罪有罪無(wú)罪正確錯(cuò)誤有罪錯(cuò)誤正確H0檢驗(yàn)決策實(shí)際情況H0為真H0為假未拒絕H0正確決策(1–

a)第Ⅱ類(lèi)錯(cuò)誤(b)拒絕H0第Ⅰ類(lèi)錯(cuò)誤(a)正確決策(1-b)假設(shè)檢驗(yàn)就好像一場(chǎng)審判過(guò)程統(tǒng)計(jì)檢驗(yàn)過(guò)程

錯(cuò)誤和

錯(cuò)誤的關(guān)系

你要同時(shí)減少兩類(lèi)錯(cuò)誤的惟一辦法是增加樣本容量!

的關(guān)系就像翹翹板,

就大,

就小兩類(lèi)錯(cuò)誤的控制一般來(lái)說(shuō),對(duì)于一個(gè)給定的樣本,如果犯第Ι類(lèi)錯(cuò)誤的代價(jià)比犯第Ⅱ類(lèi)錯(cuò)誤的代價(jià)相對(duì)較高,則將犯第Ⅰ類(lèi)錯(cuò)誤的概率定得低些較為合理;反之,如果犯第Ι類(lèi)錯(cuò)誤的代價(jià)比犯第Ⅱ類(lèi)錯(cuò)誤的代價(jià)相對(duì)較低,則將犯第Ⅰ類(lèi)錯(cuò)誤的概率定得高些一般來(lái)說(shuō),發(fā)生哪一類(lèi)錯(cuò)誤的后果更為嚴(yán)重,就應(yīng)該首要控制哪類(lèi)錯(cuò)誤發(fā)生的概率。但由于犯第Ι類(lèi)錯(cuò)誤的概率是可以由研究者控制的,因此在假設(shè)檢驗(yàn)中,人們往往先控制第Ι類(lèi)錯(cuò)誤的發(fā)生概率影響

錯(cuò)誤的因素1. 總體參數(shù)的真值隨著假設(shè)的總體參數(shù)的減少而增大2. 顯著性水平

當(dāng)

減少時(shí)增大3. 總體標(biāo)準(zhǔn)差

當(dāng)

增大時(shí)增大4. 樣本容量n當(dāng)n減少時(shí)增大檢驗(yàn)?zāi)芰?/p>

(poweroftest)拒絕一個(gè)錯(cuò)誤的原假設(shè)的能力根據(jù)

的定義,

是指沒(méi)有拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率。這也就是說(shuō),1-

則是指拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率,這個(gè)概率被稱(chēng)為檢驗(yàn)?zāi)芰?也被稱(chēng)為檢驗(yàn)的勢(shì)或檢驗(yàn)的功效(power)可解釋為正確地拒絕一個(gè)錯(cuò)誤的原假設(shè)的概率顯著性水平

(significantlevel)1. 是一個(gè)概率值2. 原假設(shè)為真時(shí),拒絕原假設(shè)的概率抽樣分布的拒絕域3. 表示為

(alpha)常用的

值有0.01,0.05,0.104. 由研究者事先確定我們可以在事先確定用于拒絕原假設(shè)H0的證據(jù)必須強(qiáng)到何種程度。這等于說(shuō)我們要求多小的P值。而這個(gè)P值就叫顯著性水平,用

表示顯著性水平表示總體中某一類(lèi)數(shù)據(jù)出現(xiàn)的經(jīng)常程度假如我們選擇

=0.05,樣本數(shù)據(jù)能拒絕原假設(shè)的證據(jù)要強(qiáng)到:當(dāng)H0正確時(shí),這種樣本結(jié)果發(fā)生的頻率不超過(guò)5%;如果我們選擇

=0.01,就是要求拒絕H0的證據(jù)要更強(qiáng),這種樣本結(jié)果發(fā)生的頻率只有1%如果P值小于或等于

,我們稱(chēng)該組數(shù)據(jù)不利于原假設(shè)的證據(jù)有

顯著性水平顯著性水平

(significantlevel)significant(顯著的)一詞的意義在這里并不是“重要的”,而是指“非偶然的”在假設(shè)檢驗(yàn)中,如果樣本提供的證據(jù)拒絕原假設(shè),我們說(shuō)檢驗(yàn)的結(jié)果是顯著的,如果不拒絕原假設(shè),我們則說(shuō)結(jié)果是不顯著的一項(xiàng)檢驗(yàn)在統(tǒng)計(jì)上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說(shuō),不是靠機(jī)遇能夠得到的拒絕原假設(shè),表示這樣的樣本結(jié)果并不是偶然得到的;不拒絕原假設(shè)(拒絕原假設(shè)的證據(jù)不充分),則表示這樣的樣本結(jié)果只是偶然得到的統(tǒng)計(jì)顯著性

(significant)假設(shè)檢驗(yàn)中的小概率原理

什么小概率?1. 在一次試驗(yàn)中,一個(gè)幾乎不可能發(fā)生的事件發(fā)生的概率2. 在一次試驗(yàn)中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)3. 小概率由研究者事先確定統(tǒng)計(jì)量與拒絕域根據(jù)樣本觀測(cè)結(jié)果計(jì)算得到的,并據(jù)以對(duì)原假設(shè)和備擇假設(shè)作出決策的某個(gè)樣本統(tǒng)計(jì)量對(duì)樣本估計(jì)量的標(biāo)準(zhǔn)化結(jié)果原假設(shè)H0為真點(diǎn)估計(jì)量的抽樣分布檢驗(yàn)統(tǒng)計(jì)量(teststatistic)

標(biāo)準(zhǔn)化的檢驗(yàn)統(tǒng)計(jì)量

顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))抽樣分布H0臨界值臨界值a/2a/2

拒絕H0拒絕H01-

置信水平拒絕域非拒絕域拒絕域顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值

a/2a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(雙側(cè)檢驗(yàn))H0臨界值臨界值a/2

a/2

樣本統(tǒng)計(jì)量拒絕H0拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(單側(cè)檢驗(yàn))H0臨界值a拒絕H0抽樣分布1-

置信水平拒絕域非拒絕域顯著性水平和拒絕域

(左側(cè)檢驗(yàn))H0臨界值a拒絕H0抽樣分布1-

置信水平樣本統(tǒng)計(jì)量顯著性水平和拒絕域

(左側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(右側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平顯著性水平和拒絕域

(右側(cè)檢驗(yàn))H0臨界值a樣本統(tǒng)計(jì)量抽樣分布1-

置信水平拒絕H0決策規(guī)則給定顯著性水平

,查表得出相應(yīng)的臨界值z(mì)

或z

/2,t

或t

/2將檢驗(yàn)統(tǒng)計(jì)量的值與

水平的臨界值進(jìn)行比較作出決策雙側(cè)檢驗(yàn):|統(tǒng)計(jì)量|>臨界值,拒絕H0左側(cè)檢驗(yàn):統(tǒng)計(jì)量<-臨界值,拒絕H0右側(cè)檢驗(yàn):統(tǒng)計(jì)量>臨界值,拒絕H0利用P值進(jìn)行決策什么是P值?

(P-value)如果原假設(shè)為真,所得到的樣本結(jié)果會(huì)像實(shí)際觀測(cè)結(jié)果那么極端或更極端的概率P值告訴我們:如果原假設(shè)是正確的話,我們得到得到目前這個(gè)樣本數(shù)據(jù)的可能性有多大,如果這個(gè)可能性很小,就應(yīng)該拒絕原假設(shè)被稱(chēng)為觀察到的(或?qū)崪y(cè)的)顯著性水平?jīng)Q策規(guī)則:若p值<

,拒絕H0雙側(cè)檢驗(yàn)的P值

/

2

/

2Z拒絕H0拒絕H00臨界值計(jì)算出的樣本統(tǒng)計(jì)量計(jì)算出的樣本統(tǒng)計(jì)量臨界值1/2P值1/2P值左側(cè)檢驗(yàn)的P值0臨界值a樣本統(tǒng)計(jì)量拒絕H0抽樣分布1-

置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值右側(cè)檢驗(yàn)的P值0臨界值a拒絕H0抽樣分布1-

置信水平計(jì)算出的樣本統(tǒng)計(jì)量P值原假設(shè)的可信度有多高?如果H0所代表的假設(shè)是人們多年來(lái)一直相信的,就需要很強(qiáng)的證據(jù)(小的P值)才能說(shuō)服他們拒絕的結(jié)論是什么?如果拒絕H0而肯定H1

,就需要有很強(qiáng)的證據(jù)顯示要支持H1。比如,H1代表要花很多錢(qián)把產(chǎn)品包裝改換成另一種包裝,你就要有很強(qiáng)的證據(jù)顯示新包裝一定會(huì)增加銷(xiāo)售量(因?yàn)榫芙^H0要花很高的成本)多大的P值合適?顯著性檢驗(yàn)的目的是要描述樣本所提供不利于原假設(shè)的證據(jù)有多強(qiáng)。P值就在做這件事。但是,要證明原假設(shè)不正確,P值要多小,才能令人信服呢?這要根據(jù)兩種情況來(lái)確定有了P值,我們并不需要用5%或1%這類(lèi)傳統(tǒng)的顯著性水平。P值提供了更多的信息,它讓我們可以選擇任意水平來(lái)評(píng)估結(jié)果是否具有統(tǒng)計(jì)上的顯著性,從而可根據(jù)我們的需要來(lái)決定是否要拒絕原假設(shè)只要你認(rèn)為這么大的P值就算是顯著了,你就可以在這樣的P值水平上拒絕原假設(shè)傳統(tǒng)的顯著性水平,如1%、5%、10%等等,已經(jīng)被人們普遍接受為“拒絕原假設(shè)足夠證據(jù)”的標(biāo)準(zhǔn),我們大概可以說(shuō):10%代表有“一些證據(jù)”不利于原假設(shè);5%代表有“適度證據(jù)”不利于原假設(shè);1%代表有“很強(qiáng)證據(jù)”不利于原假設(shè)固定顯著性水平是否有意義用P值進(jìn)行檢驗(yàn)比根據(jù)統(tǒng)計(jì)量檢驗(yàn)提供更多的信息統(tǒng)計(jì)量檢驗(yàn)是我們事先給出的一個(gè)顯著性水平,以此為標(biāo)準(zhǔn)進(jìn)行決策,無(wú)法知道實(shí)際的顯著性水平究竟是多少比如,根據(jù)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)時(shí),只要統(tǒng)計(jì)量的值落在拒絕域,我們拒絕原假設(shè)得出的結(jié)論都是一樣的,即結(jié)果顯著。但實(shí)際上,統(tǒng)計(jì)量落在拒絕域不同的地方,實(shí)際的顯著性是不同的。比如,統(tǒng)計(jì)量落在臨界值附近與落在遠(yuǎn)離臨界值的地方,實(shí)際的顯著性就有較大差異。而P值給出的是實(shí)際算出的顯著水平,它告訴我們實(shí)際的顯著性水平是多少P值決策與統(tǒng)計(jì)量的比較拒絕H0P值決策與統(tǒng)計(jì)量的比較拒絕H0的兩個(gè)統(tǒng)計(jì)量的不同顯著性

Z拒絕H00統(tǒng)計(jì)量1

P1

值統(tǒng)計(jì)量2

P2

值拒絕H0臨界值與其人為地把顯著性水平

固定按某一水平上,不如干脆選取檢驗(yàn)統(tǒng)計(jì)量的P值與其大致知道犯第Ⅰ錯(cuò)誤的概率,不如干脆知道一個(gè)確切的犯第Ⅰ類(lèi)錯(cuò)誤的概率(P值)與其為選取“適當(dāng)?shù)摹钡亩鄲?,不如干脆把真正?/p>

(P值)算出來(lái)P值決策與統(tǒng)計(jì)量的比較(結(jié)論)樣本容量對(duì)檢驗(yàn)結(jié)果的影響投擲硬幣1000次、4040次和10000次時(shí)出現(xiàn)正面樣本比例的抽樣分布0.50.507這個(gè)結(jié)果出乎預(yù)料嗎?n=1000n=4040n=10000假設(shè)檢驗(yàn)結(jié)論的表述假設(shè)檢驗(yàn)結(jié)論的表述

(“顯著”與“不顯著”)當(dāng)拒絕原假設(shè)時(shí),我們稱(chēng)樣本結(jié)果是統(tǒng)計(jì)上顯著的拒絕原假設(shè)時(shí)結(jié)論是清楚的當(dāng)不拒絕原假設(shè)時(shí),我們稱(chēng)樣本結(jié)果是統(tǒng)計(jì)上不顯著的不拒絕原假設(shè)時(shí),并未給出明確的結(jié)論,不能說(shuō)原假設(shè)是正確的,也不能說(shuō)它不是正確的假設(shè)檢驗(yàn)結(jié)論的表述

(“接受”與“不拒絕”)假設(shè)檢驗(yàn)的目的在于試圖找到證據(jù)拒絕原假設(shè),而不在于證明什么是正確的當(dāng)沒(méi)有足夠證據(jù)拒絕原假設(shè)時(shí),不采用“接受原假設(shè)”的表述,而采用“不拒絕原假設(shè)”的表述?!安痪芙^”的表述實(shí)際上意味著并未給出明確的結(jié)論,我們沒(méi)有說(shuō)原假設(shè)正確,也沒(méi)有說(shuō)它不正確“接受”的說(shuō)法有時(shí)會(huì)產(chǎn)生誤導(dǎo),因?yàn)檫@種說(shuō)法似乎暗示著原假設(shè)已經(jīng)被證明是正確的了。但事實(shí)上,H0的真實(shí)值我們永遠(yuǎn)也無(wú)法知道,H0只是對(duì)總體真實(shí)值的一個(gè)假定值,由樣本提供的信息也就自然無(wú)法證明它是否正確假設(shè)檢驗(yàn)結(jié)論的表述

(為什么不說(shuō)“接受”)【例】比如原假設(shè)為H0:

=10,從該總體中抽出一個(gè)隨機(jī)樣本,得到

x=9.8,在

=0.05的水平上,樣本提供的證據(jù)沒(méi)有推翻這一假設(shè),我們說(shuō)“接受”原假設(shè),這意味著樣本提供的證據(jù)已經(jīng)證明

=10是正確的。如果我們將原假設(shè)改為H0:

=10.5,同樣,在

=0.05的水平上,樣本提供的證據(jù)也沒(méi)有推翻這一假設(shè),我們又說(shuō)“接受”原假設(shè)。但這兩個(gè)原假設(shè)究竟哪一個(gè)是“真實(shí)的”呢?我們不知道假設(shè)檢驗(yàn)結(jié)論的表述

(為什么不說(shuō)“接受”)表述為“接受”一個(gè)原假設(shè),應(yīng)該注意到另一個(gè)原假設(shè)也可能同樣地與數(shù)據(jù)相符。因此,我們寧愿說(shuō)“不拒絕”當(dāng)然,在實(shí)際檢驗(yàn)中,針對(duì)一個(gè)具體問(wèn)題,將檢驗(yàn)結(jié)果表述為“不拒絕”原假設(shè),這似乎讓人感到無(wú)所適從比如,你想購(gòu)買(mǎi)一批產(chǎn)品,檢驗(yàn)的結(jié)果沒(méi)有拒絕原假設(shè),即達(dá)到合同規(guī)定的標(biāo)準(zhǔn)要求,你是否購(gòu)買(mǎi)這批產(chǎn)品呢?這時(shí),你可以對(duì)檢驗(yàn)的結(jié)果采取某種默認(rèn)態(tài)度,退一步說(shuō),你可以將檢驗(yàn)結(jié)果表述為“可以接受”原假設(shè),但這并不等于說(shuō)你“確實(shí)接受”它假設(shè)檢驗(yàn)步驟的總結(jié)陳述原假設(shè)和備擇假設(shè)從所研究的總體中抽出一個(gè)隨機(jī)樣本確定一個(gè)適當(dāng)?shù)臋z驗(yàn)統(tǒng)計(jì)量,并利用樣本數(shù)據(jù)算出其具體數(shù)值確定一個(gè)適當(dāng)?shù)娘@著性水平,并計(jì)算出其臨界值,指定拒絕域?qū)⒔y(tǒng)計(jì)量的值與臨界值進(jìn)行比較,作出決策統(tǒng)計(jì)量的值落在拒絕域,拒絕H0,否則不拒絕H0也可以直接利用P值作出決策6.2一個(gè)總體參數(shù)的檢驗(yàn)6.2.1總體均值的檢驗(yàn)6.2.2總體比例的檢驗(yàn)6.2.3總體方差的檢驗(yàn)一個(gè)總體參數(shù)的檢驗(yàn)z檢驗(yàn)(單尾和雙尾)

t檢驗(yàn)(單尾和雙尾)z

檢驗(yàn)(單尾和雙尾)

2檢驗(yàn)(單尾和雙尾)均值總體參數(shù)比例方差總體均值的檢驗(yàn)總體均值的檢驗(yàn)

(作出判斷)

是否已知小樣本容量n大

是否已知否t檢驗(yàn)否z檢驗(yàn)是z檢驗(yàn)

是z檢驗(yàn)總體均值的檢驗(yàn)

(大樣本)總體均值的檢驗(yàn)

(大樣本) 1.假定條件正態(tài)總體或非正態(tài)總體大樣本(n

30)2.使用z檢驗(yàn)統(tǒng)計(jì)量

2

已知:

2

未知:總體均值的檢驗(yàn)(

2

已知)

(例題分析)【例】一種罐裝飲料采用自動(dòng)生產(chǎn)線生產(chǎn),每罐的容量是255ml,標(biāo)準(zhǔn)差為5ml。為檢驗(yàn)每罐容量是否符合要求,質(zhì)檢人員在某天生產(chǎn)的飲料中隨機(jī)抽取了40罐進(jìn)行檢驗(yàn),測(cè)得每罐平均容量為255.8ml。取顯著性水平

=0.05,檢驗(yàn)該天生產(chǎn)的飲料容量是否符合標(biāo)準(zhǔn)要求?雙側(cè)檢驗(yàn)綠色健康飲品綠色健康飲品255255總體均值的檢驗(yàn)(

2

已知)

(例題分析)H0

=255H1

255

=0.05n=40臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:z01.96-1.960.025拒絕H0拒絕H00.025決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)還不足以推翻“該天生產(chǎn)的飲料符合標(biāo)準(zhǔn)要求”的看法總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類(lèi)中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名菜單下選擇【NORMSDIST】,然后【確定】第3步:將z的絕對(duì)值1.01錄入,得到的函數(shù)值為

0.843752345

P值=2(1-0.843752345)=0.312495

P值遠(yuǎn)遠(yuǎn)大于

,故不拒絕H0總體均值的檢驗(yàn)(

2

未知)

(例題分析)【例】一種機(jī)床加工的零件尺寸絕對(duì)平均誤差為1.35mm。生產(chǎn)廠家現(xiàn)采用一種新的機(jī)床進(jìn)行加工以期進(jìn)一步降低誤差。為檢驗(yàn)新機(jī)床加工的零件平均誤差與舊機(jī)床相比是否有顯著降低,從某天生產(chǎn)的零件中隨機(jī)抽取50個(gè)進(jìn)行檢驗(yàn)。利用這些樣本數(shù)據(jù),檢驗(yàn)新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比是否有顯著降低?(

=0.01)左側(cè)檢驗(yàn)50個(gè)零件尺寸的誤差數(shù)據(jù)(mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.86總體均值的檢驗(yàn)(

2

未知)

(例題分析)H0

1.35H1

<1.35

=0.01n=50臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0新機(jī)床加工的零件尺寸的平均誤差與舊機(jī)床相比有顯著降低決策:結(jié)論:-2.33z0拒絕H00.01總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類(lèi)中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名的菜單下選擇【ZTEST】,然后【確定】第3步:在所出現(xiàn)的對(duì)話框【Array】框中,輸入原始數(shù)據(jù)所在區(qū)域;在【X】后輸入?yún)?shù)的某一假定值(這里為1.35);在【Sigma】后輸入已知的總體標(biāo)準(zhǔn)差(若總體標(biāo)準(zhǔn)差未知?jiǎng)t可忽略不填,系統(tǒng)將自動(dòng)使用樣本標(biāo)準(zhǔn)差代替)第4步:用1減去得到的函數(shù)值0.995421023

即為P值

P值=1-0.995421023=0.004579

P值<

=0.01,拒絕H0總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的圖示)0-2.33a=0.01z拒絕H0抽樣分布1-

計(jì)算出的樣本統(tǒng)計(jì)量=2.6061P值P=0.004579

總體均值的檢驗(yàn)(

2

未知)

(例題分析)【例】某一小麥品種的平均產(chǎn)量為5200kg/hm2

。一家研究機(jī)構(gòu)對(duì)小麥品種進(jìn)行了改良以期提高產(chǎn)量。為檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高,隨機(jī)抽取了36個(gè)地塊進(jìn)行試種,得到的樣本平均產(chǎn)量為5275kg/hm2,標(biāo)準(zhǔn)差為120/hm2

。試檢驗(yàn)改良后的新品種產(chǎn)量是否有顯著提高?(

=0.05)右側(cè)檢驗(yàn)總體均值的檢驗(yàn)(

2

未知)

(例題分析)H0

5200H1

>5200

=0.05n=36臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0(P=0.000088<

=0.05)改良后的新品種產(chǎn)量有顯著提高決策:結(jié)論:z0拒絕H00.051.645總體均值的檢驗(yàn)(z檢驗(yàn))

(P值的圖示)抽樣分布P=0.00008801.645a=0.05拒絕H01-

計(jì)算出的樣本統(tǒng)計(jì)量=3.75P值總體均值的檢驗(yàn)

(大樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m=m0H1:m

m0H0:m

m0H1:m<m0H0:m

m0H1:m>m0統(tǒng)計(jì)量

已知

未知拒絕域P值決策拒絕H0總體均值的檢驗(yàn)

(小樣本)總體均值的檢驗(yàn)

(小樣本)1. 假定條件總體服從正態(tài)分布小樣本(n<

30)2.檢驗(yàn)統(tǒng)計(jì)量

2

已知:

2

未知:總體均值的檢驗(yàn)

(小樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m=m0H1:m

m0H0

:m

m0H1:m<m0H0:m

m0H1:m>m0統(tǒng)計(jì)量

已知

未知拒絕域P值決策拒絕H0注:

已知的拒絕域同大樣本總體均值的檢驗(yàn)

(例題分析)【例】一種汽車(chē)配件的平均長(zhǎng)度要求為12cm,高于或低于該標(biāo)準(zhǔn)均被認(rèn)為是不合格的。汽車(chē)生產(chǎn)企業(yè)在購(gòu)進(jìn)配件時(shí),通常是經(jīng)過(guò)招標(biāo),然后對(duì)中標(biāo)的配件提供商提供的樣品進(jìn)行檢驗(yàn),以決定是否購(gòu)進(jìn)?,F(xiàn)對(duì)一個(gè)配件提供商提供的10個(gè)樣本進(jìn)行了檢驗(yàn)。假定該供貨商生產(chǎn)的配件長(zhǎng)度服從正態(tài)分布,在0.05的顯著性水平下,檢驗(yàn)該供貨商提供的配件是否符合要求?10個(gè)零件尺寸的長(zhǎng)度(cm)12.210.812.011.811.912.411.312.212.012.3總體均值的檢驗(yàn)

(例題分析)H0

=12H1

12

=0.05df=10-1=9臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0樣本提供的證據(jù)還不足以推翻“該供貨商提供的零件符合要求”的看法決策:結(jié)論:t02.262-2.2620.025拒絕

H0拒絕H00.025總體均值的檢驗(yàn)(t檢驗(yàn))

(P值的計(jì)算與應(yīng)用)第1步:進(jìn)入Excel表格界面,直接點(diǎn)擊【f(x)】第2步:在函數(shù)分類(lèi)中點(diǎn)擊【統(tǒng)計(jì)】,并在函數(shù)名的菜單下選擇【TDIST】,然后【確定】第3步:在出現(xiàn)對(duì)話框的【X】欄中輸入計(jì)算出的t的絕對(duì)值0.7035,在【Deg-freedom】(自由度)欄中輸入本例的自由度9,在【Tails】欄中輸入2(表明是雙側(cè)檢驗(yàn),如果是單測(cè)檢驗(yàn)則在該欄輸入1)第4步:P值=0.499537958

P值>

=0.05,故不拒絕H0

總體比例的檢驗(yàn)適用的數(shù)據(jù)類(lèi)型離散數(shù)據(jù)

連續(xù)數(shù)據(jù)數(shù)值型數(shù)據(jù)數(shù)據(jù)品質(zhì)數(shù)據(jù)總體比例檢驗(yàn)假定條件總體服從二項(xiàng)分布可用正態(tài)分布來(lái)近似(大樣本)檢驗(yàn)的z統(tǒng)計(jì)量

0為假設(shè)的總體比例總體比例的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:

=

0H1:

0H0

0H1:

<

0H0

0H1:

>

0統(tǒng)計(jì)量拒絕域P值決策拒絕H0總體比例的檢驗(yàn)

(例題分析)【例】一種以休閑和娛樂(lè)為主題的雜志,聲稱(chēng)其讀者群中有80%為女性。為驗(yàn)證這一說(shuō)法是否屬實(shí),某研究部門(mén)抽取了由200人組成的一個(gè)隨機(jī)樣本,發(fā)現(xiàn)有146個(gè)女性經(jīng)常閱讀該雜志。分別取顯著性水平

=0.05和

=0.01,檢驗(yàn)該雜志讀者群中女性的比例是否為80%?它們的P值各是多少?雙側(cè)檢驗(yàn)總體比例的檢驗(yàn)

(例題分析)H0

=80%H1

80%

=0.05n=200臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:拒絕H0(P=0.013328<

=0.05)該雜志的說(shuō)法并不屬實(shí)

決策:結(jié)論:z01.96-1.960.025拒絕

H0拒絕

H00.025總體比例的檢驗(yàn)

(例題分析)H0

=80%H1

80%

=0.01n=200臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:不拒絕H0(P=0.013328>

=0.01)樣本提供的證據(jù)還不足以推翻“該雜志聲稱(chēng)讀者群中有80%為女性”的看法

決策:結(jié)論:z02.58-2.580.025拒絕H0拒絕H00.025總體方差的檢驗(yàn)

(

2檢驗(yàn))總體方差的檢驗(yàn)

(

2檢驗(yàn))

檢驗(yàn)一個(gè)總體的方差或標(biāo)準(zhǔn)差假設(shè)總體近似服從正態(tài)分布使用

2分布檢驗(yàn)統(tǒng)計(jì)量樣本方差假設(shè)的總體方差總體方差的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

2=

02H1:

2

0H0

2

02H1:

2

<

02H0:

2

02H1:

2

>

02統(tǒng)計(jì)量拒絕域P值決策

拒絕H0總體方差的檢驗(yàn)

(例題分析)【例】啤酒生產(chǎn)企業(yè)采用自動(dòng)生產(chǎn)線灌裝啤酒,每瓶的裝填量為640ml,但由于受某些不可控因素的影響,每瓶的裝填量會(huì)有差異。此時(shí),不僅每瓶的平均裝填量很重要,裝填量的方差同樣很重要。如果方差很大,會(huì)出現(xiàn)裝填量太多或太少的情況,這樣要么生產(chǎn)企業(yè)不劃算,要么消費(fèi)者不滿意。假定生產(chǎn)標(biāo)準(zhǔn)規(guī)定每瓶裝填量的標(biāo)準(zhǔn)差不應(yīng)超過(guò)和不應(yīng)低于4ml。企業(yè)質(zhì)檢部門(mén)抽取了10瓶啤酒進(jìn)行檢驗(yàn),得到的樣本標(biāo)準(zhǔn)差為s=3.8ml。試以0.10的顯著性水平檢驗(yàn)裝填量的標(biāo)準(zhǔn)差是否符合要求?朝日BEER朝日BEER朝日BEER朝日總體方差的檢驗(yàn)

(例題分析)H0

2=42H1

2

42

=0.10df=10-1=9臨界值(s):統(tǒng)計(jì)量:不拒絕H0樣本提供的證據(jù)還不足以推翻“裝填量的標(biāo)準(zhǔn)差不符合要求”的看法

2016.91903.32511

/2=0.05決策:結(jié)論:6.3兩個(gè)總體參數(shù)的檢驗(yàn)6.3.1兩個(gè)總體均值之差的檢驗(yàn)6.3.2兩個(gè)總體比例之差的檢驗(yàn)6.3.3兩個(gè)總體方差比的檢驗(yàn)兩個(gè)總體參數(shù)的檢驗(yàn)總體參數(shù)獨(dú)立樣本配對(duì)樣本均值差比例差方差比z

檢驗(yàn)(大樣本)t

檢驗(yàn)(小樣本)t

檢驗(yàn)(小樣本)z檢驗(yàn)F

檢驗(yàn)兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立大樣本)兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立大樣本)1.假定條件兩個(gè)樣本是獨(dú)立的隨機(jī)樣本正態(tài)總體或非正態(tài)總體大樣本(n1

30和n2

30)2.檢驗(yàn)統(tǒng)計(jì)量

12

,

22

已知:

12

22

未知:兩個(gè)總體均值之差的檢驗(yàn)

(大樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:m1-m2=0H1:m1-m2

0

H0

:m1-m2

0H1:m1-m2<0H0:m1-m2

0

H1:m1-m2>0統(tǒng)計(jì)量

12

,

22

已知

12

22

未知拒絕域P值決策拒絕H0兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】某公司對(duì)男女職員的平均小時(shí)工資進(jìn)行了調(diào)查,獨(dú)立抽取了具有同類(lèi)工作經(jīng)驗(yàn)的男女職員的兩個(gè)隨機(jī)樣本,并記錄下兩個(gè)樣本的均值、方差等資料如右表。在顯著性水平為0.05的條件下,能否認(rèn)為男性職員與女性職員的平均小時(shí)工資存在顯著差異?

兩個(gè)樣本的有關(guān)數(shù)據(jù)男性職員女性職員n1=44n1=32=75=70S12=64S22=42.25兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)H0

1-

2=0H1

1-

2

0

=0.05n1=44,n2

=32臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

拒絕H0該公司男女職員的平均小時(shí)工資之間存在顯著差異

z01.96-1.960.025拒絕H0拒絕H00.025兩個(gè)總體均值之差的檢驗(yàn)

(獨(dú)立小樣本)兩個(gè)總體均值之差的檢驗(yàn)

(

12,

22

已知)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布

12,

22已知檢驗(yàn)統(tǒng)計(jì)量?jī)蓚€(gè)總體均值之差的檢驗(yàn)

(

12,

22

未知但

12=

22)假定條件兩個(gè)獨(dú)立的小樣本兩個(gè)總體都是正態(tài)分布

12、

22未知但相等,即

12=

22檢驗(yàn)統(tǒng)計(jì)量其中:自由度:兩個(gè)總體均值之差的檢驗(yàn)

(

12,

22

未知且不相等

12

22)假定條件兩個(gè)總體都是正態(tài)分布

12,

22未知且不相等,即

12

22樣本容量相等,即n1=n2=n檢驗(yàn)統(tǒng)計(jì)量自由度:兩個(gè)總體均值之差的檢驗(yàn)

(

12,

22

未知且不相等

12

22)假定條件兩個(gè)總體都是正態(tài)分布

12,

22未知且不相等,即

12

22樣本容量不相等,即n1

n2檢驗(yàn)統(tǒng)計(jì)量自由度:兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】甲、乙兩臺(tái)機(jī)床同時(shí)加工某種同類(lèi)型的零件,已知兩臺(tái)機(jī)床加工的零件直徑(單位:cm)分別服從正態(tài)分布,并且有

12=

22

。為比較兩臺(tái)機(jī)床的加工精度有無(wú)顯著差異,分別獨(dú)立抽取了甲機(jī)床加工的8個(gè)零件和乙機(jī)床加工的7個(gè)零件,通過(guò)測(cè)量得到如下數(shù)據(jù)。在

=0.05的顯著性水平下,樣本數(shù)據(jù)是否提供證據(jù)支持

“兩臺(tái)機(jī)床加工的零件直徑不一致”的看法??jī)膳_(tái)機(jī)床加工零件的樣本數(shù)據(jù)(cm)甲20.519.819.720.420.120.019.019.9乙20.719.819.520.820.419.620.2兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)H0

1-

2

=0H1

1-

2

0

=0.05n1=8,n2

=7臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

不拒絕H0樣本提供的證據(jù)還不足以推翻“兩臺(tái)機(jī)床加工的零件直徑不一致”的看法t02.160-2.1600.025拒絕H0拒絕H00.025兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇【工具】下拉菜單并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在【數(shù)據(jù)分析】對(duì)話框中選擇

【t-檢驗(yàn):雙樣本等方差假設(shè)】第4步:當(dāng)對(duì)話框出現(xiàn)后在【變量1的區(qū)域】方框中輸入第1個(gè)樣本的數(shù)據(jù)區(qū)域在【變量2的區(qū)域】方框中輸入第2個(gè)樣本的數(shù)據(jù)區(qū)域在【假設(shè)平均差】方框中輸入假定的總體均值之差在【

】方框中輸入給定的顯著性水平(本例為0.05)

在【輸出選項(xiàng)】選擇計(jì)算結(jié)果的輸出位置,然后【確定】?jī)蓚€(gè)總體均值之差的檢驗(yàn)

(例題分析)【例】為檢驗(yàn)兩種方法組裝產(chǎn)品所需時(shí)間的差異,分別對(duì)兩種不同的組裝方法各隨機(jī)安排12個(gè)工人,每個(gè)工人組裝一件產(chǎn)品所需的時(shí)間(單位:min)下如表。假定兩種方法組裝產(chǎn)品的時(shí)間服從正態(tài)分布,但方差未知且不相等。取顯著性水平0.05,能否認(rèn)為方法1組裝產(chǎn)品的平均時(shí)間明顯地高于方法2??jī)蓚€(gè)方法組裝產(chǎn)品所需的時(shí)間方法1方法228.336.027.631.730.137.222.226.029.038.531.032.037.634.433.831.232.128.020.033.428.830.030.226.521兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:將原始數(shù)據(jù)輸入到Excel工作表格中第2步:選擇“工具”下拉菜單并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在【數(shù)據(jù)分析】對(duì)話框中選擇

【t-檢驗(yàn):雙樣本異方差假設(shè)】第4步:當(dāng)對(duì)話框出現(xiàn)后在【變量1的區(qū)域】方框中輸入第1個(gè)樣本的數(shù)據(jù)區(qū)域在【變量2的區(qū)域】方框中輸入第2個(gè)樣本的數(shù)據(jù)區(qū)域在【假設(shè)平均差】方框中輸入假定的總體均值之差在【

】方框中輸入給定的顯著性水平(本例為0.05)

在【輸出選項(xiàng)】選擇計(jì)算結(jié)果的輸出位置,然后【確定】?jī)蓚€(gè)總體均值之差的檢驗(yàn)

(匹配樣本)兩個(gè)總體均值之差的檢驗(yàn)

(匹配樣本)假定條件兩個(gè)總體配對(duì)差值構(gòu)成的總體服從正態(tài)分布配對(duì)差是由差值總體中隨機(jī)抽取的

數(shù)據(jù)配對(duì)或匹配(重復(fù)測(cè)量(前/后))檢驗(yàn)統(tǒng)計(jì)量樣本差值均值樣本差值標(biāo)準(zhǔn)差匹配樣本

(數(shù)據(jù)形式)

觀察序號(hào)樣本1樣本2差值1x11x21d1=x11-x212x12x22d2=x12-x22MMMMix1ix2idi

=x1i

-x2iMMMMnx1nx2ndn

=x1n-x2n兩個(gè)總體均值之差的檢驗(yàn)

(匹配樣本檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

:d=0H1:d

0H0

:d

0H1:d<0H0:d

0

H1:d>0統(tǒng)計(jì)量拒絕域P值決策拒絕H0兩個(gè)總體均值之差的檢驗(yàn)

(例題分析)

【例】某飲料公司開(kāi)發(fā)研制出一新產(chǎn)品,為比較消費(fèi)者對(duì)新老產(chǎn)品口感的滿意程度,該公司隨機(jī)抽選一組消費(fèi)者(8人),每個(gè)消費(fèi)者先品嘗一種飲料,然后再品嘗另一種飲料,兩種飲料的品嘗順序是隨機(jī)的,而后每個(gè)消費(fèi)者要對(duì)兩種飲料分別進(jìn)行評(píng)分(0分~10分),評(píng)分結(jié)果如下表。取顯著性水平

=0.05,該公司是否有證據(jù)認(rèn)為消費(fèi)者對(duì)兩種飲料的評(píng)分存在顯著差異??jī)煞N飲料平均等級(jí)的樣本數(shù)據(jù)舊飲料54735856新飲料66743976兩個(gè)總體均值之差的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【t檢驗(yàn):平均值成對(duì)二樣本分析】第4步:當(dāng)出現(xiàn)對(duì)話框后

在【變量1的區(qū)域】方框內(nèi)輸入變量1的數(shù)據(jù)區(qū)域

在【變量2的區(qū)域】方框內(nèi)輸入變量2的數(shù)據(jù)區(qū)域

在【假設(shè)平均差】方框內(nèi)輸入假設(shè)的差值(這里為0)

在【

】框內(nèi)輸入給定的顯著性水平,然后【確定】

兩個(gè)總體均值檢驗(yàn)方法總結(jié)均值差檢驗(yàn)獨(dú)立樣本大樣本

12、

22已知Z檢驗(yàn)

12、

22未知Z

檢驗(yàn)小樣本

12、

22已知Z檢驗(yàn)

12、

22未知

12=

22t檢驗(yàn)

12≠

22n1=n2t

檢驗(yàn)n1≠n2t

檢驗(yàn)匹配樣本小樣本t檢驗(yàn)兩個(gè)總體比例之差的檢驗(yàn)1.假定條件兩個(gè)總體都服從二項(xiàng)分布可以用正態(tài)分布來(lái)近似2.檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)H0:

1-

2=0檢驗(yàn)H0:

1-

2=d0兩個(gè)總體比例之差的檢驗(yàn)兩個(gè)總體比例之差的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0

1-

2=0H1:

1-

2

0H0

1-

2

0

H1:

1-

2<0

H0:

1-

2

0

H1:

1-

2>0

統(tǒng)計(jì)量拒絕域P值決策拒絕H0兩個(gè)總體比例之差的檢驗(yàn)

(例題分析)

【例】一所大學(xué)準(zhǔn)備采取一項(xiàng)學(xué)生在宿舍上網(wǎng)收費(fèi)的措施,為了解男女學(xué)生對(duì)這一措施的看法是否存在差異,分別抽取了200名男學(xué)生和200名女學(xué)生進(jìn)行調(diào)查,其中的一個(gè)問(wèn)題是:“你是否贊成采取上網(wǎng)收費(fèi)的措施?”其中男學(xué)生表示贊成的比例為27%,女學(xué)生表示贊成的比例為35%。調(diào)查者認(rèn)為,男學(xué)生中表示贊成的比例顯著低于女學(xué)生。取顯著性水平

=0.05,樣本提供的證據(jù)是否支持調(diào)查者的看法?21netnet兩個(gè)總體比例之差的檢驗(yàn)

(例題分析)H0

1-

2

0H1

1-

2<0

=0.05n1=200,n2=200臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

拒絕H0(P=0.041837<

=0.05)樣本提供的證據(jù)支持調(diào)查者的看法

-1.645Z0拒絕域

兩個(gè)總體比例之差的檢驗(yàn)

(例題分析)

【例】有兩種方法生產(chǎn)同一種產(chǎn)品,方法1的生產(chǎn)成本較高而次品率較低,方法2的生產(chǎn)成本較低而次品率則較高。管理人員在選擇生產(chǎn)方法時(shí),決定對(duì)兩種方法的次品率進(jìn)行比較,如方法1比方法2的次品率低8%以上,則決定采用方法1,否則就采用方法2。管理人員從方法1生產(chǎn)的產(chǎn)品中隨機(jī)抽取300個(gè),發(fā)現(xiàn)有33個(gè)次品,從方法2生產(chǎn)的產(chǎn)品中也隨機(jī)抽取300個(gè),發(fā)現(xiàn)有84個(gè)次品。用顯著性水平

=0.01進(jìn)行檢驗(yàn),說(shuō)明管理人員應(yīng)決定采用哪種方法進(jìn)行生產(chǎn)??jī)蓚€(gè)總體比例之差的檢驗(yàn)

(例題分析)H0

2-

1

8%H1

2-

1>8%

=0.01n1=300,n2=300臨界值(c):檢驗(yàn)統(tǒng)計(jì)量:決策:結(jié)論:

拒絕H0(P=1.22E-15<

=0.05)方法1的次品率顯著低于方法2達(dá)8%,應(yīng)采用方法1進(jìn)行生產(chǎn)-2.33Z0拒絕域

兩個(gè)總體方差比的檢驗(yàn)兩個(gè)總體方差比的檢驗(yàn)

(F

檢驗(yàn))假定條件兩個(gè)總體都服從正態(tài)分布,且方差相等兩個(gè)獨(dú)立的隨機(jī)樣本檢驗(yàn)統(tǒng)計(jì)量?jī)蓚€(gè)總體方差比的F

檢驗(yàn)

(臨界值)FF1-

F

拒絕H0方差比F檢驗(yàn)示意圖拒絕H0兩個(gè)總體方差比的檢驗(yàn)

(檢驗(yàn)方法的總結(jié))假設(shè)雙側(cè)檢驗(yàn)左側(cè)檢驗(yàn)右側(cè)檢驗(yàn)假設(shè)形式H0:

12/

22=1H1:

12/

221H0:

12/

22

1H1:

12/

22<1H0:

12/

22

1H1:

12/

22>1統(tǒng)計(jì)量拒絕域P值決策拒絕H0兩個(gè)總體方差比的檢驗(yàn)

(例題分析)【例】一家房地產(chǎn)開(kāi)發(fā)公司準(zhǔn)備購(gòu)進(jìn)一批燈泡,公司打算在兩個(gè)供貨商之間選擇一家購(gòu)買(mǎi)。這兩家供貨商生產(chǎn)的燈泡平均使用壽命差別不大,價(jià)格也很相近,考慮的主要因素就是燈泡使用壽命的方差大小。如果方差相同,就選擇距離較近的一家供貨商進(jìn)貨。為此,公司管理人員對(duì)兩家供貨商提供的樣品進(jìn)行了檢測(cè),得到的數(shù)據(jù)如右表。檢驗(yàn)兩家供貨商燈泡使用壽命的方差是否有顯著差異

(

=0.05)兩家供貨商燈泡使用壽命數(shù)據(jù)

樣本1650569622630596637628706617624563580711480688723651569709632

樣本2568540596555496646607562589636529584681539617兩個(gè)總體方差比的檢驗(yàn)

(用Excel進(jìn)行檢驗(yàn))第1步:選擇“工具”下拉菜單,并選擇【數(shù)據(jù)分析】第3步:在分析工具中選擇【F-檢驗(yàn)

雙樣本方差】第4步:當(dāng)出現(xiàn)對(duì)話框后

在【變量1的區(qū)域】方框內(nèi)輸入數(shù)據(jù)區(qū)域

在【變量2的區(qū)域】方框內(nèi)輸入數(shù)據(jù)區(qū)域

在【

】框內(nèi)輸入給定的顯著性水平選擇輸出區(qū)域選擇【確定】Excel中的統(tǒng)計(jì)函數(shù)ZTEST—計(jì)算Z檢驗(yàn)的P值TDIST—計(jì)算t分布的概率TINV—計(jì)算t分布的臨界值TTEST—計(jì)算t分布檢驗(yàn)的P值FDIST—計(jì)算F分布的概率FINV—計(jì)算F分布的逆函數(shù)(臨界值)FTEST—計(jì)算F檢驗(yàn)(兩個(gè)總體方差比的檢驗(yàn))單尾概率本章小結(jié)總體參數(shù)檢驗(yàn)一個(gè)總體均值大樣本Z檢驗(yàn)小樣本

2已知Z檢驗(yàn)

2未知t檢驗(yàn)比例Z檢驗(yàn)方差卡方檢驗(yàn)兩個(gè)總體均值差獨(dú)立樣本大樣本Z檢驗(yàn)小樣本

12,

22已知Z檢驗(yàn)

12,

22未知t檢驗(yàn)匹配樣本比例差大樣本Z檢驗(yàn)方差比F檢驗(yàn)本章小結(jié)假設(shè)檢驗(yàn)的基本問(wèn)題一個(gè)總體參數(shù)的檢驗(yàn)兩個(gè)總體參數(shù)的檢驗(yàn)用Excel進(jìn)行檢驗(yàn)利用P值進(jìn)行檢驗(yàn)EndofChapter6第7章方差分析7.1方差分析引論7.2單因素方差分析7.3雙因素方差分析學(xué)習(xí)內(nèi)容學(xué)習(xí)目標(biāo)解釋方差分析的概念解釋方差分析的基本思想和原理掌握單因素方差分析的方法及應(yīng)用理解多重比較的意義掌握雙因素方差分析的方法及應(yīng)用掌握試驗(yàn)設(shè)計(jì)的基本原理和方法7.1方差分析引論7.1.1方差分析及其有關(guān)術(shù)語(yǔ)7.1.2方差分析的基本思想和原理7.1.3方差分析的基本假定7.1.4問(wèn)題的一般提法為什么不做兩兩比較?設(shè)有四個(gè)總體的均值分別為m1、

m2、m3

、m4

,要檢驗(yàn)四個(gè)總體的均值是否相等,每次檢驗(yàn)兩個(gè)的作法共需要進(jìn)行6次不同的檢驗(yàn),每次檢驗(yàn)犯第一類(lèi)錯(cuò)誤的概率為,連續(xù)作6次檢驗(yàn)犯第Ⅰ類(lèi)錯(cuò)誤的概率增加到1-(1-)6=0.265,大于0.05。相應(yīng)的置信水平會(huì)降低到0.956=0.735一般來(lái)說(shuō),隨著增加個(gè)體顯著性檢驗(yàn)的次數(shù),偶然因素導(dǎo)致差別的可能性也會(huì)增加,(并非均值真的存在差別)方差分析方法則是同時(shí)考慮所有的樣本,因此排除了錯(cuò)誤累積的概率,從而避免拒絕一個(gè)真實(shí)的原假設(shè)方差分析及其有關(guān)術(shù)語(yǔ)什么是方差分析(ANOVA)?

(analysisofvariance)

檢驗(yàn)多個(gè)總體均值是否相等通過(guò)分析數(shù)據(jù)的誤差判斷各總體均值是否相等研究分類(lèi)型自變量對(duì)數(shù)值型因變量的影響

一個(gè)或多個(gè)分類(lèi)型自變量?jī)蓚€(gè)或多個(gè)(k個(gè))處理水平或分類(lèi)一個(gè)數(shù)值型因變量有單因素方差分析和雙因素方差分析單因素方差分析:涉及一個(gè)分類(lèi)的自變量雙因素方差分析:涉及兩個(gè)分類(lèi)的自變量什么是方差分析?

(例題分析)消費(fèi)者對(duì)四個(gè)行業(yè)的投訴次數(shù)行業(yè)觀測(cè)值零售業(yè)旅游業(yè)航空公司家電制造業(yè)12345675766494034534468392945565131492134404451657758【例】為了對(duì)幾個(gè)行業(yè)的服務(wù)質(zhì)量進(jìn)行評(píng)價(jià),消費(fèi)者協(xié)會(huì)在4個(gè)行業(yè)分別抽取了不同的企業(yè)作為樣本。最近一年中消費(fèi)者對(duì)總共23家企業(yè)投訴的次數(shù)如下表什么是方差分析?

(例題分析)分析4個(gè)行業(yè)之間的服務(wù)質(zhì)量是否有顯著差異,也就是要判斷“行業(yè)”對(duì)“投訴次數(shù)”是否有顯著影響作出這種判斷最終被歸結(jié)為檢驗(yàn)這四個(gè)行業(yè)被投訴次數(shù)的均值是否相等若它們的均值相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是沒(méi)有影響的,即它們之間的服務(wù)質(zhì)量沒(méi)有顯著差異;若均值不全相等,則意味著“行業(yè)”對(duì)投訴次數(shù)是有影響的,它們之間的服務(wù)質(zhì)量有顯著差異方差分析中的有關(guān)術(shù)語(yǔ)因素或因子(factor)所要檢驗(yàn)的對(duì)象分析行業(yè)對(duì)投訴次數(shù)的影響,行業(yè)是要檢驗(yàn)的因子水平或處理(treatment)因子的不同表現(xiàn)零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)觀察值在每個(gè)因素水平下得到的樣本數(shù)據(jù)每個(gè)行業(yè)被投訴的次數(shù)方差分析中的有關(guān)術(shù)語(yǔ)試驗(yàn)這里只涉及一個(gè)因素,因此稱(chēng)為單因素4水平的試驗(yàn)總體因素的每一個(gè)水平可以看作是一個(gè)總體零售業(yè)、旅游業(yè)、航空公司、家電制造業(yè)是4個(gè)總體樣本數(shù)據(jù)被投訴次數(shù)可以看作是從這4個(gè)總體中抽取的樣本數(shù)據(jù)方差分析的基本思想和原理方差分析的基本思想和原理

(圖形分析—散點(diǎn)圖)

零售業(yè)旅游業(yè)航空公司家電制造從散點(diǎn)圖上可以看出不同行業(yè)被投訴的次數(shù)有明顯差異同一個(gè)行業(yè),不同企業(yè)被投訴的次數(shù)也明顯不同家電制造被投訴的次數(shù)較高,航空公司被投訴的次數(shù)較低行業(yè)與被投訴次數(shù)之間有一定的關(guān)系如果行業(yè)與被投訴次數(shù)之間沒(méi)有關(guān)系,那么它們被投訴的次數(shù)應(yīng)該差不多相同,在散點(diǎn)圖上所呈現(xiàn)的模式也就應(yīng)該很接近方差分析的基本思想和原理

(圖形分析)散點(diǎn)圖觀察不能提供充分的證據(jù)證明不同行業(yè)被投訴的次數(shù)之間有顯著差異這種差異可能是由于抽樣的隨機(jī)性造成的需要有更準(zhǔn)確的方法來(lái)檢驗(yàn)這種差異是否顯著,也就是進(jìn)行方差分析所以叫方差分析,因?yàn)殡m然我們感興趣的是均值,但在判斷均值之間是否有差異時(shí)則需要借助于方差這個(gè)名字也表示:它是通過(guò)對(duì)數(shù)據(jù)誤差來(lái)源的分析判斷不同總體的均值是否相等。因此,進(jìn)行方差分析時(shí),需要考察數(shù)據(jù)誤差的來(lái)源方差分析的基本思想和原理方差分析的基本思想和原理

(兩類(lèi)誤差)隨機(jī)誤差因素的同一水平(總體)下,樣本各觀察值之間的差異比如,同一行業(yè)下不同企業(yè)被投訴次數(shù)之間的差異這種差異可以看成是隨機(jī)因素的影響,稱(chēng)為隨機(jī)誤差

系統(tǒng)誤差因素的不同水平(不同總體)之間觀察值的差異比如,不同行業(yè)之間的被投訴次數(shù)之間的差異這種差異可能是由于抽樣的隨機(jī)性所造成的,也可能是由于行業(yè)本身所造成的,后者所形成的誤差是由系統(tǒng)性因素造成的,稱(chēng)為系統(tǒng)誤差方差分析的基本思想和原理

(誤差平方和—SS)數(shù)據(jù)的誤差用平方和(sumofsquares)表示組內(nèi)平方和(withingroups)因素的同一水平下數(shù)據(jù)誤差的平方和比如,零售業(yè)被投訴次數(shù)的誤差平方和只包含隨機(jī)誤差組間平方和(betweengroups)因素的不同水平之間數(shù)據(jù)誤差的平方和比如,4個(gè)行業(yè)被投訴次數(shù)之間的誤差平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差方差分析的基本思想和原理

(均方—MS)平方和除以相應(yīng)的自由度若原假設(shè)成立,組間均方與組內(nèi)均方的數(shù)值就應(yīng)該很接近,它們的比值就會(huì)接近1若原假設(shè)不成立,組間均方會(huì)大于組內(nèi)均方,它們之間的比值就會(huì)大于1當(dāng)這個(gè)比值大到某種程度時(shí),就可以說(shuō)不同水平之間存在著顯著差異,即自變量對(duì)因變量有影響判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,也就是檢驗(yàn)被投訴次數(shù)的差異主要是由于什么原因所引起的。如果這種差異主要是系統(tǒng)誤差,說(shuō)明不同行業(yè)對(duì)投訴次數(shù)有顯著影響方差分析的基本假定方差分析的基本假定每個(gè)總體都應(yīng)服從正態(tài)分布對(duì)于因素的每一個(gè)水平,其觀察值是來(lái)自服從正態(tài)分布總體的簡(jiǎn)單隨機(jī)樣本比如,每個(gè)行業(yè)被投訴的次數(shù)必須服從正態(tài)分布各個(gè)總體的方差必須相同各組觀察數(shù)據(jù)是從具有相同方差的總體中抽取的比如,4個(gè)行業(yè)被投訴次數(shù)的方差都相等觀察值是獨(dú)立的比如,每個(gè)行業(yè)被投訴的次數(shù)與其他行業(yè)被投訴的次數(shù)獨(dú)立方差分析中的基本假定在上述假定條件下,判斷行業(yè)對(duì)投訴次數(shù)是否有顯著影響,實(shí)際上也就是檢驗(yàn)具有同方差的4個(gè)正態(tài)總體的均值是否相等如果4個(gè)總體的均值相等,可以期望4個(gè)樣本的均值也會(huì)很接近4個(gè)樣本的均值越接近,推斷4個(gè)總體均值相等的證據(jù)也就越充分樣本均值越不同,推斷總體均值不同的證據(jù)就越充分方差分析中的基本假定

如果原假設(shè)成立,即H0:

m1=m2=m3=m44個(gè)行業(yè)被投訴次數(shù)的均值都相等意味著每個(gè)樣本都來(lái)自均值為

、方差為

2的同一正態(tài)總體

Xf(X)

1

2

3

4

方差分析中的基本假定

若備擇假設(shè)成立,即H1:

mi(i=1,2,3,4)不全相等至少有一個(gè)總體的均值是不同的4個(gè)樣本分別來(lái)自均值不同的4個(gè)正態(tài)總體Xf(X)

3

1

2

4

問(wèn)題的一般提法問(wèn)題的一般提法設(shè)因素有k個(gè)水平,每個(gè)水平的均值分別用

1,

2,,

k

表示要檢驗(yàn)k個(gè)水平(總體)的均值是否相等,需要提出如下假設(shè):H0:

1

2

k

H1:

1,

2,,

k

不全相等設(shè)

1為零售業(yè)被投訴次數(shù)的均值,

2為旅游業(yè)被投訴次數(shù)的均值,

3為航空公司被投訴次數(shù)的均值,

4為家電制造業(yè)被投訴次數(shù)的均值,提出的假設(shè)為H0:

1

2

3

4

H1:

1,

2,

3,

4不全相等7.2單因素方差分析7.2.1數(shù)據(jù)結(jié)構(gòu)7.2.2分析步驟7.2.3關(guān)系強(qiáng)度的測(cè)量7.2.4方差分析中的多重比較單因素方差分析的數(shù)據(jù)結(jié)構(gòu)

(one-wayanalysisofvariance)

觀察值(j)因素(A)i

水平A1水平A2

水平Ak12::n

x11

x21

xk1x12

x22

xk2::

:

:::

:

:x1n

x2n

xkn分析步驟提出假設(shè)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量統(tǒng)計(jì)決策提出假設(shè)一般提法H0

:m1=m2=…=

mk

自變量對(duì)因變量沒(méi)有顯著影響H1:m1

,m2

,…

,mk不全相等自變量對(duì)因變量有顯著影響注意:拒絕原假設(shè),只表明至少有兩個(gè)總體的均值不相等,并不意味著所有的均值都不相等構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量構(gòu)造統(tǒng)計(jì)量需要計(jì)算水平的均值全部觀察值的總均值誤差平方和均方(MS)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算水平的均值)假定從第i個(gè)總體中抽取一個(gè)容量為ni的簡(jiǎn)單隨機(jī)樣本,第i個(gè)總體的樣本均值為該樣本的全部觀察值總和除以觀察值的個(gè)數(shù)計(jì)算公式為

式中:ni為第i個(gè)總體的樣本觀察值個(gè)數(shù)

xij為第i個(gè)總體的第j個(gè)觀察值

構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算全部觀察值的總均值)全部觀察值的總和除以觀察值的總個(gè)數(shù)計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(例題分析)構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算總誤差平方和SST)全部觀察值與總平均值的離差平方和反映全部觀察值的離散狀況其計(jì)算公式為

前例的計(jì)算結(jié)果

SST=(57-47.869565)2+…+(58-47.869565)2=115.9295構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算組間平方和SSA)各組平均值與總平均值的離差平方和反映各總體的樣本均值之間的差異程度該平方和既包括隨機(jī)誤差,也包括系統(tǒng)誤差計(jì)算公式為

前例的計(jì)算結(jié)果SSA=1456.608696構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算組內(nèi)平方和SSE)每個(gè)水平或組的各樣本數(shù)據(jù)與其組平均值的離差平方和反映每個(gè)樣本各觀察值的離散狀況該平方和反映的是隨機(jī)誤差的大小計(jì)算公式為

前例的計(jì)算結(jié)果SSE=2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(三個(gè)平方和的關(guān)系)

總離差平方和(SST)、誤差項(xiàng)離差平方和(SSE)、水平項(xiàng)離差平方和(SSA)之間的關(guān)系SST=SSA+SSE

前例的計(jì)算結(jié)果

4164.608696=1456.608696+2708構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)各誤差平方和的大小與觀察值的多少有關(guān),為消除觀察值多少對(duì)誤差平方和大小的影響,需要將其平均,這就是均方,也稱(chēng)為方差由誤差平方和除以相應(yīng)的自由度求得三個(gè)平方和對(duì)應(yīng)的自由度分別是SST的自由度為n-1,其中n為全部觀察值的個(gè)數(shù)SSA的自由度為k-1,其中k為因素水平(總體)的個(gè)數(shù)SSE的自由度為n-k構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算均方MS)組間方差:SSA的均方,記為MSA,計(jì)算公式為組內(nèi)方差:SSE的均方,記為MSE,計(jì)算公式為構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(計(jì)算檢驗(yàn)統(tǒng)計(jì)量F)將MSA和MSE進(jìn)行對(duì)比,即得到所需要的檢驗(yàn)統(tǒng)計(jì)量F當(dāng)H0為真時(shí),二者的比值服從分子自由度為k-1、分母自由度為n-k的F分布,即構(gòu)造檢驗(yàn)的統(tǒng)計(jì)量

(F分布與拒絕域)如果均值相等,F(xiàn)=MSA/MSE

1aF分布F

(k-1,n-k)0拒絕H0不能拒絕H0F統(tǒng)計(jì)決策

將統(tǒng)計(jì)量的值F與給定的顯著性水平

的臨界值F

進(jìn)行比較,作出對(duì)原假設(shè)H0的決策根據(jù)給定的顯著性水平

,在F分布表中查找與第一自由度df1=k-1、第二自由度df2=n-k相應(yīng)的臨界值F

若F>F

,則拒絕原假設(shè)H0

,表明均值之間的差異是顯著的,所檢驗(yàn)的因素對(duì)觀察值有顯著影響若F<F

,則不拒絕原假設(shè)H0

,無(wú)證據(jù)表明所檢驗(yàn)的因素對(duì)觀察值有顯著影響單因素方差分析表

(基本結(jié)構(gòu))誤差來(lái)源平方和(SS)自由度(df)均方(MS)F值P值F臨界值組間(因素影響)SSAk-1MSAMSAMSE組內(nèi)(誤差)SSEn-kMSE總和SSTn-1單因素方差分析

(例題分析)用Excel進(jìn)行方差分析

(Excel分析步驟)

第1步:選擇“工具”下拉菜單第2步:選擇【數(shù)據(jù)分析】選項(xiàng)第3步:在分析工具中選擇【單因素方差分析】

,然后選擇【確定】第4步:當(dāng)對(duì)話框出現(xiàn)時(shí)

在【輸入?yún)^(qū)域】方框內(nèi)鍵入數(shù)據(jù)單元格區(qū)域在【】方框內(nèi)鍵入0.05(可根據(jù)需要確定)

在【輸出選項(xiàng)】中選擇輸出區(qū)域關(guān)系強(qiáng)度的測(cè)量關(guān)系強(qiáng)度的測(cè)量

拒絕原假設(shè)表明因素(自變量)與觀測(cè)值之間有顯著關(guān)系組間平方和(SSA)度量了自變量(行業(yè))對(duì)因變量(投訴次數(shù))的影響效應(yīng)只要組間平方和SSA不等于0,就表明兩個(gè)變量之間有關(guān)系(只是是否顯著的問(wèn)題)當(dāng)組間平方和比組內(nèi)平方和(SSE)大,而且大到一定程度時(shí),就意味著兩個(gè)變量之間的關(guān)系顯著,大得越多,表明它們之間的關(guān)系就越強(qiáng)。反之,就意味著兩個(gè)變量之間的關(guān)系不顯著,小得越多,表明它們之間的關(guān)系就越弱關(guān)系強(qiáng)度的測(cè)量

變量間關(guān)系的強(qiáng)度用自變量平方和(SSA)占總平方和(SST)的比例大小來(lái)反映自變量平方和占總平方和的比例記為R2,即3.其平方根R就可以用來(lái)測(cè)量?jī)蓚€(gè)變量之間的關(guān)系強(qiáng)度關(guān)系強(qiáng)度的測(cè)量

(例題分析)

R=0.591404結(jié)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論