04_參數(shù)檢驗(yàn).ppt_第1頁
04_參數(shù)檢驗(yàn).ppt_第2頁
04_參數(shù)檢驗(yàn).ppt_第3頁
04_參數(shù)檢驗(yàn).ppt_第4頁
04_參數(shù)檢驗(yàn).ppt_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、多元統(tǒng)計(jì)分析,第4章 假設(shè)檢驗(yàn),本章主要內(nèi)容,在正態(tài)或近似正態(tài)分布的計(jì)量資料中,經(jīng)常在使用前一章統(tǒng)計(jì)描述過程分析后,還要進(jìn)行組與組之間平均水平的比較。本章介紹的T檢驗(yàn)方法,主要應(yīng)用在兩個(gè)樣本間比較。 如果需要比較兩組以上樣本均數(shù)的差別,這時(shí)就不能使用上述的T檢驗(yàn)方法作兩兩間的比較。對(duì)于兩組以上的均數(shù)比較,可使用方差分析方法。,假設(shè)檢驗(yàn)概述,假設(shè)檢驗(yàn)的基本思想 根據(jù)樣本的信息檢驗(yàn)關(guān)于總體的某個(gè)假設(shè)是否正確,這類問題稱作假設(shè)檢驗(yàn) 通過一個(gè)實(shí)例說明假設(shè)檢驗(yàn)的思想和方法,罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)為355毫升,生產(chǎn)流水線上罐裝可樂不斷地封裝,然后裝箱外運(yùn).怎么知道這批罐裝可樂的容量是否合格呢?,把每一罐都

2、打開倒入量杯, 看看容量是否合于標(biāo)準(zhǔn).,通常的辦法是進(jìn)行抽樣檢查,每隔一定時(shí)間,抽查若干罐.如每隔1小時(shí),抽查5罐,得5個(gè)容量的值X1,X5,根據(jù)這些值來判斷生產(chǎn)是否正常. 如發(fā)現(xiàn)不正常,就應(yīng)停產(chǎn),找出原因,排除故障,然后再生產(chǎn);如沒有問題,就繼續(xù)按規(guī)定時(shí)間再抽樣,以此監(jiān)督生產(chǎn),保證質(zhì)量.,討論罐裝可樂的容量問題,在正常生產(chǎn)條件下,由于種種隨機(jī)因素的影響,每罐可樂的容量應(yīng)在355毫升上下波動(dòng). 這些因素中沒有哪一個(gè)占有特殊重要的地位. 因此,假定每罐容量服從正態(tài)分布是合理的. 這樣,我們可以認(rèn)為X1,X5是取自正態(tài)總體N(,2)的樣本,當(dāng)生產(chǎn)比較穩(wěn)定時(shí),2是一個(gè)常數(shù). 要檢驗(yàn)的假設(shè)是:H0:=

3、0 (0=355) 它的對(duì)立假設(shè)是:H1:0 稱H0為原假設(shè)(或零假設(shè)),稱H1為備選假設(shè)(或?qū)α⒓僭O(shè)),如何判斷原假設(shè)H0 是否成立,由于是正態(tài)分布的期望值,它的估計(jì)量是樣本均值,因此可以根據(jù)樣本均值與0的差距來判斷H0 是否成立 當(dāng)上述差距較小時(shí),可認(rèn)為H0是成立的;差距較大時(shí),應(yīng)認(rèn)為H0不成立,即生產(chǎn)已不正常 較大、較小是一個(gè)相對(duì)的概念,合理的界限在何處?應(yīng)由什么原則來確定?,隨機(jī)誤差與系統(tǒng)誤差,問題歸結(jié)為對(duì)差異作定量的分析,以確定其性質(zhì). 差異可能是由抽樣的隨機(jī)性引起的,稱為“抽樣誤差”或 隨機(jī)誤差.這種誤差反映偶然、非本質(zhì)的因素所引起的隨機(jī)波動(dòng).然而,隨機(jī)性波動(dòng)是有一定限度的,如果差

4、異超過了這個(gè)限度,則我們就不能用抽樣的隨機(jī)性來解釋了.必須認(rèn)為這個(gè)差異反映了事物的本質(zhì)差別,即反映了生產(chǎn)已不正常.這種差異稱作“系統(tǒng)誤差” 根據(jù)所觀察到的差異,如何判斷它究竟是由于偶然性在起作用,還是生產(chǎn)確實(shí)不正常?這里需要給出一個(gè)量的界限 .,如何給出這個(gè)量的界限?,這里用到人們?cè)趯?shí)踐中普遍采用的一個(gè)原則:,小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生,在假設(shè)檢驗(yàn)中,我們稱這個(gè)小概率為顯著性水平,用表示.常取=0.1 0.05 0.01,罐裝可樂的容量按標(biāo)準(zhǔn)應(yīng)為355毫升. 一批可樂出廠前應(yīng)進(jìn)行抽樣檢查,現(xiàn)抽查了n 罐,測(cè)得容量為 X1,X2,Xn,問這一批可樂的容量是否合格? H0:=355) H

5、1:355 由于已知,選檢驗(yàn)統(tǒng)計(jì)量, N(0,1),它能衡量差異大小且分布已知,對(duì)給定的顯著水平,有標(biāo)準(zhǔn)正態(tài)分布的雙側(cè)分位數(shù)u/2 ,且下式成立,,故我們可以取拒絕域?yàn)椋?W:,如果由樣本值算得該統(tǒng)計(jì)量的實(shí)測(cè)值落入?yún)^(qū)域W,則拒絕H0;否則,不能拒絕H0 .,這里所依據(jù)的邏輯是,如果H0是對(duì)的,那么衡量差異大小的某個(gè)統(tǒng)計(jì)量落入?yún)^(qū)域 W(拒絕域) 是個(gè)小概率事件.如果該統(tǒng)計(jì)量的實(shí)測(cè)值落入W,也就是說,H0 成立下的小概率事件發(fā)生了,那么就認(rèn)為H0不可信而否定它.否則我們就不能否定H0 (只好接受它).,不否定H0并不是肯定H0一定對(duì),而只是說差異還不夠顯著,還沒有達(dá)到足以否定H0的程度 所以假設(shè)檢

6、驗(yàn)又叫“顯著性檢驗(yàn)” 如果顯著性水平取得很小,則拒絕域也會(huì)比較小.其后果是:H0難于被拒絕. 如果在很小的情況下H0仍被拒絕了,則說明實(shí)際情況很可能與之有顯著差異.基于這個(gè)理由,人們常把為0.05時(shí)拒絕H0稱為是顯著的,而把為0.01時(shí)拒絕H0稱為是高度顯著的.,假設(shè)檢驗(yàn)的一般步驟,(1)分析問題建立統(tǒng)計(jì)假設(shè); (2)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,在原假設(shè)成立條件下確定檢驗(yàn)統(tǒng)計(jì)量的分布; (3)由給定的小概率確定原假設(shè)的否定域; (4)由樣本實(shí)現(xiàn)計(jì)算檢驗(yàn)統(tǒng)計(jì)量實(shí)現(xiàn),根據(jù)其是否落入原假設(shè)的否定域進(jìn)行判斷。,假設(shè)檢驗(yàn)的兩類錯(cuò)誤,由于作出結(jié)論的依據(jù)是下述,小概率原理,小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生 .,假設(shè)

7、檢驗(yàn)的兩類錯(cuò)誤,如果H0成立,但統(tǒng)計(jì)量的實(shí)測(cè)值落入否定域,從而作出否定H0的結(jié)論,那就犯了以真為假的錯(cuò)誤.,如果H0不成立,但統(tǒng)計(jì)量的實(shí)測(cè)值未落入否定域,從而沒有作出否定H0的結(jié)論,即接受了錯(cuò)誤的H0,那就犯了以假為真的錯(cuò)誤 .,假設(shè)檢驗(yàn)的兩類錯(cuò)誤,犯兩類錯(cuò)誤的概率:,P拒絕H0|H0為真= ,P接受H0|H0不真= .,顯著性水平 為犯第一類錯(cuò)誤的概率.,4.2 單一樣本T檢驗(yàn),定義:SPSS單樣本T檢驗(yàn)是檢驗(yàn)?zāi)硞€(gè)變量的總體均值和某指定值之間是否存在顯著差異。統(tǒng)計(jì)的前提樣本總體服從正態(tài)分布。也就是說單樣本本身無法比較,進(jìn)行的是其均數(shù)與已知總體均數(shù)間的比較。,單樣本T檢驗(yàn)的零假設(shè)為H0總體均值

8、和指定檢驗(yàn)值之間不存在顯著差異。 采用T檢驗(yàn)方法,按照下面公式計(jì)算T統(tǒng)計(jì)量:,4.2 單一樣本T檢驗(yàn),操作練習(xí),菜單選項(xiàng): Analyze - Compare Means - One-Sample T Test 研究問題 打開數(shù)據(jù)文件“公司職工”,檢驗(yàn)該公司職工的平均當(dāng)前薪金是否達(dá)到36000元(年),4.3 兩獨(dú)立樣本T檢驗(yàn),定義:所謂獨(dú)立樣本是指兩個(gè)樣本之間彼此獨(dú)立沒有任何關(guān)聯(lián),兩個(gè)獨(dú)立樣本各自接受相同的測(cè)量,研究者的主要目的是了解兩個(gè)樣本之間是否有顯著差異存在。這個(gè)檢驗(yàn)的前提如下。 兩個(gè)樣本應(yīng)是互相獨(dú)立的,即從一總體中抽取一批樣本對(duì)從另一總體中抽取一批樣本沒有任何影響,兩組樣本個(gè)案數(shù)目可

9、以不同,個(gè)案順序可以隨意調(diào)整。 樣本來自的兩個(gè)總體應(yīng)該服從正態(tài)分布。,4.3 兩獨(dú)立樣本T檢驗(yàn),兩獨(dú)立樣本T檢驗(yàn)的零假設(shè)H0為兩總體均值之間不存在顯著差異。 在具體的計(jì)算中需要通過兩步來完成:第一,利用F檢驗(yàn)判斷兩總體的方差是否相同;第二,根據(jù)第一步的結(jié)果,決定T統(tǒng)計(jì)量和自由度計(jì)算公式,進(jìn)而對(duì)T檢驗(yàn)的結(jié)論作出判斷。,1判斷兩個(gè)總體的方差是否相同,SPSS采用Levene F方法檢驗(yàn)兩總體方差是否相同 原假設(shè)H0:12=22(兩總體方差齊性) 備擇假設(shè)H1:1222(兩總體方差不齊),2根據(jù)結(jié)果決定T統(tǒng)計(jì)量和自由度計(jì)算公式,(1)兩總體方差未知且相同情況下,T統(tǒng)計(jì)量,4.3 兩獨(dú)立樣本T檢驗(yàn),(

10、2)兩總體方差未知且不同情況下,T統(tǒng)計(jì)量,T統(tǒng)計(jì)仍然服從T分布,但自由度采用修正的自由度,公式為,4.3 兩獨(dú)立樣本T檢驗(yàn),原假設(shè)H0:1= 2(兩總體均值無顯著性差異) 備擇假設(shè)H1:12(兩總體均值存在顯著性差異) 從兩種情況下的T統(tǒng)計(jì)量計(jì)算公式可以看出,如果待檢驗(yàn)的兩樣本均值差異較小,t值較小,則說明兩個(gè)樣本的均值不存在顯著差異;相反,t值越大,說明兩樣本的均值存在顯著差異。,4.3 兩獨(dú)立樣本T檢驗(yàn),菜單選項(xiàng): Analyze - Compare Means - Independent-Samples T Test 研究問題 打開數(shù)據(jù)文件“公司職工”,分析下列問題 男職工平均薪金與女職

11、工平均薪金是否存在顯著性差異。 青年職工與中年職工平均薪金是否存在顯著差異。 40歲(含)以上職工與40歲以下職工平均薪金是否存在顯著差異。,4.4 配對(duì)樣本T檢驗(yàn),配對(duì)樣本T檢驗(yàn)是根據(jù)樣本數(shù)據(jù)對(duì)樣本來自的兩配對(duì)總體的均值是否有顯著性差異進(jìn)行推斷。一般用于同一研究對(duì)象(或兩配對(duì)對(duì)象)分別給予兩種不同處理的效果比較,以及同一研究對(duì)象(或兩配對(duì)對(duì)象)處理前后的效果比較。前者推斷兩種效果有無差別,后者推斷某種處理是否有效。,4.4 配對(duì)樣本T檢驗(yàn),配對(duì)樣本T檢驗(yàn)的前提要求如下: 兩個(gè)樣本應(yīng)是配對(duì)的。在應(yīng)用領(lǐng)域中,主要的配對(duì)資料包括:具有年齡、性別、體重、病況等非處理因素相同或相似者。首先兩個(gè)樣本的觀

12、察數(shù)目相同,其次兩樣本的觀察值順序不能隨意改變。 樣本來自的兩個(gè)總體應(yīng)服從正態(tài)分布。,4.4 配對(duì)樣本T檢驗(yàn),兩配對(duì)樣本T檢驗(yàn)的零假設(shè)H0為兩總體均值之間不存在顯著差異。 首先求出每對(duì)觀察值的差值,得到差值序列;然后對(duì)差值求均值;最后檢驗(yàn)差值序列的均值,即平均差是否與零有顯著差異。如果平均差和零有顯著差異,則認(rèn)為兩總體均值間存在顯著差異;否則,認(rèn)為兩總體均值間不存在顯著差異。,4.4 配對(duì)樣本T檢驗(yàn),4.4 配對(duì)樣本T檢驗(yàn),菜單選項(xiàng): Analyze - Compare Means - Paired-Samples T Test 研究問題 打開數(shù)據(jù)文件“公司職工”,分析該公司職工平均當(dāng)前薪金與

13、平均起始薪金之間是否存在顯著性差異。,4.5 單因素方差分析,方差分析用于兩個(gè)及兩個(gè)以上樣本均數(shù)差別的顯著性檢驗(yàn)。 受不同因素的影響,研究的數(shù)據(jù)會(huì)不同。造成結(jié)果差異的原因可分成兩類 一類是不可控的隨機(jī)因素的影響,這是人為很難控制的一類影響因素,稱為隨機(jī)變量; 另一類是研究中人為施加的可控因素對(duì)結(jié)果的影響,稱為控制變量。,方差分析的基本思想,通過分析研究不同變量的變異對(duì)總變異的貢獻(xiàn)大小,確定控制變量對(duì)研究結(jié)果影響力的大小。 通過方差分析,分析不同水平的控制變量是否對(duì)結(jié)果產(chǎn)生了顯著影響。如果控制變量的不同水平對(duì)結(jié)果產(chǎn)生了顯著影響,那么它和隨機(jī)變量共同作用,必然使結(jié)果有顯著的變化;如果控制變量的不同

14、水平對(duì)結(jié)果沒有顯著的影響,那么結(jié)果的變化主要由隨機(jī)變量起作用,和控制變量關(guān)系不大。,根據(jù)控制變量的個(gè)數(shù),可以將方差分析分成單因素方差分析和多因素方差分析。 單因素方差分析的控制變量只有一個(gè)(但一個(gè)控制變量可以有多個(gè)觀察水平),多因素方差分析的控制變量有多個(gè)。,單因素方差分析,定義:?jiǎn)我蛩胤讲罘治鰷y(cè)試某一個(gè)控制變量的不同水平是否給觀察變量造成了顯著差異和變動(dòng)。例如,培訓(xùn)是否給學(xué)生成績(jī)?cè)斐闪孙@著影響;不同地區(qū)的考生成績(jī)是否有顯著的差異等。 單因素方差分析實(shí)質(zhì)上采用了統(tǒng)計(jì)推斷的方法,由于方差分析有一個(gè)比較嚴(yán)格的前提條件,即不同水平下,各總體均值服從方差相同的正態(tài)分布,因此方差分析問題就轉(zhuǎn)換成研究不同水平下各個(gè)總體的均值是否有顯著差異的問題。,采用的統(tǒng)計(jì)推斷方法是計(jì)算F統(tǒng)計(jì)量,進(jìn)行F檢驗(yàn)。總的變異平方和記為SST,分解為兩個(gè)部分 一部分是由控制變量引起的離差,記為SSB(組間Between Groups離差平方和); 另一部分隨機(jī)變量引起的SSW(組內(nèi)Within Groups離差平方和)。于是有 SST=SSB+SSW,k為水平數(shù);ni為第i個(gè)水平下的樣本容量。 SSW是各水平組均值和總體均值離差的平方和,反映了控制變量的影響。 SSB是每個(gè)數(shù)據(jù)與本水平組平均值離差的平方和,反映了數(shù)據(jù)抽樣誤差的大小程度。,F統(tǒng)計(jì)量是平均組間平方和與平均

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論