版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2020/8/25,1,Chapter8假設(shè)檢驗(yàn)初步,2020/8/25,2,假設(shè)檢驗(yàn)要解決的問題,處理組之間的平均數(shù)差異 處理組之間的平均數(shù)差異是偶然造成的,處理本身沒有效應(yīng) 處理組之間的平均數(shù)差異是由處理的效應(yīng)造成的 假設(shè)檢驗(yàn)用來發(fā)現(xiàn)屬于哪種情況 標(biāo)準(zhǔn)誤 概率,2020/8/25,3,假設(shè)檢驗(yàn)的定義,假設(shè)檢驗(yàn)是用樣本的數(shù)據(jù)來評(píng)估對(duì)于一個(gè)總體參數(shù)的假設(shè) 步驟 先提出一個(gè)關(guān)于一個(gè)總體的假設(shè)。例如考研(心理學(xué))的人智商都要高于普通人。 從考研的總體中,得到一個(gè)100人的隨機(jī)樣本 用樣本的數(shù)據(jù)來檢驗(yàn)假設(shè)。兩種結(jié)果:支持或者反對(duì),2020/8/25,4,假設(shè)檢驗(yàn),假設(shè)檢驗(yàn) (Hypothesis t
2、esting)是一種用樣本數(shù)據(jù)來評(píng)價(jià)有關(guān)總體的某一假設(shè)的可置信性的推論程序。 換句話說, 我們以樣本為依據(jù),對(duì)總體作出判斷. 例: 我們想知道心理學(xué)的學(xué)習(xí)成績(jī)和性別的關(guān)系. 假定女性要好于男性. 取本課程中的女性和男性. 在期末考察他們的學(xué)習(xí)成績(jī). 這里的總體是什么? 1)學(xué)心理學(xué)的女性 2) 學(xué)心理學(xué)的男性 - 這里的問題是, 兩個(gè)總體是否不同? 或者說, 女性學(xué)心理學(xué)的成績(jī)是否好于男性 女性的平均成績(jī)84分,男性79分 -問題: 這 5 的差異是 真實(shí)的 還是由于取樣誤差造成的? 如果差異是 “真實(shí)的”,那么我們可以得出結(jié)論:這兩個(gè)總體是不同的, 女性的學(xué)習(xí)心理學(xué)的成績(jī)好于男性。 如果差別
3、是由于取樣誤差造成的, 那么我們應(yīng)該得出結(jié)論:兩個(gè)總體其實(shí)沒有什么差別, 男女在學(xué)習(xí)心理學(xué)的成績(jī)上沒有差異。,2020/8/25,5,基本邏輯,假設(shè)檢驗(yàn)背后的基本邏輯是:總存在兩個(gè)假設(shè):虛無假設(shè)(null hypothesis)備擇假設(shè) (alternative hypothesis) 虛無假設(shè) (H0) 預(yù)測(cè)總體中自變量(處理)對(duì)于因變量不產(chǎn)生效應(yīng)。 備擇假設(shè) (H1) 預(yù)測(cè)總體中自變量(處理)對(duì)于因變量產(chǎn)生效應(yīng)。 假設(shè)檢驗(yàn)的邏輯是假定我們嘗試拒絕虛無假設(shè), 即我們要嘗試證明備擇假設(shè) .為什么? 一般說來, 顯示一件事不是真的比證明這件事是真的容易些。尤其是在考察樣本時(shí),我們根本無法了解整個(gè)
4、總體中, 除樣本之外的個(gè)體的情況。,2020/8/25,6,為什么嘗試拒絕虛無假設(shè)?,一般說來, 顯示一件事不是真的比證明這件事是真的容易些。尤其是在考察樣本時(shí),我們根本無法了解整個(gè)總體中, 除樣本之外的個(gè)體的情況。 假設(shè): 所有的狗都有 4 條腿. 要拒絕這個(gè)假設(shè): 只需拿出一個(gè)包括至少1只不是4條腿的狗的樣本 要接受這個(gè)假設(shè): 需要檢查總體中的所有狗,逐個(gè)數(shù)腿的個(gè)數(shù),2020/8/25,7,例子一,做蛋糕的方子的例子 方子上的做蛋糕的一種原料看不清了 先假設(shè)它為雞蛋 做出蛋糕以后看味道是否和原來一樣 說明那個(gè)原料不是雞蛋,2020/8/25,8,例子二,法庭上對(duì)于罪犯的無罪假設(shè)( H0 )
5、 基于無罪假設(shè)的推論和證據(jù)之間在常理上出現(xiàn)矛盾 推翻H0,H1成立 從而推出有罪,2020/8/25,9,假設(shè)檢驗(yàn)的邏輯,假設(shè)檢驗(yàn)的步驟 step1: 作出假設(shè),選擇一個(gè)決策標(biāo)準(zhǔn) - 所做的假設(shè)是對(duì)于某一事件/處理/因素的效應(yīng)(其導(dǎo)致總體間的差異)的有根據(jù)的推測(cè)或預(yù)測(cè)- 所做的假設(shè)可以是一般的 (如., 統(tǒng)計(jì)課程會(huì)改變閱讀理解能力), 或者具體的(如., 統(tǒng)計(jì)課程會(huì)使閱讀理解能力增加10%). step2: 收集一個(gè) 樣本 從總體中隨機(jī)選取個(gè)體- 隨機(jī)分配所選取的個(gè)體到特定的處理組 處理后, 主要問題是, 是所有的個(gè)體都屬于同一總體, 還是因?yàn)樘幚韨€(gè)體就屬于一個(gè)新的總體。 step3: 計(jì)算出
6、考驗(yàn)統(tǒng)計(jì)量 - 如z分?jǐn)?shù), t-考驗(yàn), f-考驗(yàn) (ANOVA) step4: 將考驗(yàn)統(tǒng)計(jì)量與某個(gè)發(fā)表比較以得出有關(guān)參數(shù)的推論,然后對(duì)樣本作出結(jié)論. - 所觀察到的差別有多大可能性是因?yàn)槿诱`差? 給出這個(gè)概率, 如何下結(jié)論?,2020/8/25,10,拒絕虛無假設(shè)的標(biāo)準(zhǔn),現(xiàn)在我們面臨的問題是. 我們由一個(gè)樣本,其描述統(tǒng)計(jì)量與總體的參數(shù) (由 控制組的樣本統(tǒng)計(jì)量反映出來)不同. 我們?nèi)绾文軟Q定發(fā)現(xiàn)的差異是由于兩總體間存在真實(shí)的差異還是由于取樣誤差所造成? 要解決這一問題,研究者必須事先設(shè)定一個(gè)標(biāo)準(zhǔn). 例如, 有一個(gè)總體 = 65 = 10, 取到一個(gè)均值是80的樣本 (容量為 n)的概率是多大
7、? 取到一個(gè)均值是80的樣本的概率是0.0002. 這已經(jīng)很小了. 我有把握說這個(gè)樣本不是從這個(gè)總體中來, 它是來自另一個(gè)總體。 事先設(shè)定一個(gè)標(biāo)準(zhǔn)會(huì)為我們說“這已經(jīng)很小了”提供更客觀的依據(jù). 這個(gè)事先設(shè)定的標(biāo)準(zhǔn)會(huì)限定概率有多小才足夠拒絕虛無假設(shè). 換言之, 發(fā)現(xiàn)的差別有多大才可以拒絕虛無假設(shè). 注意: 這慣例常常隨學(xué)科不同而不同.例如, 一些領(lǐng)域認(rèn)為 p 0.05 就足夠拒絕 H0. 而另一些領(lǐng)域則把界限設(shè)定在 p 0.01 。,2020/8/25,11,假設(shè)驗(yàn)證的可能結(jié)果,實(shí)際情況是怎樣? - H0 正確 (沒有差異,自變量沒有效應(yīng)) - H0 錯(cuò)誤 (差異存在,自變量產(chǎn)生效應(yīng)) 研究結(jié)論是
8、怎樣? - H0 正確 (未發(fā)現(xiàn)差異,未發(fā)現(xiàn)自變量的效應(yīng)) - H0 錯(cuò)誤(發(fā)現(xiàn)差異,發(fā)現(xiàn)自變量的效應(yīng)) 這就構(gòu)成了4種可能性 (2 * 2): - 2 種錯(cuò)誤方式- 2 種正確方式,2020/8/25,12,兩類錯(cuò)誤的產(chǎn)生,2020/8/25,13,I 類錯(cuò)誤(type I error),I 類錯(cuò)誤(type I error) (a 錯(cuò)誤) - H0 實(shí)際正確, 但研究結(jié)果拒絕了 H0 實(shí)際只有一個(gè)總體, 即使從該總體中抽取這樣樣本的概率很小, 但小概率事件發(fā)生了,2020/8/25,14,II類錯(cuò)誤(type II error),II類錯(cuò)誤(type II error) (b 錯(cuò)誤)- H
9、0 實(shí)際是錯(cuò)誤的, 但是研究沒有拒絕它 考察的樣本其實(shí)來自另一個(gè)總體, 但樣本均值與原來的總體均值太接近了不能排除它們是來自一個(gè)總體的可能性,2020/8/25,15,法庭裁決的類比,I類錯(cuò)誤 - 將無辜者送進(jìn)監(jiān)獄 II類錯(cuò)誤 - 讓罪人逃脫法網(wǎng),2020/8/25,16,alpha 水平的設(shè)定,在科學(xué)研究中, 我們常常采取保守的策略, 設(shè)定標(biāo)準(zhǔn)來盡量減少I類錯(cuò)誤 (自變量其實(shí)沒有效應(yīng),但研究得到結(jié)論是有效應(yīng))。或者說, 科學(xué)家要設(shè)定一個(gè)可接受的alpha 水平 , 或稱顯著性水平(level of significance)。,2020/8/25,17,顯著性水平,顯著性水平規(guī)定了當(dāng)虛無假設(shè)
10、正確時(shí),樣本結(jié)果非常不可能出現(xiàn)的概率值。 當(dāng)實(shí)驗(yàn)產(chǎn)生非常不可能(以alpha為標(biāo)準(zhǔn))的數(shù)據(jù)時(shí), 我們就會(huì)拒絕虛無假設(shè). 所以, alpha 水平 也規(guī)定了I 類錯(cuò)誤的概率。 即, 當(dāng)H0事實(shí)上正確時(shí),拒絕H0的概率。 在心理學(xué)中, alpha 通常定在0.05。,2020/8/25,18,假設(shè)檢驗(yàn)的例子,不服用酒精的 總體 =18 正態(tài) =4,酒 精,服用酒精的總體 =? 正態(tài) =4,2020/8/25,19,解題過程,step 1:state the hypotheses, and select the alpha level. step 2:set the decision criteri
11、a by locating the critical region. step 3: collect the data, and compute the test statistics. step 4: make a decision,2020/8/25,20,樣本均值分布圖,如何解釋這些圖? 如果樣本均值落入陰影區(qū)域之內(nèi),那么我們就拒絕 H0. 如果樣本均值落在陰影區(qū)域之外, 那么我們可能不會(huì)拒絕H0. 這些陰影區(qū)域叫做臨界區(qū)域。 臨界區(qū)域由極端的樣本值組成,如果虛無假設(shè)正確的話,不大可能得到。臨界區(qū)域的大小是由alpha 水平?jīng)Q定的。 落入臨界區(qū)域之內(nèi)的樣本數(shù)據(jù)會(huì)使得虛無假設(shè)被拒絕。,20
12、20/8/25,21,什么時(shí)候用單尾檢驗(yàn)?,以前的研究的支持。 理論假設(shè)。 否則用雙尾檢驗(yàn),2020/8/25,22,有方向性的假設(shè)檢驗(yàn) 單尾考驗(yàn),2020/8/25,23,處理這一問題的另一個(gè)辦法是應(yīng)用 z分?jǐn)?shù). 因?yàn)槲覀冎缹?duì)應(yīng)于臨界區(qū)域的z分?jǐn)?shù)是 1.65, 這樣我們 只需要計(jì)算對(duì)應(yīng)于這一樣本均值的 z分?jǐn)?shù),來看它是否 is 大于或小于這一臨界z分?jǐn)?shù). Z = = (69 - 65) / 2 = 2.0 因?yàn)?Z臨界, 那么,我們可以拒絕 H0 在這個(gè)例子中, 我們假設(shè)處理會(huì)在某一特定方向上造成差異 (即,處理會(huì)使均值增加). 但是,假設(shè)檢驗(yàn)最提出的方式是作一個(gè)更一般的假設(shè):處理應(yīng)當(dāng)改變
13、均值, 或增加或減少.,2020/8/25,24,雙尾考驗(yàn),2020/8/25,25,假設(shè)檢驗(yàn)的前提,隨機(jī)樣本 - 樣本必須對(duì)總體有代表性。隨機(jī)取樣有助于確保取樣的代表性. 獨(dú)立觀察 也與樣本代表性有關(guān), 每個(gè)觀察應(yīng)該與所有其它觀察是獨(dú)立的。一個(gè)特定的觀察的概率應(yīng)當(dāng)保持恒定. 擲硬幣 賭徒錯(cuò)誤 研究一 研究?jī)和碾娨暪?jié)目偏好 選了20個(gè)兒童,來自A家庭4,來自B家庭3,來自C家庭5,來自E家庭2 20個(gè)被試在一個(gè)房間里按照順序判斷紐約到曼阿密的距離從眾群體壓力 已知且保持恒定 - 原總體的標(biāo)準(zhǔn)差必須保持恒定. 為什么? 一般的說,處理就是假定對(duì)總體中的每一個(gè)個(gè)體都加上(或減去) 一個(gè)常數(shù)。所以
14、總體的均值可能因處理而導(dǎo)致變化。但是, 記住對(duì)每一個(gè)個(gè)體都加上(或減去)一個(gè)常數(shù)并不改變其標(biāo)準(zhǔn)差. 取樣樣本是相對(duì)正態(tài)的 或者因?yàn)樵加^察的樣本是相對(duì)正態(tài)的, 或者因?yàn)橹行臉O限定理(或二者都有). 違反以上任何一個(gè)前提會(huì)嚴(yán)重地危及依據(jù)樣本對(duì)總體作出推論的有效性(應(yīng)付種種違反前提的情況, 其它類型的推論統(tǒng)計(jì)需要用到)。,2020/8/25,26,統(tǒng)計(jì)效力,type II error()-H0 實(shí)際上是錯(cuò)誤的, 但是實(shí)驗(yàn)結(jié)果沒有拒絕它。 當(dāng)H0錯(cuò)誤的時(shí)候必然有兩種結(jié)果(概率相加為1) 錯(cuò)誤的接受H0 正確的拒絕H0 統(tǒng)計(jì)考驗(yàn)的效力是該考驗(yàn)?zāi)軌蛘_地拒絕一個(gè)錯(cuò)誤的虛無假設(shè)的概率. 所以效力是 1 -
15、 . 所以, 考驗(yàn)的“效力” 越高,偵察到處理效應(yīng)的能力越大. 為了考察效力, 我們需要考慮H0錯(cuò)誤的情形。當(dāng)有兩個(gè)總體存在時(shí), 被處理的總體和虛無總體,效力就是當(dāng)虛無假設(shè)不正確時(shí),獲得落在臨界區(qū)域內(nèi)的樣本數(shù)據(jù)的概率.,2020/8/25,27,兩個(gè)總體間差異大 注意陰影區(qū)域 很大 正確地拒絕虛無假設(shè)的計(jì)劃?rùn)C(jī)會(huì)很大 兩個(gè)總體間差異小 注意陰影區(qū)域 很小 正確地拒絕虛無假設(shè)的計(jì)劃?rùn)C(jī)會(huì)不大,2020/8/25,28,影響效力的因素,增加 會(huì)增加效力. 單尾考驗(yàn)比雙尾考驗(yàn)的效力高, 如果能夠設(shè)定正確的尾端。 增加樣本容量會(huì)減少標(biāo)準(zhǔn)誤從而增加效力。,2020/8/25,29,增加 會(huì)增加效力.,202
16、0/8/25,30,單尾考驗(yàn)比雙尾考驗(yàn)的效力高, 如果能夠設(shè)定正確的尾端。,單尾 考驗(yàn)a = 0.05 臨界區(qū)域 (a) 全部在樣本的一邊 雙尾 考驗(yàn)a = 0.05 臨界 區(qū)域 (a)平均分布在 樣本的兩邊 結(jié)果是效力較小,2020/8/25,31,增加樣本容量會(huì)減少標(biāo)準(zhǔn)誤從而增加效力。,n 小a = 0.05 相對(duì)大的標(biāo)準(zhǔn)誤 N 大a = 0.05 相對(duì)小的標(biāo)準(zhǔn)誤 結(jié)果是效力較高,2020/8/25,32,本章回顧,什么是假設(shè)檢驗(yàn) 假設(shè)檢驗(yàn)的步驟 I 類錯(cuò)誤和II 類錯(cuò)誤 單尾和雙尾檢驗(yàn) 統(tǒng)計(jì)效力,2020/8/25,33,t 統(tǒng)計(jì)量簡(jiǎn)介,2020/8/25,34,t 統(tǒng)計(jì)量,與前面章節(jié)的
17、重大差別: 前面章節(jié):總體 m 和 s 均為已知 本章:處理總體s 未知的情況 (實(shí)際情況大部分是這樣),必須用 s 的估計(jì)值 某教師教授普通心理學(xué)已十個(gè)學(xué)期,期末考試分?jǐn)?shù)總體上呈正態(tài)分布=42 ,=9。現(xiàn)在這班學(xué)生100人,嘗試了新的教學(xué)方法,得到期末考試分?jǐn)?shù)的均值Xbar=46.5。新的教學(xué)方法有顯著的效應(yīng)嗎(用=0.05)?,2020/8/25,35,t 統(tǒng)計(jì)量,某教師教授普通心理學(xué),上學(xué)期期末考試分?jǐn)?shù)總體上呈正態(tài)分布=42 。學(xué)期有學(xué)生100人,嘗試了新的教學(xué)方法,得到期末考試分?jǐn)?shù)的均值Xbar=46.5,s=9。 新的教學(xué)方法有顯著的效應(yīng)嗎(用=0.05)?,2020/8/25,36
18、,Z 統(tǒng)計(jì)量,一位研究者編制問卷來測(cè)量抑郁水平。他使用了一個(gè)非常多的“正常”個(gè)體作標(biāo)準(zhǔn)化群體。其在這一測(cè)驗(yàn)上的均值和標(biāo)準(zhǔn)差為=55 ,=12。分?jǐn)?shù)分布呈正態(tài)。測(cè)驗(yàn)中,高分表示抑郁程度高。為確定測(cè)驗(yàn)是否對(duì)那些有嚴(yán)重抑郁的個(gè)體有足夠的敏感性,隨機(jī)抽取了一個(gè)抑郁癥病人樣本,對(duì)其進(jìn)行測(cè)試。得到一組數(shù)據(jù)如下: 59,60,60,67,65,90,89,73,74,81,71,71,83,83,88,83,84,86,85,78,79 病人在這一測(cè)驗(yàn)上的分?jǐn)?shù)與正常人顯著不同嗎?用 Alpha = .01 的標(biāo)準(zhǔn)作雙尾的假設(shè)檢驗(yàn)。,2020/8/25,37,Z 統(tǒng)計(jì)量適用的情形舉例,應(yīng)用多年的標(biāo)準(zhǔn)化成就測(cè)驗(yàn) Life Satisfaction ,GRE 已確立
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 實(shí)數(shù)考試?yán)}解析及答案
- 商法機(jī)考考試題及答案
- 汽車美容保養(yǎng)試題及答案
- 水泥廠培訓(xùn)課件教學(xué)
- 2025 小學(xué)三年級(jí)科學(xué)下冊(cè)保存磁鐵防止消磁的方法課件
- 《GAT 1054.6-2017公安數(shù)據(jù)元限定詞(6)》專題研究報(bào)告
- 2026 年初中英語《感嘆詞》專項(xiàng)練習(xí)與答案 (100 題)
- 《GAT 488-2020道路交通事故現(xiàn)場(chǎng)勘查車載照明設(shè)備通 用技術(shù)條件》專題研究報(bào)告
- 2026年深圳中考物理電熱的計(jì)算專項(xiàng)試卷(附答案可下載)
- 2026年大學(xué)大二(家具設(shè)計(jì)與工程)家具設(shè)計(jì)心理學(xué)綜合測(cè)試題及答案
- 結(jié)直腸癌患者健康教育處方
- 血透室感染控制
- 51-認(rèn)知無線電技術(shù)1課件
- 提高鋼立柱基礎(chǔ)預(yù)埋件質(zhì)量控制合格率QC活動(dòng)成果
- 高等有機(jī)合成-全套課件
- 2023年馬克思主義基本原理概論讀書筆記
- 鋼筋桁架樓板配筋及撓度計(jì)算小工具
- 新課標(biāo)必修數(shù)學(xué)5解三角形內(nèi)容分析及教學(xué)建議
- GB/T 40692-2021政務(wù)信息系統(tǒng)定義和范圍
- 公務(wù)員辭去公職申請(qǐng)表
- GB/T 13683-1992銷剪切試驗(yàn)方法
評(píng)論
0/150
提交評(píng)論