統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素_第1頁
統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素_第2頁
統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素_第3頁
統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素_第4頁
統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素_第5頁
已閱讀5頁,還剩80頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)總體方法和影響因素10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的影響因素4心理學(xué)實(shí)驗(yàn)研究過程數(shù)據(jù)的采集和分析撰寫論文并提交發(fā)表對(duì)數(shù)據(jù)理論意義的討論和結(jié)論的推論課題的選擇與問題的提出實(shí)驗(yàn)設(shè)計(jì)的確定被試的選擇材料的選擇儀器的選擇和程序的確定13章四節(jié):統(tǒng)計(jì)檢驗(yàn)力17(13) Interpreting Research ResultsDescribing the Results of Research1The Nature of the Relationshi

2、p2Real Versus Chance Relationships3Effect Size and Importance4Inference in Behavioral Science Research5Null Results6Integrating the Results of Research7The process of conducting research can be divided into five stepsDeveloping an idea and refing it into a hypothesis Choosing a research strategyColl

3、ecting dataAnalyzing and interpreting dataReporting resultsWhitley等 (2013, P23)心理統(tǒng)計(jì)學(xué)新內(nèi)容學(xué)術(shù)期刊發(fā)表新要求1-1心理統(tǒng)計(jì)學(xué)教材發(fā)展的新內(nèi)容Howell-2011Gravetter-2011Aron等-20132013 - B.H.Cohen - 2008 高定國譯-2011甘怡群等-20051986-張厚粲先生等-2015 (4)張敏強(qiáng)-2010心理統(tǒng)計(jì)學(xué)的主要發(fā)展第9章 方差分析第12章 線性回歸第8章 假設(shè)檢驗(yàn)第1章 緒論第2章 統(tǒng)計(jì)圖表第3章 集中量數(shù)第4章 差異量數(shù)第5章 相關(guān)系數(shù)第6章 概率分布第7

4、章 參數(shù)估計(jì)第10章 X2檢驗(yàn)第11章 非參數(shù)檢驗(yàn)第14章 抽樣原理及方法第9章 方差分析第12章 線性回歸第13章 多變量統(tǒng)計(jì)分析簡介 多變量統(tǒng)計(jì)分析簡介1統(tǒng)計(jì)檢驗(yàn)力和效果大小2一般線性模型(協(xié)方差分析)3Howell-2011Gravetter-2011Aron等-20132013/4-B.H.Cohen-(2007/3)2010.1-2013.5統(tǒng)計(jì)檢驗(yàn)力和效果大小2第8章 假設(shè)檢驗(yàn)1-2 APA論文發(fā)表的新要求“作者對(duì)于自己的研究假設(shè)進(jìn)行檢驗(yàn)時(shí),必須考慮采取嚴(yán)格的統(tǒng)計(jì)力(statistical power)。我們可以通過特定的水平、效果大小和樣本大小來決定統(tǒng)計(jì)力,而這關(guān)系到正確地拒絕作

5、者想要檢驗(yàn)的假設(shè)的可能性APA寫作手冊(cè)2001第5版中譯本P14“Statistical power. Take seriously the statistical power considerations associated with your tests of hypotheses. Such considerations relate to the likelihood of correctly rejecting the tested hypotheses, given a particular alpha level, effect size,and sample sizeAPA寫

6、作手冊(cè)1994第4版P16為了讓讀者能夠充分地了解到你的研究發(fā)現(xiàn)的重要性,在你的結(jié)果段落中呈現(xiàn)效果大?。╡ffect size)的索引或關(guān)系強(qiáng)度(strength of a relationship)是必要的。你可以使用一些一般效果大小的估計(jì)值來估計(jì)你研究結(jié)果的效果大小或關(guān)系強(qiáng)度,包括 , , , , , Cohen的d值 ”APA寫作手冊(cè)2001第5版中譯本P141-2 APA論文發(fā)表的新要求“Effect size and strength of relationship. You can estimate the magnitude of the effect or the streng

7、th of the relationship with a number of measures that do not depend on sample size. Common measures are , , , , , Cohen的d值 APA寫作手冊(cè)1994第4版 P18Cohens d值1-2 APA論文發(fā)表的新要求Cohens d值美國APA-2010中國心理學(xué)會(huì)-20162011年3期2010年1期We conducted planned comparisons between judgments in the strong and weak alternatives cond

8、itions. Diagnostic judgments in the weak alternatives condition (M = 81.7) were higher than in the strong alternatives condition (M = 58.5), t(19) = 5.0, p .001, . Predictive judgments did not differ significantly (Mstrong = 75.3; Mweak = 69.6) t(19) = 1.3, ns. Corroborating this analysis, we also f

9、ound that there was no significant difference between judgments of P and Wc, t(39) = 0.60, ns.例 1 :Sloman等:Diagnostic Reasoning (JEP-G,P168-185)Cohens d Experiment 1: Results A comparison of the absolute values of the residuals from these models showed smaller deviations for the log model, t(19)= 3.

10、03, p = .007, d = 0.957 例 2 :Rips:How Many Is a Zillion? (JEP-LMC,P1257-1264)Experiment 1: Results and DiscussionA paired t test of the absolute values of the residuals shows smaller deviations from the logarithmic model, t(19) = 5.85, p .001, d = 1.85 d Experiment 2: Results and Discussiond The rat

11、e of false alarms to non-repeated stimuli was relatively low (M = 0.08, SD = 0.05), and for further analyses it was used in order to correct the individual hit rates. Repeated measures analysis of variance (ANOVA) revealed the main effect of n factor, F(2, 200) = 128.53, , p .61, ps .001)例 3 :Chuder

12、ski等:The Contribution of Working Memory to Fluid Reasoning(JEP-LMC,P1689-1710 )Experiment 1: Results We collapsed the data across participants and assessed the relative effect of strength of alternatives on predictive and diagnostic judgments by performing a 2 (alternatives: strong vs. weak) X 2 (ju

13、dgment: predictive vs. diagnostic) repeated-measures analysis of variance (ANOVA). There was a signifi-cant interaction between judgment type and strength of alter-natives, F(1, 19) = 31.4, p .001, . There was also a main effect of strength of alternatives, F(1, 19) = 4.9, p .039, , but no significa

14、nt effect of type of judgment, F(1, 19) = 0.6, ns.例 1 :Sloman等:Diagnostic Reasoning (JEP-G,P168-185)Experiment 1: Results 國內(nèi)心理學(xué)期刊有與國際接軌的要求2013年第3期開始2014年第1期開始第八屆全國心理學(xué)學(xué)術(shù)期刊聯(lián)席會(huì)議(2014年7月1820日. 江西師范大學(xué))10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2假設(shè)檢驗(yàn)統(tǒng)計(jì)檢驗(yàn)力的影響因素4統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3 2.1 男女學(xué)生平均智商差異顯著性檢驗(yàn)實(shí)例確定顯著性水平并

15、做出推論:3計(jì)算統(tǒng)計(jì)量2 建立假設(shè)1因 ,我們沒有充分根據(jù)拒絕虛無假設(shè),因此推論 為真(即兩組智商沒有顯著差異),作出這一推論的置信度為 95%(也即犯推論錯(cuò)誤的可能性為 5%) 2.1 男女學(xué)生平均智商差異顯著性檢驗(yàn)實(shí)例確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2 建立假設(shè)1因 ,我們沒有充分根據(jù)拒絕虛無假設(shè),因此推論 為真(即兩組智商沒有顯著差異),作出這一推論的置信度為 95%(也即犯推論錯(cuò)誤的可能性為 5%)問題:當(dāng) 在事實(shí)上是假的時(shí)候我們犯錯(cuò)誤的概率是多少?兩種假設(shè)兩類錯(cuò)誤及統(tǒng)計(jì)檢驗(yàn)力的含義 虛無假設(shè):備擇(研究)假設(shè): 在其他條件不變的前提下 和不可以同時(shí)增大或減小為真為假接受拒絕正確

16、決策正確決策 I 型錯(cuò)誤II 型錯(cuò)誤統(tǒng)計(jì)檢驗(yàn)力(if the null hypothesis is false) The power of a statistical test of a null hypothesis is the probability that it will lead to the rejection of the null hypothesis.(在虛無假設(shè)為假時(shí))對(duì)一個(gè)虛無假設(shè)的統(tǒng)計(jì)檢驗(yàn)力是指將引導(dǎo)我們拒絕這個(gè)虛無假設(shè)的概率統(tǒng)計(jì)檢驗(yàn)力的含義假設(shè)檢驗(yàn)的效力是指該檢驗(yàn)?zāi)軌蛘_地拒絕一個(gè)錯(cuò)誤的虛無假設(shè)的概率statistical power is the probabil

17、ity that the study will give a significant result if the research hypothesis is true (P189) 接受拒絕正確決策正確決策 I 型錯(cuò)誤II 型錯(cuò)誤為真為假統(tǒng)計(jì)檢驗(yàn)力統(tǒng)計(jì)檢驗(yàn)力是指在虛無假設(shè)( )為假(也即備擇假設(shè)( )為真)時(shí),正確拒絕這一虛假的虛無假設(shè)的概率統(tǒng)計(jì)檢驗(yàn)力10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3統(tǒng)計(jì)檢驗(yàn)力的影響因素4統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法五種分布的不同含義統(tǒng)計(jì)檢驗(yàn)力的估計(jì)原理Comparison ofThree Type

18、s of DistributionsPopulationsDistributionParticularSamples DistributionDistribution of Means內(nèi)容總體中所有個(gè)體的分?jǐn)?shù)一次抽樣中每個(gè)個(gè)體的分?jǐn)?shù)從某個(gè)總體中多次隨機(jī)抽樣后各次抽樣的平均數(shù) 形狀可以是任何形狀,常為正態(tài)分布可以是任何形狀可以是任何形狀,常為正態(tài)分布Aron等-2013,P147在理解上述三種分布的基礎(chǔ)上,掌握下面兩種分布的內(nèi)涵:“虛無假設(shè)的分布”和“備擇假設(shè)的分布”總體分布樣本分布抽樣平均數(shù)的分布3.1 五種“分布”的不同含義樣本分布2抽樣平均數(shù)分布3備擇假設(shè)的分布5總體分布1虛無假設(shè)的分布4

19、總體中所有個(gè)體的分?jǐn)?shù) Aron: Scores of all individuals in the population在研究者所要研究的群體中,每位個(gè)體的智商在自己所屬的群體中都有自己特定的位置,所有個(gè)體智商的分布構(gòu)成該群體的“ ”全體女學(xué)生智商的分布服從正態(tài)分布,平均智商為總體分布每位個(gè)體的智商在研究者所要研究的群體中,每位個(gè)體的智商在自己所屬的群體中都有自己特定的位置,所有個(gè)體智商的分布構(gòu)成該群體的“ ”全體男學(xué)生智商的分布服從正態(tài)分布,平均智商為總體分布每位個(gè)體的智商3.1 五種“分布”的不同含義樣本分布2抽樣平均數(shù)分布3備擇假設(shè)的分布5總體分布1虛無假設(shè)的分布4一次抽樣中每位個(gè)體的分

20、數(shù) Aron: Scores of the individuals in a single sample在某總體中進(jìn)行抽樣研究,在一次抽樣過程中被抽取個(gè)體的智商分布被稱為“ ”。例如:隨機(jī)抽取100位 , 的智商分布形成這次抽樣的樣本分布女生這100位女生被抽取個(gè)體女生總體在某校新生樣本分布在某總體中進(jìn)行抽樣研究,在一次抽樣過程中被抽取個(gè)體的智商分布被稱為“ ”。例如:隨機(jī)抽取100位 , 的智商分布形成這次抽樣的樣本分布被抽取個(gè)體男生總體男生這100位男生在某校新生樣本分布3.1 五種“分布”的不同含義樣本分布2抽樣平均數(shù)分布3備擇假設(shè)的分布5總體分布1虛無假設(shè)的分布4 Aron: Mean

21、s of samples randomly taken from the population從某個(gè)總體中多次隨機(jī)抽樣后各次抽樣的平均數(shù)在一個(gè)總體中多次抽樣后,每次抽樣都有該次抽樣的平均分?jǐn)?shù)并在總體分布中有自己特定的位置,所有抽樣平均數(shù)形成的分布稱為“ ”第一次抽樣:100位女生的智商有自己的分布抽樣平均數(shù)的分布在一個(gè)總體中多次抽樣后,每次抽樣都有該次抽樣的平均分?jǐn)?shù)并在總體分布中有自己特定的位置,所有抽樣平均數(shù)形成的分布稱為“ ”第一次抽樣:第二次抽樣100位女生的智商有自己的分布抽樣平均數(shù)的分布在一個(gè)總體中多次抽樣后,每次抽樣都有該次抽樣的平均分?jǐn)?shù)并在總體分布中有自己特定的位置,所有抽樣平均

22、數(shù)形成的分布稱為“ ”第一次抽樣:第二次抽樣第 k 次抽樣:100位女生的智商有自己的分布抽樣平均數(shù)的分布在一個(gè)總體中多次抽樣后,每次抽樣都有該次抽樣的平均分?jǐn)?shù)并在總體分布中有自己特定的位置,所有抽樣平均數(shù)形成的分布稱為“ ”第一次抽樣:第二次抽樣第 k 次抽樣:100位女生的智商有自己的分布“抽樣平均數(shù)”的平均數(shù)抽樣平均數(shù)的分布3.1 五種“分布”的不同含義樣本分布2抽樣平均數(shù)分布3備擇假設(shè)的分布5總體分布1虛無假設(shè)的分布4虛無假設(shè)的含義:全體女學(xué)生智商的分布( )服從正態(tài)分布當(dāng)虛無假設(shè)為真時(shí), 和 的分布完全重疊全體男學(xué)生智商的分布( )服從正態(tài)分布虛無假設(shè)的分布第一次抽樣100位女生的智

23、商有自己的分布100位男生的智商也有自己的分布虛無假設(shè)為真時(shí),每次在兩個(gè)總體中各抽取一個(gè)樣本,這兩個(gè)樣本的平均數(shù)之間會(huì)有一定的差距,并在總體分布中有自己特定的位置兩樣本之差在總體分布中有自己特定的位置虛無假設(shè)的分布第一次抽樣第二次抽樣100位女生的智商有自己的分布100位男生的智商也有自己的分布虛無假設(shè)為真時(shí),每次在兩個(gè)總體中各抽取一個(gè)樣本,這兩個(gè)樣本的平均數(shù)之間會(huì)有一定的差距,并在總體分布中有自己特定的位置兩樣本之差在總體分布中有自己特定的位置虛無假設(shè)的分布第一次抽樣第二次抽樣100位女生的智商有自己的分布100位男生的智商也有自己的分布虛無假設(shè)為真時(shí),每次在兩個(gè)總體中各抽取一個(gè)樣本,這兩個(gè)

24、樣本的平均數(shù)之間會(huì)有一定的差距,并在總體分布中有自己特定的位置兩樣本之差在總體分布中有自己特定的位置第 k 次抽樣:虛無假設(shè)的分布第一次抽樣第二次抽樣100位女生的智商有自己的分布100位男生的智商也有自己的分布虛無假設(shè)為真時(shí),每次在兩個(gè)總體中各抽取一個(gè)樣本,這兩個(gè)樣本的平均數(shù)之間會(huì)有一定的差距,并在總體分布中有自己特定的位置兩樣本之差在總體分布中有自己特定的位置第 k 次抽樣:虛無假設(shè)的分布虛無假設(shè)( )為真時(shí),多次從兩個(gè)總體中各抽取一個(gè)樣本所形成的兩個(gè)樣本平均數(shù)之差( )在總體中的分布被稱為“ ”它是以零為中心的分布虛無假設(shè)的分布以虛無假設(shè)分布為基礎(chǔ)的平均數(shù)差異顯著性檢驗(yàn)的 Z 分布(或

25、t 分布)也是以零為中心的分布(a central Z(or t) distribution)3.1 五種“分布”的不同含義樣本分布2抽樣平均數(shù)分布3備擇假設(shè)的分布5總體分布1虛無假設(shè)的分布4備擇假設(shè)( )的含義:全體新入學(xué)女學(xué)生身高的分布( )服從正態(tài)分布備擇假設(shè)( )的含義:全體新入學(xué)女學(xué)生身高的分布( )服從正態(tài)分布全體新入學(xué)男學(xué)生身高的分布( )服從正態(tài)分布備擇假設(shè)( )的含義:全體新入學(xué)女學(xué)生身高的分布( )服從正態(tài)分布全體新入學(xué)男學(xué)生身高的分布( )服從正態(tài)分布身高差等于多少是不知道的備擇假設(shè)為真時(shí)備擇假設(shè)( )的含義:全體新入學(xué)女學(xué)生身高的分布( )服從正態(tài)分布全體新入學(xué)男學(xué)生身

26、高的分布( )服從正態(tài)分布身高差等于多少是不知道的備擇假設(shè)為真時(shí)備擇假設(shè)( )的含義:虛無假設(shè)( )為假時(shí),多次從兩個(gè)總體中各抽取一個(gè)樣本所形成的兩個(gè)樣本平均數(shù)之差( )在總體中的分布被稱為“ ”備擇假設(shè)的分布因?yàn)?, 因此,備擇假設(shè)的分布不是一個(gè)以零為中心的分布(a distribution that is not central on zero), 它的分布以什么值為中心有無數(shù)多個(gè)選擇當(dāng)備擇假設(shè)為真時(shí),從男女生兩個(gè)總體中各抽取一定的樣本,這兩個(gè)樣本均數(shù)之間存在“系統(tǒng)誤差”和“隨 機(jī)誤差”以男女學(xué)生的平均身高相差 3 厘米為例第一次女生男生在男女生中各抽取100人的樣本測試其身高當(dāng)備擇假設(shè)為

27、真時(shí),從男女生兩個(gè)總體中各抽取一定的樣本,這兩個(gè)樣本均數(shù)之間存在“系統(tǒng)誤差”和“隨 機(jī)誤差”以男女學(xué)生的平均身高相差 3 厘米為例第一次女生男生在男女生中各抽取100人的樣本測試其身高第二次當(dāng)備擇假設(shè)為真時(shí),從男女生兩個(gè)總體中各抽取一定的樣本,這兩個(gè)樣本均數(shù)之間存在“系統(tǒng)誤差”和“隨 機(jī)誤差”以男女學(xué)生的平均身高相差 3 厘米為例第一次女生男生在男女生中各抽取100人的樣本測試其身高第二次第 k 次當(dāng)備擇假設(shè)為真時(shí),從男女生兩個(gè)總體中各抽取一定的樣本,這兩個(gè)樣本均數(shù)之間存在“系統(tǒng)誤差”和“隨 機(jī)誤差”以男女學(xué)生的平均身高相差 3 厘米為例第一次女生男生在男女生中各抽取100人的樣本測試其身高第

28、二次第 k 次隨機(jī)誤差當(dāng)備擇假設(shè)為真時(shí),從男女生兩個(gè)總體中各抽取一定的樣本,這兩個(gè)樣本均數(shù)之間存在“系統(tǒng)誤差”和“隨 機(jī)誤差”以男女學(xué)生的平均身高相差 3 厘米為例第一次女生男生在男女生中各抽取100人的樣本測試其身高第二次第 k 次隨機(jī)誤差系統(tǒng)誤差備擇假設(shè)( )為真時(shí),其抽樣分布( )不是以零為中心的分布k 次抽樣后兩樣本算術(shù)平均數(shù)之差的隨機(jī)誤差會(huì)趨于零:因此多次抽樣后兩樣本均數(shù)之差的算術(shù)平均數(shù)會(huì)趨近系統(tǒng)誤差(本例為3)“抽樣均數(shù)的分布”的均數(shù):以備擇假設(shè)分布為基礎(chǔ)的平均數(shù)差異顯著性檢驗(yàn)的 Z 分布(或 t 分布)也是非中心 Z(or t) 分布(a noncentral Z(or t) d

29、istribution),因此一般情況下,我們是難以對(duì) 或 值作出準(zhǔn)確的估計(jì)的?10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3統(tǒng)計(jì)檢驗(yàn)力的影響因素4統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法五種分布的不同含義統(tǒng)計(jì)檢驗(yàn)力的估計(jì)原理假設(shè)這次檢驗(yàn)中的“備擇假設(shè) 的分布”服從正態(tài)分布,并用符號(hào) 來表示這一正態(tài)分布的期望值Z 檢驗(yàn)后估計(jì)統(tǒng)計(jì)檢驗(yàn)力的估計(jì)原理:1個(gè)假設(shè)雖然我們不知道這個(gè)期望值的具體數(shù)值是多少,但是我們卻可以肯定這次假設(shè)檢驗(yàn)中“ ”分布的期望值 是某個(gè)非零的值Z 檢驗(yàn)后估計(jì)統(tǒng)計(jì)檢驗(yàn)力的估計(jì)原理:1條指令在沒有其他信息支持的情況下,也許這一次抽

30、樣檢驗(yàn)中所得到的Z值最有資格代表該次假設(shè)檢驗(yàn)備擇假設(shè)分布的中心點(diǎn)在上述一個(gè)假設(shè)和一條指令的基礎(chǔ)上,我們就可以對(duì)這次假設(shè)檢驗(yàn)結(jié)果可能犯 型錯(cuò)誤(或統(tǒng)計(jì)檢驗(yàn)力 )的概率進(jìn)行近似的估計(jì)一般情況下,我們不知道備擇假設(shè)的期望值 是多少,但是,當(dāng)我們用 Z 分布對(duì)這次抽樣的數(shù)據(jù)進(jìn)行假設(shè)檢驗(yàn)后,總是可以得到一個(gè) Z 統(tǒng)計(jì)量(Z 值)一條指令:令10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3統(tǒng)計(jì)檢驗(yàn)力的影響因素4五種分布的不同含義統(tǒng)計(jì)檢驗(yàn)力的估計(jì)原理統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法 均數(shù)差異檢驗(yàn)實(shí)例接受 拒絕 為真 正確決策 I 型錯(cuò)誤 為假 II

31、型錯(cuò)誤 正確決策,統(tǒng)計(jì)檢驗(yàn)力確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2 建立假設(shè)1因 因此沒有充分根據(jù)拒絕虛無假設(shè)并推論 為真(即兩組智商沒有顯著差異),作出這一推論的置信度為 95%(也即犯推論錯(cuò)誤的可能性為 5%)方法2:利用 和查轉(zhuǎn)換表求 或2方法1:利用正態(tài)分布表求 或 (推薦)1問題:當(dāng) 在事實(shí)上是假的時(shí)候我們犯錯(cuò)誤的概率是多少?方法1:利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力(推薦)3 確定做出統(tǒng)計(jì)決策的 水平及相應(yīng)的臨界值(并作出決策)1 根據(jù)已知條件建立需要檢驗(yàn)的假設(shè);2 用相應(yīng)的公式計(jì)算 Z 統(tǒng)計(jì)量;4 計(jì)算實(shí)際得到的Z值與 水平臨界值的差;5 根據(jù)Z值與 水平臨界值的差查正態(tài)分布表,確定可

32、能犯的 型錯(cuò)誤的概率或統(tǒng)計(jì)檢驗(yàn)力( )的概率。利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2 建立假設(shè)1因 因此沒有充分根據(jù)拒絕虛無假設(shè)并推論 為真(即兩組智商沒有顯著差異),作出這一推論的置信度為 95%(也即犯推論錯(cuò)誤的可能性為 5%)Z=0.07在正態(tài)分布表約占3%面積,由此確定虛無假設(shè)為真推論正確 - 1.96 = -0.07 求實(shí)得Z值與 水平臨界值的差4根據(jù)Z值與 水平臨界值的差查正態(tài)分布表求檢驗(yàn)力5虛無假設(shè)為假推論錯(cuò)誤ZY平均數(shù)到Z的P值超過Z的P值.00.39894.00000.50000.01.39892.00399.49601.02.39886.0079

33、8.49202.03.39876.01197.48803.04.39862.01595.48405.05.39844.01994.48006.06.39822.02392.47608.07.39797.02790.47210.08.39767.03183.46817.09.39733.03586.46414.10.39695.03983.460170.07 0.2790 方法2:利用 和 值直接查表求取獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn)的統(tǒng)計(jì)檢驗(yàn)力Z 統(tǒng)計(jì)量的計(jì)算公式:因?yàn)?和 的總體期望值分別是 和 ,因此在兩方差齊性的前提下可得備擇假設(shè)期望值 的計(jì)算公式為:Z檢驗(yàn)備擇假設(shè)期望值 的計(jì)算公式假定2

34、:令 = Z單尾檢驗(yàn)( )0.050.0250.010.005雙尾檢驗(yàn)( )0.100.050.020.010.5.14.08.03.020.6.16.09.04.021.8.56.44.30.221.9.60.48.33.252.7.85.77.65.554.0.99.98.95.92方法2:利用 和 值直接查表求取獨(dú)立樣本平均數(shù)差異顯著性檢驗(yàn)的統(tǒng)計(jì)檢驗(yàn)力10 統(tǒng)計(jì)檢驗(yàn)力的含義、估計(jì)方法和影響因素效果大小在學(xué)術(shù)論文報(bào)告中的使用背景1統(tǒng)計(jì)檢驗(yàn)力的含義2統(tǒng)計(jì)檢驗(yàn)力的估計(jì)方法3統(tǒng)計(jì)檢驗(yàn)力的影響因素4樣本容量 N效果大小顯著性水平統(tǒng)計(jì)檢驗(yàn)力的主要影響因素“作者對(duì)于自己的研究假設(shè)進(jìn)行檢驗(yàn)時(shí),必須考慮采

35、取嚴(yán)格的統(tǒng)計(jì)力(statistical power)。我們可以通過特定的水平、效果大小和樣本大小來決定統(tǒng)計(jì)力,而這關(guān)系到正確地拒絕作者想要檢驗(yàn)的假設(shè)的可能性陳玉玲等譯J. Cohen (1992): for any given statistical test, we can determine power for given , N and ES.統(tǒng)計(jì)檢驗(yàn)力影響因素:顯著性水平心理統(tǒng)計(jì)學(xué)家根據(jù)備擇假設(shè)期望值 和顯著性水平 編制出 求統(tǒng)計(jì)檢驗(yàn)力值的轉(zhuǎn)換表,其格式有如下表所示。由表中數(shù)據(jù)可知,顯著性水平越嚴(yán)格,則統(tǒng)計(jì)檢驗(yàn)力的值越小單尾檢驗(yàn)( )0.050.250.010.05雙尾檢驗(yàn)( )0.1

36、00.050.020.011.8.56.44.30.221.9.60.48.33.252.7.85.77.65.55統(tǒng)計(jì)檢驗(yàn)力與顯著性水平的關(guān)系通常我們?cè)?的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)推斷,由于 , 由此推斷“沒有充分根據(jù)拒絕虛無假設(shè),當(dāng)虛無假設(shè)為假時(shí)接受它犯 型錯(cuò)誤的概率為 53%”顯著性水平 影響統(tǒng)計(jì)檢驗(yàn)力舉例假設(shè)對(duì)上述數(shù)據(jù)在顯著性水平 的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)推斷,其得到什么樣的推斷結(jié)果呢?在例 1 中:根據(jù)上述數(shù)據(jù)求得的檢驗(yàn)統(tǒng)計(jì)量為 建立假設(shè)1確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2方法1:利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力推論是“拒絕虛無假設(shè)”虛無假設(shè)為真推論錯(cuò)誤,犯錯(cuò)誤的概率為 建立假設(shè)1確定顯著性水平并做出

37、推論:3計(jì)算統(tǒng)計(jì)量2方法1:利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力推論是“拒絕虛無假設(shè)”虛無假設(shè)為真推論錯(cuò)誤,犯錯(cuò)誤的概率為虛無假設(shè)為假推論正確如何求這一推論的統(tǒng)計(jì)檢驗(yàn)力? 建立假設(shè)1確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2方法1:利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力 - 1.645 = 0.245 求實(shí)得Z值與 水平臨界值的差4根據(jù)Z值與 水平臨界值的差查正態(tài)分布表求檢驗(yàn)力5 建立假設(shè)1確定顯著性水平并做出推論:3計(jì)算統(tǒng)計(jì)量2方法1:利用正態(tài)分布表求統(tǒng)計(jì)檢驗(yàn)力 - 1.645 = 0.245 求實(shí)得Z值與 水平臨界值的差4根據(jù)Z值與 水平臨界值的差查正態(tài)分布表求檢驗(yàn)力5Z=0.245個(gè)標(biāo)準(zhǔn)差在正態(tài)分布表所占的面積是0.0968 (約等于10%),加上中心點(diǎn)右邊的0.50的面積,即 0.50 + 0.10 = 0.60,由此確定作出這一推論的統(tǒng)計(jì)檢驗(yàn)力為ZY平均數(shù)到Z的P值超過Z的P值.20.39104.07926.42074.21.39024.08317.41683.22.38949.08

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論