版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第三講推斷統(tǒng)計一、概率分布(理論基礎(chǔ))二、假設(shè)檢驗三、方差分析四、非參數(shù)檢驗五、回歸分析概率分布[學(xué)習(xí)目標(biāo)]1、了解掌握有關(guān)概率的基本知識;2、理解常用概率分布的基本特征3、二項分布與正態(tài)分布的具體應(yīng)用[學(xué)習(xí)重點]概率原理;二項分布、標(biāo)準(zhǔn)正態(tài)分布表、t分布表、x2分布、F分布的特征及使用。一、概率分布概率論是推論統(tǒng)計的基礎(chǔ)。推論統(tǒng)計通過對樣本數(shù)量化結(jié)果的分析,在指出是什么和不是什么的同時,還用概率指出這種可能性的大小。概率的一些基本概念什么是概率后驗概率:事件A出現(xiàn)的次數(shù)m與觀測次數(shù)n的比值為事件A的概率估計值,可寫作當(dāng)觀測次數(shù)n無限增大,計算出的概率估計值越接近真實的概率值。因這種概率是由事件A出現(xiàn)的次數(shù)決定,故又稱為統(tǒng)計概率。先驗概率它是真實的概率而不是估計值。①實驗的每一種可能結(jié)果(稱為基本事件)是有限的,②每一個基本事件出現(xiàn)的可能性相等。如果基本事件的總數(shù)為n,事件A包括m個基本事件,則事件A的概率為:這種概率稱為或古典概率,當(dāng)進行多次觀測時,按觀測結(jié)果計算的概率(后驗概率)基本接近先驗概率。概率的某些基本性質(zhì)(一)概率的公理系統(tǒng)。(1)任何一個隨機事件A的概率都是非負(fù)的P(A)>0(2)必然事件的概率為1,必然事件是指在一定條件下必然發(fā)生的事件。P(A)=1(3)不可能事件的概率為0,不可能事件是指在一定條件下必然不發(fā)生的事件。P(A)=0概率值0≤P(A)
≤1。概率接近1的事件其發(fā)生的可能性較大,而概率接近0的事件其發(fā)生的可能性較小。(二)概率的加法定理加法定理是指兩個互不相容事件A、B之和的概率,等于兩個事件概率之和。寫作P(A+B)=P(A)+P(B)。所謂互不相容事件是指在一次實驗或調(diào)查中,若事件A發(fā)生則事件B就一定不發(fā)生,否則二者為相容事件。例:對某一考生進行考核,若該生得優(yōu)的概率為0.10,得良的概率為0.60,問該生考核成績?yōu)閮?yōu)或良的概率為多大?P(優(yōu)+良)=P(優(yōu))+P(良)
=0.10+0.60=0.70〈三〉概率的乘法定理概率的乘法定理適用于幾種情況組合的概率,即幾種事件同時發(fā)生的情況。乘法定理:兩獨立事件同時出現(xiàn)的概率等于該兩事件概率的乘積。P(A+B)=P(A)·P(B)。所謂獨立事件指的是一個事件的出現(xiàn)對另一個事件的出現(xiàn)不發(fā)生影響,如果事件A的概率隨事件B是否出現(xiàn)而改變,事件B的概率隨事件A是否出現(xiàn)而改變,則此兩事件被稱為相關(guān)事件或相依事件。例:一份有10道四選一多項選擇題的試卷,考生全憑隨機猜測得滿分的概率有多大?P(A+B)=P(A)·P(B)=0.2510=0.000000953概率分布的類型
概率分布是指對隨機變量取值的概率分布情況用數(shù)學(xué)方法(函數(shù))進行描述。概率分布依不同的劃分標(biāo)準(zhǔn),可分為不同的類型。(一)離散分布與連續(xù)分布·(二)經(jīng)驗分布與理論分布(三)基本隨機變量分布與抽樣分布(一)離散分布與連續(xù)分布(是否具有連續(xù)性)離散隨機變量的概率分布又稱作離散分布,即計數(shù)數(shù)據(jù)的概率分布,它可用分布函數(shù)加以數(shù)量化描述。如二項分布連續(xù)分布是指連續(xù)隨機變量的概率分布,即測量數(shù)據(jù)的概率分布,它用連續(xù)隨機變量的分布函數(shù)描述它的分布規(guī)律。如正態(tài)分布。(二)經(jīng)驗分布與理論分布(分布函數(shù)的來源)經(jīng)驗分布是指根據(jù)觀察或?qū)嶒炈@得的數(shù)據(jù)而編制的次數(shù)分布或相對頻率分布,經(jīng)驗分布往往是總體的一個樣本,它可對所研究的對象給以初步描述,并作為推論總體的依據(jù)。理論分布有兩個含義,一是隨機變量概率分布的函數(shù)——數(shù)學(xué)模型,二是指按某種數(shù)學(xué)模型計算出的總體的次數(shù)分布。(三)基本隨機變量分布與抽樣分布
(描述的數(shù)據(jù)特征)基本隨機變量分布是指理論分布中描述構(gòu)成總體的基本變量的分布,心理與教育統(tǒng)計中常用的基本隨機變量分布有二項分布與正態(tài)分布。抽樣分布是樣本統(tǒng)計量的理論分布。正態(tài)分布正態(tài)分布也稱常態(tài)分布或常態(tài)分配,是連續(xù)隨機變量概率分布的一種,是在數(shù)理統(tǒng)計的理論與實際應(yīng)用中占有重要地位的種理論分布。
正態(tài)分布(normaldistribution)也叫高斯分布(Gaussiandistribution),是最常見、最重要的一種連續(xù)型分布
正態(tài)分布的特征(一)正態(tài)分布的函數(shù)(又稱密度函數(shù))為
式中π是圓周率3.14159…
e是自然對數(shù)的底2.71828…
x為隨機變量取值一∞<x<∞μ為理論的平均數(shù)
δ2為理論的方差
y為概率密度即正態(tài)分布上的縱坐標(biāo)。正態(tài)曲線(normalcurve
)圖形特點:鐘型中間高兩頭低左右對稱最高處對應(yīng)于X軸的值就是均數(shù)曲線下面積為1標(biāo)準(zhǔn)差決定曲線的形狀Xf(X)m012-1-2xy-3μ=-1σ=0.5012-1-2xy-33μ=0σ=1012-1-2xy-334μ=1σ=2(2)曲線在x軸的上方,與x軸不相交.即y>0(3)曲線是單峰的,它關(guān)于直線x=μ對稱.(5)曲線與x軸之間的面積為1.(4)曲線在x=μ處達到峰值(最高點)
(1)圖象中間高,兩邊低,左右對稱
(6)當(dāng)x<μ時,圖象自左向右下降;……..(二)正態(tài)分布的特征1、正態(tài)分布的形式是對稱的,(但對稱的不一定是正態(tài)分布),它的對稱軸是過平均數(shù)點的垂線。正態(tài)分布中,平均數(shù)、中數(shù)、眾數(shù)三者相等,此點y值最大(0.3989)。2、正態(tài)分布的中央點(即平均數(shù)點)最高,然后逐漸向兩側(cè)下降,曲線的形式是先向內(nèi)彎,然后向外彎,拐點位于正負(fù)1個標(biāo)準(zhǔn)差處,曲線兩端向靠近基線處無限延伸,但終不能與基線相交。012-1-2xy-33μ=0σ=13、正態(tài)曲線下的面積為1,由于它在平均數(shù)處左右對稱,故過平均數(shù)點的垂線將正態(tài)曲線下的面積劃分為相等的兩部分,即各為0.50。0.54、正態(tài)分布是一族分布。它隨隨機變量的平均數(shù),標(biāo)準(zhǔn)差的大小與單位不同而有不同的分布形態(tài)。如果平均數(shù)相同,標(biāo)準(zhǔn)差不同,這時標(biāo)準(zhǔn)差大的正態(tài)分布曲線形式低闊,如果標(biāo)準(zhǔn)差小,則正態(tài)曲線的形式高狹。
標(biāo)準(zhǔn)正態(tài)分布(standardnormaldistribution)的兩個參數(shù)為:μ=0,σ=1記為
N(0,1)
一般正態(tài)分布為一個分布族:N(m,s2)
;標(biāo)準(zhǔn)正態(tài)分布只有一個
N(0,1)
;這樣簡化了應(yīng)用
u-∞6、在正態(tài)分布曲線下,標(biāo)準(zhǔn)差與概率(面積)有一定的數(shù)量關(guān)系。即
正態(tài)分布表的編制與使用依據(jù)正態(tài)分布的密度函數(shù),編制方法:從Z=O開始,逐漸變化Z分?jǐn)?shù),計算從Z=0至某一定值之間的概率。012-1-2zy-33μ=0P=1zY正態(tài)表一般包括以下三欄:第一欄表明Z分?jǐn)?shù)單位,在平均數(shù)這一點上Z=0,在平均數(shù)以上(即曲線右側(cè))Z分?jǐn)?shù)為正值,在平均數(shù)以下(即曲線左側(cè))Z分?jǐn)?shù)為負(fù)值。一般正態(tài)表上z分?jǐn)?shù)列到3.99,更詳細(xì)的列到5.00。第二欄為y(即密度函數(shù)或比率數(shù))值,即某一Z分?jǐn)?shù)點上的曲線縱坐標(biāo)的高度,標(biāo)準(zhǔn)正態(tài)曲線下y==0.3989,它是Z=0。這一點上曲線縱坐標(biāo)具有的最大值或說概率密度值。第三欄為概率值(常標(biāo)以P)即不同z分?jǐn)?shù)點與平均數(shù)之間的面積與總面積之比。使用正態(tài)表,可以進行如下幾個方面的計算:(一)依據(jù)Z分?jǐn)?shù)求概率。即已知差度(Z),求面積(P)因為z分?jǐn)?shù)的值表示該點至平均數(shù)之間的距離,所以稱之為差度有下述三種情況:1.某Z分?jǐn)?shù)值與平均數(shù)(Z=0)之間的概率。2.求某Z分?jǐn)?shù)以上或以下自概率。3.求兩個Z分?jǐn)?shù)之間的概率。(二)從概率(P)求Z分?jǐn)?shù),即從面積求差度值。這種計算的查表方法有以下幾種情況:1、從平均數(shù)開始的概率值已知,求Z值。2、求兩端概率的Z值。指已知位于正態(tài)分布兩端的概率值求該概率值分界點的Z值。3、若已知正態(tài)曲線下中央部分的概率,求Z分?jǐn)?shù)是多少,則將中央部分的概率值除以2(因為正態(tài)曲線于平均數(shù)處對稱)然后再據(jù)此P值查表求z,因為是曲線中間部分。(三)求概率的密度Y,即正態(tài)曲線的高。不論已知概率,還是已知Z值,都可從表的第一或第三欄查對應(yīng)的第二欄。所知的概率是位于正態(tài)曲線的中間部分,還是兩尾端部分。這一點要注意區(qū)分,才能通過P值查表求得正確的概率密度Y。
次數(shù)分布是否正態(tài)的檢驗方法在心理與教育的實際測量和實驗中所獲得的基本隨機變量。為了統(tǒng)計分析的需要,常要分析次數(shù)分布是否為正態(tài)分布,對分布曲線是否為正態(tài)分布的擬合檢驗方法是X2檢驗,除此之外,還有一些簡單的方法,幫助分析。這些方法有累加次數(shù)曲線法,偏態(tài)峰態(tài)量數(shù)的描述方法法。(一)皮爾遜偏態(tài)量數(shù)法(skwed)皮爾遜發(fā)現(xiàn)在偏態(tài)分布中平均數(shù)距中數(shù)較近而離眾數(shù)較遠(yuǎn)。在正偏態(tài)中M>Md>Mo,在負(fù)偏態(tài)中M<Md<Mo,而在正態(tài)分布三者合于一點。根據(jù)平均數(shù)與眾數(shù)或中數(shù)的距離,提出一個偏態(tài)量數(shù)公式,用以描述分布形態(tài):
式中δ為標(biāo)準(zhǔn)差,sk為偏態(tài)量數(shù),當(dāng)SK=0時,分布對稱,當(dāng)SK為正數(shù)時,分布屬正偏態(tài),當(dāng)SK為負(fù)數(shù)時,分布屬負(fù)偏態(tài).例SPSS中30名學(xué)生的成績分布峰度、偏度檢驗法這種方法是根據(jù)分析分布的峰度系數(shù)(cofficientofkurtosis)與偏度系數(shù)(cofficientofskewness),確定分布形態(tài)。一般情況下,需要觀測數(shù)據(jù)的數(shù)目要足夠大,應(yīng)用這種方法才有意義。偏度系數(shù)
當(dāng)g1=0時分布是對稱的,當(dāng)gl>0分布為正偏態(tài),當(dāng)g1<0分布呈負(fù)偏態(tài)。當(dāng)觀測數(shù)據(jù)數(shù)目N>200時,這個偏態(tài)系數(shù)的統(tǒng)計量g1才較可靠。峰度系數(shù)
當(dāng)g2=0時,正態(tài)分布的峰度,g2>0時,分布的峰度比正態(tài)分布峰度低闊,g2<0時,表明分布的峰度比正態(tài)分布的峰度高狹。當(dāng)N>1000時,計算出的g2統(tǒng)計量才較可靠。用SPSS次數(shù)分布是否正態(tài)的檢驗Analyze——descriptive選擇optionsDistribution中kurtosis與skewness即可用SPSS求z分?jǐn)?shù)Analyze——descriptive選擇savestandardizedvaluesasvariable即可標(biāo)準(zhǔn)分?jǐn)?shù)的優(yōu)越性表現(xiàn)在三個方面:(1)各種標(biāo)準(zhǔn)分?jǐn)?shù)的單位是絕對等價的,因此,它具有可加性;(2)標(biāo)準(zhǔn)分?jǐn)?shù)值的大小和正負(fù),可以反映某一考分在全體考分中所處的地位,因此,它具有可比性;(3)標(biāo)準(zhǔn)分?jǐn)?shù)可以作為舍棄異常數(shù)據(jù)的依據(jù):如果Z的絕對值大于3,則可考慮舍棄這種原始數(shù)據(jù)。
樣本分布樣本分布指樣本統(tǒng)計量的分布,即樣本統(tǒng)計量的抽樣分布,它是統(tǒng)計推論的重要依據(jù)。在分析樣本統(tǒng)計量的分布時,首先要保證各個樣本是獨立的,各個樣本都服從同樣的分布,為了保證這一點,取樣方法應(yīng)該用隨機抽樣的方法。正態(tài)分布及漸近正態(tài)分布
(normaldistribution)樣本統(tǒng)計量為正態(tài)分布或接近正態(tài)分布的兩種情況,凡符合這兩種情況的分布,都可根據(jù)正態(tài)分布的概率進行統(tǒng)計推論。(一)原總體為正態(tài)分布,方差δ2
的已知,樣本平均數(shù)的抽樣分布為正態(tài)分布。各自的正態(tài)分布形式轉(zhuǎn)換成相同的標(biāo)準(zhǔn)正態(tài)分布。樣本平均數(shù)的標(biāo)準(zhǔn)分?jǐn)?shù),可寫作:(二)總體分布非正態(tài),但σ已知,且樣本足夠大時(n>30),其樣本平均數(shù)的抽樣分布為漸近正態(tài)分布其樣本平均數(shù)的抽樣分布的平均數(shù)與標(biāo)準(zhǔn)差,與總體的μ及σ之間,也有下述關(guān)系:2t分布(T-distribution)
t分布是統(tǒng)計分析中應(yīng)用較多的一種隨機變量函數(shù)的分布,是統(tǒng)計學(xué)者高賽特(Goeset)1908年在以筆名"Student"發(fā)表的一篇論文中推導(dǎo)的一種分布。t分布的意義與特點當(dāng)樣本容量n→∞時,它是正態(tài)分布,當(dāng)n≥30以上時接近正態(tài)分布,當(dāng)n<30時,此分布不接近正態(tài)分布。而是具有左右對稱,高狹峰的分布,且分布形狀隨樣本容量n-1的變化而變化的一族分布。這就是t分布。它的函數(shù)為df為自由度df=n-1T分布密度曲線圖t分布與σ無關(guān)而與n-1(自由度)有關(guān),t分布的自由度(符號v或df表示)一般為n-1,即樣本容量減1。自由度(degreesoffreedom)是指任何變量中可以自由變化的數(shù)目。是t分布的參數(shù)v,因為v代表t分布中獨立隨機變量的數(shù)目。故曰自由度。t分布的特點可歸納如下:①t分布的平均值為0。②是對于平均值0對稱的分布,分布左側(cè)t為負(fù)值,分布右側(cè)t為正值。③t變量取值在一∞一+∞之間。④當(dāng)樣本容量趨于∞時,t分布為正態(tài)分布,方差為1,而當(dāng)n-1大于30以上時,t分布接近正態(tài)分布,方差大于1,隨n-1之增大而方差漸趨于1,當(dāng)n-1<30時,t分布與正態(tài)分布相差較大,隨n-1減少,離散程度(方差)越大,分布中間部分低面分布的尾部較高.(三)方差未知時,樣本平均數(shù)的分布1.總體分布為正態(tài),當(dāng)其方差(σ2)未知時,樣本平均數(shù)的抽樣分布為t分布。2.當(dāng)總體分布為非正態(tài)而其方差又未知時,若滿足n>30。樣本平均數(shù)的抽樣分布近似為t分布。
χ2
分布χ音chi(希臘文),讀作卡方。分布是統(tǒng)計分析中應(yīng)用較多的一種抽樣分布。(一)χ2
分布的直觀意義從一個服從正態(tài)分布的總體中,每次隨機抽取隨機變量X1,X2,X3…XN分別將其平方,即可得到X12,X22X32…,這樣可抽取無限多個數(shù)量為n的隨機變量x,及X2,可求得無限多個平方和,也可計算其標(biāo)準(zhǔn)分?jǐn)?shù)Z=X-μ/δ,及其平方Z2=(X-μ/δ)2。這無限多個n個隨機變量平方和或標(biāo)準(zhǔn)分?jǐn)?shù)的平方和的分布,即為χ2分布。X2可寫作:
這時自由度為n。如果正態(tài)總體的平均數(shù)未知,若用樣本平均數(shù)X作為μ的估計值時:此時χ2分布的自由度為df=n-1.(二)χ2分布的特點1、是一個正偏態(tài)分布。隨每次所抽取的隨機變量X個數(shù)(n的大小)不同,其分布曲線的形狀不同,n或n-1越小分布越偏斜,df很大時,接近正態(tài)分布。當(dāng)df→∞時,χ2分布為正態(tài)分布??梢姦?分布是一族分布,正態(tài)分布是其中一特例,如圖2.卡方值都是正值。3.卡方分布的和也是卡方分布·,..遵從df=df1+df2+…+dfk的∑x2分布。即t分布具有可加性。4.χ2分布的平均值與方差.如果df>2,這時χ2分布的平均數(shù):
方差:5.χ2分布是連續(xù)型分布,但有些離散型的分布也近似χ2分布
F分布F分布是統(tǒng)計分析中常用的一種樣本分布。(一)F分布的直觀意義設(shè)有兩個正態(tài)分布的總體,其平均數(shù)與方差分別為μ1、σ12及μ2、σ22,自此二總體中分別隨機抽取容量為n1及n2的樣本,每個樣本都可計算χ2值,這樣可得到無限多個χ21與χ22,每個χ2隨機變量各除以對應(yīng)的自由度V1與V2(V1=n1或V2==n2或n2一1)之比,稱為F比率,這無限多個F的分布稱作F分布.據(jù)上式可理解F比率為樣本方差各除以其總體方差的比率.。如果令σ12=σ22,。即從一個總體中抽樣,其F比率可寫作:這就是說,自一個正態(tài)總體中隨機抽取容量為n1及n2兩樣本,其方差的比率分布為F分布,分子的自由度為n1一1,分母的自由度為n2一1。知道了同一總體不同樣本的方差比率分布,即可分析任意兩樣本方差是否取自同一總體了??梢?F分布在統(tǒng)計分析中是很有用的一種樣本分布。(二)F分布的特點及F分布表的使用特點:1.F分布形態(tài)是一個正偏態(tài)的分布,它的分布曲線的形式隨分子、分母的自由度不同而不同,它是一族分布,隨df3與df2的增加而漸趨正態(tài)分布。2.因F為兩個方差之比率,故F總為正值。3.F分布表是根據(jù)F分布函數(shù)計算得來。4.當(dāng)分子的自由度為1,分母的自由度為任意值時,F值與分母自由度相同概率的t值〈雙側(cè)概率)的平方相等。假設(shè)檢驗主要問題:一、假設(shè)檢驗的基本問題二、平均數(shù)的顯著性檢驗三、平均數(shù)差異顯著性檢驗四、方差的差異檢驗五、相關(guān)系數(shù)的顯著性檢驗假設(shè)檢驗的基本問題一、假設(shè)與假設(shè)檢驗假設(shè)一般專指用統(tǒng)計學(xué)術(shù)語對總體參數(shù)所做的假定性說明。假設(shè)檢驗:通過樣本統(tǒng)計量得出的差異作出一般性結(jié)論,判斷總體參數(shù)之間是否存在差異,這種推論過程稱做假設(shè)檢驗.
假設(shè)檢驗包括參數(shù)檢驗和非參數(shù)檢驗.參數(shù)檢驗:若進行假設(shè)檢驗時總體的分布形式已知,需要對總體的未知參數(shù)進行假設(shè)檢驗.非參數(shù)檢驗:若對總體分布形式甚少,需要對未知分布函數(shù)的形式及其他特征進行假設(shè)檢驗.假設(shè):原假設(shè)(虛無假設(shè)):HO:U≥u備擇假設(shè)(真實假設(shè),期望假設(shè)):H1:U<u它們之間是相互對立的。假設(shè)檢驗:依據(jù)樣本分布的原理,用反證法進行推論,(也即假設(shè)虛無假設(shè)成立)二、假設(shè)檢驗中的兩類錯誤接受H0拒絕H0H0為真正確Ⅰ型錯誤α型錯誤H0為假Ⅱ型錯誤β型錯誤正確單側(cè)檢驗與雙側(cè)檢驗這種只強調(diào)差異而不強調(diào)方向性的檢驗叫雙側(cè)檢驗。這種強調(diào)某一方向的檢驗叫單側(cè)檢驗。通常適用于檢驗?zāi)骋粎?shù)是否"大于"或"優(yōu)于"、"快于"及"小于"、"劣于"、"慢于"另一參數(shù)等一類問題。單側(cè)檢驗與雙側(cè)檢驗有幾點區(qū)別:(1)問題的提法不同。雙側(cè)檢驗的提法是:μ和已知常數(shù)μo是否有顯著性差異?單側(cè)檢驗的提法是:μ是否顯著地高于已知常數(shù)μ0?(2)建立假設(shè)的形式不同。雙側(cè)檢驗的原假設(shè)和備擇假設(shè)為:H。:μ=μ。H1:μ≠μ。;單側(cè)檢驗的原假設(shè)和備擇假設(shè)為:H。:μ≤μ。,H1:μ>μ?;騂。:μ≥μ。,H1:μ<μ。(3)否定區(qū)域不同。雙側(cè)檢驗的否定區(qū)為∣Z∣
>Zα/2,而單側(cè)檢驗查表得Zα。四、假設(shè)檢驗的步驟(一)建立原假設(shè)與備擇假設(shè),雙側(cè)檢驗的原假設(shè)和備擇假設(shè)為:H。:μ=μ。H1:μ≠μ。;單側(cè)檢驗的原假設(shè)和備擇假設(shè)為:H。:μ≤μ。,H1:μ>μ?;騂。:μ≥μ。,H1:μ<μ。(二)在H。成立的前提下,尋找和決定合適的統(tǒng)計量及其抽樣分布,并計算出統(tǒng)計量的值。常用的抽樣分布和標(biāo)準(zhǔn)正態(tài)分布,t分布和F分布等,對應(yīng)的檢驗方法稱為Z檢驗、t檢驗和F檢驗。(三)選定顯著性水平α,查相應(yīng)的分布表來確定臨界值,從而確定出H。的拒絕區(qū)間或接受區(qū)間。(四)對H。作出判斷和解釋。即把臨界值與統(tǒng)計量值相比較,若統(tǒng)計量值勤落在H。拒絕區(qū)間中,則拒絕H。;若統(tǒng)計量值落在H。接受區(qū)間中,則接受H。平均數(shù)的顯著性檢驗
(單總體檢驗)平均數(shù)的顯著性檢驗是指對樣本平均數(shù)與總體平均數(shù)的差異進行的顯著性檢驗。一、原總體為正態(tài)分布,方差δ2的已知,
樣本平均數(shù)的抽樣分布為正態(tài)分布。例:全區(qū)統(tǒng)一考試數(shù)學(xué)平均分μ。=62,標(biāo)準(zhǔn)差σ0=10.2分。某校90名學(xué)生該次考試的平均成績?yōu)?8,問該校成績與全區(qū)平均成績差異是否顯著。課堂練習(xí):某高校參加同專業(yè)的統(tǒng)一考試,隨機抽查64份試卷,由此求得平均成績?yōu)?9分.已知該科全體考生成績服從正態(tài)分布,且總平均分為65分,標(biāo)準(zhǔn)差為9.5分問該高??忌钠骄煽兪欠耧@著地高于全體考生的平均水平?二、總體分布為正態(tài),當(dāng)其方差未知時,樣本平均數(shù)的抽樣分布為t分布,t檢驗(df=n-1)例:學(xué)生的學(xué)習(xí)成績與教師的教學(xué)方法有關(guān).某校教師采用了一種他認(rèn)為是新式有效的教學(xué)方法,經(jīng)過一學(xué)年的教學(xué)后,從該教師所教班級中隨機抽取了6名學(xué)生的考試成績,分別為48.5,49,53.5,49.5,56,52.5,而在該學(xué)年考試中,全年級的總平均分為52,試分析采用這種教學(xué)方法與未采用新教學(xué)方法的學(xué)生成績有無顯著差異(已知考生成績服從正態(tài)分布)三、總體非正態(tài)分布
如果有理由認(rèn)為某一變量的總體分布不是正態(tài),原則上是不能進行Z檢驗或t檢驗的。這時應(yīng)該進行非參數(shù)檢驗。有時也可以對原始數(shù)據(jù)進行對數(shù)轉(zhuǎn)換或其他種種轉(zhuǎn)換(目的在于使非正態(tài)數(shù)據(jù)轉(zhuǎn)化為正態(tài)形式〉,然后再作Z檢驗或t檢驗。(一)總體分布非正態(tài),但σ2已知,且樣本足夠大時(n>30),其樣本平均數(shù)的抽樣分布為漸近正態(tài)分布(二)當(dāng)總體分布為非正態(tài)而其方差又未知時,若滿足n>30。樣本平均數(shù)的抽樣分布近似為t分布。[例5]某省進行數(shù)學(xué)競賽,結(jié)果分?jǐn)?shù)的分布不是正態(tài),總平均分43.5。其中某縣參加競賽的學(xué)生168人,X=45.1,S=18.7,該縣平均分與全省平均分有否顯著差異?
用SPSS進行檢驗analyze——comparemeans——One-SampleTtest單樣本T檢驗過程檢驗單個變量的均值是否與給定的常數(shù)之間存在差異。樣本均數(shù)與總體均數(shù)之間的差異顯著性檢驗屬于單一樣本T檢驗單樣本T檢驗的功能與應(yīng)用執(zhí)行One-SampleTTest過程,SPSS將顯示:每個檢驗變量的統(tǒng)計量的均值、標(biāo)準(zhǔn)差和均值的標(biāo)準(zhǔn)誤;檢驗樣本是否來自總體均數(shù)為一指定總體的結(jié)果:顯示樣本值與常數(shù)之差以其95%的可信區(qū)間。單樣本T檢驗的應(yīng)用示例下面舉出一個實際例子來說明單樣本T檢驗過程。[例2·1]某輪胎廠的質(zhì)量分析報告中說明,該廠某輪胎的平均壽命在一定的載重負(fù)荷.與正常行駛條件下會大于25000公里。平均輪胎壽命的公里數(shù)近似服從正態(tài)分布?,F(xiàn)對該廠該種輪胎抽取一容量為15個的樣本,試驗結(jié)果得樣本均值為27000公里。能否作出結(jié)論:該廠產(chǎn)品與申報的質(zhì)量標(biāo)準(zhǔn)相符?21000、 31500、29000、28000 、27500、19000、18500、26000、30000、28000、33000、34000、25000、28500、26000單樣本T檢驗過程單樣本T檢驗的SPSS過程一般分為四步:1、建立無效(原)假設(shè)H。,假設(shè)μ=μo。2、建立數(shù)據(jù)集(數(shù)據(jù)文件),僅有一個變量3、對話框選項的選擇。4、結(jié)果分析。下面就"3.對話框選項的選擇"詳細(xì)闡述。按"Analyze→Comparemeans→One-SampleTTest”進入到單樣本T檢驗主對話框,選中對話框選中左邊的源變量矩形框中唯一的變量,點擊源變量框與Variable變量框之間的向右按鈕,將變量移入變量框,使之進入TestVariable(s)變量矩形框。在TestValue檢驗值一欄中填入μ。的大小,選擇后的主對話框。單擊"Options"按鈕,彈出Options選擇項對話框,在此對話框中,ConfidenceInterval一欄為可信水平,系統(tǒng)默認(rèn)為95%,讀者可以改寫。在MissingValues一欄中有兩個選項,一為Excludecaseanalysisbyanalysis選項,帶有缺失值的觀測量,當(dāng)它與分析有關(guān)時才被剔除。一為Excludecaseslistwise選項,剔除在主對話框中Variables矩形框中列出的變量帶有缺失值的所有觀測量。點擊"Continue"按鈕,可返回主對話框。平均數(shù)差異的顯著性檢驗
(雙總體檢驗)檢驗兩個樣本平均數(shù)差異的問題,叫平均數(shù)差異的顯著性檢驗.這種檢驗的目的在于由樣本平均數(shù)之間的差異檢驗各自代表的兩個總體之間的差異.注意:1、總體分布和總體方差,2、兩個總體方差是否一致、
3、兩個樣本是否相關(guān)
4、兩個樣本容量是否相同一、兩個總體都是正態(tài)分布、兩個總體方差都已知(一)兩個樣本相互獨立方差的一個重要性質(zhì)是當(dāng)兩個變量相互獨立時。其和〈或差〉的方差等于各自方差的和:因此χ1與χ2獨立時,〈χ1—χ2〉的方差〈這里實際上是標(biāo)準(zhǔn)誤的平方)應(yīng)等于各自分布的方差:
例:從某地區(qū)的六歲兒童中隨機抽取男生30人,身高平均為114cm,抽取女生27人平均身高為112.5cm。根據(jù)以往資料,該地區(qū)六歲男童身高的標(biāo)準(zhǔn)差為5cm。女童身高的標(biāo)準(zhǔn)差為6.5cm,能否根據(jù)這一次抽樣測量的結(jié)果下結(jié)論:該地區(qū)六歲男女兒童的身高有顯著性差異。(二)兩個樣本相關(guān)這里所謂相關(guān),指兩個樣本之間存在一一對應(yīng)的關(guān)系。這時不能應(yīng)用上式。當(dāng)兩個變量之間相關(guān)系數(shù)為r時,兩變量差的方差為:式中r即變量χ與y的相關(guān)系數(shù)。因此,同樣可以得到進行Z檢驗:[例2]某幼兒園在兒童入園時對49名兒童進行了比奈智力測驗(σ=16),結(jié)果平均智商為106,一年后再對同組被試施測,結(jié)果平均數(shù)為110,已知兩次測驗結(jié)果的相關(guān)系數(shù)r=·74,問能否說隨著年齡增長與一年的教育,兒童智商有了顯著提高。二、兩總體都是正態(tài)分布、兩總體方差都未知當(dāng)總體正態(tài)分布、總體方差未知時,要用t檢驗來檢驗差異。(一)獨立樣本1.兩個總體方差一致(相等)2.兩個總體方差不等樣本分布不再是t分布(更不是正態(tài)分布)。對于這個問題不少人提出過各種解決方法,其中柯克蘭與柯克斯于1957年介紹的方法最常用。從兩所高中隨機抽取的物理的成績?nèi)缦拢僭O(shè)總體呈正態(tài))。試問兩所高中的成績有無顯著不同?A校:78848178788379758585B校:40352587705460548782SPSS獨立樣本T檢驗Indepentdent-SamplesTTest過程是進行兩樣本均數(shù)的比較。設(shè)總體X服從設(shè)正態(tài)分布N(μ1,δ1),Y服從設(shè)正態(tài)分布N(μ2,δ2),其中δ2未.知。分別從總體中抽取樣本(X1,X2,...,Xn)和(Y1,Y2,...,Yn),且兩樣本互相獨立。現(xiàn)要檢驗假設(shè)Ho:u1=μ2,Hl:u1≠μ2。獨立樣本T檢驗的功能與應(yīng)用執(zhí)行Independent-SampleTTest獨立樣本T檢驗過程,SPSS將顯示:每個檢驗變量的統(tǒng)計量的均值、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和樣本含量;檢驗兩樣本是否來自相等的Levene檢驗結(jié)果:假定方差齊性時,檢驗兩樣本均數(shù)是否來自同一總體均數(shù)的t檢驗結(jié)果:假定方差不齊時,檢驗兩樣本均數(shù)是否來自同一總體均數(shù)的t檢驗結(jié)果:差值的均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和可信區(qū)間。獨立樣本T檢驗的應(yīng)用示例[例3.1]某物質(zhì)在處理前與處理后分別抽樣分析其含脂率如下:處理前(Xi)0.19,0.18,0.21,0.30,0.41,0.12,0.27.處理后Yi)0.15,0.13,0.07,0.24,0.19,0.06,0.08,0.12假定處理前后的含脂率都服從正態(tài)分布,且方差相同。問處理前后的含脂率的平均值是否有顯著變化?(α=0.05)IndependentSamplesTest獨立樣本T檢驗結(jié)果由表可得出以下結(jié)論:1.Levene方差齊性檢驗F=.895,P=0.361〉0.05,可以認(rèn)為兩樣本方差相等。2.進行方差齊性檢驗時,t=2.378,P=0.033<0.05,可以認(rèn)為處理前與處理后的含脂率有統(tǒng)計意義的。3.處理前樣本的均數(shù)為0.2287,標(biāo)準(zhǔn)差為0.09403,處理后樣本的均數(shù)為0.1271,標(biāo)準(zhǔn)差為0.02523,兩樣本均數(shù)之差為0.1016,均數(shù)之差的標(biāo)準(zhǔn)誤為0.04273以及95%水平:可信區(qū)間.獨立樣本T檢驗過程l、Independent-SampleTTest獨立樣本T檢驗過程與單樣本T檢驗過程一樣,基本上可分為四步。1.建立無效假設(shè)Ho:μ1=μ2,H1:μ1≠μ2。2.建立數(shù)據(jù)文件。3.對話框選項的選擇。4.結(jié)果分析。(二)相關(guān)樣本所謂相關(guān)樣本,指兩個樣本的數(shù)據(jù)之間存在一一對應(yīng)的關(guān)系。例:對9個被試進行兩種夾角(15度和30度的繆勒-萊依爾錯覺實驗結(jié)果如下,問兩種夾角的情況下錯覺量是否有顯著差異?被試1234567891514.718.917.215.415.313.920.016.215.33010.615.116.211.212.014.718.113.810.9di4.13.81.04.23.3-0.81.92.44.4用SPSS進行配對樣本T檢驗進行配對樣本的T檢驗要求被比較的兩個樣本有配對關(guān)系。要求兩個樣本均來自正態(tài)總體。而且均值是對于檢驗有意義的描述統(tǒng)計量。均值的配對比較是比較常見的。配對樣本T檢驗實際上是先求出每對測T值之差值,對差值求均值。檢驗配對變量之間的差異是否顯著。其實質(zhì)檢驗的假設(shè)實際上是差值的均值與零均值之間差異的顯著性。如果差值均值與0均值無顯著性差異,說明配對變量均值之間無顯著性差異。配對樣本丁檢驗功能與應(yīng)用配對樣本T檢驗過程進行配對樣本均數(shù)的比較。執(zhí)行該過程,SPSS將顯示:每個變量的均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和樣本含量;每對變量的相關(guān)系數(shù);每對變量差值得均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤和可信區(qū)間:檢驗每地對變量差值的均數(shù)是否來自總體均數(shù)為0的T檢驗的結(jié)果。配對樣本T檢驗與獨立樣本T檢驗均使用TTest過程,但兩者調(diào)用該過程的菜單不同,對數(shù)據(jù)文件結(jié)構(gòu)的要求不同和所使用的命令語句也有區(qū)別。在進行配對樣本T檢驗的數(shù)據(jù)文件中一對數(shù)據(jù)必須作為同一個觀測量中的兩個變量值。Indepentdent-SamplesTest過程是進行兩樣本均數(shù)的比較.配對樣本T檢驗的應(yīng)用示例[例4.1]某單位研究飲食中缺乏維生素E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近者配成對子,共8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,過一定時期后將大白鼠殺死,測行其肝中維生素A含量,結(jié)果如下表。問不同飼料的大白鼠中維生素A含量有無差別?不同飼料的大白鼠維生素A含量數(shù)據(jù)表大白鼠對號12345678正常飼料組35502000300039503800375034503050維生素A缺乏組24502400180032003250270025001750步驟:1、 將數(shù)據(jù)輸入到數(shù)據(jù)文件中;2、 選擇Analyze→CompqreMeans→Paired-SampleTTest激活Paired-SampleTTest配對樣本檢驗主對話框。3、 單擊正常飼料組[X1],[X2]出現(xiàn)在CurrentSelection當(dāng)前選擇欄中的Variable1后面;單擊維生素E缺乏組[X2],X1出現(xiàn)在Variable2后面,點擊兩個變量欄之間的向右箭頭,使CurrentSelection的變量進入右邊的PairedVariable配對變量欄。4、 單擊OK提交運行,所得的輸出結(jié)果。5、 結(jié)果解釋:(1)相關(guān)系數(shù)r=0.584,P=0.129認(rèn)為兩配對變量無相關(guān)系數(shù);(2)t=4.207,自由度df=7,雙尾檢驗概率P=0.004<0.05,故可認(rèn)為不同飼料的大白鼠肝中維生素A含量有統(tǒng)計意義;(3)配對數(shù)差之均數(shù)=3318.75-2506.25=812.50,標(biāo)準(zhǔn)差為546.25,標(biāo)準(zhǔn)誤為193.12977。95%的可信區(qū)間為355.8207到1269.1793。三、配對樣本T檢驗過程由上例可以看出,配對樣本T檢驗過程有以下四個步驟;"1·建立無效假設(shè)。這一步基本上可省略。2·建立數(shù)據(jù)文件。3·選擇好對話框的選擇項。4·結(jié)果分析。下面重點介紹。"選擇好對話框的選擇項"部分。在PairedVariableTTest配對樣本T檢驗主對話框,選擇好配對變量。主對話框左邊的源變量欄中只有兩個變量的選擇方法,在上例己有介紹,這里不再贅述。唯一要補充說明的是,當(dāng)源變量欄中有三個或三個以上的變量時的選擇方法,先選擇一對配對變量,使之進入PairedVariable配對變量欄,然后再選中下一對配對變量,使之進入PairedVariable配對變量欄,這樣就可以指定多對配對變量同時進行分折。在配對變量欄中,配對變量名處于同一行,中間有“——”連接。在配對樣本T檢驗主對話框的右下角有一個Opitions按鈕,點擊該按鈕彈出Opitions選擇項對話框。此對話框ConfidenceInterval一欄為可信水平,系統(tǒng)默認(rèn)為95%,讀者可以改寫。Excludecasesanalysisbyanalysis選項,帶有缺失值的觀測量,當(dāng)它與分析有關(guān)時才被剔除。一為Excludecaseslistwise項,剔除在主對話框中Variables矩形框中列出的變量帶有缺失值的所有觀測量。點擊"Continue”按鈕,可返回主對話框。點擊"OK"按鈕,便可運行該過程。下面舉出一道多對配對變量的T檢驗例題。[例4.2]為了檢驗甲、乙、丙三種分離機在析出某種有用物質(zhì)效能上的高低,今抽取8批溶液,每批均分成三份,分別由甲、乙、丙機分解處理,其析出效果數(shù)據(jù)如表,試問甲、乙、丙三種機在析出效能上有無差異(α=0.05)?甲、乙、丙三種機析出效能數(shù)據(jù)表樣號1 2 3 4 5 6 7 8甲X4.0 3.5 4.1 5.5 4.6 6.05.14.3乙Y3.0 3.0 3.8 2.1 4.9 5.3 3.12.7丙Z3.2 3.8 4.3 3.6 4.0 4.9 4.72.4選擇Analyze→CompqreMeans→Paired-SampleTTest激活Paired-SampleTTest配對樣本檢驗主對話框,將三個變量“甲機[X]”,“乙機[Y]”“丙機[Z]”兩兩配對,組成三對配對變量進行T檢驗,其余使用系統(tǒng)默認(rèn)值,即將提交運行時的配對樣本T檢驗主對話框,單擊“OK”。PairedSamplesTest-.3750.90040.31834-1.1278.3778-1.1787.2771.15001.16251.41101.17812.12192.7987.027.7750.83794.29626.07451.47552.6167.035乙-丙Pair1甲-乙Pair2甲-丙Pair3MeanStd.DeviationStd.ErrorMeanLowerUpper95%ConfidenceIntervaloftheDifferencePairedDifferencestdfSig.(2-tailed)方差分析單因素方差分析多因素方差分析
方差分析又稱作變異數(shù)分析(analysisofvariance,或縮寫ANOVA)是一種應(yīng)用非常廣泛的變量分析方法。其主要功能在于分析實驗數(shù)據(jù)中不同來源的變異對總變異的貢獻大小,從而確定實驗中的自變量是否對因變量有重要影響。方差分析的原理及其基本過程一、方差分析的基本原理:綜合的F檢驗(一)綜合虛無假設(shè)與部分虛無假設(shè)虛無假設(shè)是“任何一對平均數(shù)”之間是否有顯著性差異綜合虛無假設(shè):樣本所歸屬的的所有平均數(shù)都相等。H0:U1=U2=U3部分虛無假設(shè):是指組間的虛無假設(shè)。檢驗綜合的虛無假設(shè)是方差分析的主要任務(wù)。如果綜合的虛無假設(shè)被拒絕,緊接著要確定究竟哪兩個組之間的平均數(shù)之間存在顯著性差異時,需要運用事后檢驗的方法來確定。(二)方差的可分解性它所依據(jù)的基本原理是變異的可加性。具體地講,它是將總平方和分解為幾個不同來源的平方和(這里的平方和指實驗數(shù)據(jù)與平均數(shù)離差的平方和)。
F為組間變異與組內(nèi)變異相比較而得出的一個比率數(shù),如果F<1,說明數(shù)據(jù)的總變異中由分組不同所造成的變異只占很小的比例,大部分由實驗誤差和個體差異所致,也就是說不同的實驗處理之間差異不大,或者說實驗處理基本上無效。如果F=1,同樣說明實驗處理之間的差異不夠大。當(dāng)F>1而且落入F分布的臨界區(qū),則表明數(shù)據(jù)的總變異基本上由不同的實驗處理所造成,或者說不同的實驗處理之間存在著顯著差異。二、方差分析的基本過程與步驟1、求平方和2、確定自由度3、求均方4、計算F值5、查F值表進行F檢驗,并做出決斷6、列出方差分析表1、求平方和總平方和是所有觀測值與總平均數(shù)的離差的平方總和。組間平方和是幾個組的平均數(shù)與總平均數(shù)的離差的平方總和。組內(nèi)平方和是各被試的數(shù)值與組平均數(shù)之間的離差的平方總和。2、計算自由度3、計算均方4、計算F值5、查F表進行F檢驗并做出決斷6、列出方差分析表三、方差分析的基本假定1.總體正態(tài)分布在心理與教育研究領(lǐng)域中,大多數(shù)變量是可以假定其總體是服從于正態(tài)分布的,因此一般進行方差分析時并不需要去檢驗總體分布的正態(tài)性。當(dāng)有證據(jù)表明總體分布不是正態(tài)時,可以將數(shù)據(jù)作某種轉(zhuǎn)換,經(jīng)過轉(zhuǎn)換以后的數(shù)據(jù)就可以接近正態(tài)分布了。2.變異的可加性
方差分析所依據(jù)的一個基本原理就是變異的可加性。確切地說,應(yīng)該是變異的可分解性,總變異可以分解成幾個不同來源的部分,這幾個部分變異的來源在意義上必須明確,而且彼此要相互獨立。3.各處理內(nèi)的方差一致(齊性)
在方差分析中用MSw作為總體組內(nèi)方差的估計值,而計算MSw時相當(dāng)于將各個處理中的樣本方差合成,這如同前一章t檢驗中求兩個樣本方差的聯(lián)合方差一樣,在由兩個樣本方差求聯(lián)合方差時有個前提條件,兩個樣本方差無顯著差異。同樣,求組內(nèi)均方MSw時,各實驗處理內(nèi)的方差彼此也應(yīng)無顯著差異,這是方差分析中最為重要的基本假定。這一假定若不能滿足,原則上是不能進行上述方差分析的四、方差分析中的方差齊性檢驗單因素方差分析
(Completerandomalizeddesign)把被試隨機分成若干個組每個組分別接受一種實驗處理(單因素),則設(shè)計中有幾種實驗處理,被試就必須隨機分成幾組.這樣的實驗設(shè)計叫完全隨機設(shè)計.因此又叫單因素方差分析.(one-wayanalysisofvariace)完全隨機設(shè)計方差分析的實驗設(shè)計處理1處理2……處理K被試11被試21……被試K1被試12被試22……被試K2被試12被試23……被試K3……………………SST=SSB+SSWMSB=SSB/dfbMSW=SSW/dfwF=MSB/MSW[例1]有人研究自尊對個人表現(xiàn)的反饋類型之間的關(guān)系.讓15名被試參加一項知識測驗,每組各5名被試.在積極反饋組,不管被試在測驗中的實際表現(xiàn)如何,都告訴他們水平很高.對消極反饋組的被試,告訴他們表現(xiàn)很差.對控制組被試,不管測驗分?jǐn)?shù)如何,都不提供任何反饋信息.最后,讓所有被試都參加一個自尊測驗,測驗總分為10分,得到的分?jǐn)?shù)越高,表示自尊心越強.實驗結(jié)果如下表,試檢驗不同反饋類型與自尊之間的關(guān)系如何?積極反饋組消極反饋組控制組XXX8527649751043636(5)列出方差分析表變異來源平方和自由度均方Fp組間效應(yīng)43.33221.678.67**<.01組內(nèi)效應(yīng)30122.50總變異73.3314注:*表示p<·05,**表示p<.01例:用不同強度的光做視覺反應(yīng)時的實驗,光強分為Ⅰ,Ⅱ,Ⅲ三個等級,把被試隨機分成三組,分別做某一種光強的反應(yīng)時實驗,由于某些原因,各組人數(shù)沒能相同。試問從下面的結(jié)果中能否得出不同強度光的反應(yīng)時有顯著不同?光強等級Ⅰ光強等級Ⅱ光強等級ⅢXXX150190200220230240190170260170260180240250190200170280180280190220n796(5)列出方差分析表變異來源平方和自由度均方Fp組間效應(yīng)3878.821939.41.37>.05組內(nèi)效應(yīng)368.848191413.1總變異30727.321注:*表示p<·05,**表示p<.01各個平均數(shù)之間的比較(事后檢驗posthoetest)方差分析的主要目的是通過F檢驗討論組間變異(實驗處理)在總變異中的作用,借以對兩組以上的平均數(shù)進行差異檢驗。得到一個整體性的檢驗結(jié)果。如果F檢驗的結(jié)果差異不顯著,說明實驗中的自變量對因變量沒有顯著影響,檢驗就此結(jié)束.但是如果F檢驗的結(jié)果差異顯著時,卻往往不能就此結(jié)束,因為它只表明幾個實驗處理組的兩兩比較中至少有一對平均數(shù)間的差異達到了顯著水平,至于是哪一對卻沒有回答。若想找出究竟是哪一對或哪幾對的差異顯著,哪幾對不顯著,則需要進一步對各實驗處理組的平均數(shù)做比較。如何進行比較呢?學(xué)過t檢驗的人可能會馬上想到:這并不困難,只需對各組平均數(shù)兩兩成對地多進行幾次t檢驗即可。例如要同時比較A、B、C、D四個平均數(shù)兩兩之間的差異,需分別進行六次t檢驗。并且認(rèn)為這樣做除因進行t檢驗的次數(shù)較多而有些不便之外,并沒有什么問題了。其實不然。因為要同時比較的平均數(shù)越多,其中差異較大的一對所得t值超過原定臨界值tα的概率就越大,這時α錯誤的概率將明顯增加,或者說本來達不到顯著性水平的差異就很容易被說成是顯著了。除N-K法之外,事后檢驗最常用的方法還有Hayter提出的LSD檢驗方法。目前在各個統(tǒng)計領(lǐng)域內(nèi)應(yīng)用非常廣泛,它的統(tǒng)計軟件中也都能完成這一檢驗。注意事后多重比較并不限于在F檢驗以后進行,只要是對多個平均數(shù)進行兩兩比較,都應(yīng)當(dāng)使用多重比較方法。用SPSS進行方差分析
One-WayANOVA單因素方差分析應(yīng)用實例例題2、1:為研究三種教材的質(zhì)量,隨機抽取15名被試被隨機地分為三組,每組5人,各組被隨機地分配一種教材進行實驗,結(jié)果如下,問這三種教材質(zhì)量是否一致
教材(處理)樣本ⅠⅡⅢ17075702748072372776646868725717570平均數(shù)717570方差分析的過程1、建立數(shù)據(jù)文件,定義兩個變量一列為分?jǐn)?shù)X變量,數(shù)值型變量一列為G變量(因素),數(shù)值型,標(biāo)記不同教材的處理,1為第一種教材,2為第二種教材,3為第三種教材。從Analyze→CompareMeans→One-WayANOVA單因素對話框,將變量x分?jǐn)?shù)移入Dependentlist獨立列表欄,將變量G移入Factor欄,點擊OK即可。分析主對話框的三個功能按鈕1、Contrasts對話框,用來進行均值的多項式比較。2、PostHocMultipleComparisons為各組均數(shù)的多重比較對話框。(1)方差具有齊次性時(Equalvarianceassumed),均數(shù)的多重比較,一般選用S-N-K(StudentNewman-Keuls),各組均值從在到小按順序排列,最先比較最未端的差異。(2)方差不具齊次性時(Equalvariancenotassumed)檢驗各均數(shù)間是否有差異,一般選用Dunnett’sC,正態(tài)分布下的配對比較。(3)顯著性水平的輸入。3、Options輸出統(tǒng)計量的選擇對話框(1)Statistics輸出統(tǒng)計量的選擇項Descriptive輸出描述統(tǒng)計量Homogeneity-of-variance進行方差齊次性檢驗(2)Meansplot均數(shù)分布圖,根據(jù)各組均數(shù)描繪出因變量的分布情況。(3)MissingValue選擇缺失值處理方法。上例中,在“PostHoc”選擇S-N-K,在Options中選擇Descriptive,Homogeneity-of-variance,Meansplot,單擊OK,得到結(jié)果如下:單因素方差分析齊次性檢驗結(jié)果單因素方差分析結(jié)果均值多重比較的檢驗結(jié)果S-N-K均值散點圖不同教材的教學(xué)質(zhì)量的差異檢驗教材類型MSDFP(sig.)教材一71.0002.3673.4430.066教材二75.0004.416教材三70.0002.499多因素方差分析自變量為兩個或兩個以上。AXBSST=SSA+SSB+SSAXB+SSE2X2設(shè)計的方差分析舉例例:研究不同教學(xué)方法(A)和不同教學(xué)態(tài)度(B)對兒童識字量的作用。將20名被試隨機分成四組(每組5人),每組接受一種實驗處理,結(jié)果見下表,表中A因素表示教學(xué)方法,其中a1為集中識字,a2為分散識字,B因素表示教學(xué)態(tài)度,其中b1為“嚴(yán)肅”,b2為“輕松”,每一單元格中的數(shù)據(jù)為識字量。試分析兩種因素對識字量的作用。B因素(教學(xué)態(tài)度)A因素(教學(xué)方法)集中識字a1分散識字a2嚴(yán)肅b1輕松b2嚴(yán)肅b1輕松b2839173220262123121220281445172510402029∑6418195137(5)列出方差分析表變異來源平方和自由度均方FF.01組間A8.4518.450.368.53B1264.0511264.0553.89**AXB281.251281.2511.88**組內(nèi)(誤差)378.81623.675總變異1932.5519**表示在.01水平上具有統(tǒng)計學(xué)意義從以上分析可知,兩因素之間的交互作用非常顯著,這表明不同方法是受不同教學(xué)態(tài)度的影響,同樣不同的教學(xué)態(tài)度對識字量的不同作用也受到識字教學(xué)方式的影響。X2檢驗
(chi-squaretest)[教學(xué)目標(biāo)]1、了解X2檢驗的一般原理2、掌握X2檢驗的具體方法(配合度檢驗、獨立性檢驗、同質(zhì)性檢驗、計數(shù)數(shù)據(jù)的合并方法)[學(xué)習(xí)重點]1、X2檢驗的一般原理2、配合度檢驗3、獨立性檢驗第一節(jié)X2檢驗的原理X2檢驗分析計數(shù)數(shù)據(jù)時,對計數(shù)數(shù)據(jù)總體的分布形態(tài)不作任何假設(shè),X2檢驗被視為非參數(shù)檢驗的方法的一種。X2檢驗方法能處理一個因素兩項或多項分類的實際觀察頻數(shù)與理論頻數(shù)分布是否一致問題,或說有無顯著差異問題。所謂實際頻數(shù)(Actualfrequencies),簡稱實計數(shù)或?qū)嶋H數(shù),是指在實驗調(diào)查得到的計數(shù)資料,又稱為觀察頻數(shù)(observedfrequencies)。理論次數(shù)(theoreticalfrequencies)是指根據(jù)概率原理、某種理論、某種理論次數(shù)分布或經(jīng)驗次數(shù)分布計算出來的次數(shù),稱為期望次數(shù)(expectedfrequencies)。一、X2檢驗的假設(shè)(一)分類相互排斥,互不包容(二)觀測值相互獨立讓觀測值的總數(shù)等于實驗中不同被試的總數(shù),要求每個被試只有一個觀測值,這是確保觀測值相互獨立最安全的做法。二、X2檢驗的類別1、配合度檢驗2、獨立性檢驗1、配合度檢驗主要用來檢驗一個因素多項分類的實際觀察數(shù)與某理論次數(shù)是否接近,也稱無差假說。當(dāng)對連續(xù)數(shù)據(jù)的正態(tài)性進行檢驗時,這種檢驗又可稱為正態(tài)吻合性檢驗。2、獨立性檢驗是用來檢驗兩個或兩個以上因素各種之間是否關(guān)聯(lián)或是否獨立性問題。適用于探討兩個變量之間是否關(guān)聯(lián)(非獨立)或無關(guān)(獨立),如果再加入另一個變量提影響,即探討三個變量之間關(guān)系時,就必須使用多維列聯(lián)表分析方法。三、X2檢驗的基本公式X2檢驗方法檢驗的是樣本觀測次數(shù)f0(或百分比)與理論fe或總體次數(shù)(百分比)的差異性。
X2檢驗的統(tǒng)計原理,是比較觀察值與理論值的差別,如果差異越小,檢驗結(jié)果越不容易達到顯著性水平;兩者差異越大,檢驗的結(jié)果越可能達到顯著性水平,就可以下結(jié)論拒絕虛無假設(shè)而接受備擇假設(shè)。應(yīng)用X2檢驗應(yīng)注意取樣代表性盡管計數(shù)資料的獲得比計量資料容易,但實驗難于控制,搜集數(shù)據(jù)過程中易出現(xiàn)偏樣本,為確保統(tǒng)計推論的科學(xué)性,取樣問題就顯得特別突出。第二節(jié)配合度檢驗(單因素檢驗)配合度檢驗(goodnessoffittest)主要用于檢驗單一變量的實際觀察次數(shù)分布與某理論總?cè)藬?shù)是否有差別。也即單因素檢驗(one-waytest)一、配合度檢驗的一般問題1、統(tǒng)計假設(shè)研究假設(shè):實際觀察次數(shù)與某理論次數(shù)之間差異顯著:H1:fofe虛無假設(shè):實際觀察數(shù)與理論次數(shù)之間無差異或相等。H0:fo=fe,X2檢驗法查附表12得到的概率是雙側(cè)概率.≠2、自由度的確定為資料的分類或分組的數(shù)目,減去計算理論次數(shù)時所用統(tǒng)計量的個數(shù)。(分類項數(shù)-1(總數(shù)))3、理論次數(shù)的計算:是根據(jù)某種理論,按一定的概率通過樣本即實際觀察次數(shù)計算.二、配合度的應(yīng)用(一)檢驗無差假說是指各項分?jǐn)?shù)的實計數(shù)之間沒有差異,也就是假設(shè)各項分類之間的機會相等,或概率相等,因此理論次數(shù)完全按概率相等的條件計算。(一)檢驗無差假說例10-1:隨機抽取60名學(xué)生,詢問他們在高中是否需要文理分科,贊成分科的39人,反對分科的21人,問他們對分科的意見是否有顯著差異?例2:某項民意測驗,答案有同意、不置可否、不同意3種。調(diào)查了48人,結(jié)果同意的24人,不置可否的12人,不同意的12人,問持這3種意見的人數(shù)是否有顯著不同?用SPSS檢驗無差假說建立數(shù)據(jù)文件,定義變量名:各意見為group,人數(shù)為“data”。從選擇“data”“weightcase”,進入“weightcase”對話框.把date放入“frequencyvariable”欄中定義人數(shù)為權(quán)數(shù),單擊“ok”從Analyze–Nonparametrictest–Chi-Square,進入Chi-Square對話框,現(xiàn)欲對不同意見進行分布分析,故在對話框左側(cè)的變量列表中選group,點擊向右箭頭使之進入testvariablelist框,點擊OK。結(jié)果如下表課堂練習(xí):根據(jù)以往經(jīng)驗,某校長認(rèn)為高中生升學(xué)的男女比例為2:1,今年的升學(xué)情況是男生85人,女生35人,問今年升學(xué)的男女生比例是否符合該校長的經(jīng)驗?第三節(jié)獨立性檢驗
(列聯(lián)表分析)
(testofindependence)獨立性檢驗主要用于兩個或兩個以上因素多項分類的計數(shù)資料分析,也就是研究兩類變量之間的關(guān)聯(lián)性和依存性問題。其目的在于檢驗從樣本得到的兩個變量的觀測值,是否具有特殊的關(guān)聯(lián)。一、獨立性檢驗的一般問題與步驟(一)統(tǒng)計假設(shè)虛無假設(shè):二因素(多因素)之間是獨立的或無關(guān)聯(lián)的。備擇假設(shè):二因素之間有關(guān)聯(lián)或者說差異顯著。(二)理論次數(shù)的計算獨立性檢驗的理論次數(shù)是直接用列聯(lián)表提供的數(shù)據(jù)推算出來的。fxi表示第一行的和,fyi表示每一列的和。fe為理論次數(shù)。允許小數(shù)出現(xiàn)。(三)自由度的確定
df=(R-1)(C-1)R為每一行的分類項數(shù),C為每一列的分類數(shù)目。(四)統(tǒng)計方法的選擇獨立樣本
f2oi為每一格的實計數(shù)。fxi是與f2oi對應(yīng)的那一行的總數(shù),稱為邊緣次數(shù)。fyi是與foi對應(yīng)的那一列的總數(shù),也稱邊緣次數(shù)。N為總的觀察數(shù)目。(五)結(jié)果及解釋小于臨界值則認(rèn)為兩因素?zé)o關(guān)聯(lián),或相互獨立,或說一因素的幾項分類在另一因素的幾項分類上實際觀察次數(shù)與理論次數(shù)差異不顯著,或可以籠統(tǒng)地講差異不顯著。大于臨界值則認(rèn)為兩因素有關(guān)聯(lián),或不獨立,或說一因素的幾項分類在另一因素的幾項分類上實際觀察次數(shù)與理論次數(shù)差異顯著,或可以籠統(tǒng)地講差異顯著二、四格表獨立性檢驗(一)獨立樣本四格表X2檢驗(二)相關(guān)樣本四格表X2檢驗(三)四格表X2值的近似校正(四)四格表的Fisher精確概率檢驗方法(一)獨立樣本四格表X2檢驗(crosstabs)獨立樣本四格表X2檢驗,相當(dāng)于獨立樣本比率差異的顯著性檢驗。因素A分類1分類2因素B分類1ABA+B分類2CDC+DA+CB+DN=A+B+C+D例10:隨機抽取90人,按男女不同性別分類,將學(xué)生成績分為中等以上及中等以下兩類,結(jié)果如下。問男女在學(xué)業(yè)水平上是否有關(guān)聯(lián)?或男女在學(xué)業(yè)中等以上的比率差異是否顯著?學(xué)業(yè)水平總和中等以上中等以下性別男231740女282250總和513990(二)相關(guān)樣本四格表X2檢驗df=1A,D為四格表中兩次實驗或調(diào)查中分類項目不同的那兩個格的實計數(shù)例11:100名學(xué)生先后測驗兩次,結(jié)果如下:測驗1總和錯對測驗2對55560錯251540總和3070100非參數(shù)檢驗[教學(xué)目標(biāo)]1、理解非參數(shù)檢驗的一般原理和特點2、理解和掌握非參數(shù)檢驗的具體方法,包括卡方檢驗、秩和檢驗法、中數(shù)檢驗法、符號檢驗法、等級方差分析等[學(xué)習(xí)重點]1、非參數(shù)檢驗的特點與原理2、秩和檢驗法、中數(shù)檢驗法、符號檢驗法、等級方差法假設(shè)檢驗包括參數(shù)檢驗和非參數(shù)檢驗.參數(shù)檢驗:若進行假設(shè)檢驗時總體的分布形式已知,需要對總體的未知參數(shù)進行假設(shè)檢驗.非參數(shù)檢驗:若對總體分布形式甚少,需要對未知分布函數(shù)的形式及其他特征進行假設(shè)檢驗.第一節(jié)非參數(shù)檢驗的基本概念與特點一、非參數(shù)檢驗的概念1、參數(shù)模型與非參數(shù)模型:參數(shù)模型是指分布的“模式”已經(jīng)知道,而其中一些具體細(xì)節(jié)(參數(shù))是未知的,這種對分布模式的知識可以解釋為在觀察樣本之前所掌握的信息,可以使研究者更有效地提煉樣本中的信息。非參數(shù)模型是指在總體或樣本的分布缺乏關(guān)于總體分布模式的知識很少,或相關(guān)信息很少。2、在非參數(shù)統(tǒng)計中面臨的問題與參數(shù)統(tǒng)計不同。一類問題是要知道分布是否屬于某一參數(shù)模型。另一類問題則是根本與參數(shù)模型沒有任何關(guān)系3、在非參數(shù)統(tǒng)計中使用的統(tǒng)計量與參數(shù)統(tǒng)計中使用的統(tǒng)計量也不同非參數(shù)檢驗:若對總體分布形式甚少,需要對未知分布函數(shù)的形式及其他特征進行假設(shè)檢驗,又稱任意分布檢驗.特別適用于計量信息較弱的資料,往往僅依據(jù)數(shù)據(jù)的順序、等級資料即可進行統(tǒng)計推斷,在實踐中應(yīng)用極為廣泛。二、非參數(shù)檢驗的特點1、一般不需要嚴(yán)格的前提假設(shè)2、特別適用于順序資料(等級變量)3、很適用于小樣本,且方法簡單4、不足是未能充分利用資料的全部信息5、非參數(shù)方法目前還不能處理“交互作用”其重要特點是對總體分布的假定要求不嚴(yán)格,條件很寬。第二節(jié)X2檢驗X2檢驗分析計數(shù)數(shù)據(jù)時,對計數(shù)數(shù)據(jù)總體的分布形態(tài)不作任何假設(shè),X2檢驗被視為非參數(shù)檢驗的方法的一種。X2檢驗方法能處理一個因素兩項或多項分類的實際觀察頻數(shù)與理論頻數(shù)分布是否一致問題,或說有無顯著差異問題。所謂實際頻數(shù)(Actualfrequencies),簡稱實計數(shù)或?qū)嶋H數(shù),是指在實驗調(diào)查得到的計數(shù)資料,又稱為觀察頻數(shù)(observedfrequencies)。理論次數(shù)(theoreticalfrequencies)是指根據(jù)概率原理、某種理論、某種理論次數(shù)分布或經(jīng)驗次數(shù)分布計算出來的次數(shù),稱為期望次數(shù)(expectedfrequencies)。一、X2檢驗的假設(shè)(一)分類相互排斥,互不包容(二)觀測值相互獨立讓觀測值的總數(shù)等于實驗中不同被試的總數(shù),要求每個被試只有一個觀測值,這是確保觀測值相互獨立最安全的做法。三、X2檢驗的基本公式X2檢驗方法檢驗的是樣本觀測次數(shù)f0(或百分比)與理論fe或總體次數(shù)(百分比)的差異性。
X2檢驗的統(tǒng)計原理,是比較觀察值與理論值的差別,如果差異越小,檢驗結(jié)果越不容易達到顯著性水平;兩者差異越大,檢驗的結(jié)果越可能達到顯著性水平,就可以下結(jié)論拒絕虛無假設(shè)而接受備擇假設(shè)。應(yīng)用X2檢驗應(yīng)注意取樣代表性盡管計數(shù)資料的獲得比計量資料容易,但實驗難于控制,搜集數(shù)據(jù)過程中易出現(xiàn)偏樣本,為確保統(tǒng)計推論的科學(xué)性,取樣問題就顯得特別突出。例題1為考察“運算標(biāo)記”對小學(xué)二年級學(xué)生四則混合運算規(guī)則的樣例學(xué)習(xí)是否有促進作用,研究者在實驗中設(shè)計了兩種樣例:有“運算標(biāo)記”的樣例和“無運算標(biāo)記”的樣例。有運算標(biāo)記的樣例用紅色箭頭標(biāo)示解題步驟,無運算標(biāo)記的樣例在解題步驟無任何,除此之外,二者完全相同,記錄兩組被試學(xué)會的人數(shù),問這兩組被試學(xué)會的人數(shù)是否有顯著差異?組別學(xué)會的人數(shù)有標(biāo)記組15無標(biāo)記組5第二節(jié)兩個獨立樣本的非參數(shù)檢驗方法一、秩和檢驗法“秩和”(thesumofranks)即秩次的和或者等級之和。(一)秩統(tǒng)計量(rankstatistics):是把樣本數(shù)據(jù)從小到大排序,賦予等級。ri(二)適用資料:1、總體方差未知,不需要考慮總體分布2、兩獨立樣本為順序變量(三)計算過程1、兩個樣本容量均小于10——維克檢驗W秩和檢驗(1)將兩個樣本數(shù)據(jù)混合由小到大作等級排列(最小為1等)例11-1:在一項關(guān)于模擬訓(xùn)練的實驗中,以技工學(xué)校的學(xué)生為對象,對5名學(xué)生用針對某一工種的模擬器進行訓(xùn)練,另外讓6名學(xué)生下車間直接在實習(xí)中訓(xùn)練,經(jīng)過同樣時間后對兩組人進行該工種的技術(shù)操作考核,結(jié)果如下:模擬器組:56,62,42,72,76實習(xí)組:68,50,84,78,46,92假設(shè)兩組學(xué)生初始水平相同,問兩種訓(xùn)練方法效果是否不同?解:(1)排等級等級1234567891011模擬器組4256627276實習(xí)組465068788492(2)計算秩和(等級和)T=1+4+5+7+8=25(即模擬器組的秩和)(3)查秩和檢驗表n1=5,n2=6時,T1=19,T2=41時,(表中值為單側(cè)檢驗,故這里查0.025的臨界值)19<25<41,即T1<T<T2答,尚不能認(rèn)為兩種方式的訓(xùn)練效果不同.Analyze---Nanparametric—2indenpentsample課堂練習(xí):從某班隨機抽取5名走讀生和6名住宿生,測得英語口語分?jǐn)?shù)如下,問走讀生和住宿生英語口語成績是否有顯著差異?走讀生:42,38,35,41,32住宿生:56,49,60,43,38,552、兩個樣本容量均大于10例[11-5]對某班學(xué)生進行注意穩(wěn)定性實驗,男生與女生的實驗結(jié)果如下,問男女生之間注意穩(wěn)定性是否不同?男生:(n1=14)19,32,21,34,19,25,25,31,31,27,22,26,29女生:(n2=17)25,30,28,34,23,25,27,35,30,29,33,35,37,24,34解:先將兩組實驗數(shù)據(jù)混合,從小到大排序,然后標(biāo)出男生、女生每個人相應(yīng)的等級。結(jié)果男生的等級依次為:1.5,23.5,3,27,1.5,8.5,8.5,21.5,21.5,29.5,13.5,4,11.5,11.5,17.女生的等級次序為:8.5,19.5,15,27,5,8.5,13.5,29.5,19.5,17,17,25,29.5,19.5,17,17,25,29.5,31,6,27,23.5.
由于n1<n2,根據(jù)定義,男生的等級總和:
T=174答:可以認(rèn)為男女生注意穩(wěn)定性之間的差異有統(tǒng)計意義答:可以認(rèn)為男女生注意穩(wěn)定性之間的差異有統(tǒng)計意義課堂練習(xí):某師范院校書法比賽男女生得分如下,問男女生書法比賽成績是否有顯著差異?男生(12人):24,18,36,40,25,28,30,21,14,26,29,27女生(14人):30,27,19,36,26,41,16,22,15,28,31,32,42,43
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030中國互聯(lián)網(wǎng)金融行業(yè)政策影響深度分析及市場前景報告
- 2025-2030中國互聯(lián)網(wǎng)廣告行業(yè)市場格局分析及投資評估發(fā)展戰(zhàn)略報告
- 2025-2030中國互聯(lián)網(wǎng)醫(yī)療行業(yè)市場現(xiàn)狀供求分析及投資評估規(guī)劃分析研究報告
- 智能家居安裝施工方案與注意事項
- 付款分期協(xié)議書
- 酒店活動策劃方案范文(3篇)
- 佛教道場協(xié)議書
- 市政工程創(chuàng)業(yè)創(chuàng)新項目申請方案范本
- 門店花園施工方案(3篇)
- 高端游戲制作與服務(wù)業(yè)市場現(xiàn)狀供需分析及投資評估規(guī)劃分析研究報告
- 社會主義發(fā)展史知到章節(jié)答案智慧樹2023年齊魯師范學(xué)院
- 美國史智慧樹知到答案章節(jié)測試2023年東北師范大學(xué)
- GB/T 15924-2010錫礦石化學(xué)分析方法錫量測定
- GB/T 14525-2010波紋金屬軟管通用技術(shù)條件
- GB/T 11343-2008無損檢測接觸式超聲斜射檢測方法
- GB/T 1040.3-2006塑料拉伸性能的測定第3部分:薄膜和薄片的試驗條件
- 教師晉級專業(yè)知識和能力證明材料
- 申報專業(yè)技術(shù)職稱課件-
- 排隊叫號系統(tǒng)施工技術(shù)方案
- 應(yīng)用3-農(nóng)業(yè)收獲機器人課件
- 呼氣末二氧化碳分壓的臨床應(yīng)用-課件
評論
0/150
提交評論