版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章心理測量中的統(tǒng)計(jì)技術(shù)孫海龍第一節(jié)
次數(shù)分布與集中量數(shù)描述統(tǒng)計(jì)的目的使得一組數(shù)據(jù)易于理解。圖和表是很好的手段和方法一個(gè)例子一位研究者調(diào)查了151位大學(xué)生,問他們在過去一年中的應(yīng)激程度,用的是0到10點(diǎn)量表。151個(gè)大學(xué)生的數(shù)據(jù)如下:4,7,7,7,8,8,7,8,9,4,7,3,6,9,10,5,7,10,6,8,7,8,7,8,7,4,5,10,10,0,9,8,3,7,9,7,9,5,8,5,0,4,6,6,7,5,3,2,8,5,10,9,10,6,4,8,8,8,4,8,7,3,8,8,8,8,7,9,7,5,6,3,4,8,7,5,7,3,3,6,5,7,5,7,8,8,7,10,5,4,3,7,6,3,9,7,8,5,7,9,9,3,1,8,6,6,4,8,5,10,4,8,10,5,5,4,9,4,7,7,7,6,6,4,4,4,9,7,10,4,7,5,10,7,9,2,7,5,9,10,3,7,2,5,9,8,10,10,6,8,3用次數(shù)分布表整理在應(yīng)激量表每一點(diǎn)上的學(xué)生數(shù)目——————————————應(yīng)激分?jǐn)?shù)學(xué)生數(shù)目百分比
10149.39159.982617.273120.56138.651811.941610.63127.9232.0110.7021.3——————————————一、次數(shù)分布描述統(tǒng)計(jì)的目的:簡化和整理數(shù)據(jù)的表達(dá)。次數(shù)分布(FrequencyDistribution):是指一批數(shù)據(jù)在某一量度的每一個(gè)類目所出現(xiàn)的次數(shù)情況組織此類數(shù)據(jù)的第一種方法是:建立次數(shù)分布表次數(shù)分布表和次數(shù)分布圖就是表達(dá)一組數(shù)據(jù)是如何在某一度量上分布的例1:某個(gè)班的26個(gè)學(xué)生在一次測驗(yàn)中的分?jǐn)?shù)如下(10分為滿分):
9,2,3,8,10,9,9,2,1,2,9,8,2,5,2,9,9,3,2,5,7,2,10,1,2,9
將這些分?jǐn)?shù)作成一個(gè)次數(shù)分布表
Xf1029782716052403228
12(一)簡單次數(shù)分布表
次數(shù)分布表是將位于量數(shù)的每一個(gè)類目的個(gè)體的個(gè)數(shù)組織成表格的形式-
變量的值?-填充x列從大到小,每個(gè)可能的值-
每個(gè)值出現(xiàn)多少次(發(fā)生次數(shù))?-填充f列3-
觀察的總數(shù)?將次數(shù)行求和,將得到S
f=N4-
變量的總值?最簡單的方法就是求(X)和(f)的乘積列,然后將結(jié)果求和S(Xf)例1:對于下面的次數(shù)分布表:
a)
此分布中共有幾個(gè)分?jǐn)?shù)(N=?)
b)
對這些分?jǐn)?shù)求和∑XN=∑f=14∑X=∑xf=33
每個(gè)分?jǐn)?shù)的比率和百分率Proportion=p=f/n分組次數(shù)分布表
當(dāng)變量的值分布在一個(gè)較廣的范圍時(shí),需要分組次數(shù)分布表簡捷地描述數(shù)據(jù)常常以區(qū)間或類別的形式出現(xiàn),而不是某一特定值.例如學(xué)生成績,(A=90-99,B=80-89,...).編制分組次數(shù)分布表的步驟把所有數(shù)據(jù)按大小順序排列求全距定組數(shù)定組距寫出區(qū)間上下限統(tǒng)計(jì)每個(gè)區(qū)間的次數(shù)
分組的“慣常法則”1.分組次數(shù)分布表應(yīng)該有大約10(5-15)個(gè)區(qū)間,目的是使這組數(shù)據(jù)易于直觀感受和理解2.所有區(qū)間的寬度應(yīng)該相等3.組距應(yīng)該是個(gè)比較簡單的數(shù)字,如2,5,10,204.每個(gè)區(qū)間開始的分?jǐn)?shù)應(yīng)該是組距的倍數(shù)例3:以下是22個(gè)同學(xué)的測驗(yàn)分?jǐn)?shù),編制分組次數(shù)分布表
94,92,82,87,81,74,75,78,76,76,63,60,62,54,51,56,59,43,32,36,25,18
例3:以下是22個(gè)同學(xué)的測驗(yàn)分?jǐn)?shù),編制分組次數(shù)分布表
94,92,82,87,81,74,75,78,76,76,63,60,62,54,51,56,59,43,32,36,25,18分?jǐn)?shù)的分布范圍是18-942為組距,分38組5為組距,分16組10為組距,分9組精確界限(RealLimits)對于一個(gè)連續(xù)型變量,每個(gè)分?jǐn)?shù)實(shí)際對應(yīng)量尺上的一段區(qū)間。分割這些區(qū)間的界限叫做精確界限(reallimits).
分割兩個(gè)鄰近分?jǐn)?shù)的精確界限位于兩個(gè)分?jǐn)?shù)的中間。每個(gè)分?jǐn)?shù)有兩個(gè)精確界限,一個(gè)在區(qū)間的頂端,稱為精確上限(upperreallimit),另一個(gè)在區(qū)間的底端,稱為精確下限(lowerreallimit).注意一個(gè)區(qū)間的精確上限也是高一個(gè)區(qū)間的精確下限
次數(shù)分布圖直方圖(histogram)
用一些垂直條畫在每個(gè)分?jǐn)?shù)之上垂直條的高度代表次數(shù)垂直條的寬度代表分?jǐn)?shù)的精確區(qū)間.臨近的垂直條連接在一起只有數(shù)據(jù)是等距或等比量度(連續(xù)變量)時(shí),才能用直方圖繪制一個(gè)直方圖來表達(dá)例2的分布
水平軸-X軸(abscissa)-X的值
垂直軸-Y軸(ordinate)-次數(shù)繪制直方圖的一般規(guī)則X軸與Y軸的交叉點(diǎn)應(yīng)該是0Y軸高度大約是X軸的2/3到3/4繪制直方圖的方法用坐標(biāo)紙繪制用Excel,SPSS等電腦軟件繪制折線圖(linegraph)
又稱次數(shù)分布多邊圖(frequencydistributionpolygon)在每一分?jǐn)?shù)上面畫點(diǎn)點(diǎn)的高度代表次數(shù)一條連續(xù)折線將這些點(diǎn)連接在一起表達(dá)數(shù)據(jù)的變化趨勢折線圖(linegraph)如何準(zhǔn)確地用圖表達(dá)數(shù)據(jù)把復(fù)雜的觀點(diǎn)傳遞得清晰,準(zhǔn)確,高效.在最短的時(shí)間里用最少的筆墨和空間傳遞最多的信息.圖形的實(shí)際差別與數(shù)據(jù)的差別成正比.標(biāo)注清楚,詳細(xì),完全.測度單位要一致.誤導(dǎo)讀者的圖仔細(xì)看看y軸,我們才發(fā)現(xiàn),原來膽固醇水平不過降低了5%!次數(shù)分布的形狀
用3個(gè)特征可以完整地描述一個(gè)分布:形狀(shape)集中趨勢(centraltendency)變異性(variability)對稱分布可以畫一條垂直線穿過分布的中央,使得分布的一邊恰是另一邊的鏡象。偏態(tài)分布(skeweddistribution)
分?jǐn)?shù)堆積在分布的一端,而另一端成為比較尖細(xì)的尾端(tail)
偏態(tài)分布尾端向右的稱為正偏態(tài)(positivelyskewed
)(因?yàn)槠湮捕酥赶蛘龜?shù))偏態(tài)分布尾端向左的稱為負(fù)偏態(tài)(negativelyskewed).百分位數(shù)(percentile)以上是描述觀察的整體,而我們也可用次數(shù)分布來描述某一個(gè)別點(diǎn)在一個(gè)集合中的位置原始分?jǐn)?shù)本身并不提供該點(diǎn)在一個(gè)集合中的位置的信息一個(gè)分?jǐn)?shù)的等級(rank)或百分位數(shù)等級(percentilerank):某一分布中分?jǐn)?shù)在某一值之下或等于該值的個(gè)體所占的百分比.當(dāng)一個(gè)分?jǐn)?shù)被其百分位數(shù)等級,該分?jǐn)?shù)稱為百分位數(shù)(percentile).累計(jì)次數(shù)分布cf=累積次數(shù)(cumulativefrequency)c%=cf/NX100%累積百分比(cumulativepercentage)如何確定百分位數(shù)對于連續(xù)型數(shù)據(jù),必須考慮其精確上限和精確下限如何確定百分位數(shù)1)
-對于分?jǐn)?shù)4,其對應(yīng)的累積百分比是95%.但注意:分?jǐn)?shù)4意味著一個(gè)人得分在3.5和4.5之間.累積百分比表明組距的精確上限。因此,95的百分位數(shù)是與4.5相對應(yīng)(而不是4.0).2)
找出分布中4分的精確上限和精確下限的累積次數(shù).
-對于分?jǐn)?shù)4.5,其對應(yīng)的累積百分比是95-
對于分?jǐn)?shù)3.5,其對應(yīng)的累積百分比是70
對于分?jǐn)?shù)4.0,其對應(yīng)的累積百分比是多少呢?
插值法(Interpolation)
有時(shí)你所感興趣的值并未出現(xiàn)在表內(nèi)。此時(shí)你需要做基于經(jīng)驗(yàn)的猜測.插值法的假設(shè)是在所求解點(diǎn)的附近1個(gè)組距單位區(qū)間之內(nèi)的分?jǐn)?shù)和對應(yīng)的百分比的變化是線性的。關(guān)鍵在于要找到距求解點(diǎn)最近的兩個(gè)區(qū)間,對于較遠(yuǎn)的區(qū)間,則不滿足分?jǐn)?shù)和對應(yīng)的百分比線性變化的假設(shè)。練習(xí)使用下表,求出第50個(gè)百分點(diǎn)解答14.5------60X------509.5-------30
(X-9.5)/(14.5-9.5)=(50-30)/(60-30)
X=12.83概念小測查:判斷正誤按照慣例,次數(shù)分布表從高到低列出分布類目(X的值).T當(dāng)樣本中的分?jǐn)?shù)被列到次數(shù)分布表中時(shí),你可以把f列加起來確定這些分?jǐn)?shù)的數(shù)目T為了得到一個(gè)次數(shù)分布表中分?jǐn)?shù)的總和,你需要做的只是將X列加在一起.F對于在X=61到X=68之間的一組分?jǐn)?shù),應(yīng)當(dāng)使用分組次數(shù)分布表而不是簡單次數(shù)分布表.F按照慣例,分組次數(shù)分布表的組距是一個(gè)簡單的數(shù)字,如2,5,10.T一個(gè)分組次數(shù)分布表列出一組分?jǐn)?shù)是20-24.其組距是4.F在次數(shù)分布圖中,分?jǐn)?shù)(X值)被列在垂直軸上.F如果分?jǐn)?shù)是等距量表,可以以直方圖或次數(shù)多邊圖來表示次數(shù)分布.T在棒圖中,兩條棒之間有空間.T在負(fù)偏態(tài)分布中,分?jǐn)?shù)堆積在分布右側(cè),而分布左側(cè)分?jǐn)?shù)稀薄T.(一)、算術(shù)平均數(shù)算術(shù)平均數(shù)一般簡稱為平均數(shù),或均數(shù),或均值。一般用字母M或表示。二、集中量數(shù)1.算術(shù)平均數(shù)的特點(diǎn)(或性質(zhì)):1)2)3)受兩極量數(shù)的影響較大4)5)6)算術(shù)平均數(shù)是“真值”的漸進(jìn)估計(jì)值,最佳的估計(jì)量2、算術(shù)平均數(shù)的計(jì)算方法1)未分組數(shù)據(jù)計(jì)算平均數(shù)由次數(shù)分布表求平均數(shù)2)使用次數(shù)分布表計(jì)算平均數(shù)表3-1次數(shù)分組求平均數(shù)計(jì)算表分組組中值(Xc)次數(shù)(f)Xc×f計(jì)算80—70—60—857565692510675130合計(jì)1713153、平均數(shù)的優(yōu)缺點(diǎn)1)優(yōu)點(diǎn)1.反應(yīng)靈敏2.計(jì)算嚴(yán)密3.計(jì)算簡單4.簡明易解5.適合于進(jìn)一步代數(shù)運(yùn)算6.較少受抽樣變動的影響2)缺點(diǎn)1.易受極端數(shù)據(jù)影響修剪平均數(shù):也稱截尾平均數(shù),是從一組數(shù)據(jù)中去除一定百分比(如5%)的最大值和最小值數(shù)據(jù)后,再次計(jì)算的算術(shù)平均數(shù)。2.若出現(xiàn)模糊不清的數(shù)據(jù)時(shí),無法計(jì)算平均數(shù)4、小結(jié)如果一組數(shù)據(jù)是比較準(zhǔn)確,可靠又同質(zhì),而且需要每一個(gè)數(shù)據(jù)都加入計(jì)算,同時(shí)還要作進(jìn)一步代數(shù)運(yùn)算時(shí),這時(shí)就要用算術(shù)平均數(shù)表示其集中趨勢。如果一組數(shù)據(jù)中出現(xiàn)兩個(gè)極端的數(shù)目,或有一些數(shù)據(jù)不清楚,數(shù)據(jù)不同質(zhì)時(shí),就不宜使用算術(shù)平均數(shù)。在報(bào)告平均數(shù)時(shí),要按特別指定的單位來表達(dá)。在書寫平均數(shù)時(shí),習(xí)慣上平均數(shù)保留的小數(shù)位數(shù)要比原來的測量數(shù)據(jù)多一位小數(shù)。(二)中數(shù)和眾數(shù)1、中數(shù)
1)中數(shù)的意義和特點(diǎn)
a意義:
中數(shù)又稱中點(diǎn)數(shù),中位數(shù),中值,是指按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù)。符號為Md或Mdn。
b特點(diǎn):不受兩極量數(shù)的影響
2)中數(shù)的計(jì)算方法(1)a)量數(shù)未分組求中數(shù)的方法當(dāng)量數(shù)不多時(shí),先把數(shù)據(jù)排序,若數(shù)據(jù)個(gè)數(shù)為奇數(shù)時(shí),則為中數(shù);若數(shù)據(jù)個(gè)數(shù)為偶數(shù)時(shí),則為中數(shù)。1.一組數(shù)據(jù)中無重復(fù)數(shù)值的情況①求數(shù)列4,6,7,8,12的中數(shù)?②有2,3,5,7,8,10,15,19共8個(gè)數(shù),求其中數(shù)。2)中數(shù)的計(jì)算方法(2)一組數(shù)據(jù)中有重復(fù)數(shù)值的情況①當(dāng)重復(fù)數(shù)值沒有位于數(shù)列中間時(shí)求數(shù)列5,5,6,10,12,15,17的中數(shù)。②當(dāng)重復(fù)數(shù)目位于數(shù)據(jù)中間,數(shù)據(jù)的個(gè)數(shù)為奇數(shù)時(shí)求數(shù)列11,11,11,11,13,13,13,17,17的中數(shù)。③當(dāng)重復(fù)數(shù)目位于數(shù)列中間,數(shù)據(jù)的個(gè)數(shù)為偶數(shù)時(shí)求數(shù)列11,11,11,11,13,13,13,17,17,18的中數(shù)。2、眾數(shù)1)眾數(shù)的意義和特點(diǎn)
a意義:指在一組量數(shù)中,出現(xiàn)頻數(shù)最多的量數(shù)。用符號表示。
b特點(diǎn):獲取容易;在一組量數(shù)中,眾數(shù)可能不止一個(gè);在次數(shù)分布中,眾數(shù)受組距和組限的影響很大。
2、眾數(shù)2)眾數(shù)的求法a用觀察法求眾數(shù)例:求2,3,3,5,3,4,3,6這一組數(shù)據(jù)的眾數(shù)。b用公式計(jì)算眾數(shù)金氏(W.I.king)插補(bǔ)法(量數(shù)已分組歸類,可用下列公式)::含眾數(shù)這一區(qū)間的精確下限;:高于眾數(shù)所在組一個(gè)組距那一分組區(qū)間的次數(shù);:低于眾數(shù)所在組一個(gè)組距那一分組區(qū)間的次數(shù);i:組距。金氏插補(bǔ)法適合次數(shù)分布比較偏斜的情況,比較接近正態(tài)的分布也適用。2)眾數(shù)的求法用公式計(jì)算眾數(shù)皮爾遜(K.Person)近似公式
皮爾遜經(jīng)驗(yàn)法只有當(dāng)次數(shù)分布呈現(xiàn)正態(tài)或接近正態(tài)時(shí),才能使用。眾數(shù)的應(yīng)用1.當(dāng)需要快速而粗略地尋求一組數(shù)據(jù)的代表值時(shí);2.當(dāng)一組數(shù)據(jù)出現(xiàn)不同質(zhì)的情況時(shí);3.當(dāng)次數(shù)分布中有兩極端的數(shù)目時(shí),除了一般用中數(shù)外,有時(shí)也用眾數(shù);4.當(dāng)粗略估計(jì)次數(shù)分布的形態(tài)時(shí),有時(shí)用平均數(shù)與眾數(shù)之差,作為表示次數(shù)分布是否偏態(tài)的指標(biāo)。5.當(dāng)一組數(shù)據(jù)中同時(shí)有兩個(gè)數(shù)值的次數(shù)都比較多時(shí),即次數(shù)分布中出現(xiàn)雙眾數(shù)時(shí),也多用眾數(shù)來表示數(shù)據(jù)分布形態(tài)。平均數(shù)、中數(shù)與眾數(shù)之間的關(guān)系在偏態(tài)分布中,平均數(shù)永遠(yuǎn)位于尾端。一般偏態(tài)情況下,中數(shù)離平均數(shù)較近,而距眾數(shù)較遠(yuǎn)。第二節(jié)差異量數(shù)與標(biāo)準(zhǔn)分?jǐn)?shù)差異量數(shù)是表示量數(shù)之間的差異程度的一些統(tǒng)計(jì)量的總稱。差異量數(shù)包括:絕對差異量數(shù)、相對差異量數(shù)和相對位置量數(shù)。一、差異量數(shù)
(一)平均差⒈意義:⒉計(jì)算:⑴未歸類量數(shù)求AD:可用定義式。⑵已歸類量數(shù)求AD表4-3已分組歸類求平均差組限f計(jì)算95—90—85—80—75—70—65—60—55—146912854197928782777267625719.714.79.74.70.35.310.315.320.319.758.858.242.33.642.451.561.220.3合計(jì)50358.03.平均差的優(yōu)缺點(diǎn)優(yōu)點(diǎn):平均差是根據(jù)全部數(shù)值計(jì)算的,受極端值影響較全距小。缺點(diǎn):由于采取絕對值的方法消除離差的正負(fù)號,應(yīng)用較少。
(二)方差與標(biāo)準(zhǔn)差1方差與標(biāo)準(zhǔn)差的意義
1)方差:
2)標(biāo)準(zhǔn)差:
2標(biāo)準(zhǔn)差的計(jì)算
1)基本公式:
2)原始量數(shù)求標(biāo)準(zhǔn)差的公式:
3)由次數(shù)分布表求標(biāo)準(zhǔn)差:
a簡單次數(shù)分布表求S:
1.性質(zhì)方差是對一組數(shù)據(jù)中各種變異的總和的測量,具有可加性和可分解性。統(tǒng)計(jì)實(shí)踐中常利用方差的可加性去分解和確定屬于不同來源的變異性(如組內(nèi)、組間等),并進(jìn)一步說明各種變異對總結(jié)果的影響,是以后統(tǒng)計(jì)推論中最常用的統(tǒng)計(jì)特征數(shù)。㈢方差與標(biāo)準(zhǔn)差的性質(zhì)和意義(1)
1.性質(zhì)標(biāo)準(zhǔn)差是一組數(shù)據(jù)方差的平方根,它不可以進(jìn)行代數(shù)計(jì)算,但有以下特性。⑴每一個(gè)觀測值都加上一個(gè)相同常數(shù)C之后,計(jì)算得到的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差。⑵每一個(gè)觀測值都乘以一個(gè)相同的常數(shù)C,則所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)。⑶以上兩點(diǎn)相結(jié)合,每一個(gè)觀測值都乘以同一個(gè)常數(shù)C(C≠0),再加上一個(gè)常數(shù)d,所得的標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘以這個(gè)常數(shù)C。㈢方差與標(biāo)準(zhǔn)差的性質(zhì)和意義(2)2.方差與標(biāo)準(zhǔn)差的意義方差與標(biāo)準(zhǔn)差是表示一組數(shù)據(jù)離散程度的最好指標(biāo)。其值越大,說明次數(shù)分布的離散程度越大,該組數(shù)據(jù)較分散;其值越小,說明次數(shù)分布的數(shù)據(jù)比較集中,離散程度越小。標(biāo)準(zhǔn)差具備一個(gè)良好的差異量數(shù)應(yīng)具備的條件:①反應(yīng)靈敏;②計(jì)算公式嚴(yán)密確定;③容易計(jì)算;④適合代數(shù)運(yùn)算;⑤受抽樣變動影響??;⑥簡單明了。標(biāo)準(zhǔn)差與其他各種差異量數(shù)相比,具有數(shù)學(xué)上的優(yōu)越性。㈢方差與標(biāo)準(zhǔn)差的性質(zhì)和意義(3)二、標(biāo)準(zhǔn)分?jǐn)?shù)
㈠標(biāo)準(zhǔn)分?jǐn)?shù)的定義⒈定義:原始量數(shù)與其平均數(shù)的差數(shù),除以標(biāo)準(zhǔn)差所得的商,稱之為標(biāo)準(zhǔn)分?jǐn)?shù)。又稱為Z分?jǐn)?shù)。用公式表示:
標(biāo)準(zhǔn)分?jǐn)?shù)是以標(biāo)準(zhǔn)差為單位表示一個(gè)原始分?jǐn)?shù)在團(tuán)體中所處位置的相對位置量數(shù)。標(biāo)準(zhǔn)分?jǐn)?shù)從分?jǐn)?shù)對平均數(shù)的相對地位、該組分?jǐn)?shù)的離中趨勢兩個(gè)方面來表示原始分?jǐn)?shù)的地位。㈡標(biāo)準(zhǔn)分?jǐn)?shù)的求法X96908685838281807572137320-1-2-3-8-11
㈢標(biāo)準(zhǔn)分?jǐn)?shù)的性質(zhì)⑴Z分?jǐn)?shù)無實(shí)際單位,是以平均數(shù)為參照點(diǎn),以標(biāo)準(zhǔn)差為單位的一個(gè)相對量。⑵一組原始分?jǐn)?shù)轉(zhuǎn)換得到的Z分?jǐn)?shù)可以是正值,也可以是負(fù)值。⑶所有原始分?jǐn)?shù)的Z分?jǐn)?shù)之和為0,Z分?jǐn)?shù)的平均數(shù)也為0,即⑷一組數(shù)據(jù)的標(biāo)準(zhǔn)分?jǐn)?shù)的標(biāo)準(zhǔn)差為1,即⑸若原始分?jǐn)?shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分?jǐn)?shù)值服從均值為0,標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布。㈣標(biāo)準(zhǔn)分?jǐn)?shù)轉(zhuǎn)換的意義
把原始分?jǐn)?shù)轉(zhuǎn)換成Z分?jǐn)?shù),就是把單位不等距的和缺乏明確參照點(diǎn)的分?jǐn)?shù)轉(zhuǎn)換成以標(biāo)準(zhǔn)差為單位,以平均數(shù)為參照點(diǎn)的分?jǐn)?shù)。因?yàn)樵谝粋€(gè)分布中,標(biāo)準(zhǔn)差所表示的距離是相等的,以標(biāo)準(zhǔn)差為單位就使單位等距了。以平均數(shù)為參照點(diǎn),也就是以0為參照點(diǎn),因?yàn)榈扔谄骄鶖?shù)的原始分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)后,其值為0.原始分?jǐn)?shù)轉(zhuǎn)換成Z分?jǐn)?shù),就是轉(zhuǎn)換為以1為標(biāo)準(zhǔn)差,以0為參照點(diǎn)(平均值)的分?jǐn)?shù),從而可以明確各個(gè)原始分?jǐn)?shù)的相對地位,并且分?jǐn)?shù)間也有了相互比較的基礎(chǔ)。正因?yàn)樗?(1個(gè)標(biāo)準(zhǔn)差)為單位,以0為參照點(diǎn),故名標(biāo)準(zhǔn)分?jǐn)?shù)。㈤標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用1.比較幾個(gè)性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低例:測驗(yàn)一個(gè)班級的數(shù)學(xué)成績,平均數(shù)為80分,標(biāo)準(zhǔn)差為8分;又測驗(yàn)了該班的語文成績,平均數(shù)為70分,標(biāo)準(zhǔn)差為5分。甲生在數(shù)學(xué)測驗(yàn)中得81分,在語文測驗(yàn)中得78分,問該生哪一學(xué)科的成績在班上比較優(yōu)?解:㈤標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用2.計(jì)算不同質(zhì)的觀測值的總和或平均值,以表示在團(tuán)體中的相對位置例16在招生考試時(shí),有甲、乙兩考生的各科成績?nèi)缦卤?-14,如果這兩個(gè)考生只錄取一個(gè),應(yīng)錄取哪位考生?表4-14標(biāo)準(zhǔn)分?jǐn)?shù)在計(jì)算總成績中的應(yīng)用考試科目個(gè)人分?jǐn)?shù)全體考生個(gè)人標(biāo)準(zhǔn)分甲乙平均分標(biāo)準(zhǔn)差甲乙語文數(shù)學(xué)外語政治歷史748732787089825060657080357568128111070.3330.875-0.2720.30.2851.580.251.36-1.50-0.42合計(jì)3413461.5211.27㈤標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用3.表示標(biāo)準(zhǔn)測驗(yàn)分?jǐn)?shù)㈤標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用4.異常值的取舍在一個(gè)正態(tài)分布中,平均數(shù)上下一定的標(biāo)準(zhǔn)差處,包含有確定百分?jǐn)?shù)的數(shù)據(jù)個(gè)數(shù)。根據(jù)這個(gè)原理,整理數(shù)據(jù)時(shí),常采用三個(gè)標(biāo)準(zhǔn)差法取舍數(shù)據(jù),即如果數(shù)據(jù)值落在平均數(shù)加減三個(gè)標(biāo)準(zhǔn)差之外,則在整理數(shù)據(jù)時(shí),可將此數(shù)據(jù)作為異常值舍棄。以上時(shí)指數(shù)據(jù)較多的情況。㈤標(biāo)準(zhǔn)分?jǐn)?shù)的應(yīng)用4.異常值的取舍如果數(shù)據(jù)個(gè)數(shù)較少,則可依據(jù)下表所列的標(biāo)準(zhǔn)差數(shù)的一半(全距與標(biāo)準(zhǔn)差比率一半)乘以標(biāo)準(zhǔn)差,然后再求與平均數(shù)的和、差,并以這兩個(gè)值為界取舍數(shù)據(jù)。表4-15全距與標(biāo)準(zhǔn)差的比率隨N變化表N5101520405010020040050070010002.33.13.53.74.34.55.05.55.96.16.36.5第三節(jié)相關(guān)與回歸一、相關(guān)相關(guān)(correlation)的概念兩個(gè)變量之間不精確、不穩(wěn)定的變化關(guān)系稱為相關(guān)關(guān)系。相關(guān)系數(shù)(correlationcoefficient)用來描述兩個(gè)變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。一般用r表示。正相關(guān)positivecorrelation負(fù)相關(guān)negativecorrelation零相關(guān)相關(guān)系數(shù)相關(guān)系數(shù)不等距,只能比較,不能直接作加、減、乘、除。相關(guān)不等于因果:相關(guān)系數(shù)只能描述兩個(gè)變量之間的變化方向及密切程度,并不能揭示二者之間的內(nèi)在本質(zhì)聯(lián)系。
積差相關(guān)積差相關(guān)(PearsonProductMomentCorrelationCoefficient,r)的概念當(dāng)兩個(gè)變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關(guān)系,表示這兩個(gè)變量之間的相關(guān)稱為積差相關(guān)。積差相關(guān)使用的條件兩個(gè)變量都是由測量獲得的連續(xù)性數(shù)據(jù);兩個(gè)變量的總體都是呈正態(tài)分布,或接近正態(tài)分布,至少是單峰對稱分布;必須是成對的數(shù)據(jù),而且每對數(shù)據(jù)之間是相互獨(dú)立的;兩個(gè)變量之間呈線性關(guān)系;排除共變因素的影響;大樣本。積差相關(guān)系數(shù)的定義和計(jì)算協(xié)方差(covariance)是積差相關(guān)系數(shù)的基礎(chǔ),它是兩個(gè)變量離差乘積之和除以n所得之商。其公式為:積差相關(guān)系數(shù)的定義和計(jì)算積差相關(guān)系數(shù)是協(xié)方差除以兩個(gè)變量的標(biāo)準(zhǔn)差。其公式為:用原始數(shù)據(jù)直接計(jì)算,則例題為研究某測驗(yàn)的預(yù)測效度,在被錄取的高考考生中隨機(jī)抽取10人,測得他們的能力測驗(yàn)得分(X),對他們進(jìn)行跟蹤研究,求得他們大學(xué)一、二年級有關(guān)科目平均分?jǐn)?shù)(Y),求該測驗(yàn)的效度。X74718085767777687474756Y82758189828988848087837相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的抽樣分布只有當(dāng)總體相關(guān)系數(shù)為0,或者相關(guān)系數(shù)接近于0且樣本容量相當(dāng)大(n>50或n>30)時(shí),r的抽樣分布才接近正態(tài)分布。相關(guān)系數(shù)顯著性檢驗(yàn)的步驟及方法(1)H0:ρ=0;(2)H0:ρ=ρ0;(3)H0:ρ1=ρ2
相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)顯著性檢驗(yàn)的步驟及方法(1)H0:ρ=0;(2)H0:ρ=ρ0;(3)H0:ρ1=ρ2
二、回歸將存在相關(guān)的兩個(gè)變量,一個(gè)作為自變量,另一個(gè)作為因變量,并把二者之間不十分準(zhǔn)確、穩(wěn)定的關(guān)系,用數(shù)學(xué)方程式來表達(dá),則可利用該方程由自變量的值來估計(jì)、預(yù)測因變量的估計(jì)值,這一過程稱為回歸分析
。
回歸表示一個(gè)變量隨另一個(gè)變量作不同程度變化的單向關(guān)系。
相關(guān)與回歸是從不同角度對變量間關(guān)系的分析:相關(guān)關(guān)系是兩個(gè)變量之間的雙向關(guān)系,沒有主從之分;而回歸關(guān)系是兩個(gè)變量之間的單向關(guān)系,是自變量對因變量的影響關(guān)系。相關(guān)關(guān)系用相關(guān)系數(shù)來表示,而回歸關(guān)系用數(shù)學(xué)模型來表示,這種數(shù)學(xué)模型稱為回歸方程(regressionequation)二.一元線性回歸方程的建立1.一元線性回歸概念
線性回歸(linearregression):自變量與因變量之間呈線性關(guān)系(linearrelationship)的回歸關(guān)系。一元線性回歸是指只有一個(gè)自變量的線性回歸。一元線性回歸又稱為簡單線性回歸(simplelinearregression)。2.一元線性回歸方程的通式式中:a為直線的截距;b為回歸系數(shù)(也是回歸直線的斜率)(20.1)
3.一元線性回歸方程的建立建立回歸方程的步驟一般包括:根據(jù)數(shù)據(jù)資料作散點(diǎn)圖,判斷直線關(guān)系;選定計(jì)算回歸系數(shù)的方法并計(jì)算回歸系數(shù)b和直線的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣東深圳北理莫斯科大學(xué)材料科學(xué)系微流控校企聯(lián)合實(shí)驗(yàn)室招聘考試重點(diǎn)試題及答案解析
- 開發(fā)廊合同范本
- 崗位保密協(xié)議書
- 委托征收協(xié)議書
- 意向團(tuán)購協(xié)議書
- 資金托底協(xié)議書
- 小學(xué)分手協(xié)議書
- 裝燈施工協(xié)議書
- 賬務(wù)平攤協(xié)議書
- 志愿星級協(xié)議書
- 【數(shù) 學(xué)】2025-2026學(xué)年北師大版數(shù)學(xué)七年級上冊期末練習(xí)(一)
- (一診)成都市2023級高三高中畢業(yè)班第一次診斷性檢測英語試卷(含官方答案)
- 2025山西大地環(huán)境投資控股有限公司社會招聘116人參考筆試題庫及答案解析
- 2026年哈爾濱鐵道職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫帶答案
- 珠海市紀(jì)委監(jiān)委公開招聘所屬事業(yè)單位工作人員12人考試題庫附答案
- 心肌炎與心包炎管理指南中心肌炎部分解讀2026
- 2025濟(jì)寧市檢察機(jī)關(guān)招聘聘用制書記員(31人)筆試考試參考試題及答案解析
- 廚師專業(yè)職業(yè)生涯規(guī)劃與管理
- 統(tǒng)編版高中政治必修二經(jīng)濟(jì)與社會 選擇題 專項(xiàng)練習(xí)題(含答案)
- 《恒X地產(chǎn)集團(tuán)地區(qū)公司管理辦法》(16年12月發(fā)文版)
- 智慧社區(qū)建設(shè)項(xiàng)目施工方案
評論
0/150
提交評論