心理測量學(xué)基礎(chǔ)知識_第1頁
心理測量學(xué)基礎(chǔ)知識_第2頁
心理測量學(xué)基礎(chǔ)知識_第3頁
心理測量學(xué)基礎(chǔ)知識_第4頁
心理測量學(xué)基礎(chǔ)知識_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

心理測量學(xué)基礎(chǔ)知識

中南大學(xué)湘雅二醫(yī)院醫(yī)學(xué)心理研究所蒲唯丹MD,PhDpulv1128@126.com

什么是心理測量?心理測驗(yàn)?

簡單地說,測量就是依據(jù)一定的法則用數(shù)字對食物加以確定的過程。是“動詞”。從字面上看,該定義包括三個主要的因素:

1、事物;

2、數(shù)字;

3、法則。心理測驗(yàn)是實(shí)現(xiàn)心理測量過程所用的工具。是“名詞”。

測量要素

任何測量都應(yīng)該具備這樣兩個要要素:即參點(diǎn)和單位。參照點(diǎn)參照點(diǎn)有兩種:一種是絕對零點(diǎn);另一種是人定的參照點(diǎn),即相對零點(diǎn)。單位好的單位必須具備兩個條件:一為有確定的意義;二為有相同的價值,即相鄰兩個單位點(diǎn)之間的差別總是相等的。

測量量表

由于制定量表的單位和參照點(diǎn)不同,量表的種類也不同。根據(jù)量表的精確程度,斯蒂文斯將測量從低級到高級分成四種水平,即命名量表、順序量表、等距量表和等比量表。命名量表代號—用數(shù)字來代表個別事物。類別——用數(shù)字來代表某一具有某種屬性的事物的全體。例如,組別、班別。順序量表

它比命名量表水平高,其中的數(shù)字不僅指明類別,同時指明類別的大小或含有某種屬性的程度。在順序量表中,既無相等單位,又無絕對零點(diǎn),數(shù)字僅表示等級,并不表示某種屬性的真正量或絕對值。例如,班級內(nèi)的考試成績。等距量表不但有大小關(guān)系,而且具有相等的單位,其數(shù)值可以相互做加、減運(yùn)算,但沒有絕對的零點(diǎn),因此不能做乘、除運(yùn)算。例如,溫度計,心理量表(通過非線性轉(zhuǎn)化為常態(tài)化標(biāo)準(zhǔn)分?jǐn)?shù))。等比量表是最高水平的量表,既有相等單位又有絕對零點(diǎn)。

心理測量的概念

心理測量就是根據(jù)心理學(xué)的理論,在一定的操作程序下,觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點(diǎn)做出推論和數(shù)量化分析的一種科學(xué)手段對象:人的行為,且是,通過行為來推論所要測量的這一類人的心理或者個性特征對所有人的測驗(yàn)的條件相同,施測程序標(biāo)準(zhǔn)化個人的原始分只有與他人或者“常?!保ù硇匀巳旱男袨椋┳霰容^才有意義

心理測驗(yàn)的性質(zhì)間接性相對性客觀性首先,測驗(yàn)用的項(xiàng)目或作業(yè)、施測說明、施測者的言語態(tài)度及施測時的物理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化。其次,評分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對反應(yīng)的量化是客觀的。最后,分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對結(jié)果的推論是客觀的

心理測驗(yàn)按測驗(yàn)的功能分類

智力測驗(yàn)這類測驗(yàn)的功能是測量人的一般智力水平。如Binet-Simon智力測驗(yàn)、Stanford-Binet智力量表、Wechsler兒童和成人智力量表等,都是現(xiàn)代常用的著名智力測量工具,用于評估人智力水平。特殊能力測驗(yàn)常用的如音樂、繪畫、機(jī)械技巧、文書才能測驗(yàn)。人格測驗(yàn)一般有兩類,一類是問卷法,一類是投射法。前者如MMPI、16PF、EPQ,后者如羅夏測驗(yàn)、主題統(tǒng)覺測驗(yàn)(TAT)

按測驗(yàn)材料的性質(zhì)分類文字測驗(yàn)

MMPI、EPQ、16PF及Wechsler兒童和成人智力量表中的言語量表部分均屬于文字測驗(yàn)。操作測驗(yàn)如羅夏測驗(yàn)、TAT、Raven測驗(yàn)及Wechsler兒童和成人智力量表中的操作量表部分均屬于非文字測驗(yàn)。按測驗(yàn)材料的嚴(yán)謹(jǐn)程度分類客觀測驗(yàn)投射測驗(yàn)

按測驗(yàn)的方式分類個別測驗(yàn)如Binet-Simon智力量表、Wechsler智力量表。團(tuán)體測驗(yàn)團(tuán)體測驗(yàn)材料,也可以個別方式實(shí)施,如MMPI、EPQ、16PF等。但個別測驗(yàn)材料不能以團(tuán)體方式進(jìn)行,除非將實(shí)施方法和材料加以改變,使之適合團(tuán)體測驗(yàn)。

錯誤的測驗(yàn)觀測驗(yàn)萬能論測驗(yàn)無用論心理測驗(yàn)即智力測驗(yàn)

正確的測驗(yàn)觀1、心理測驗(yàn)是重要的心理學(xué)研究方法之一,是決策的輔助工具。2、心理測驗(yàn)作為研究方法和測量工具尚不完善。

心理測驗(yàn)的目的測量心理健康:發(fā)現(xiàn)心理問題和心理疾病測量心理素質(zhì):個性、愛好、職業(yè)咨詢、婚姻、學(xué)業(yè)、犯罪鑒定等測量心理能力:智力、記憶力、反應(yīng)速度幫助被試了解自己的心理特點(diǎn)選擇職業(yè)、學(xué)業(yè),特殊人才選拔分析比較不同民族、文化或群體的心理特征

心理測驗(yàn)的臨床應(yīng)用智力落后兒童與行為兒童的鑒別。了解心理癥狀及嚴(yán)重程度。心理與行為正常變異還是病態(tài)的鑒別。器質(zhì)性精神病和功能性精神病的鑒別。腦器質(zhì)性病變的定位。觀察病情的程度、療效的比較、病情預(yù)后的評估。心理測驗(yàn)在心理咨詢中的應(yīng)用

智力測驗(yàn)?zāi)壳俺S昧勘碛校簠翘烀粜抻喌闹袊葍?nèi)量表,龔耀先等人修訂的韋氏成人智力量表(WAIS-RC)、韋氏兒童智力量表(C-WISC)和韋氏幼兒智力量表(C-WYCSI),林傳鼎等人修訂韋氏兒童智力量表(WISC-CR),以及張厚粲主持修訂的瑞文標(biāo)準(zhǔn)型測驗(yàn)(SPM)和李丹等修訂的聯(lián)合型瑞文測驗(yàn)(CRT)等。心理測驗(yàn)在心理咨詢中的應(yīng)用人格測驗(yàn)?zāi)壳皯?yīng)用較多的有:艾林確立人格問卷(EPQ),卡特爾16人格因素問卷(16PF),以及明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)等。人格測驗(yàn)有助于治療者對求助者人格特征的了解,以便于對其問題有更深入的理解,并可針對性地開展咨詢與心理治療工作。其中,MMPI還有助于治療者了解對方是否屬于精神異常范圍。

心理測驗(yàn)在心理咨詢中的應(yīng)用心理評定量表多用于檢查對方某方面心理障礙的存在與否或其程度如何,并可反映病情的演變。但作為咨詢者,有一點(diǎn)必須明確,那就是心理測驗(yàn)在咨詢和心理治療過程中并不是必不可少的一個環(huán)節(jié)。一般來講,心理測驗(yàn)應(yīng)在咨詢關(guān)系尚未建立之間實(shí)施,進(jìn)入正式的心理咨詢程序之后,要避免再進(jìn)行心理測驗(yàn)。

心理測驗(yàn)的發(fā)展史首先倡導(dǎo)科學(xué)心理測驗(yàn)的學(xué)者是英國生物學(xué)家和心理學(xué)家高爾頓。研究差異的遺傳性,便設(shè)計了測量差異的方法。這雖然不是正式的心理測驗(yàn)但可視為心理測驗(yàn)的開端。高爾頓也為心理測驗(yàn)奠定了統(tǒng)計學(xué)基礎(chǔ)。1890年,卡特爾在《心理》雜志上發(fā)表《心理測驗(yàn)與測量》一文,這是心理測驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)中。比內(nèi)(A.Binet)與助手西蒙(T.Sinmon)的精心研究,次年在《心理學(xué)年報》上發(fā)表了一篇文章,題為《診斷異常獐智力的新方法》,一個包括30個項(xiàng)目的量表,但它在心理測驗(yàn)史上極其重要,是世界是第一個正式的心理測驗(yàn)。常模團(tuán)體的性質(zhì)

常模的選擇主要是基于對測驗(yàn)將要施測的總體的認(rèn)識,常模團(tuán)體必須能夠代表該總體。常模團(tuán)體的條件

1、群體的構(gòu)成必須明確界定。

2、常模團(tuán)體必須是所測群體的代表性樣本。

3、樣本的大小要適當(dāng)。

4、標(biāo)準(zhǔn)化樣組是一定時空的產(chǎn)物。

取樣的方法簡單隨機(jī)抽樣按隨機(jī)表順序選擇系統(tǒng)抽樣總體為N,要選擇K分之一的被試作為樣本,則在取樣范圍內(nèi)選擇每個第K個人來構(gòu)成樣本。分組抽樣先將群體分組,再在組內(nèi)進(jìn)行隨機(jī)取樣。例如,在全國取樣,可以先按行政區(qū)域劃分組,再在組內(nèi)依照一定的性質(zhì)進(jìn)行歸類,然后從各類中按隨機(jī)抽樣樣本。分層抽樣這是在確定常模時,最常用的方法,先將目標(biāo)總體按某種變量(如年齡、文化程度)分成若干層次,在各層次內(nèi)隨機(jī)抽取若干被試,最后把各層的被試組合成常模樣本。常模分?jǐn)?shù)與常模常模分?jǐn)?shù)就是施測常模樣本被試后,將被試者的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。常模常模分?jǐn)?shù)構(gòu)成的分布,就是通常所說的常模,它是解釋心理測驗(yàn)分?jǐn)?shù)的基礎(chǔ)。

常模的類型發(fā)展常模發(fā)展順序量表:最直觀的發(fā)展常模。智力年齡:比內(nèi)-西蒙量表年級當(dāng)量:教育成就測驗(yàn)常模的類型百分位常模百分等級:指常模中低于這個分?jǐn)?shù)的人數(shù)百分比。85的百分等級表示在常模樣本中有85%的人比這個分?jǐn)?shù)要低。百分等級指個體在常模團(tuán)體中所處的位置,百分等級越低,個體所處的位置就越低。百分點(diǎn):指計算出某一百分位點(diǎn)對應(yīng)的測驗(yàn)分?jǐn)?shù)是多少。四分位數(shù)和十分位數(shù):四分位數(shù)是將量表分成四等份,相當(dāng)于百分位等級的25%、50%、75%對應(yīng)的三個百分分成的四段。十分位數(shù)依次類推。百分等級及百分位數(shù)的優(yōu)缺點(diǎn)主要優(yōu)點(diǎn):①易于對沒有多少統(tǒng)計知識的人進(jìn)行解釋②計算簡便③即使分?jǐn)?shù)不是常態(tài)分布,也可能進(jìn)行準(zhǔn)確的解釋。主要缺點(diǎn):①不容易用于進(jìn)行統(tǒng)計分析②沒有給出關(guān)于分?jǐn)?shù)實(shí)際差異的信息。

正態(tài)分布標(biāo)準(zhǔn)分系統(tǒng)

標(biāo)準(zhǔn)分常模標(biāo)準(zhǔn)分常模是將原始分?jǐn)?shù)與平均分?jǐn)?shù)的距離以標(biāo)準(zhǔn)差為單位表示出來的量表,因?yàn)樗幕締挝皇菢?biāo)準(zhǔn)差,所以叫標(biāo)準(zhǔn)分。標(biāo)準(zhǔn)分能說明被試的得分在標(biāo)準(zhǔn)化樣本的成績分布圖上居何位置。這樣不僅說明被試成績與樣本比較在其上或在其下,而且還能說明相差幾個標(biāo)準(zhǔn)差。均數(shù)():反映樣本集中的趨勢,是常模的普通形式,一般臨床量表常采用。標(biāo)準(zhǔn)差(SD):反映樣本分散的趨勢,是個人分?jǐn)?shù)與整體的平均分比較而得到的分?jǐn)?shù)差,可以更清楚地提供樣本更多的信息。

標(biāo)準(zhǔn)分常模

線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)

z分?jǐn)?shù)為最典型的線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)。

公式5-2非線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)當(dāng)原始分?jǐn)?shù)不是常態(tài)分布時,也可以使之常態(tài)化,這一轉(zhuǎn)換過程就是非線性的。常態(tài)化過程主要是將原始分?jǐn)?shù)轉(zhuǎn)化為百分等級,再將百分等級轉(zhuǎn)化為常態(tài)分布上相應(yīng)的均值,并可以表示為任何平均數(shù)和標(biāo)準(zhǔn)差。

T=50+10zˊ

T分?jǐn)?shù)是當(dāng)以50為平均數(shù)(即加上一個常數(shù)50),以10為標(biāo)準(zhǔn)差(乘以一個常數(shù)10)來表示。標(biāo)準(zhǔn)九分(5為平均數(shù),2為標(biāo)準(zhǔn)差),標(biāo)準(zhǔn)九分(5為平均數(shù),1.5為標(biāo)準(zhǔn)差),標(biāo)準(zhǔn)十分(10為平均數(shù),3為標(biāo)準(zhǔn)差),離差智商使用最廣、影響最大。心理測量的記分方法能力測量:智力量表使用標(biāo)準(zhǔn)百分制記分,均值100,標(biāo)準(zhǔn)差15,(兩個例外:瑞文推理測驗(yàn)先轉(zhuǎn)化為百分位等級再轉(zhuǎn)化為IQ,比奈量表先使用比率智商,以后改為均值100,標(biāo)準(zhǔn)差16的離差智商)個性測量:EPQ、MMPI使用標(biāo)準(zhǔn)T分記分,均值50,標(biāo)準(zhǔn)差10(16PF使用標(biāo)準(zhǔn)十分)臨床量表:SCL90、SAS、SDS等使用原始劃界分記分(因其樣本常常不是正態(tài)分布)

智商的概念及計算方法心理年齡(或智力年齡):1908年比奈和西蒙首先采用了心理年齡的概念。比率智商:德國心理學(xué)家施太倫提出心理年齡除以實(shí)足年齡所得商數(shù)即為智力商數(shù)或比率智商。美國心理學(xué)家推孟在編制的“斯比量表”中正式引用。其公式為:IQ=MA(心理年齡)/CA(實(shí)足年齡)×100

其不足為不適用于20歲以上的成年人。智商的概念及計算方法離差智商:韋克斯勒在編制WAIS時提出了智商的另一種計算方法。它是采用統(tǒng)計學(xué)中的均數(shù)和標(biāo)準(zhǔn)差計算出來的。其公式為:

15×(X-)IQ=100+-------

SD

1960年推孟在修訂斯比量表時也使用了離差智商

測驗(yàn)的信度與效度信度-Reliability:工具的穩(wěn)定性和可重復(fù)性,分為重測信度、評定者間信度、同質(zhì)性信度-測驗(yàn)質(zhì)量的必要不充分條件。效度-Validity:工具的準(zhǔn)確性,分為內(nèi)容效度、結(jié)構(gòu)效度和診斷(效標(biāo))效度-測驗(yàn)質(zhì)量的必要充分條件。一個測驗(yàn)的效度不會超過它的信度的平方根(P358頁公式)這說明效度總受到它的信度所制約。信度和效度都比較差效度與信度的關(guān)系圖示信度好,效度差信度效度都好

測驗(yàn)的信度

信度的定義信度是指同一被試在不同時間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)果的一致程度。信度只受隨機(jī)誤差的影響。隨機(jī)誤差越大,信度越低。

信度的指標(biāo)(一)信度系數(shù)與信度指數(shù).信度是以信度系數(shù)為指標(biāo),它是一種相關(guān)系數(shù)。信度指數(shù)是真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差之比值(理論上)。(二)測量標(biāo)準(zhǔn)誤:用一組被試兩次測量結(jié)果來代替對同一個人的反復(fù)施測時有此指標(biāo)。公式中SE為測量的標(biāo)準(zhǔn)誤,Sx是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx為測驗(yàn)的信度系數(shù)。從公式中可以看出,測量的標(biāo)準(zhǔn)誤與信度之間有互為消長的關(guān)系:信度越高,標(biāo)準(zhǔn)誤越??;信度越低,標(biāo)準(zhǔn)越大。

信度評估的方法

重測信度又稱穩(wěn)定性系數(shù),它的計算方法是采用重測法,即使用同一測驗(yàn),在同等條件下對同一組被試者前后施測兩次測驗(yàn),求兩次得分間的相關(guān)系數(shù)。最適宜的時距隨測驗(yàn)的目的、性質(zhì)和被試特點(diǎn)而異,一般是兩周到四周較宜,間隔時間最好不超過六個月。復(fù)本信度又稱等值性系數(shù)。它是以兩個等值但題目不同的測驗(yàn)(復(fù)本)來測量同一群體,然后求得被試者在兩個測驗(yàn)上得分的相關(guān)系數(shù),這個相關(guān)系數(shù)就代表了復(fù)本信度的高低.復(fù)本信度反映的是測驗(yàn)在內(nèi)容上的等值性,故又稱等值性系數(shù)。

信度評估的方法內(nèi)部一致性信度內(nèi)部一致性信度系數(shù)主要反映的是題目之間的關(guān)系,表示測驗(yàn)?zāi)軌驕y量相同內(nèi)容或物質(zhì)的程度。1.分半信度這種方法估計信度系數(shù)只需一種測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分為等值的兩半,并分別計算每位被試在兩半測驗(yàn)上的得分,求出這兩半分?jǐn)?shù)的相關(guān)系數(shù)。在其他條件相同的情況下,測驗(yàn)越長,信度越高。因而分半法經(jīng)常會低估信度,必須修正。其中常用的修正公式是斯皮爾曼—布朗公式:

(公式5-14)上述公式的假設(shè)條件是兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相同,當(dāng)假設(shè)不成立時可采用佛朗那根公式或盧倫公式。

信度評估的方法2.同質(zhì)性信度同質(zhì)性主要代表測驗(yàn)內(nèi)部所有題目間的一致性。當(dāng)各個測題的得分有較高的正相關(guān)時則測驗(yàn)為同質(zhì)的。幾個計算同質(zhì)性信度的公式如下:

1.庫德—理查遜公式;

2.克倫馬赫α系數(shù)。評分者信度信度與測驗(yàn)分?jǐn)?shù)的解釋

一、解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)信度系數(shù)的分布是從0.00到1.00的正數(shù)范圍,代表了從缺乏信度到完全可信的所有狀態(tài).二、確定信度可以接受的水平一般的能力測驗(yàn)、成就測驗(yàn)的信度系數(shù)在0.90以上,人格測驗(yàn)、興趣、態(tài)度測驗(yàn)的信度一般在0.80-0.85;一般原則是:當(dāng)rxx<0.7時,測驗(yàn)不能用于對個人做出評價或預(yù)測,而且不能作團(tuán)體比較。當(dāng)0.7≤rxx<0.85可用于團(tuán)體比較;當(dāng)rxx≥0.85時,才能用來鑒別或預(yù)測個人成績或作為。

信度與測驗(yàn)分?jǐn)?shù)的解釋三、解釋個人分?jǐn)?shù)的意義:它有兩個作用:其一是估計真實(shí)分?jǐn)?shù)的范圍;其二是了解實(shí)得分?jǐn)?shù)再測時可能的變化情形。(公式5-15)

SE為測量標(biāo)準(zhǔn)誤,Sx是所得分?jǐn)?shù)的標(biāo)準(zhǔn)差,rxx為測驗(yàn)的信度。

X-1.96SE<XT≤X+1.96SE(公式5-16)假設(shè)在一個智力測驗(yàn)中,某個被試的IQ為100,這是否反映了他的真實(shí)水平?如果再測一次他的分?jǐn)?shù)將改變多少?已知該智力測驗(yàn)的標(biāo)準(zhǔn)差為15,信度系數(shù)為0.84,則其IQ的測量標(biāo)準(zhǔn)誤和可能范圍分別為:

SE=15=6.0IQ=100±1.96×6=100±11.76≈88~112我們可以說這個被試的真實(shí)EQ有95%的可能性落在88至于112之間。即若再測一次,他的智商低于88、高于112的可能性不超過5%。信度與測驗(yàn)分?jǐn)?shù)的解釋四、比較不同測驗(yàn)分?jǐn)?shù)的差異(公式5-17)例:某被試在韋氏成人智力測驗(yàn)中言語智商為102,操作智商為110。已知兩個分?jǐn)?shù)都是以100為平均數(shù),15為標(biāo)準(zhǔn)差的標(biāo)準(zhǔn)分?jǐn)?shù)。假設(shè)言語測驗(yàn)和操作測驗(yàn)的分半信度分別為0.87和0.88。問其操作智商是否顯著高于言語智商呢?首先計算出差異分?jǐn)?shù)的標(biāo)準(zhǔn)誤,然后將差異標(biāo)準(zhǔn)誤乘以1.96。

影響信度的因素

樣本特征

1.樣本團(tuán)體異質(zhì)性的影響:可能會高估測驗(yàn)的信度,相反會低估測驗(yàn)的信度。

2.樣本團(tuán)體平均能力水平的影響:對年幼和能力水平較低者,其信度值相對低.測驗(yàn)長度P353頁計算題

1.測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣就越有代表性。結(jié)果較為可靠

2.測驗(yàn)越長,被試的猜測因素影響就越小。結(jié)果較為可靠

K=(公式5-18)影響信度的因素測驗(yàn)難度就難度與信度間的關(guān)系而言,并沒有簡單的對應(yīng)關(guān)系。然而,若測驗(yàn)對某團(tuán)體太難或太易,分?jǐn)?shù)范圍將縮小,從而使信度降低。時間間隔兩次測驗(yàn)相間隔的時間越短,其信度系數(shù)越大,間隔的時間越長,信度系數(shù)會降低.

測驗(yàn)的效度

效度的定義:在心理測驗(yàn)中,效度是指測量的與所要測量的心理特點(diǎn)之間符合的程度,或者簡單地說是指一個心理測驗(yàn)的準(zhǔn)確性.在測驗(yàn)理論中,效度被定義為在一組測量中,與測量目標(biāo)有關(guān)的真實(shí)方差與總方差的比率。

(公式5-21)

效度的性質(zhì)

1.效度具有相對性:測驗(yàn)只有用于與測驗(yàn)?zāi)繕?biāo)一致的目的和場合才會有效。不能籠統(tǒng)地說測驗(yàn)有沒有效,而應(yīng)該說它測量什么有沒有效.2.效度具有連續(xù)性:測驗(yàn)效度只有程度上的不同,而沒有“全有”或“全無”的區(qū)別。應(yīng)該用效度較高或較低來表示.

內(nèi)容效度什么是內(nèi)容效度:

內(nèi)容效度指的是測驗(yàn)題目對有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗(yàn)是否是所欲測量的行為領(lǐng)域的代表性取樣。首先要對所測量的心理特征有個明確的界定;其次,測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。內(nèi)容效度的特性:內(nèi)容效度不是普遍適用的,而是根據(jù)具體情況分析得來。此外,內(nèi)容效度也有時間上的特定性。

內(nèi)容效度的評估方法1.專家判斷法最常用的方法是請有關(guān)專家對測驗(yàn)題目與原定內(nèi)容的符合性做出判斷,看測驗(yàn)的題目是否代表規(guī)定的內(nèi)容。如果專家認(rèn)為測驗(yàn)題目恰當(dāng)?shù)卮砹怂鶞y內(nèi)容,測測驗(yàn)具有內(nèi)容效度。由于這種估計效度的方法,是一個邏輯分析的過程,所以內(nèi)容效度有時又稱“邏輯效度”

2.統(tǒng)計分析法內(nèi)容效度的確定也可采用一些統(tǒng)計分析方法,例如計算兩個評分者之間評定的一致性;內(nèi)容效度可由一組被試在獨(dú)立取自同樣內(nèi)容范圍的兩個測驗(yàn)復(fù)本上得分之相關(guān)來作估計;另外,再測法也可用于內(nèi)容效度的評估。

3.經(jīng)驗(yàn)推測法通過實(shí)踐來檢驗(yàn)效度。構(gòu)想效度什么是構(gòu)想效度是指測驗(yàn)?zāi)軌驕y量到理論上的構(gòu)想或特質(zhì)的程度,即測驗(yàn)的結(jié)果是否能證實(shí)或解釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。構(gòu)想效度的估計方法

1.對測驗(yàn)本身的分析:這類方法是通過研究測驗(yàn)內(nèi)部結(jié)構(gòu)來界定理論構(gòu)想,從而為構(gòu)思效度提供證據(jù)。測驗(yàn)的內(nèi)容效度可以作為構(gòu)思效度的證據(jù);測驗(yàn)的內(nèi)部一致性指標(biāo)可以推斷測驗(yàn)是測量單一特質(zhì)還是測量多種特質(zhì),從而為評估測驗(yàn)的構(gòu)想效度提供證據(jù);有時分析被試者對題目的反應(yīng)特點(diǎn)也可以作為構(gòu)思效度的證據(jù)。2.測驗(yàn)間的相互比較:通過分析幾個測驗(yàn)間的相互關(guān)系,找出其共同之處,進(jìn)而推斷這些測驗(yàn)測量的特質(zhì)是什么,也可以確定這些測驗(yàn)構(gòu)思效度如何。最簡單的是計算兩種測驗(yàn)之間得分的相關(guān);區(qū)分效度是構(gòu)思效度的又一個證據(jù)。測驗(yàn)要有效必須測量與其他變量無關(guān)的獨(dú)立的構(gòu)思。相關(guān)越低,區(qū)分度越大;因素分析法也是建立構(gòu)思效度的常用方法。3.效標(biāo)效度的研究證明一個測驗(yàn)的效標(biāo)效度理想,那么該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗(yàn)構(gòu)思效度的指標(biāo)。

效標(biāo)效度什么是效標(biāo)效度反映的是測驗(yàn)預(yù)測個體在某種情境下行為表現(xiàn)的有效性程度。被預(yù)測的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。由于這種效度是看看對效標(biāo)預(yù)測得如何,所以叫效標(biāo)效度。這種效度需在實(shí)踐中檢驗(yàn),所以又稱實(shí)證效度。效標(biāo)效度的評估方法

1.相關(guān)法:相關(guān)法是評估效標(biāo)效度最常用的方法,它是求測驗(yàn)分?jǐn)?shù)與效標(biāo)資料間的相關(guān),這一相關(guān)系數(shù)稱為效度系數(shù)。計算效度系數(shù)最常用的是積差相關(guān)法。

效標(biāo)效度2.區(qū)分法:區(qū)分法是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的一種方法。計算公式如下:(公式5-22)3.命中率法。用正確的比例作為效度指標(biāo)。

考查一個智力測驗(yàn)效度常用的方法求測驗(yàn)的結(jié)果與另一種已經(jīng)標(biāo)準(zhǔn)化的測驗(yàn)結(jié)果的相關(guān)。求測驗(yàn)結(jié)果與學(xué)生學(xué)業(yè)成績、教師評定之間的相關(guān)。觀察每項(xiàng)測題通過人數(shù)的百分比,是否隨年齡或年級而增加。觀察每項(xiàng)測題與全量表是否有連貫性。

效度的功能

一、預(yù)測誤差:測驗(yàn)分?jǐn)?shù)預(yù)測的準(zhǔn)確性(公式5-25)真正效標(biāo)分?jǐn)?shù)落在預(yù)測效標(biāo)分?jǐn)?shù)±1Sest的范圍內(nèi),有68%的可能性;落在預(yù)測效標(biāo)分?jǐn)?shù)±2.58Sest的范圍內(nèi),有99%的可能性。二、預(yù)測效標(biāo)分?jǐn)?shù)(公式5-26)(公式5-27)(公式5-28)

效度的功能

三、預(yù)測效率指數(shù):

E=100(1-K)

E值大小表明使用測驗(yàn)比盲目猜疑能減少多少差異。P366頁計算題。

影響效度的因素

測驗(yàn)本身的因素測驗(yàn)實(shí)施中的干擾因素

1.主試的影響因素

2.被試的影響因素樣本團(tuán)體的性質(zhì)

1.樣本團(tuán)體的異質(zhì)性樣本團(tuán)體越異質(zhì),分?jǐn)?shù)分布,范圍越大測驗(yàn)效度就越高。

2.干涉變量:不同性質(zhì)的團(tuán)體,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論