心理測量學(xué)教案全

上傳人：文*** IP屬地：河北上傳時(shí)間：2025-02-27 格式：PDF 頁數(shù)：134 大?。?0.39MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩129頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章心理測驗(yàn)總論

［教學(xué)目的與要求］

(1)識(shí)記并了解心理測驗(yàn)的發(fā)展歷史

(2)掌握心理測驗(yàn)的性質(zhì)

(3)了解心理測驗(yàn)的種類

［教學(xué)重點(diǎn)與難點(diǎn)］心理測驗(yàn)的性質(zhì)

第一節(jié)心理測驗(yàn)的歷史

一、中國古代的心理測驗(yàn)思想

1、孔子：把人分為中人、中人以上、中人以下三個(gè)類別，“中人以上,

可以語上也；中人以下，不可以語上也”。(相當(dāng)于現(xiàn)代測量學(xué)中的命

名量表和次序量表)

2、孟子：“權(quán)，然后知輕重；度，然后知長短。物皆然，心為甚?！泵?/p>

確指出了心理能力和心理特征與物理現(xiàn)象一樣，具有可測量的特性。

3、(南朝)劉勰：世界上最早的“分心測驗(yàn)”，認(rèn)為一心不能二用。

4、(南北朝)顏之推：周歲試兒，其是1925年格塞爾嬰兒發(fā)展量表的

前導(dǎo)。

5、“七巧板”又稱益智圖、唐圖(Tangram),為當(dāng)代多數(shù)智力測驗(yàn)和

創(chuàng)造力測驗(yàn)所使用。

6、隋煬帝科舉制度的開端，被認(rèn)為是世界上最早的心理測驗(yàn)的實(shí)踐。

當(dāng)時(shí)的考試方法：貼經(jīng)和對(duì)偶，類似于現(xiàn)代西方言語測驗(yàn)中常見的填

字和類比。

7、、中國古代心理測驗(yàn)的思想，包含著典型的東方文化特點(diǎn)：

A、他們都是描述性的，沒有定量的標(biāo)準(zhǔn)；

B、往往將心理特點(diǎn)與道德觀念聯(lián)系起來（局限性）

二、科學(xué)心理測驗(yàn)產(chǎn)生的原因

（-）對(duì)智力落后著分類和訓(xùn)練的早期關(guān)注

1、心理測驗(yàn)產(chǎn)生的最初原因：對(duì)智力落后和精神病人治療的需要。

2、法國醫(yī)生埃斯克羅：1838年出版了兩卷本著作，第一次明確地對(duì)智

力落后與精神病人作出了區(qū)分,他認(rèn)為精神病是以情緒障礙為標(biāo)志。（發(fā)

現(xiàn)一個(gè)人的語言能力是他智力水平的最可靠的指標(biāo)）

3、法國醫(yī)生塞國恩（E.Sequin）：訓(xùn)練智力落后者的先驅(qū)。1837年，

他創(chuàng)建了第一座教育智力落后兒童的學(xué)校，1846年出版了《白癡：用

生理方法進(jìn)行診斷和治療》。其首創(chuàng)方法感官訓(xùn)練（sense-training）、肌

肉訓(xùn)練（muscle-training）至今仍在全世界范圍內(nèi)的智力落后兒童教育機(jī)

構(gòu)。其SequinFormBoard拼圖板被心理測驗(yàn)的非語言測驗(yàn)所采用,其

操作方法是要求受測者盡快地將不同形狀的圖片嵌入適當(dāng)?shù)陌疾蹆?nèi)。

4、法國心理學(xué)家比奈開始致力于推動(dòng)建立鑒別不能適應(yīng)正常學(xué)校學(xué)習(xí)

但是可教育兒童的方法，鑒別出后安排接受一系列特殊教育課程。比

奈與“兒童心理學(xué)研究會(huì)”的同事們努力推動(dòng)法國公共教育部開展一

項(xiàng)促進(jìn)智能不足兒童學(xué)習(xí)能力計(jì)劃，并成立了專門的研究小組，這個(gè)

小組的成立是心理測驗(yàn)發(fā)展史上一個(gè)極為重大的歷史事件。

（-）實(shí)驗(yàn)心理學(xué)的發(fā)展

1、馮特：1879年他在德國萊比錫大學(xué)建立了心理學(xué)史上第一個(gè)實(shí)驗(yàn)室,

引發(fā)了個(gè)別差異的研究。

2、實(shí)驗(yàn)心理學(xué)的誕生和發(fā)展，給心理測驗(yàn)帶來了另一個(gè)副產(chǎn)品：嚴(yán)格

的標(biāo)準(zhǔn)化程序。

三、心理測驗(yàn)的發(fā)展(金瑜P7-9)

1、高爾頓：英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測驗(yàn)運(yùn)動(dòng)的主要人

物。他設(shè)計(jì)了測量差異的方法，1884年，他在倫敦國際博覽會(huì)中專門

設(shè)立了個(gè)“人體測量學(xué)實(shí)驗(yàn)室”六年中積累了9337人的資料，雖不是

正式的心理測驗(yàn)，但可視為心理測驗(yàn)的開端。他還是評(píng)定量表和問卷

法應(yīng)用的先驅(qū)，他的另一個(gè)重要貢獻(xiàn)是為心理測驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ),

并第一個(gè)提出了相關(guān)的概念。(皮爾遜相關(guān))

2、卡特爾：美國心理學(xué)家，從師馮特。1890年，卡特爾在《心理》雜

志上發(fā)表“心理測驗(yàn)與測量”，這是心理測驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)

中。

3、世界上第一個(gè)智力測驗(yàn)：比內(nèi)與助手西蒙在《心理學(xué)年報(bào)》上發(fā)表

了一篇文章，題為：“診斷異常兒童智力的新方法”，是世界上第一個(gè)

正式的心理測驗(yàn)。比內(nèi)一西蒙量表自1905年發(fā)表后，在1908年修訂,

1908年量表題目總數(shù)達(dá)到了59個(gè)，所有測題按年齡分組，組別從3-13

歲，測驗(yàn)的結(jié)果用“智力水平”表示，但其通常翻譯和提法為“智力

年齡”。后又經(jīng)1911年修訂一次。

4、心理測驗(yàn)的蓬勃發(fā)展：

(1)操作測驗(yàn)的發(fā)展：理論上的缺陷和實(shí)際上的需要，所以就有操作

測驗(yàn)的問世和發(fā)展。

(2)團(tuán)體智力測驗(yàn)的發(fā)展：這是心理測驗(yàn)方式的極大進(jìn)步，也擴(kuò)大了

測驗(yàn)的應(yīng)用范圍。

(3)能力傾向測驗(yàn)的發(fā)展：韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成

人智力量表。

(4)人格測驗(yàn)的發(fā)展：心理測驗(yàn)的另一領(lǐng)域是涉及情感或行為等非智

力方面的人格評(píng)估，通常包括對(duì)性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、

動(dòng)機(jī)、興趣和態(tài)度的測量。

(5)現(xiàn)代西方心理測驗(yàn)的發(fā)展，受到計(jì)算機(jī)的產(chǎn)生和發(fā)展，以及統(tǒng)計(jì)

方法的改進(jìn)的極大影響。

四、現(xiàn)代心理測驗(yàn)在中國的發(fā)展：以1949年中華人民共和國成立為分

期

(-)中華人民共和國成立前心理測驗(yàn)的發(fā)展

1、1916年，樊炳清先生首先介紹了比內(nèi)一西蒙智力量表；

2、1920年，廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測驗(yàn)課，

并用心理測驗(yàn)試測投考該校的學(xué)生，這便是中國正式開始的科學(xué)心理

測驗(yàn)；

3、1921年，他倆正式出版《心理測驗(yàn)法》一書，成為中國最早的心理

測驗(yàn)專著；

4、1922年，中華教育改進(jìn)社聘請(qǐng)美國教育心理測驗(yàn)專家麥考爾來華講

學(xué)，并主持編制心理測驗(yàn)事宜；

5、1924年，陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測驗(yàn)說明書》，30年

代又與吳天敏再次做了修訂；

6、1931年，由艾偉、陸志韋、陳鶴琴、蕭孝嵯等倡議，組織并成立

了中國測驗(yàn)學(xué)會(huì)；

7、1932年，《測驗(yàn)》雜志創(chuàng)刊。

(-)中華人民共和國成立后心理測驗(yàn)的發(fā)展

1、1979年，林傳鼎、張厚粲等以國外資料為參考，編制了少年兒童

學(xué)習(xí)能力測驗(yàn)；

2、1989年，成立中國心理學(xué)會(huì)心理測驗(yàn)專業(yè)委員會(huì)，標(biāo)志著中國心

理測驗(yàn)已進(jìn)入了一個(gè)新的高速發(fā)展時(shí)期。

第二節(jié)心理測驗(yàn)的性質(zhì)

一、測量的基本問題

(-)測量的定義

1、定義：測量就是根據(jù)一定的法則，用數(shù)字對(duì)事物加以確定。

a一定的法則：是指測量行為發(fā)生時(shí)采用的規(guī)則或方法。

b事物：是指我們要測量的感興趣的事物的屬性或特征。

c數(shù)字：可以表示數(shù)量，也可以不表示數(shù)量。

d通常人們所說的測量，指的是給事物確定出一種數(shù)量化的價(jià)值。

2、測量的要素：一是參照點(diǎn)，二是單位

a參照點(diǎn)：一種是絕對(duì)的零點(diǎn)；一種是相對(duì)參照點(diǎn)，是認(rèn)為確定的。最

理想的參照點(diǎn)是絕對(duì)零點(diǎn)，心理測驗(yàn)中所用的參照點(diǎn)都是相對(duì)的，因

而測量的結(jié)果常常不能以“倍數(shù)”的方式解釋。

b理想的單位的條件：有明確的意義和有相等的價(jià)值。

3、測量的量表：量表就是有參照點(diǎn)和單位的連續(xù)體。斯蒂文斯將量表

由低到高依次為：

a命名量表：是水平最低的一種測量量表，用數(shù)字來代替事物或?qū)κ?/p>

物進(jìn)行分類；

b順序量表：不僅表明類別，還能表明不通類別的大小等級(jí)，或具有某

種屬性的程度；

c等距量表：不僅有大小關(guān)系，而且又有相等的單位，因此可以加減運(yùn)

算，但沒有絕對(duì)零點(diǎn)，所以不能做乘除運(yùn)算；

d比例量表：是最精確的測量，既有相等的單位，又有絕對(duì)零點(diǎn)。

二、心理測量的基本概念

1、定義：是根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定，即依據(jù)一定

的心理學(xué)理論，使用一定的操作程序，給人的行為和心理屬性確定出

一種數(shù)量化的價(jià)值。

2、特點(diǎn)：

(1)心理測量的間接性

(2)心理測量的相對(duì)性

3、心理測量的水平

心理測量，不論是對(duì)智力，還是對(duì)能力傾向或人格的測量，都只具有

等級(jí)量表的特征。測驗(yàn)分?jǐn)?shù)一般只能顯示個(gè)體智力、能力、人格上的

等級(jí)位次，而沒有一個(gè)相等的單位，故它不是一個(gè)等距量表。但由于

多數(shù)心理特征具有常態(tài)分布的特征，且沒有絕對(duì)零點(diǎn)，所以我們也可

以把測量后直接得到的原始分?jǐn)?shù)轉(zhuǎn)化為常態(tài)分布下的標(biāo)準(zhǔn)分?jǐn)?shù)，把這

些量表當(dāng)作等距量表來處理。

三、心理測驗(yàn)的基本問題

（-）心理測驗(yàn)和心理測量的的聯(lián)系和區(qū)別

心理測驗(yàn)是了解人心理的工具，主要在名詞上使用。而心理測量則是

運(yùn)用測驗(yàn)為工具，達(dá)到了解人類心理的實(shí)踐活動(dòng)，它主要是在“動(dòng)詞”

意義上使用。因此，相對(duì)而言，心理測量的意義范圍更廣一些。能被

應(yīng)用于實(shí)際心理測量的心理測驗(yàn)才是真正有效的測驗(yàn)工具才是真正有

效的測驗(yàn)工具。

（二）心理測驗(yàn)的定義

心理測驗(yàn)就是通過觀察人的少數(shù)有代表性行為，對(duì)于貫穿在人的全部

行為活動(dòng)中心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。

心理測驗(yàn)即是依據(jù)一定的心理學(xué)理論，使用一定的操作程序，給人的

行為確定出一種數(shù)量化的價(jià)值。

（三）心理測驗(yàn)的要素

1、行為樣本：對(duì)少數(shù)經(jīng)過慎重選擇的樣本進(jìn)行觀察，來間接推知被試

的心理特征。

2、標(biāo)準(zhǔn)化：是指測驗(yàn)編制、實(shí)施、記分以及測驗(yàn)分?jǐn)?shù)解釋程序的一致

性，標(biāo)準(zhǔn)化的量一個(gè)重要步驟是建立有代表性的常模。

3、客觀性：在不受被試主觀判斷支配的范圍內(nèi)，測驗(yàn)的實(shí)施、評(píng)分、

解釋應(yīng)是客觀的，要盡量減少主試和被試的隨意程度。客觀性另一個(gè)

主要方面是測題或整個(gè)測驗(yàn)的難度水平的確定必須客觀。神經(jīng)心理測

驗(yàn)客觀性最高，智力測驗(yàn)較高，人格問卷次之，投射測驗(yàn)的客觀性較

低。

（四）心理測驗(yàn)的性質(zhì)

1、心理測驗(yàn)的間接性；

2、心理測驗(yàn)的相對(duì)性；

3、心理測驗(yàn)的客觀性：心理測驗(yàn)標(biāo)準(zhǔn)化包括：

①測驗(yàn)用的項(xiàng)目或作業(yè)、實(shí)測說明、實(shí)測者的言語態(tài)度及實(shí)測時(shí)的物

理環(huán)境等，均經(jīng)過標(biāo)準(zhǔn)化。

②評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化，對(duì)反應(yīng)的量化是客觀的。

③分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化，對(duì)結(jié)果的推論是客觀的。

第三節(jié)心理測驗(yàn)的種類

一、按測驗(yàn)功能分類：

1、能力測驗(yàn)：智力測驗(yàn)：比內(nèi)一西蒙智力測驗(yàn)、韋克斯勒兒童和成人

智力量表。特殊能力測驗(yàn)：如音樂、繪畫等

2、成就測驗(yàn)：用于測量個(gè)人（團(tuán)體）經(jīng)過某種正式教育或訓(xùn)練之后對(duì)

知識(shí)和技能掌握的程度。學(xué)科測驗(yàn)

3、人格測驗(yàn)：用于測量性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、

信念、價(jià)值觀等方面的個(gè)性心理特征，即個(gè)性中除能力以外的部分。

明尼蘇達(dá)多項(xiàng)人格調(diào)查表（MMPI）、16種人格因素問卷（16PF）、艾

森克人格問卷（EPQ）、羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)（TAT）o

二、按測驗(yàn)對(duì)象分類

1、個(gè)別測驗(yàn)：優(yōu)點(diǎn)：主試可以仔細(xì)觀察被試的言語情緒，并有充分的

機(jī)會(huì)與被試合作，所以其結(jié)果正確可靠。缺點(diǎn)：時(shí)間不經(jīng)濟(jì)，不能在

短時(shí)間呢您收集到大量的資料。

2、團(tuán)體測驗(yàn)：優(yōu)點(diǎn)：時(shí)間經(jīng)濟(jì)，主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)

任。缺點(diǎn)：主試對(duì)被試的行為不能作切實(shí)的控制，所得結(jié)果不及個(gè)別

測驗(yàn)正確可靠。

三、按測驗(yàn)方式分類：

1、紙筆測驗(yàn)：言語作為刺激。MMPLEPQ、16PF及韋克斯勒兒童和

成人智力量表中的言語量表部分。

優(yōu)點(diǎn)：實(shí)施方便，團(tuán)體測驗(yàn)多用，有肢體殘疾而無言語困難的病人只

能用此。

缺點(diǎn)：受被試文化程度的影響。

2、操作測驗(yàn)：也稱非文字測驗(yàn)。羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)、瑞文

測驗(yàn)及韋克斯勒兒童和成人智力量表中的操作量表部分。

優(yōu)點(diǎn)：不受文化因素的限制。

3、口頭測驗(yàn)

4、電腦測驗(yàn)

四、按測驗(yàn)?zāi)康姆诸悾?/p>

1、描述性測驗(yàn)：目的在于對(duì)個(gè)人或團(tuán)體的能力、性格、興趣、知識(shí)水

平等進(jìn)行描述。

2、診斷性測驗(yàn)：目的在于對(duì)個(gè)人或團(tuán)體的某種行為問題進(jìn)行診斷。

3、預(yù)示性測驗(yàn)：目的在于通過測驗(yàn)分?jǐn)?shù)預(yù)示一個(gè)人將來的表現(xiàn)和所能

達(dá)到的水平。

五、按測驗(yàn)難度分類

1、速度測驗(yàn)

2、難度測驗(yàn)

六、按測驗(yàn)要求分類

1、最高作為測驗(yàn)

2、典型作為測驗(yàn)

七、按測驗(yàn)性質(zhì)分類

1、構(gòu)造性測驗(yàn)：在此種測驗(yàn)中，所呈現(xiàn)的刺激和被試的任務(wù)是明確的。

2、投射性測驗(yàn)：在此種測驗(yàn)中，刺激沒有明確意義，問題模糊，對(duì)被

試的反應(yīng)也沒有明確規(guī)定。

八、按測驗(yàn)解釋分類

1、常模參照測驗(yàn)

2、標(biāo)準(zhǔn)參照測驗(yàn)

九、按測驗(yàn)應(yīng)用分類

1、教育測驗(yàn)

2、職業(yè)測驗(yàn)

3、臨床測驗(yàn)

第四節(jié)心理測驗(yàn)的功能與應(yīng)用

一、心理測驗(yàn)的功能：最基本的功能是測量個(gè)體差異或行為反應(yīng)。

（-）從實(shí)際應(yīng)用角度看：

①人才選拔；

②崗位安置

③臨床診斷；

④教育評(píng)價(jià)；

⑤心理咨詢和治療

(-)從理論研究角度看：

①搜集材料：心理測驗(yàn)是收集個(gè)體差異資料最快捷的辦法。

②提出和驗(yàn)證假設(shè)

③實(shí)驗(yàn)分組

二、測驗(yàn)的應(yīng)用

(-)錯(cuò)誤的測驗(yàn)觀

1、測驗(yàn)萬能論

2、測驗(yàn)無用論：

①某些人格測驗(yàn)侵犯了個(gè)人隱私；

②測驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)。

3、心理測驗(yàn)即智力測驗(yàn)

(-)正確的測驗(yàn)觀

1、重要的心理學(xué)研究方法和決策的輔助工具：心理測驗(yàn)法的出現(xiàn)是心

理科學(xué)發(fā)展史上的一大進(jìn)步，是心理學(xué)研究中不可缺少的研究方法之

2、作為研究方法和測量工具尚不完善：過分夸大心理測驗(yàn)的科學(xué)性和

準(zhǔn)確性是不對(duì)的。

3、科學(xué)地看待心理測驗(yàn)，防止亂用測驗(yàn)：

①測驗(yàn)使用者必須具備一定的資格；

②慎重選擇測驗(yàn)量表；

③與被試建立良好的協(xié)調(diào)關(guān)系；

④正確解釋測驗(yàn)結(jié)果；

⑤注意測驗(yàn)的保密。

第二章心理測驗(yàn)的編制

［教學(xué)目的與要求］

(1)掌握心理測驗(yàn)編制的一般程序

(2)心理測驗(yàn)的難度與區(qū)分度的定義及

［教學(xué)重點(diǎn)與難點(diǎn)］心理測驗(yàn)的項(xiàng)目分析

第一節(jié)編制測驗(yàn)的一般程序

一、確定測驗(yàn)?zāi)康?/p>

(-)心理測驗(yàn)的對(duì)象:首先要明確測量的對(duì)象，也就是測驗(yàn)編成后要

用于哪些團(tuán)體。

A年齡

B教育水平：在編制兒童測驗(yàn)時(shí)，要同時(shí)考慮教育水平和年齡的影響。

在承認(rèn)測驗(yàn)中，一般只考慮教育水平的影響。

C文化背景

(-)測驗(yàn)的目標(biāo)：是指編制的測驗(yàn)是測什么的，即用來測量什么樣

的心理變量或行為特征。目標(biāo)分析以測驗(yàn)不同而異，一般分為三種情

況:

A工作分析：主要任務(wù)是對(duì)所預(yù)測的行為活動(dòng)作具體分析，我們稱之

為任務(wù)分析或工作分析。

B對(duì)特定概念下定義：如果測驗(yàn)是為了測量某種特殊的心理品質(zhì)或特

點(diǎn)，那么測驗(yàn)編制者就必須給所要測量的心理或行為特質(zhì)下定義，然

后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行

測量。

C確定測驗(yàn)的具體內(nèi)容：如果測驗(yàn)是描述性的顯示測驗(yàn)，它的目標(biāo)分

析的主要任務(wù)則是確定顯示的內(nèi)容和技能。

（三）測驗(yàn)用途：所編出的測驗(yàn)是要對(duì)被試做描述，還是做診斷，抑

或是選拔和預(yù)示。

二、擬定編制計(jì)劃

編制計(jì)劃，實(shí)際上是對(duì)測驗(yàn)的總體設(shè)計(jì)，指出測驗(yàn)的內(nèi)容結(jié)構(gòu)和項(xiàng)目

形式等，以及對(duì)每個(gè)內(nèi)容、目標(biāo)的相對(duì)重視程度。

根據(jù)布魯姆最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)分成

認(rèn)知、精神運(yùn)動(dòng)和情感三個(gè)領(lǐng)域，又把認(rèn)知領(lǐng)域具體分為知識(shí)、理解、

應(yīng)用、分析和綜合、評(píng)價(jià)。

三、設(shè)計(jì)測試項(xiàng)目

（-）搜集有關(guān)資料

1、資料要豐富

2、資料要有普遍性

（-）選擇項(xiàng)目形式

1、測驗(yàn)的目的和材料性質(zhì)

2、接受測驗(yàn)的團(tuán)體的特點(diǎn)

3、各種實(shí)際因素：時(shí)間，人數(shù)、經(jīng)費(fèi)等

（三）編寫和修訂項(xiàng)目

1、項(xiàng)目的范圍要與測驗(yàn)計(jì)劃相一致

2、項(xiàng)目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍，以備篩選和編制復(fù)

本

3、項(xiàng)目的難度必須符合測驗(yàn)?zāi)康男枰?/p>

4、項(xiàng)目的說明必須清楚

四、項(xiàng)目的試測和分析

（-）試測

1、預(yù)測對(duì)象應(yīng)取自將來正式測驗(yàn)準(zhǔn)備應(yīng)用的群體

2、預(yù)測的實(shí)施過程與情境應(yīng)力求與將來正式測試時(shí)的情況相近似

3、預(yù)測的時(shí)限可稍寬一些，最好使每個(gè)被試都能將項(xiàng)目做完，以搜集

較充分的反應(yīng)資料-，使統(tǒng)計(jì)分析的結(jié)果更為可靠。

4、在預(yù)測過程中應(yīng)隨時(shí)記錄被試的反應(yīng)情形，如在不同時(shí)限內(nèi)一般被

試所完成的題數(shù)、題意不清之處及其他有關(guān)問題。

（-）項(xiàng)目分析

包括質(zhì)的分析和量的分析

質(zhì)的分析是從內(nèi)容取樣的適當(dāng)性、題目的思想性以及表達(dá)是否清楚等

方面加以分析。

量的分析是對(duì)預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析，確定項(xiàng)目的難度、區(qū)分度、備

選答案的適宜性等。

五、合成測驗(yàn)

1、項(xiàng)目的選擇：要考慮測驗(yàn)的目的、性質(zhì)與功能，區(qū)分度，難度

2、項(xiàng)目的編排：由易到難，有并列直進(jìn)式，混合螺旋式

A一般原則：a測題的難度排列易逐步上升；b盡可能將同類型的測題

組合在一起；c各種類型測題本身的特點(diǎn)；

B常見試題排列方式：a并列直進(jìn)式b混合螺旋式

3、編造復(fù)本

測驗(yàn)的各份復(fù)本必須等值，所謂等值需符合下列幾個(gè)條件：

(1)各份測驗(yàn)測量的是同一種心理特質(zhì)；

(2)各份測驗(yàn)包含相同的內(nèi)容范圍，但題目不應(yīng)有重復(fù)；

(3)各份測驗(yàn)題型相同，題目數(shù)量相等，并且有大體相同的難度分布。

六、測驗(yàn)使用的標(biāo)準(zhǔn)化

1、施測過程標(biāo)準(zhǔn)化

2、評(píng)分計(jì)分標(biāo)準(zhǔn)化

3、分?jǐn)?shù)解釋標(biāo)準(zhǔn)化

七、搜集信度、效度資料

(-)信度

指的是測量的可靠性或一致性。

(-)效度

指的是測量的有效性或正確性。

A搜集有關(guān)資料：題目的有關(guān)來源

a已出版的標(biāo)準(zhǔn)測驗(yàn)

b理論和專家的經(jīng)驗(yàn)

C臨床觀察和記錄

B命題的原則及編寫要領(lǐng)

a命題的原則（理解）：

O1內(nèi)容方面：符合測驗(yàn)的目的，取樣有代表性，相互獨(dú)立，互不牽掛;

02文字方面：準(zhǔn)確，簡明扼要，少使用雙重否定句；

03理解方面：不要超出受測團(tuán)體的知識(shí)水平和理解能力，不要有爭議

誤解；

04社會(huì)敏感性方面：應(yīng)盡量避開社會(huì)敏感性問題，如涉及社會(huì)禁忌或

個(gè)人隱私的題目不應(yīng)使用。

菲利普對(duì)于涉及社會(huì)敏感性問題，怎樣鼓勵(lì)被試作出真實(shí)回答的策略:

O1命題時(shí)假定被試具有某種行為，使他不得不在確實(shí)沒有該行為時(shí)才

否定，可避免否定過多的傾向。

?2命題時(shí)假定規(guī)范不一致。

?3指出該行為是常見的，雖然是違規(guī)的。

b測題的編制要領(lǐng)：根據(jù)被試的要求不同分為

O1提供型：要求被試給出正確答案。

02選擇題：要求被試在有限幾個(gè)答案中選擇正確的答案。由題干和選

項(xiàng)構(gòu)成。

題干：呈現(xiàn)一個(gè)問題的情境，一般由直接問句或不完全的陳述句構(gòu)成。

選項(xiàng)：問題的多種可能答案，常常是包含一個(gè)正確答案，若干（一般

是1?5個(gè)）錯(cuò)誤答案，其中的錯(cuò)誤的答案叫做“誘答”。

八、編寫測驗(yàn)手冊

1、本測驗(yàn)的目的和功用

2、測驗(yàn)的理論背景以及選擇項(xiàng)目的根據(jù)

3、測驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng)

4、測驗(yàn)的標(biāo)準(zhǔn)答案和記分方法

5、常模表或其他有助于分?jǐn)?shù)轉(zhuǎn)化與解釋的資料

6、測驗(yàn)的信度、效度資料?，包括信度系數(shù)、效度系數(shù)以及這些數(shù)據(jù)是

在什么情境下得到的

第二節(jié)測驗(yàn)的項(xiàng)目分析

一、項(xiàng)目的難度分析

(-)定義：

1、難度：是指項(xiàng)目的難易程度。P在能力測驗(yàn)中通常需要一個(gè)反映難

度水平的指標(biāo)，在非能力測驗(yàn)中，類似的指標(biāo)是“通俗性”，即取自相

同總體的樣本中，能在答案方向上回答該題的的人數(shù)。

P=&

2、難度的指標(biāo)：N

以通過率表示難度時(shí)?，通過人數(shù)越多，即P值越大，難度就越低；P

值越小，難度越高。因?yàn)镻值大小與難度高低成反比，有人將其稱

作易度。

(二)難度的計(jì)算

1、原始定義法

p=—

(1)客觀試題(二分法記分)：N

R：答對(duì)該題的人數(shù)；N：參加測驗(yàn)的總?cè)藬?shù)

由于選擇題允許猜測，所以通過率可能因機(jī)遇作用而變大。備選答案

的數(shù)目越少，機(jī)遇的作用越大，越不能真正反映測驗(yàn)的難度。為此，

…KP-l

CP=--------

吉爾福特提出了一個(gè)P值校正公式。K-1

CP：校正后的難度值；P：實(shí)際得到的通過率；K：選項(xiàng)數(shù)目

例題：假定某題有75%的被試通過，若該題有5個(gè)備選答案，則校正

后的通過率為：

當(dāng)有4個(gè)備選答案時(shí)，CP=0.67；有3個(gè)，CP=0.63；有2個(gè)，CP=0.54)

b非二分記分：例題某一數(shù)學(xué)能力測驗(yàn)題的滿分為20分，全體被試在

該題上的平均分?jǐn)?shù)為15分，則該題的難度為：P=15/20=0.75

例：一個(gè)題目的難度值為0.75,分別計(jì)算此題有四個(gè)選項(xiàng)、三個(gè)選項(xiàng)、

兩個(gè)選項(xiàng)時(shí)大的難度值

p=X

(2)主觀題的平均數(shù)法

2、極端分組法

(1)客觀題的極端分組法

根據(jù)測驗(yàn)分?jǐn)?shù)按高低排序，用兩個(gè)極端組在某項(xiàng)目上的平均通過率表

p=「H'PL

示項(xiàng)目的難度—2PH、PL分別為高分組與低分組的通過率。

步驟：

A、按測驗(yàn)總分由高到低排序

B、從高分段向下選出全部試卷的27%作為高分組

C、從低分段向上選出全部試卷的27%作為低分組

D、按照上述公式計(jì)算項(xiàng)目難度值

例：100人參加某測驗(yàn)，高分組與低分組各取27人，其中第一題高分

組20人答對(duì)，低分組10人答對(duì)。這道題的難度系數(shù)是多少？

(2)主觀題的極端分組法

步驟：

A、按測驗(yàn)總分由高到低排序

B、從高分段向下選出全部試卷的25%作為高分組

C、從低分段向上選出全部試卷的25%作為低分組

D、按照上述公式計(jì)算項(xiàng)目難度值

P；XH+X「2NL

2N(H-L)

XH：高分組所得總分；

XL：低分組所得總分；H：該題最高分；L：該題最低分；N：考生總

人數(shù)的25%

(三)難度對(duì)測驗(yàn)的影響

1、難度對(duì)測驗(yàn)分?jǐn)?shù)分布的影響

(DP值越小一測驗(yàn)項(xiàng)目越難一測驗(yàn)分?jǐn)?shù)集中在低分端一分?jǐn)?shù)分布呈

正偏態(tài)分布。

(2)P值越大一測驗(yàn)項(xiàng)目越易一測驗(yàn)分?jǐn)?shù)集中在高分端一分?jǐn)?shù)分布呈

負(fù)偏態(tài)分布。

即：測驗(yàn)項(xiàng)目過份容易或過份難，都會(huì)造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分

布，而使測驗(yàn)分?jǐn)?shù)的離散程度變小。

2、難度對(duì)測驗(yàn)鑒別力的影響

測驗(yàn)的主要功效之一就是鑒別考生實(shí)際水平的高低。自欺欺人適量難

度可以加大考生得分的差異，從而提高測驗(yàn)的鑒別力。

P值越接近0.50,試題的鑒別能力就越高；相反，P值越接近1.00或0,

試題的鑒別能力就越低。

3、難度與測驗(yàn)?zāi)康牡年P(guān)系

項(xiàng)目難度應(yīng)根據(jù)測驗(yàn)?zāi)康膩泶_定，不能認(rèn)為測驗(yàn)項(xiàng)目都必須保持值等

于0.50最好。事實(shí)上，一方面，如果每個(gè)項(xiàng)目的難度都等于0.50,測

驗(yàn)項(xiàng)目之間存在高度相關(guān)，會(huì)使測驗(yàn)分?jǐn)?shù)的分布呈雙峰狀態(tài)，即有5%

的人所有題目都答對(duì)，得滿分，另外5%的人全部答錯(cuò)，得0分。

為此，難度水平的確定應(yīng)根據(jù)測驗(yàn)的目的，性質(zhì)及題目的形成。

(1)對(duì)于一般的常模、參照測驗(yàn)而言，其目的在于測量個(gè)體差異，一

般只要求測驗(yàn)題目的平均難度為0.50,而個(gè)題難度可在0.50+0.20之

間。

(2)當(dāng)測驗(yàn)用與選拔或診斷時(shí)，題目的難度值應(yīng)更多地接近錄取率。

(3)就選擇題而言，P值應(yīng)大于概率水平。P值若等于概率，說明被

試純粹憑猜測作答；P值若小于概率，說明題目很可能存在問題。

(4)整個(gè)測驗(yàn)的難度水平取決于組成測驗(yàn)的題目的難度。

(四)難度的轉(zhuǎn)換

難度指出的僅僅是題目的相對(duì)難度，不能客觀地指出題目難度之間差

異大小

P向Z的轉(zhuǎn)換

n假定每個(gè)試題所要測量地潛在特質(zhì)或能力是呈正態(tài)分布的，可將P

值作為正態(tài)曲線下的概率面積，以此轉(zhuǎn)換成Z分?jǐn)?shù)

二、項(xiàng)目的區(qū)分度D

(-)區(qū)分度的概念

區(qū)分度是測驗(yàn)對(duì)被試實(shí)際水平的區(qū)分程度。是測驗(yàn)項(xiàng)目分析的重要內(nèi)

容

是作為評(píng)價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù)

通常用D表示，取值范圍為+1.00至-1.00

D越高時(shí)，試題的質(zhì)量越好，D值范圍在-1.00和+1.00之間，值越大,

試題的區(qū)分能力越強(qiáng)。當(dāng)D為正值時(shí)，說明試題是積極區(qū)分，即高分

組通過率高，低分組通過率低。為D負(fù)值時(shí)，說明試題有消極區(qū)分，

高組通過率低，低組通過率高。D為0時(shí)，說明試題無區(qū)分用

(二)區(qū)分度對(duì)測驗(yàn)的影響

1.區(qū)分度與難度的關(guān)系

1試題的區(qū)分度與難度有密切關(guān)系。試題難度過大或過小，其區(qū)分度都

較低。當(dāng)難度值為1.00或0時(shí)，高分組和低分組或全部通過得滿分，

或全部未通過得0分，這時(shí)區(qū)分度都為0分。這兩種情況，都表示試

題沒有鑒別考生水平高低的能力。所以，調(diào)整試題難度是提高試題區(qū)

分度的重要方法。右表可說明難度與區(qū)分度的關(guān)系。

5?厘(P)

1.OOO.OO

O.QOO.20

O.-7OO.0O

O.501.OO

O.30O.do

0.10O.NO

O.OOO.OO

A、假如樣本中通過某一項(xiàng)目的人數(shù)比率為1.00或0,說明高分組與低

分組在通過率上不存在差異，因此D為0；假如項(xiàng)目的通過率為0.50,

則可能是高分組的所有人都通過了，而低分組卻無人通過，這樣D的

最大值可能達(dá)到l.OOo

B、為了使整個(gè)測驗(yàn)項(xiàng)目的潛在區(qū)分度最大，似乎應(yīng)該使每個(gè)項(xiàng)目的難

度處于0.50水平，但事實(shí)并非如此簡單。如果每一個(gè)項(xiàng)目的難度均處

于0.50,由于項(xiàng)目難度相同，有可能大多趨向于有關(guān)的內(nèi)容或技能，

結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下，有可能50%的被試全部通

過各項(xiàng)目得滿分，另外50%的被試全部為。分，形成U形分布，這樣

反而降低總分的區(qū)分能力。如果測驗(yàn)的所有項(xiàng)目都是中等難度，只有

項(xiàng)目的內(nèi)在相關(guān)為0時(shí)，整個(gè)測驗(yàn)才能產(chǎn)生常態(tài)分布。考慮到一般測

驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些，梯度多一些，

是合乎需要的。

2.區(qū)分度與信度的關(guān)系

O.1NN50.00

0.16OYN

0.20

0.30O.W夕

0.-^00.915

O.SOO.OV。

一個(gè)良好的測驗(yàn)，信度必須要高。測驗(yàn)的信度與項(xiàng)目的區(qū)分度有著密

切的關(guān)系，事實(shí)上，由試題的區(qū)分度還可以估計(jì)測驗(yàn)的信度。整個(gè)測

驗(yàn)中各試題的區(qū)分度值的平均數(shù)越高，測驗(yàn)的信度就越高。值的平均

數(shù)與信度的關(guān)系如右表。

(三)區(qū)分度計(jì)算方法

1、極端分組法

(1)客觀性試題區(qū)分度的計(jì)算公式：D=PH-PL

按測驗(yàn)總分從高到低排序

確定測驗(yàn)總分最高的27%的被試作為高分組，最低的27%的被試為低

分

分別求出這兩組被試通過試題的百分比

(2)主觀性試題區(qū)分度的計(jì)算公式：N(H-L)

說明：XH：高分組所得總分；XL：低分組所得總分；H：該題最高

分；L：該題最低分；N：考生總?cè)藬?shù)的25%

步驟：

按測驗(yàn)總分由高到低排序；分別確定測驗(yàn)總分的25%、25%作為高低

分組；列出試題分析表；將數(shù)據(jù)帶入以上公式加以計(jì)算

2、相關(guān)法

考慮中間數(shù)據(jù)

以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)（效標(biāo)分?jǐn)?shù)不易得到時(shí)，以測驗(yàn)總分代替）的

相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)

相關(guān)越高，區(qū)分能力越好

具體方法：

①點(diǎn)二列相關(guān)：適用于一類變量為二分稱名變量，另一類變量為連續(xù)

變量的成對(duì)變量的相關(guān)計(jì)算。

②二列相關(guān)：適用于兩個(gè)連續(xù)變量，但其中一個(gè)變量被人為分成兩類。

③相關(guān)：適用于兩個(gè)變量均為二分稱名變量。

積差相關(guān)法，點(diǎn)二列相關(guān)，二列相關(guān)，牛相關(guān)

區(qū)分度許價(jià)

04。肚域弱

0.3H.39眠如微枷更隹

0.2H.29尚可,仍需赧1

0.19以下徽必衡微或加以赧

提高區(qū)分度的方法

使試題的難度適中，使整個(gè)考試難度適中

著重考察復(fù)雜的學(xué)習(xí)結(jié)果

區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)

以上標(biāo)準(zhǔn)僅作參考，不是絕對(duì)的。事實(shí)上，項(xiàng)目區(qū)分度的要求應(yīng)根據(jù)

測驗(yàn)?zāi)康亩?，若測驗(yàn)?zāi)康脑谟谶x人，主要評(píng)判被試的個(gè)別差異，那

么區(qū)分度要求高些；若測驗(yàn)只是考察被試對(duì)所學(xué)知識(shí)的掌握情況，可

不過多考慮區(qū)分度。

三、項(xiàng)目分析的特殊問題

(-)選擇題反應(yīng)模式的分析

對(duì)于選擇題，除了分析其難度的區(qū)分度外，還要分析被試對(duì)每個(gè)備選

答案的反應(yīng)情況。一般要做以下分析：

1、如果正確的備選答案被所有被試所選擇，則說明該題目太易或者題

目中可能提供了某種暗示；

2、如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇，說明該選項(xiàng)不具迷惑性，錯(cuò)

得過于明顯，一般說來，除非有2%以上的人選擇，否則這個(gè)備選答案

就應(yīng)該修改。

3、如果所有被試的選擇了同一個(gè)錯(cuò)誤答案，可能是編制測驗(yàn)時(shí)把答案

定錯(cuò)了，也可能是教學(xué)中發(fā)生了錯(cuò)誤。

4、如果所有被試的選擇集中在兩個(gè)答案上，二者選擇率相近，，說明

該題可能有兩個(gè)正確答案或另一個(gè)答案也有一定道理。

5、如果高分組對(duì)正確答案的選擇與低分組相等或低于，說明所考察的

東西與水平無關(guān)。

6、如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)備選答案人數(shù)相等則說

明題目過難或題意不清。

（二）標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析

標(biāo)準(zhǔn)參照測驗(yàn)主要用于判斷被試是否掌握了某些知識(shí)技能，是達(dá)到了

一個(gè)事先確定的標(biāo)準(zhǔn)，測驗(yàn)結(jié)果只與既定標(biāo)準(zhǔn)比較而不在被試之間作

比較。因此測驗(yàn)分?jǐn)?shù)的變異性不是標(biāo)準(zhǔn)參照測驗(yàn)的必要條件。所以，

常模參照測驗(yàn)的項(xiàng)目分析方法不完全適用于標(biāo)準(zhǔn)參照測驗(yàn)。

1、難度分析

標(biāo)準(zhǔn)參照測驗(yàn)可以采用常模參照測驗(yàn)的方法計(jì)算難度，但是在篩選項(xiàng)

目時(shí)，對(duì)難度水平的要求與常模參照測驗(yàn)不同。

由于標(biāo)準(zhǔn)參照測驗(yàn)的目的是為了考察被試對(duì)某方面的知識(shí)技能的掌握

情況，因此，只要能反映教育目標(biāo)或教育者認(rèn)為重要的內(nèi)容，無論其

難度為多少，都可以編入測驗(yàn)。

2、區(qū)分度分析

標(biāo)準(zhǔn)參照測驗(yàn)一般分?jǐn)?shù)變異較小，不適合用相關(guān)法來計(jì)算區(qū)分度，但

是可以采用鑒別指數(shù)的方法計(jì)算，即比較兩組的通過率。

方法一

根據(jù)測驗(yàn)分?jǐn)?shù)將被試分為達(dá)標(biāo)組與未達(dá)標(biāo)組，然后分別計(jì)算它們在某

一項(xiàng)目上的通過率，兩組考生通過率之差，便是該項(xiàng)目的區(qū)分度，其

公式為:

D=ps-pn

式中ps、pn為達(dá)標(biāo)組與未達(dá)標(biāo)組在某一項(xiàng)目上的通過率。

這種方法主要的問題是分組標(biāo)準(zhǔn)不同，得到的區(qū)分度值不同。

方法二

用同一測驗(yàn)對(duì)同一組被試在教學(xué)前后各施測一次，分別統(tǒng)計(jì)各項(xiàng)目前

后測的通過率，二者之差便是項(xiàng)目的區(qū)分度。其公式為：

D=ppost-ppre

D值越高，說明項(xiàng)目對(duì)教學(xué)效果越敏感，所以有人將其稱做教學(xué)效果

敏感指數(shù)，其公式也可寫為

其中S為敏感指數(shù)，RA、RB分別為前測、后測通過人數(shù)，N為總?cè)?/p>

數(shù)。

此種方法的主要缺點(diǎn)是：（1）同一測驗(yàn)施測兩次可能會(huì)產(chǎn)生練習(xí)效應(yīng),

成績的提高究竟是由教學(xué)引起的，還是由練習(xí)引起的難以分辨；（2）

只有等兩次施測后才能進(jìn)行項(xiàng)目分析；（3）當(dāng)D值低時(shí)，難于做出明

確的解釋，無法確定是由試題不良還是由教學(xué)不當(dāng)所致。

式中ppost.ppre分別為項(xiàng)目在后測和前測中的通過率。

方法三

取兩組條件相近的考生，一組接受過同測驗(yàn)有關(guān)的學(xué)科教學(xué)，另一組

沒有接受過此種教學(xué)。施測同一測驗(yàn)后，分別統(tǒng)計(jì)每組考生答對(duì)某題

的人數(shù)，兩組考生通過率之差便是該題的區(qū)分度。公式為D=pi-pu

式中pi、pu分別為教學(xué)組和未經(jīng)教學(xué)組對(duì)某題的通過率。

此方法的缺點(diǎn)是，兩組考生除在教學(xué)方面不同外在其他有關(guān)方面必須

同質(zhì)，而這一點(diǎn)是難以做到的。

項(xiàng)目特征曲線：是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式，它反映

了被試對(duì)某一測驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)

的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項(xiàng)目分析，而且也

適用于某些測驗(yàn)量表的編制。

A項(xiàng)目特征曲線可圖解測驗(yàn)的鑒別力，項(xiàng)目鑒別力的高低主要在于其

曲線的傾斜度，曲線坡度越陡，鑒別能力越好，預(yù)測的誤差越小。

B項(xiàng)目特征曲線可以圖解項(xiàng)目難度。

C項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。

第三章測量的誤差及其檢驗(yàn)

［教學(xué)目的與要求］

(1)了解測量誤差的種類與來源

(2)掌握信度的定義、意義及其估計(jì)方法

(3)掌握效度的定義、意義及其估計(jì)方法

［教學(xué)重點(diǎn)與難點(diǎn)］信度與效度的估計(jì)

第一節(jié)測量的誤差

一、誤差的種類

(-)誤差的定義

誤差是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)

果。

(二)誤差的種類

1、隨機(jī)誤差：與測量目的無關(guān)的偶然因素引起的變化規(guī)律的誤差，使

得多次的測量結(jié)果不一致，這種誤差的大小和方向是隨機(jī)的。既影響

測量的準(zhǔn)確性又影響一致性。

2、系統(tǒng)誤差：與測量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差，它

穩(wěn)定地存在于每一次測量中。只影響測量的準(zhǔn)確性。

二、誤差的來源

(-)測驗(yàn)自身引起的誤差

主要來源于測驗(yàn)的編制過程，其中項(xiàng)目取樣影響最大。

(-)施測過程引起的誤差

1、測試環(huán)境

2、測試時(shí)間

3、主試因素

4、意外干擾

5、評(píng)分記分

(三)被試引起的誤差

1、應(yīng)試動(dòng)機(jī)

2、測驗(yàn)焦慮

3、測驗(yàn)經(jīng)驗(yàn)

4、練習(xí)效應(yīng)

5、反應(yīng)傾向

6、生理變因

三、真分?jǐn)?shù)

(-)含義

真分?jǐn)?shù)是指測量沒有誤差時(shí)所得到的真值。其操作定義是無數(shù)次測量

結(jié)果的平均值。

(-)數(shù)學(xué)模型及其假設(shè)

1、CTT模型——經(jīng)典測驗(yàn)理論假定，觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)

之間是一種線性關(guān)系，并只相差下個(gè)隨機(jī)誤差(E),即乂=丁+￡這里的

測量誤差E指的是引起測量不一致的變因所產(chǎn)生的效應(yīng)，即指隨機(jī)誤

差，不包括系統(tǒng)誤差。

分析假設(shè)公理：

(1)若一具人的某種心理特質(zhì)可以用平行的測驗(yàn)分?jǐn)?shù)反復(fù)測量足夠多

次，則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即E(X)=T或E(E)

=10

(2)真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。

即P(T,E)=0

(3)各平行測驗(yàn)上的誤差分?jǐn)?shù)之間的相關(guān)為零。

2、引申：

（1）在一次測量中，被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分

數(shù)方差之和。S2X=ST2+S2E

（2）真分?jǐn)?shù)可以分成兩部分：與測量目的有關(guān)變異S2V和與測量目的

無關(guān)的變異S2L即：ST2=S2V+S2I

（3）一次測驗(yàn)中，一個(gè)團(tuán)體的實(shí)測分?jǐn)?shù)之間的變異性是由與測量目的

有關(guān)的變異數(shù)SV2、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和測量誤差

的變異數(shù)SE2所決定的。

即：S2X=SV2+SI2+SE2

第二節(jié)信度（reliability）

一、什么是信度

定義：指的是測量結(jié)果的穩(wěn)定性程度（或叫可靠性）。也指同一被試在

不同時(shí)間內(nèi)用同一測驗(yàn)（或用另一套相等的測驗(yàn)）重復(fù)測量，所得結(jié)

果的一致程度。

1、理論定義：傳統(tǒng)的信度理論認(rèn)為，每一個(gè)測驗(yàn)的實(shí)得分?jǐn)?shù)（X）總

是由真實(shí)分?jǐn)?shù)（T）和誤差（E）,兩個(gè)部份構(gòu)成的，公式為：

X=T+E

討論一組測驗(yàn)分?jǐn)?shù)的特性時(shí)，可用方差導(dǎo)標(biāo)具體分?jǐn)?shù)，公式：

（測驗(yàn)實(shí)得分?jǐn)?shù)的方差）=（測驗(yàn)真分?jǐn)?shù)的方差）+（測驗(yàn)誤差的方

差）

2、操作定義：

定義1：一組測量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)（方差）與總變異數(shù)（總方差、

實(shí)得分?jǐn)?shù)的方差）的比率，或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。

計(jì)算公式：

rxx=ST2/SX2

定義2：信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平

方。即

rxx=ptx2

定義3：信度乃是一個(gè)測驗(yàn)X（A卷）與它的任意一個(gè)“平行測驗(yàn)”

X/（B卷）的相關(guān)系數(shù)。即rxx=pXX'2

二、信度的指標(biāo)

（一）信度系數(shù)：大部分情況下，信度是信度系數(shù)為指標(biāo)，它是一種

相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值，公式

是：rxx=ptx2

（-）信度指數(shù)：是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值，公式

是：

信度指數(shù)的平方就是信度系數(shù)rxx=ST2/SX2

（三）標(biāo)準(zhǔn)誤：指出個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。信度系數(shù)表示一組測量

的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度，標(biāo)注誤表示個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。

用一組被試兩次測量結(jié)果來代替同一個(gè)人反復(fù)實(shí)測，有了信度的另一

個(gè)指標(biāo)：

測量標(biāo)準(zhǔn)誤。測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系：標(biāo)準(zhǔn)誤越小，信

度越；標(biāo)準(zhǔn)誤越大，信度越低。

三、信度與測驗(yàn)分?jǐn)?shù)的解釋

(-)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)

(二)比較信度可以接受的水平

(三)解釋個(gè)人分?jǐn)?shù)的意義：

(四)比較不同測驗(yàn)分?jǐn)?shù)的差異：

四、信度的類型及估計(jì)方法

(-)重測信度(再測信度)：

1、含義與計(jì)算

又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測法，即使用同一測驗(yàn)，在

同樣條件下對(duì)同一組被試前后施測兩次測驗(yàn)，求兩次得分間的相關(guān)系

_YXY-NXY

數(shù)?！耙籒w

2、使用的前提條件

(1)所測量的心理特性必須是穩(wěn)定的。

(2)遺忘和練習(xí)的效果基本上相互抵消。

(3)在時(shí)間間隔中沒有學(xué)習(xí)另外的與測驗(yàn)有關(guān)的東西，或者說每人學(xué)

習(xí)其他東西的程度都一樣。

3、優(yōu)缺點(diǎn)：

優(yōu)點(diǎn)：

它最符合重復(fù)測驗(yàn)的涵義，是重復(fù)測驗(yàn)最簡單最明確的方式

(2)首測和再測只需要一套測驗(yàn)題目，省時(shí)，省力

(3)同一套題目無論施測兒次，所測的屬性是完全相同的。

缺點(diǎn)：

(1)同一組被試對(duì)同一個(gè)測驗(yàn)先后兩次作答相互之間是不獨(dú)立的。

(2)如果兩次施測時(shí)間間隔較長，在此期間被試的身心發(fā)展，新知識(shí)

的獲得，都會(huì)使兩次測驗(yàn)結(jié)果不相同。

(3)同一個(gè)被試對(duì)現(xiàn)一個(gè)測驗(yàn)先后兩次作答，對(duì)測驗(yàn)的興趣不同，影

響測驗(yàn)結(jié)果。

(4)兩次施測的環(huán)境不同，也是產(chǎn)生測量誤差的因素。

(二)復(fù)本信度(Alternate-formreliability)

1、含義與計(jì)算：

含義：又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測驗(yàn)(等值但題目

不同)來測量同一群體，然后求得被試在兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù),

這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗(yàn)在內(nèi)

容上的等值性，故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測

驗(yàn)的選擇。

2、使用的前提條件：

(1)要兩份或兩份以上真正平行的測驗(yàn)

(2)被試要有條件接受兩個(gè)測驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。

3、優(yōu)缺點(diǎn)：

優(yōu)點(diǎn)：

(1)一個(gè)測驗(yàn)的復(fù)本使得測驗(yàn)數(shù)目的增加，對(duì)于所欲測量的屬性相聯(lián)

系的行為總體代表性強(qiáng)，因此，一個(gè)測驗(yàn)的兩個(gè)復(fù)本在兩三天至一周

對(duì)同一組被試施測時(shí)，獲得的復(fù)本信度系數(shù)是相當(dāng)準(zhǔn)確的。

(2)測驗(yàn)的兩個(gè)復(fù)本，如果在不同時(shí)間使用，其信度不僅可以反映在

不同時(shí)間的穩(wěn)定性，而且還可以反映對(duì)于不同測題的一致性。

(3)兩個(gè)復(fù)本在同時(shí)使用時(shí)，可以避免再測驗(yàn)信度的缺點(diǎn)。

缺點(diǎn)：

(1)編制兩個(gè)完全相等的測驗(yàn)是很困難的，

(2)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。

(3)被試同時(shí)接受性質(zhì)相似的兩個(gè)測驗(yàn)可能減少完成測驗(yàn)的積極性。

4、適用范圍

(1)如果兩個(gè)復(fù)本的施測相隔一段時(shí)間，則稱穩(wěn)定與等值系數(shù)。穩(wěn)定

與等值系數(shù)既考慮了測驗(yàn)在時(shí)間上的穩(wěn)定性，也考慮了不同題目樣本

反應(yīng)的一致性，因而是更為嚴(yán)格的信度考察方法，也是應(yīng)用較為廣泛

的方法。

(2)在實(shí)際應(yīng)用時(shí)，為了抵消施測順序的效應(yīng)，應(yīng)該有半數(shù)的被試先

作A本再作B本，另一半被試先作B本再作A本。

(3)復(fù)本測驗(yàn)不僅適用于難度測驗(yàn)，也是估計(jì)速度測驗(yàn)信度的最好方

法。

(三)分半信度(split-halfreliability)

1、含義與計(jì)算

指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種

測驗(yàn)形式，實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分

為等值的兩半，并分別計(jì)算每位被試在兩半測驗(yàn)上的得分，求出這兩

半分?jǐn)?shù)的相關(guān)系數(shù)。

常見的是將測題按其序列號(hào)的奇偶分，這種分法的前提是：測題并非

隨機(jī)排列，而是按某種順序(如難度)排列；如果隨機(jī)排列的題目，

則必須是所有題目平等的（要么難度相等，要么性質(zhì)一樣）；如果測驗(yàn)

有多個(gè)分量表，應(yīng)該在分量表內(nèi)部排好順序，再把各分量表分兩半組

合起來求相關(guān)。

2、計(jì)算

（1）兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等（方差齊性）

先計(jì)算兩半測驗(yàn)的積差相關(guān)系數(shù)，再進(jìn)行校正。常用的修正公式是：

r=2%,

斯皮爾曼-布朗公式：“-1+如

（2）兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)不等（方差不齊），可采用：

弗朗那根公式I工J

r=l-4

或盧倫公式其中s；為兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù),s；為測驗(yàn)總分的變異數(shù).中的

任----個(gè)。

例題：對(duì)初一年級(jí)學(xué)生進(jìn)行地理成績測驗(yàn)，每答對(duì)1題得1分，答錯(cuò)1

題得0分，測題從易到難排列如表所示，試估計(jì)該測驗(yàn)的分半信度。

學(xué)12345678910

生

奇1022132213

數(shù)

題

得

分X

偶0101123223

數(shù)

題

得

分Y

總1123255436

分

由計(jì)算器算得a=1.7,4=0.9468,7=1.5,<TV=1.08012

Sxy=30,<r,=1.75119

尸=4=-

3、使用條件及范圍

分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。而且，在

使用斯皮爾-布朗公式時(shí)要求全體被試在兩半測驗(yàn)上得分的變異數(shù)要相

等。當(dāng)一個(gè)測驗(yàn)無法分成對(duì)等的兩半時(shí)，分半信度不宜使用。

(四)同質(zhì)性信度(homogeneityreliability)

1、含義：指測驗(yàn)內(nèi)部所有題目間的一致性。

題目的一致性有兩層含義：其一是指所有題目都測的是同一種心理特

質(zhì)；其二是指所有題目之間都具有較高的正相關(guān)?？傊?，同質(zhì)性信度

就是一個(gè)測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。

2、測量同質(zhì)性的基本公式：

%一

1+(1)虧

其中K為構(gòu)成測驗(yàn)的項(xiàng)目數(shù)，虧為項(xiàng)目間相關(guān)系數(shù)的平均數(shù),%為同質(zhì)性信度值.

3、庫德-理查遜公式：適用于客觀性試題(0、1記分)

K-ao公式:

K表示構(gòu)成測驗(yàn)的題目數(shù),Pj為通過第i題的人數(shù)比例,q1為未通過第i題的人數(shù)比例為測驗(yàn)總分的變異:

K-4I公式：

kS^-X(k-X)

二-d)s；-

K表示構(gòu)成測驗(yàn)的題目數(shù)，又為測驗(yàn)總分的平均數(shù),s：為測驗(yàn)總分的變異數(shù).

3、克倫巴赫系數(shù)(多重記分測驗(yàn))

其中K為測驗(yàn)的題目數(shù),S：為某一題目分?jǐn)?shù)的變異數(shù),S；為測驗(yàn)總分的變異數(shù).

例題：某態(tài)度量表共7題，100個(gè)被試在各題上的得分方差分別是

0.81,0.82,0.79,0.83,0.85,0.76,0.77,測驗(yàn)總分的方差為14.00,則此測量的

的信度為0.70.

4、注意:

當(dāng)各個(gè)測題的得分有較高的正相關(guān)時(shí)，不論題目的內(nèi)容和形式如何，

測驗(yàn)即為同質(zhì)的；若所有題目看起來好像測量的是同一特質(zhì)，但相關(guān)

很低或?yàn)樨?fù)相關(guān)時(shí).，測驗(yàn)即為異質(zhì)的。

對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量，采用單一的同質(zhì)性測驗(yàn)是不行

的，因而常常采用若干相對(duì)異質(zhì)的分測驗(yàn)，并使每個(gè)分測驗(yàn)內(nèi)容具有

同質(zhì)性，這樣每個(gè)分測驗(yàn)就能用來預(yù)測異質(zhì)效標(biāo)的某一方面。

(五)評(píng)分者信度(scorerreliability)

1、含義與計(jì)算：指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致

性程度。是用于測量不同評(píng)分者之間所產(chǎn)生的誤差。

^K2(N3-N)

式中W為和諧系數(shù)，K為評(píng)分者的人數(shù)，N為被評(píng)對(duì)象數(shù)，RI為每一

對(duì)象被評(píng)的等級(jí)總和。

例子：假設(shè)有三位專家給六篇論文評(píng)等級(jí)，結(jié)果如表所示，試計(jì)算此

次評(píng)分者的評(píng)分者信度。

C家123456

1241563

2341562

3351462

Ri813314187

解：分別求出各篇論文等級(jí)之各Ri,

則有ZR：=63,ZR：=811,k=3,n=6

LK2(N3-N

121

=0.95

2、注意的問題：為了衡量評(píng)分者之間的信度高低，可隨機(jī)抽取若干份

測驗(yàn)卷，由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分，然后再根據(jù)每份測驗(yàn)卷

的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān)，即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練

的評(píng)分者之間平均一致性達(dá)0.90以上，才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)

評(píng)分者評(píng)定多個(gè)對(duì)象，并以等級(jí)法記分時(shí)，可采用肯德爾和諧系數(shù)作

為評(píng)分者信度的估計(jì)。

五、標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)

1、對(duì)相關(guān)法信度系數(shù)進(jìn)行校正

為了對(duì)標(biāo)準(zhǔn)參照測驗(yàn)的信度做出較為準(zhǔn)確的估計(jì)，利文斯頓提出了對(duì)

相關(guān)法信度系數(shù)的校正公式：

"+（、-Of

52+（X-C）2

式中公為標(biāo)準(zhǔn)參照測驗(yàn)的信度,〃為任何一種相關(guān)法信度系數(shù)，

S為分?jǐn)?shù)的標(biāo)準(zhǔn)差，又為分?jǐn)?shù)的均值,C為達(dá)標(biāo)分?jǐn)?shù)或分?jǐn)?shù)線.

2、用決策的一致性作為信度指標(biāo)

林德曼與梅倫達(dá)的一致性公式：

C=…

+v(n+/7+?)

C為一致性，n為在兩次施測中均未達(dá)到標(biāo)的人數(shù)，b為在兩次施測中

均已達(dá)標(biāo)的人數(shù)，f為只在第一次施測中達(dá)標(biāo)的人數(shù)，s為只在第二次

施測中達(dá)標(biāo)的人數(shù)，v為f或s中較小的值。

六、各種信度系數(shù)相應(yīng)誤差方差的來源

信度系數(shù)類型誤差方差來源

重測信度時(shí)間取樣

復(fù)本信度（連續(xù)施測）內(nèi)容取樣

復(fù)本信度（間隔施測）時(shí)間和內(nèi)容取樣

分半信度內(nèi)容取樣

同質(zhì)性信度內(nèi)容的異質(zhì)性

評(píng)分者信度評(píng)分者之間的差異

七、影響信度的因素

(-)樣本的特征：信度常用信度系數(shù)來表示，信度系數(shù)就是相關(guān)系

數(shù)，相關(guān)系數(shù)受樣本團(tuán)體得分分布、樣本是否異質(zhì)及樣本團(tuán)體平均能

力水平的影響。

1、樣本團(tuán)體分?jǐn)?shù)分布的影響：當(dāng)分布范圍增大時(shí)，其信度估計(jì)就較高;

當(dāng)分布范圍減小時(shí)，相關(guān)系數(shù)隨之下降，信度值則較低。

2、樣本團(tuán)體異質(zhì)性的影響：若獲得信度的取樣團(tuán)體較為異質(zhì)的話，往

往會(huì)高估測驗(yàn)的信度，相反則會(huì)低估測驗(yàn)的信度。

3、樣本團(tuán)體平均能力水平的影響：對(duì)于不同水平的團(tuán)體，題目具有不

同的難度，每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。

(-)測驗(yàn)的長度：

1、測驗(yàn)越長，測驗(yàn)的測題取樣或內(nèi)容取樣越有代表性。

2、測驗(yàn)越長，被試的猜測因素影響就越小。

3、測驗(yàn)的項(xiàng)目越多，在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。

1+(1股

式中k為改變后長度與原長度之比,2為原測驗(yàn)的信度，

%為測驗(yàn)長度是原來的k倍時(shí)的信度估計(jì).

(三)測驗(yàn)的難度：難度對(duì)信度的影響只存在于某些測驗(yàn)中，如智力

測驗(yàn)、成就測驗(yàn)、

能力傾向測驗(yàn)等。如果一個(gè)測驗(yàn)對(duì)某團(tuán)體而言太容易，會(huì)使所得分?jǐn)?shù)

都集中在高分端；當(dāng)題目太困難時(shí);得分就會(huì)集中在低分端。兩種情

況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄，從而使測驗(yàn)變得不夠可靠。從理

論上說，只有難度水平為50%時(shí)，才能使測驗(yàn)分?jǐn)?shù)分布范圍最大，求

得的信度也最I(lǐng)WJ。

(四)測驗(yàn)的時(shí)間間隔：以再測法或復(fù)本法求信度，兩次測驗(yàn)相隔時(shí)

間越短，其信度系數(shù)越大；間隔時(shí)間越久，其它變因介入的可能性越

大，受外界的影響越大，信度系數(shù)便越低。

第三節(jié)測驗(yàn)的效度

在測量活動(dòng)中，測量者對(duì)所使用的測量工具非常信任，他會(huì)采取復(fù)測

行為以判斷測量有無誤差；如果測量者對(duì)所使用的測量工具發(fā)生懷疑,

那他往往會(huì)去找一公認(rèn)非常準(zhǔn)確的測量工具對(duì)先前的測值進(jìn)行檢驗(yàn)。

這種在原測量工具之外尋求新的證據(jù)來肯定或否定某一測量工具準(zhǔn)確

性的做法就是在研究測量的效度問題。心理測量是一種間接測量，心

理測量更重視測量的效度研究。

一、效度(validity)

(-)定義：效度是指所測量的與所要測量的心理特點(diǎn)之間符合的程

度，或者簡單地說是指一個(gè)心理測驗(yàn)的準(zhǔn)確性?；蚴侵敢粋€(gè)測驗(yàn)或量

表實(shí)際能測出其所要測的心理特質(zhì)的程度。

1、關(guān)于效度的概念，我們要特別注意以下幾點(diǎn)：

(1)效度是一個(gè)相對(duì)的概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面：

①效度是相對(duì)于一定的測量目的而言的。

②心理特質(zhì)是較隱蔽的特性，只能通過他的行為表現(xiàn)來進(jìn)行推測，因

此，心理測量不可能達(dá)到百分之百的準(zhǔn)確，而只能達(dá)到某種程度的準(zhǔn)

確。

（2）效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。任一誤差的存在,

測量的效度都會(huì)受到影響

（3）判斷一個(gè)測量是否有效要從多方面收集證據(jù)

2、在測驗(yàn)理論中，效度被定義為在一組測量中，與測量目標(biāo)有關(guān)的真

實(shí)方差（或稱有效方差，由所要測量的變因引起的有效變異）與總方

差（實(shí)得變異數(shù)）的比率，即

X），_2

3、一組測驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和，而真實(shí)方差

又可分為兩部分，即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差，后者也就是

所謂系統(tǒng)誤差帶來的方差S2X=SV2+SI2+SE2

由于有效方差是一個(gè)理論值，無法測量，所以效度和信度一樣是一個(gè)

理論上的概念。

二、效度和信度的關(guān)系

（-）信度是效度的必要而非充分條件。

（-）效度是受信度制約的：信度系數(shù)的平方根是效度系數(shù)的最高限

度，

可見，一個(gè)測驗(yàn)的效度總是受它的信度所制約。

三、效度的類型及評(píng)估方法

（一）內(nèi)容效度（ContentValidity）

1、定義：指的是項(xiàng)目對(duì)欲測的內(nèi)容或行為范圍的取樣的適當(dāng)程度。也

即測驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性，從而確定測驗(yàn)是否是所

欲測量的行為領(lǐng)域的代表性取樣。

一個(gè)測驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件：

(1)要確定好內(nèi)容范圍，并使測驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。所謂內(nèi)

容范圍可以是具體知識(shí)或技能，也可以是復(fù)雜的行為。要對(duì)所測量的

心理特性有個(gè)明確的概念，并劃定出哪些行為與這心理特性有關(guān)。

(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。

2、內(nèi)容效度的評(píng)估方法：

(1)專家判斷法：

(2)統(tǒng)計(jì)分析法

(3)經(jīng)驗(yàn)推測法：3、內(nèi)容效度的應(yīng)用

(1)是編制任何測驗(yàn)應(yīng)加以考慮的基本方面。

(2)較適用于評(píng)價(jià)教育成就測驗(yàn)和職業(yè)選拔測驗(yàn)。

(3)對(duì)標(biāo)準(zhǔn)參照測驗(yàn)更為重要，是因?yàn)樵跇?biāo)準(zhǔn)參照測驗(yàn)中我們主要關(guān)

心的是被試對(duì)一定范圍的知識(shí)、技能掌握得如何。

(4)注意內(nèi)容效度與表面效度的關(guān)系(5)它缺乏可靠的數(shù)量指標(biāo)，

因而妨礙了各測驗(yàn)間的相互比較。

(二)構(gòu)想效度(constructValidity)

1954年提出，有人翻譯為構(gòu)思效度，也有叫結(jié)構(gòu)效度。它是指測驗(yàn)?zāi)?/p>

夠測量到理論上的構(gòu)想和特質(zhì)的程度，即測驗(yàn)的結(jié)果是否能證實(shí)或解

釋某一理論的假設(shè)、術(shù)語或構(gòu)想，解釋的程度如何。

1、構(gòu)想效度的特點(diǎn)：

(1)其大小首先取決于事先假定的心理特質(zhì)理論

(2)當(dāng)實(shí)際測量的資料無法證實(shí)我們的理論假設(shè)時(shí)，并不一定就表明

該測驗(yàn)結(jié)構(gòu)效不高，因?yàn)檫€有可能是理論假設(shè)不成立，或者該實(shí)驗(yàn)設(shè)

計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況，當(dāng)然這就使得結(jié)構(gòu)效度的獲取

更為困難。

(3)結(jié)構(gòu)效度通過測量什么、不測量什么的證據(jù)累積起來給以確定，

因而不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。

結(jié)構(gòu)效度主要應(yīng)用于智力測驗(yàn)、人格測驗(yàn)等一些心理測驗(yàn)方面。

2、結(jié)構(gòu)效度的確定方法：

(1)提出理論假設(shè)，并把這一假設(shè)分解成一些細(xì)小的綱目，以解釋被

試在測驗(yàn)上的表現(xiàn)。

(2)依據(jù)理論框架，推演出有關(guān)測驗(yàn)成績的假設(shè)。

(3)用邏輯和實(shí)證的方法來驗(yàn)證假設(shè)。

3、構(gòu)想效度的估計(jì)方法：

(1)測驗(yàn)內(nèi)法(對(duì)測驗(yàn)本身的分析)：

(2)測驗(yàn)間的相互比較：

①相容效度

②區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。

③因素效度：(3)效標(biāo)關(guān)聯(lián)法，效度的研究證明：一個(gè)測驗(yàn)若效標(biāo)度

理想，那么該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗(yàn)構(gòu)

思效度的指標(biāo)，另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。

(4)實(shí)驗(yàn)法和觀察法證實(shí)：觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)

思效度的方法。

3、對(duì)構(gòu)想效度的評(píng)價(jià)

(1)構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上，使

得測驗(yàn)成為理論研究的重要工具，而不再只是實(shí)際決策的輔助工具，

從而使測驗(yàn)有了更廣闊的發(fā)展情景。

(2)主要缺點(diǎn)是，有些構(gòu)想概論模糊，沒有一致的定義，確定效度時(shí)

沒有明確的操作步驟，沒有單一的數(shù)量指標(biāo)來描述有效程度。

(三)效標(biāo)效度

1、定義：又稱實(shí)證效度，反映的是測驗(yàn)預(yù)測個(gè)體在某種情境下行為表

現(xiàn)的有效性程度。被預(yù)測的行為是檢驗(yàn)效度的標(biāo)準(zhǔn)，簡稱效標(biāo)。由于

這種效度是看測驗(yàn)對(duì)效標(biāo)預(yù)測如何，所以叫效標(biāo)效度。這種效度需在

實(shí)踐中檢驗(yàn)，所以又稱為實(shí)證效標(biāo)。

2、分類：根據(jù)效標(biāo)資料是否與測驗(yàn)分?jǐn)?shù)同時(shí)獲得，又可分為同時(shí)效度

和預(yù)測效度兩類。同時(shí)效度即測驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證，通常

與心理特征的評(píng)估及診斷有關(guān)。

3、效標(biāo)和效標(biāo)測量：效標(biāo)，即衡量測驗(yàn)有效性的參照標(biāo)準(zhǔn)，指的是可

以直接而且獨(dú)立測量的我們感興趣的行為。效標(biāo)可以分為兩個(gè)層次，

其一是理論水平的觀念效標(biāo)，其二是操作定義水平的效標(biāo)測量。

4、常用的效標(biāo)包括：

(1)學(xué)業(yè)成就；

(2)實(shí)際工作表現(xiàn)

(3)特殊訓(xùn)練成績

(4)精神病診斷

（5）等級(jí)評(píng)定

（6）效標(biāo)團(tuán)體的比較

（7）先前有效的測驗(yàn)

5、效標(biāo)效度的表示方法

（1）相關(guān)法：效度系數(shù)是最常用的效度指標(biāo)，尤其是效標(biāo)效度。它是

以皮爾遜積差相關(guān)系數(shù)來表示的，主要反映測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相

關(guān)。當(dāng)測驗(yàn)成績是連續(xù)變量，而效標(biāo)資料是二分變量時(shí)，計(jì)算效度系

數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式；當(dāng)測驗(yàn)分?jǐn)?shù)為連續(xù)變量，效

標(biāo)資料為等級(jí)評(píng)定時(shí)，可用賈斯朋多系列相關(guān)公式計(jì)算。

（2）區(qū)分法：是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的

一種方法。算出t值后，便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著，

說明該測驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體，否則，測驗(yàn)是無效的。

重疊百分比可以通過計(jì)算每一組內(nèi)得分超過（或低于）另一組平均數(shù)

的人數(shù)百分比得出；另外，還可以計(jì)算兩組分布的共同區(qū)的百分比。

重疊量越大，說明兩組分?jǐn)?shù)差異越小，即測驗(yàn)的效度越差。

（3）命中率法：是當(dāng)測驗(yàn)用來做取舍的依據(jù)時(shí)，用其正確決定的比例

作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法，一是計(jì)算總命

中率，另一種是計(jì)算正命中率。

命中表

失?。?）成功（+）

成功（+）A（失誤）B（命中）

失敗（-）C（命中）D（失誤）

總命中率:p=-命中—〃x100%=―5^—X100%

命中+失誤A+B+C+D

正命中率黑管'1°°%=焉-°°%

(4)預(yù)期表法：是一種雙向表格，預(yù)測分?jǐn)?shù)排在表的左邊，效標(biāo)排在

表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大，而其它的百分?jǐn)?shù)

字越小，表示測驗(yàn)的效標(biāo)效度越高；反之，數(shù)字越分散，則效度越低。

(5)功利率法：使用測驗(yàn)所花掉的費(fèi)用與得到的利益進(jìn)行比較，此種

效度指標(biāo)叫功利率。

四章測驗(yàn)分?jǐn)?shù)的合成與解釋

［教學(xué)目的與要求］

(1)了解分?jǐn)?shù)合成的方法

(2)掌握分?jǐn)?shù)解釋要注意的問題

［教學(xué)重點(diǎn)與難點(diǎn)］常模及其意義

第一節(jié)分?jǐn)?shù)的合成

分?jǐn)?shù)的組合可以在不同層面上進(jìn)行，一般情況下有以下幾種方法：

項(xiàng)目的組合：不同項(xiàng)目可以組合成量表或分測驗(yàn)，所有項(xiàng)目可以合成

一個(gè)測驗(yàn)總分。

分測驗(yàn)或量表的組合：幾個(gè)分測驗(yàn)可量表的分?jǐn)?shù)組合到一起得到一個(gè)

合成分?jǐn)?shù)。

測驗(yàn)或預(yù)測源的組合：幾個(gè)測驗(yàn)或預(yù)測源同時(shí)使用。

一、組合變量的方法

（―）臨床判斷MMPI

根據(jù)直覺經(jīng)驗(yàn)，主觀地將各種因素組合以得出結(jié)論或預(yù)測的方法叫臨

床判斷。

優(yōu)點(diǎn)：

1、能從整體上對(duì)各個(gè)因素加以綜合考慮

2、每個(gè)判斷都是針對(duì)特定的個(gè)人做出的，能考慮到每個(gè)人具體情況。

缺點(diǎn)：

1、主觀加權(quán)可能受判斷者的偏見的影響，不夠客觀；

2、沒有精確的數(shù)量指標(biāo)；

3、判斷者需要受過訓(xùn)練并具有豐富經(jīng)驗(yàn)

（―）推理方法

不考慮各個(gè)變量的經(jīng)驗(yàn)關(guān)系，而是根據(jù)某種先驗(yàn)的理想程序來作推理

性加權(quán)。

1、單位加權(quán)：將各個(gè)變量直接相加而得一個(gè)合成分?jǐn)?shù)

2、等量加權(quán)：將所有分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù)，然后再把它們加以組合。

（三）多重分段：假設(shè)預(yù)測源間不具互償性。

把人分成達(dá)到最低標(biāo)準(zhǔn)（接受）與未達(dá)到最低標(biāo)準(zhǔn)（拒絕）兩類，而

不在這兩組人內(nèi)部作進(jìn)一步區(qū)分。

1、綜合分段

把風(fēng)個(gè)預(yù)測源與效標(biāo)的關(guān)系綜合起來考慮，在保證合成體的預(yù)測效度

最高的前提下，分別確定出每個(gè)預(yù)測源的最佳分?jǐn)?shù)線。

2、連續(xù)柵欄

當(dāng)預(yù)測源分?jǐn)?shù)只能陸續(xù)得到，而每個(gè)變量又具有自己特定的閾限時(shí)，

不必讓每個(gè)申請(qǐng)者都在所有預(yù)測源上嘗試，只有通過第一項(xiàng)，才能進(jìn)

行下一項(xiàng)。

（四）多重回歸

當(dāng)同時(shí)采用幾個(gè)預(yù)測源來預(yù)測一個(gè)效標(biāo)，而這些預(yù)測源變量之間又具

有互償性時(shí)，采用多重回歸。

（五）合成分?jǐn)?shù)

1、完形記分

將各個(gè)變量看做一個(gè)整體，不是孤立地看第一個(gè)反應(yīng)結(jié)果，而是看總

的反應(yīng)模式。

2、輪廓分析

考慮被試在各個(gè)測驗(yàn)或量表上所得分?jǐn)?shù)的輪廓，而不是將各個(gè)變量作

簡單的線性組合。

二、各種組合方法的比較

（一）應(yīng)用范圍

1、選人：以多重分段或多重回歸方法來組合預(yù)測分?jǐn)?shù)

2、安置：多重回歸

3、描述：所有方法均可

（-）資料特征

1、輸入資料的種類

2、輸出資料的方式

(三)效度

1、合成體的效度

2、元素的效度

3、效度的比較

(1)推理法與實(shí)證法的比較

(2)分段法與回歸法的比較

(3)臨床法與統(tǒng)計(jì)法的比較

第二節(jié)分?jǐn)?shù)的解釋

一、常模

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

心理測量學(xué)教案全

文檔簡介

溫馨提示

最新文檔

評(píng)論

心理測量學(xué)教案全

文檔簡介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔