心理測量學(xué)教案全_第1頁
心理測量學(xué)教案全_第2頁
心理測量學(xué)教案全_第3頁
心理測量學(xué)教案全_第4頁
心理測量學(xué)教案全_第5頁
已閱讀5頁,還剩129頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第一章心理測驗(yàn)總論

[教學(xué)目的與要求]

(1)識(shí)記并了解心理測驗(yàn)的發(fā)展歷史

(2)掌握心理測驗(yàn)的性質(zhì)

(3)了解心理測驗(yàn)的種類

[教學(xué)重點(diǎn)與難點(diǎn)]心理測驗(yàn)的性質(zhì)

第一節(jié)心理測驗(yàn)的歷史

一、中國古代的心理測驗(yàn)思想

1、孔子:把人分為中人、中人以上、中人以下三個(gè)類別,“中人以上,

可以語上也;中人以下,不可以語上也”。(相當(dāng)于現(xiàn)代測量學(xué)中的命

名量表和次序量表)

2、孟子:“權(quán),然后知輕重;度,然后知長短。物皆然,心為甚?!泵?/p>

確指出了心理能力和心理特征與物理現(xiàn)象一樣,具有可測量的特性。

3、(南朝)劉勰:世界上最早的“分心測驗(yàn)”,認(rèn)為一心不能二用。

4、(南北朝)顏之推:周歲試兒,其是1925年格塞爾嬰兒發(fā)展量表的

前導(dǎo)。

5、“七巧板”又稱益智圖、唐圖(Tangram),為當(dāng)代多數(shù)智力測驗(yàn)和

創(chuàng)造力測驗(yàn)所使用。

6、隋煬帝科舉制度的開端,被認(rèn)為是世界上最早的心理測驗(yàn)的實(shí)踐。

當(dāng)時(shí)的考試方法:貼經(jīng)和對(duì)偶,類似于現(xiàn)代西方言語測驗(yàn)中常見的填

字和類比。

7、、中國古代心理測驗(yàn)的思想,包含著典型的東方文化特點(diǎn):

A、他們都是描述性的,沒有定量的標(biāo)準(zhǔn);

B、往往將心理特點(diǎn)與道德觀念聯(lián)系起來(局限性)

二、科學(xué)心理測驗(yàn)產(chǎn)生的原因

(-)對(duì)智力落后著分類和訓(xùn)練的早期關(guān)注

1、心理測驗(yàn)產(chǎn)生的最初原因:對(duì)智力落后和精神病人治療的需要。

2、法國醫(yī)生埃斯克羅:1838年出版了兩卷本著作,第一次明確地對(duì)智

力落后與精神病人作出了區(qū)分,他認(rèn)為精神病是以情緒障礙為標(biāo)志。(發(fā)

現(xiàn)一個(gè)人的語言能力是他智力水平的最可靠的指標(biāo))

3、法國醫(yī)生塞國恩(E.Sequin):訓(xùn)練智力落后者的先驅(qū)。1837年,

他創(chuàng)建了第一座教育智力落后兒童的學(xué)校,1846年出版了《白癡:用

生理方法進(jìn)行診斷和治療》。其首創(chuàng)方法感官訓(xùn)練(sense-training)、肌

肉訓(xùn)練(muscle-training)至今仍在全世界范圍內(nèi)的智力落后兒童教育機(jī)

構(gòu)。其SequinFormBoard拼圖板被心理測驗(yàn)的非語言測驗(yàn)所采用,其

操作方法是要求受測者盡快地將不同形狀的圖片嵌入適當(dāng)?shù)陌疾蹆?nèi)。

4、法國心理學(xué)家比奈開始致力于推動(dòng)建立鑒別不能適應(yīng)正常學(xué)校學(xué)習(xí)

但是可教育兒童的方法,鑒別出后安排接受一系列特殊教育課程。比

奈與“兒童心理學(xué)研究會(huì)”的同事們努力推動(dòng)法國公共教育部開展一

項(xiàng)促進(jìn)智能不足兒童學(xué)習(xí)能力計(jì)劃,并成立了專門的研究小組,這個(gè)

小組的成立是心理測驗(yàn)發(fā)展史上一個(gè)極為重大的歷史事件。

(-)實(shí)驗(yàn)心理學(xué)的發(fā)展

1、馮特:1879年他在德國萊比錫大學(xué)建立了心理學(xué)史上第一個(gè)實(shí)驗(yàn)室,

引發(fā)了個(gè)別差異的研究。

2、實(shí)驗(yàn)心理學(xué)的誕生和發(fā)展,給心理測驗(yàn)帶來了另一個(gè)副產(chǎn)品:嚴(yán)格

的標(biāo)準(zhǔn)化程序。

三、心理測驗(yàn)的發(fā)展(金瑜P7-9)

1、高爾頓:英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測驗(yàn)運(yùn)動(dòng)的主要人

物。他設(shè)計(jì)了測量差異的方法,1884年,他在倫敦國際博覽會(huì)中專門

設(shè)立了個(gè)“人體測量學(xué)實(shí)驗(yàn)室”六年中積累了9337人的資料,雖不是

正式的心理測驗(yàn),但可視為心理測驗(yàn)的開端。他還是評(píng)定量表和問卷

法應(yīng)用的先驅(qū),他的另一個(gè)重要貢獻(xiàn)是為心理測驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ),

并第一個(gè)提出了相關(guān)的概念。(皮爾遜相關(guān))

2、卡特爾:美國心理學(xué)家,從師馮特。1890年,卡特爾在《心理》雜

志上發(fā)表“心理測驗(yàn)與測量”,這是心理測驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)

中。

3、世界上第一個(gè)智力測驗(yàn):比內(nèi)與助手西蒙在《心理學(xué)年報(bào)》上發(fā)表

了一篇文章,題為:“診斷異常兒童智力的新方法”,是世界上第一個(gè)

正式的心理測驗(yàn)。比內(nèi)一西蒙量表自1905年發(fā)表后,在1908年修訂,

1908年量表題目總數(shù)達(dá)到了59個(gè),所有測題按年齡分組,組別從3-13

歲,測驗(yàn)的結(jié)果用“智力水平”表示,但其通常翻譯和提法為“智力

年齡”。后又經(jīng)1911年修訂一次。

4、心理測驗(yàn)的蓬勃發(fā)展:

(1)操作測驗(yàn)的發(fā)展:理論上的缺陷和實(shí)際上的需要,所以就有操作

測驗(yàn)的問世和發(fā)展。

(2)團(tuán)體智力測驗(yàn)的發(fā)展:這是心理測驗(yàn)方式的極大進(jìn)步,也擴(kuò)大了

測驗(yàn)的應(yīng)用范圍。

(3)能力傾向測驗(yàn)的發(fā)展:韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成

人智力量表。

(4)人格測驗(yàn)的發(fā)展:心理測驗(yàn)的另一領(lǐng)域是涉及情感或行為等非智

力方面的人格評(píng)估,通常包括對(duì)性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、

動(dòng)機(jī)、興趣和態(tài)度的測量。

(5)現(xiàn)代西方心理測驗(yàn)的發(fā)展,受到計(jì)算機(jī)的產(chǎn)生和發(fā)展,以及統(tǒng)計(jì)

方法的改進(jìn)的極大影響。

四、現(xiàn)代心理測驗(yàn)在中國的發(fā)展:以1949年中華人民共和國成立為分

(-)中華人民共和國成立前心理測驗(yàn)的發(fā)展

1、1916年,樊炳清先生首先介紹了比內(nèi)一西蒙智力量表;

2、1920年,廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測驗(yàn)課,

并用心理測驗(yàn)試測投考該校的學(xué)生,這便是中國正式開始的科學(xué)心理

測驗(yàn);

3、1921年,他倆正式出版《心理測驗(yàn)法》一書,成為中國最早的心理

測驗(yàn)專著;

4、1922年,中華教育改進(jìn)社聘請(qǐng)美國教育心理測驗(yàn)專家麥考爾來華講

學(xué),并主持編制心理測驗(yàn)事宜;

5、1924年,陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測驗(yàn)說明書》,30年

代又與吳天敏再次做了修訂;

6、1931年,由艾偉、陸志韋、陳鶴琴、蕭孝嵯等倡議,組織并成立

了中國測驗(yàn)學(xué)會(huì);

7、1932年,《測驗(yàn)》雜志創(chuàng)刊。

(-)中華人民共和國成立后心理測驗(yàn)的發(fā)展

1、1979年,林傳鼎、張厚粲等以國外資料為參考,編制了少年兒童

學(xué)習(xí)能力測驗(yàn);

2、1989年,成立中國心理學(xué)會(huì)心理測驗(yàn)專業(yè)委員會(huì),標(biāo)志著中國心

理測驗(yàn)已進(jìn)入了一個(gè)新的高速發(fā)展時(shí)期。

第二節(jié)心理測驗(yàn)的性質(zhì)

一、測量的基本問題

(-)測量的定義

1、定義:測量就是根據(jù)一定的法則,用數(shù)字對(duì)事物加以確定。

a一定的法則:是指測量行為發(fā)生時(shí)采用的規(guī)則或方法。

b事物:是指我們要測量的感興趣的事物的屬性或特征。

c數(shù)字:可以表示數(shù)量,也可以不表示數(shù)量。

d通常人們所說的測量,指的是給事物確定出一種數(shù)量化的價(jià)值。

2、測量的要素:一是參照點(diǎn),二是單位

a參照點(diǎn):一種是絕對(duì)的零點(diǎn);一種是相對(duì)參照點(diǎn),是認(rèn)為確定的。最

理想的參照點(diǎn)是絕對(duì)零點(diǎn),心理測驗(yàn)中所用的參照點(diǎn)都是相對(duì)的,因

而測量的結(jié)果常常不能以“倍數(shù)”的方式解釋。

b理想的單位的條件:有明確的意義和有相等的價(jià)值。

3、測量的量表:量表就是有參照點(diǎn)和單位的連續(xù)體。斯蒂文斯將量表

由低到高依次為:

a命名量表:是水平最低的一種測量量表,用數(shù)字來代替事物或?qū)κ?/p>

物進(jìn)行分類;

b順序量表:不僅表明類別,還能表明不通類別的大小等級(jí),或具有某

種屬性的程度;

c等距量表:不僅有大小關(guān)系,而且又有相等的單位,因此可以加減運(yùn)

算,但沒有絕對(duì)零點(diǎn),所以不能做乘除運(yùn)算;

d比例量表:是最精確的測量,既有相等的單位,又有絕對(duì)零點(diǎn)。

二、心理測量的基本概念

1、定義:是根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定,即依據(jù)一定

的心理學(xué)理論,使用一定的操作程序,給人的行為和心理屬性確定出

一種數(shù)量化的價(jià)值。

2、特點(diǎn):

(1)心理測量的間接性

(2)心理測量的相對(duì)性

3、心理測量的水平

心理測量,不論是對(duì)智力,還是對(duì)能力傾向或人格的測量,都只具有

等級(jí)量表的特征。測驗(yàn)分?jǐn)?shù)一般只能顯示個(gè)體智力、能力、人格上的

等級(jí)位次,而沒有一個(gè)相等的單位,故它不是一個(gè)等距量表。但由于

多數(shù)心理特征具有常態(tài)分布的特征,且沒有絕對(duì)零點(diǎn),所以我們也可

以把測量后直接得到的原始分?jǐn)?shù)轉(zhuǎn)化為常態(tài)分布下的標(biāo)準(zhǔn)分?jǐn)?shù),把這

些量表當(dāng)作等距量表來處理。

三、心理測驗(yàn)的基本問題

(-)心理測驗(yàn)和心理測量的的聯(lián)系和區(qū)別

心理測驗(yàn)是了解人心理的工具,主要在名詞上使用。而心理測量則是

運(yùn)用測驗(yàn)為工具,達(dá)到了解人類心理的實(shí)踐活動(dòng),它主要是在“動(dòng)詞”

意義上使用。因此,相對(duì)而言,心理測量的意義范圍更廣一些。能被

應(yīng)用于實(shí)際心理測量的心理測驗(yàn)才是真正有效的測驗(yàn)工具才是真正有

效的測驗(yàn)工具。

(二)心理測驗(yàn)的定義

心理測驗(yàn)就是通過觀察人的少數(shù)有代表性行為,對(duì)于貫穿在人的全部

行為活動(dòng)中心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。

心理測驗(yàn)即是依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的

行為確定出一種數(shù)量化的價(jià)值。

(三)心理測驗(yàn)的要素

1、行為樣本:對(duì)少數(shù)經(jīng)過慎重選擇的樣本進(jìn)行觀察,來間接推知被試

的心理特征。

2、標(biāo)準(zhǔn)化:是指測驗(yàn)編制、實(shí)施、記分以及測驗(yàn)分?jǐn)?shù)解釋程序的一致

性,標(biāo)準(zhǔn)化的量一個(gè)重要步驟是建立有代表性的常模。

3、客觀性:在不受被試主觀判斷支配的范圍內(nèi),測驗(yàn)的實(shí)施、評(píng)分、

解釋應(yīng)是客觀的,要盡量減少主試和被試的隨意程度。客觀性另一個(gè)

主要方面是測題或整個(gè)測驗(yàn)的難度水平的確定必須客觀。神經(jīng)心理測

驗(yàn)客觀性最高,智力測驗(yàn)較高,人格問卷次之,投射測驗(yàn)的客觀性較

低。

(四)心理測驗(yàn)的性質(zhì)

1、心理測驗(yàn)的間接性;

2、心理測驗(yàn)的相對(duì)性;

3、心理測驗(yàn)的客觀性:心理測驗(yàn)標(biāo)準(zhǔn)化包括:

①測驗(yàn)用的項(xiàng)目或作業(yè)、實(shí)測說明、實(shí)測者的言語態(tài)度及實(shí)測時(shí)的物

理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化。

②評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對(duì)反應(yīng)的量化是客觀的。

③分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的。

第三節(jié)心理測驗(yàn)的種類

一、按測驗(yàn)功能分類:

1、能力測驗(yàn):智力測驗(yàn):比內(nèi)一西蒙智力測驗(yàn)、韋克斯勒兒童和成人

智力量表。特殊能力測驗(yàn):如音樂、繪畫等

2、成就測驗(yàn):用于測量個(gè)人(團(tuán)體)經(jīng)過某種正式教育或訓(xùn)練之后對(duì)

知識(shí)和技能掌握的程度。學(xué)科測驗(yàn)

3、人格測驗(yàn):用于測量性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、

信念、價(jià)值觀等方面的個(gè)性心理特征,即個(gè)性中除能力以外的部分。

明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)、16種人格因素問卷(16PF)、艾

森克人格問卷(EPQ)、羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)(TAT)o

二、按測驗(yàn)對(duì)象分類

1、個(gè)別測驗(yàn):優(yōu)點(diǎn):主試可以仔細(xì)觀察被試的言語情緒,并有充分的

機(jī)會(huì)與被試合作,所以其結(jié)果正確可靠。缺點(diǎn):時(shí)間不經(jīng)濟(jì),不能在

短時(shí)間呢您收集到大量的資料。

2、團(tuán)體測驗(yàn):優(yōu)點(diǎn):時(shí)間經(jīng)濟(jì),主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)

任。缺點(diǎn):主試對(duì)被試的行為不能作切實(shí)的控制,所得結(jié)果不及個(gè)別

測驗(yàn)正確可靠。

三、按測驗(yàn)方式分類:

1、紙筆測驗(yàn):言語作為刺激。MMPLEPQ、16PF及韋克斯勒兒童和

成人智力量表中的言語量表部分。

優(yōu)點(diǎn):實(shí)施方便,團(tuán)體測驗(yàn)多用,有肢體殘疾而無言語困難的病人只

能用此。

缺點(diǎn):受被試文化程度的影響。

2、操作測驗(yàn):也稱非文字測驗(yàn)。羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)、瑞文

測驗(yàn)及韋克斯勒兒童和成人智力量表中的操作量表部分。

優(yōu)點(diǎn):不受文化因素的限制。

3、口頭測驗(yàn)

4、電腦測驗(yàn)

四、按測驗(yàn)?zāi)康姆诸悾?/p>

1、描述性測驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的能力、性格、興趣、知識(shí)水

平等進(jìn)行描述。

2、診斷性測驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的某種行為問題進(jìn)行診斷。

3、預(yù)示性測驗(yàn):目的在于通過測驗(yàn)分?jǐn)?shù)預(yù)示一個(gè)人將來的表現(xiàn)和所能

達(dá)到的水平。

五、按測驗(yàn)難度分類

1、速度測驗(yàn)

2、難度測驗(yàn)

六、按測驗(yàn)要求分類

1、最高作為測驗(yàn)

2、典型作為測驗(yàn)

七、按測驗(yàn)性質(zhì)分類

1、構(gòu)造性測驗(yàn):在此種測驗(yàn)中,所呈現(xiàn)的刺激和被試的任務(wù)是明確的。

2、投射性測驗(yàn):在此種測驗(yàn)中,刺激沒有明確意義,問題模糊,對(duì)被

試的反應(yīng)也沒有明確規(guī)定。

八、按測驗(yàn)解釋分類

1、常模參照測驗(yàn)

2、標(biāo)準(zhǔn)參照測驗(yàn)

九、按測驗(yàn)應(yīng)用分類

1、教育測驗(yàn)

2、職業(yè)測驗(yàn)

3、臨床測驗(yàn)

第四節(jié)心理測驗(yàn)的功能與應(yīng)用

一、心理測驗(yàn)的功能:最基本的功能是測量個(gè)體差異或行為反應(yīng)。

(-)從實(shí)際應(yīng)用角度看:

①人才選拔;

②崗位安置

③臨床診斷;

④教育評(píng)價(jià);

⑤心理咨詢和治療

(-)從理論研究角度看:

①搜集材料:心理測驗(yàn)是收集個(gè)體差異資料最快捷的辦法。

②提出和驗(yàn)證假設(shè)

③實(shí)驗(yàn)分組

二、測驗(yàn)的應(yīng)用

(-)錯(cuò)誤的測驗(yàn)觀

1、測驗(yàn)萬能論

2、測驗(yàn)無用論:

①某些人格測驗(yàn)侵犯了個(gè)人隱私;

②測驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)。

3、心理測驗(yàn)即智力測驗(yàn)

(-)正確的測驗(yàn)觀

1、重要的心理學(xué)研究方法和決策的輔助工具:心理測驗(yàn)法的出現(xiàn)是心

理科學(xué)發(fā)展史上的一大進(jìn)步,是心理學(xué)研究中不可缺少的研究方法之

O

2、作為研究方法和測量工具尚不完善:過分夸大心理測驗(yàn)的科學(xué)性和

準(zhǔn)確性是不對(duì)的。

3、科學(xué)地看待心理測驗(yàn),防止亂用測驗(yàn):

①測驗(yàn)使用者必須具備一定的資格;

②慎重選擇測驗(yàn)量表;

③與被試建立良好的協(xié)調(diào)關(guān)系;

④正確解釋測驗(yàn)結(jié)果;

⑤注意測驗(yàn)的保密。

第二章心理測驗(yàn)的編制

[教學(xué)目的與要求]

(1)掌握心理測驗(yàn)編制的一般程序

(2)心理測驗(yàn)的難度與區(qū)分度的定義及

[教學(xué)重點(diǎn)與難點(diǎn)]心理測驗(yàn)的項(xiàng)目分析

第一節(jié)編制測驗(yàn)的一般程序

一、確定測驗(yàn)?zāi)康?/p>

(-)心理測驗(yàn)的對(duì)象:首先要明確測量的對(duì)象,也就是測驗(yàn)編成后要

用于哪些團(tuán)體。

A年齡

B教育水平:在編制兒童測驗(yàn)時(shí),要同時(shí)考慮教育水平和年齡的影響。

在承認(rèn)測驗(yàn)中,一般只考慮教育水平的影響。

C文化背景

(-)測驗(yàn)的目標(biāo):是指編制的測驗(yàn)是測什么的,即用來測量什么樣

的心理變量或行為特征。目標(biāo)分析以測驗(yàn)不同而異,一般分為三種情

況:

A工作分析:主要任務(wù)是對(duì)所預(yù)測的行為活動(dòng)作具體分析,我們稱之

為任務(wù)分析或工作分析。

B對(duì)特定概念下定義:如果測驗(yàn)是為了測量某種特殊的心理品質(zhì)或特

點(diǎn),那么測驗(yàn)編制者就必須給所要測量的心理或行為特質(zhì)下定義,然

后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行

測量。

C確定測驗(yàn)的具體內(nèi)容:如果測驗(yàn)是描述性的顯示測驗(yàn),它的目標(biāo)分

析的主要任務(wù)則是確定顯示的內(nèi)容和技能。

(三)測驗(yàn)用途:所編出的測驗(yàn)是要對(duì)被試做描述,還是做診斷,抑

或是選拔和預(yù)示。

二、擬定編制計(jì)劃

編制計(jì)劃,實(shí)際上是對(duì)測驗(yàn)的總體設(shè)計(jì),指出測驗(yàn)的內(nèi)容結(jié)構(gòu)和項(xiàng)目

形式等,以及對(duì)每個(gè)內(nèi)容、目標(biāo)的相對(duì)重視程度。

根據(jù)布魯姆最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)分成

認(rèn)知、精神運(yùn)動(dòng)和情感三個(gè)領(lǐng)域,又把認(rèn)知領(lǐng)域具體分為知識(shí)、理解、

應(yīng)用、分析和綜合、評(píng)價(jià)。

三、設(shè)計(jì)測試項(xiàng)目

(-)搜集有關(guān)資料

1、資料要豐富

2、資料要有普遍性

(-)選擇項(xiàng)目形式

1、測驗(yàn)的目的和材料性質(zhì)

2、接受測驗(yàn)的團(tuán)體的特點(diǎn)

3、各種實(shí)際因素:時(shí)間,人數(shù)、經(jīng)費(fèi)等

(三)編寫和修訂項(xiàng)目

1、項(xiàng)目的范圍要與測驗(yàn)計(jì)劃相一致

2、項(xiàng)目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復(fù)

3、項(xiàng)目的難度必須符合測驗(yàn)?zāi)康男枰?/p>

4、項(xiàng)目的說明必須清楚

四、項(xiàng)目的試測和分析

(-)試測

1、預(yù)測對(duì)象應(yīng)取自將來正式測驗(yàn)準(zhǔn)備應(yīng)用的群體

2、預(yù)測的實(shí)施過程與情境應(yīng)力求與將來正式測試時(shí)的情況相近似

3、預(yù)測的時(shí)限可稍寬一些,最好使每個(gè)被試都能將項(xiàng)目做完,以搜集

較充分的反應(yīng)資料-,使統(tǒng)計(jì)分析的結(jié)果更為可靠。

4、在預(yù)測過程中應(yīng)隨時(shí)記錄被試的反應(yīng)情形,如在不同時(shí)限內(nèi)一般被

試所完成的題數(shù)、題意不清之處及其他有關(guān)問題。

(-)項(xiàng)目分析

包括質(zhì)的分析和量的分析

質(zhì)的分析是從內(nèi)容取樣的適當(dāng)性、題目的思想性以及表達(dá)是否清楚等

方面加以分析。

量的分析是對(duì)預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度、區(qū)分度、備

選答案的適宜性等。

五、合成測驗(yàn)

1、項(xiàng)目的選擇:要考慮測驗(yàn)的目的、性質(zhì)與功能,區(qū)分度,難度

2、項(xiàng)目的編排:由易到難,有并列直進(jìn)式,混合螺旋式

A一般原則:a測題的難度排列易逐步上升;b盡可能將同類型的測題

組合在一起;c各種類型測題本身的特點(diǎn);

B常見試題排列方式:a并列直進(jìn)式b混合螺旋式

3、編造復(fù)本

測驗(yàn)的各份復(fù)本必須等值,所謂等值需符合下列幾個(gè)條件:

(1)各份測驗(yàn)測量的是同一種心理特質(zhì);

(2)各份測驗(yàn)包含相同的內(nèi)容范圍,但題目不應(yīng)有重復(fù);

(3)各份測驗(yàn)題型相同,題目數(shù)量相等,并且有大體相同的難度分布。

六、測驗(yàn)使用的標(biāo)準(zhǔn)化

1、施測過程標(biāo)準(zhǔn)化

2、評(píng)分計(jì)分標(biāo)準(zhǔn)化

3、分?jǐn)?shù)解釋標(biāo)準(zhǔn)化

七、搜集信度、效度資料

(-)信度

指的是測量的可靠性或一致性。

(-)效度

指的是測量的有效性或正確性。

A搜集有關(guān)資料:題目的有關(guān)來源

a已出版的標(biāo)準(zhǔn)測驗(yàn)

b理論和專家的經(jīng)驗(yàn)

C臨床觀察和記錄

B命題的原則及編寫要領(lǐng)

a命題的原則(理解):

O1內(nèi)容方面:符合測驗(yàn)的目的,取樣有代表性,相互獨(dú)立,互不牽掛;

02文字方面:準(zhǔn)確,簡明扼要,少使用雙重否定句;

03理解方面:不要超出受測團(tuán)體的知識(shí)水平和理解能力,不要有爭議

誤解;

04社會(huì)敏感性方面:應(yīng)盡量避開社會(huì)敏感性問題,如涉及社會(huì)禁忌或

個(gè)人隱私的題目不應(yīng)使用。

菲利普對(duì)于涉及社會(huì)敏感性問題,怎樣鼓勵(lì)被試作出真實(shí)回答的策略:

O1命題時(shí)假定被試具有某種行為,使他不得不在確實(shí)沒有該行為時(shí)才

否定,可避免否定過多的傾向。

?2命題時(shí)假定規(guī)范不一致。

?3指出該行為是常見的,雖然是違規(guī)的。

b測題的編制要領(lǐng):根據(jù)被試的要求不同分為

O1提供型:要求被試給出正確答案。

02選擇題:要求被試在有限幾個(gè)答案中選擇正確的答案。由題干和選

項(xiàng)構(gòu)成。

題干:呈現(xiàn)一個(gè)問題的情境,一般由直接問句或不完全的陳述句構(gòu)成。

選項(xiàng):問題的多種可能答案,常常是包含一個(gè)正確答案,若干(一般

是1?5個(gè))錯(cuò)誤答案,其中的錯(cuò)誤的答案叫做“誘答”。

八、編寫測驗(yàn)手冊

1、本測驗(yàn)的目的和功用

2、測驗(yàn)的理論背景以及選擇項(xiàng)目的根據(jù)

3、測驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng)

4、測驗(yàn)的標(biāo)準(zhǔn)答案和記分方法

5、常模表或其他有助于分?jǐn)?shù)轉(zhuǎn)化與解釋的資料

6、測驗(yàn)的信度、效度資料?,包括信度系數(shù)、效度系數(shù)以及這些數(shù)據(jù)是

在什么情境下得到的

第二節(jié)測驗(yàn)的項(xiàng)目分析

一、項(xiàng)目的難度分析

(-)定義:

1、難度:是指項(xiàng)目的難易程度。P在能力測驗(yàn)中通常需要一個(gè)反映難

度水平的指標(biāo),在非能力測驗(yàn)中,類似的指標(biāo)是“通俗性”,即取自相

同總體的樣本中,能在答案方向上回答該題的的人數(shù)。

P=&

2、難度的指標(biāo):N

以通過率表示難度時(shí)?,通過人數(shù)越多,即P值越大,難度就越低;P

值越小,難度越高。因?yàn)镻值大小與難度高低成反比,有人將其稱

作易度。

(二)難度的計(jì)算

1、原始定義法

p=—

(1)客觀試題(二分法記分):N

R:答對(duì)該題的人數(shù);N:參加測驗(yàn)的總?cè)藬?shù)

由于選擇題允許猜測,所以通過率可能因機(jī)遇作用而變大。備選答案

的數(shù)目越少,機(jī)遇的作用越大,越不能真正反映測驗(yàn)的難度。為此,

…KP-l

CP=--------

吉爾福特提出了一個(gè)P值校正公式。K-1

CP:校正后的難度值;P:實(shí)際得到的通過率;K:選項(xiàng)數(shù)目

例題:假定某題有75%的被試通過,若該題有5個(gè)備選答案,則校正

后的通過率為:

當(dāng)有4個(gè)備選答案時(shí),CP=0.67;有3個(gè),CP=0.63;有2個(gè),CP=0.54)

b非二分記分:例題某一數(shù)學(xué)能力測驗(yàn)題的滿分為20分,全體被試在

該題上的平均分?jǐn)?shù)為15分,則該題的難度為:P=15/20=0.75

例:一個(gè)題目的難度值為0.75,分別計(jì)算此題有四個(gè)選項(xiàng)、三個(gè)選項(xiàng)、

兩個(gè)選項(xiàng)時(shí)大的難度值

p=X

(2)主觀題的平均數(shù)法

2、極端分組法

(1)客觀題的極端分組法

根據(jù)測驗(yàn)分?jǐn)?shù)按高低排序,用兩個(gè)極端組在某項(xiàng)目上的平均通過率表

p=「H'PL

示項(xiàng)目的難度—2PH、PL分別為高分組與低分組的通過率。

步驟:

A、按測驗(yàn)總分由高到低排序

B、從高分段向下選出全部試卷的27%作為高分組

C、從低分段向上選出全部試卷的27%作為低分組

D、按照上述公式計(jì)算項(xiàng)目難度值

例:100人參加某測驗(yàn),高分組與低分組各取27人,其中第一題高分

組20人答對(duì),低分組10人答對(duì)。這道題的難度系數(shù)是多少?

(2)主觀題的極端分組法

步驟:

A、按測驗(yàn)總分由高到低排序

B、從高分段向下選出全部試卷的25%作為高分組

C、從低分段向上選出全部試卷的25%作為低分組

D、按照上述公式計(jì)算項(xiàng)目難度值

P;XH+X「2NL

2N(H-L)

XH:高分組所得總分;

XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總

人數(shù)的25%

(三)難度對(duì)測驗(yàn)的影響

1、難度對(duì)測驗(yàn)分?jǐn)?shù)分布的影響

(DP值越小一測驗(yàn)項(xiàng)目越難一測驗(yàn)分?jǐn)?shù)集中在低分端一分?jǐn)?shù)分布呈

正偏態(tài)分布。

(2)P值越大一測驗(yàn)項(xiàng)目越易一測驗(yàn)分?jǐn)?shù)集中在高分端一分?jǐn)?shù)分布呈

負(fù)偏態(tài)分布。

即:測驗(yàn)項(xiàng)目過份容易或過份難,都會(huì)造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分

布,而使測驗(yàn)分?jǐn)?shù)的離散程度變小。

2、難度對(duì)測驗(yàn)鑒別力的影響

測驗(yàn)的主要功效之一就是鑒別考生實(shí)際水平的高低。自欺欺人適量難

度可以加大考生得分的差異,從而提高測驗(yàn)的鑒別力。

P值越接近0.50,試題的鑒別能力就越高;相反,P值越接近1.00或0,

試題的鑒別能力就越低。

3、難度與測驗(yàn)?zāi)康牡年P(guān)系

項(xiàng)目難度應(yīng)根據(jù)測驗(yàn)?zāi)康膩泶_定,不能認(rèn)為測驗(yàn)項(xiàng)目都必須保持值等

于0.50最好。事實(shí)上,一方面,如果每個(gè)項(xiàng)目的難度都等于0.50,測

驗(yàn)項(xiàng)目之間存在高度相關(guān),會(huì)使測驗(yàn)分?jǐn)?shù)的分布呈雙峰狀態(tài),即有5%

的人所有題目都答對(duì),得滿分,另外5%的人全部答錯(cuò),得0分。

為此,難度水平的確定應(yīng)根據(jù)測驗(yàn)的目的,性質(zhì)及題目的形成。

(1)對(duì)于一般的常模、參照測驗(yàn)而言,其目的在于測量個(gè)體差異,一

般只要求測驗(yàn)題目的平均難度為0.50,而個(gè)題難度可在0.50+0.20之

間。

(2)當(dāng)測驗(yàn)用與選拔或診斷時(shí),題目的難度值應(yīng)更多地接近錄取率。

(3)就選擇題而言,P值應(yīng)大于概率水平。P值若等于概率,說明被

試純粹憑猜測作答;P值若小于概率,說明題目很可能存在問題。

(4)整個(gè)測驗(yàn)的難度水平取決于組成測驗(yàn)的題目的難度。

(四)難度的轉(zhuǎn)換

難度指出的僅僅是題目的相對(duì)難度,不能客觀地指出題目難度之間差

異大小

P向Z的轉(zhuǎn)換

n假定每個(gè)試題所要測量地潛在特質(zhì)或能力是呈正態(tài)分布的,可將P

值作為正態(tài)曲線下的概率面積,以此轉(zhuǎn)換成Z分?jǐn)?shù)

二、項(xiàng)目的區(qū)分度D

(-)區(qū)分度的概念

區(qū)分度是測驗(yàn)對(duì)被試實(shí)際水平的區(qū)分程度。是測驗(yàn)項(xiàng)目分析的重要內(nèi)

是作為評(píng)價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù)

通常用D表示,取值范圍為+1.00至-1.00

D越高時(shí),試題的質(zhì)量越好,D值范圍在-1.00和+1.00之間,值越大,

試題的區(qū)分能力越強(qiáng)。當(dāng)D為正值時(shí),說明試題是積極區(qū)分,即高分

組通過率高,低分組通過率低。為D負(fù)值時(shí),說明試題有消極區(qū)分,

高組通過率低,低組通過率高。D為0時(shí),說明試題無區(qū)分用

(二)區(qū)分度對(duì)測驗(yàn)的影響

1.區(qū)分度與難度的關(guān)系

1試題的區(qū)分度與難度有密切關(guān)系。試題難度過大或過小,其區(qū)分度都

較低。當(dāng)難度值為1.00或0時(shí),高分組和低分組或全部通過得滿分,

或全部未通過得0分,這時(shí)區(qū)分度都為0分。這兩種情況,都表示試

題沒有鑒別考生水平高低的能力。所以,調(diào)整試題難度是提高試題區(qū)

分度的重要方法。右表可說明難度與區(qū)分度的關(guān)系。

5?厘(P)

1.OOO.OO

O.QOO.20

O.-7OO.0O

O.501.OO

O.30O.do

0.10O.NO

O.OOO.OO

A、假如樣本中通過某一項(xiàng)目的人數(shù)比率為1.00或0,說明高分組與低

分組在通過率上不存在差異,因此D為0;假如項(xiàng)目的通過率為0.50,

則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的

最大值可能達(dá)到l.OOo

B、為了使整個(gè)測驗(yàn)項(xiàng)目的潛在區(qū)分度最大,似乎應(yīng)該使每個(gè)項(xiàng)目的難

度處于0.50水平,但事實(shí)并非如此簡單。如果每一個(gè)項(xiàng)目的難度均處

于0.50,由于項(xiàng)目難度相同,有可能大多趨向于有關(guān)的內(nèi)容或技能,

結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下,有可能50%的被試全部通

過各項(xiàng)目得滿分,另外50%的被試全部為。分,形成U形分布,這樣

反而降低總分的區(qū)分能力。如果測驗(yàn)的所有項(xiàng)目都是中等難度,只有

項(xiàng)目的內(nèi)在相關(guān)為0時(shí),整個(gè)測驗(yàn)才能產(chǎn)生常態(tài)分布。考慮到一般測

驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些,梯度多一些,

是合乎需要的。

2.區(qū)分度與信度的關(guān)系

O.1NN50.00

0.16OYN

0.20

0.30O.W夕

0.-^00.915

O.SOO.OV。

一個(gè)良好的測驗(yàn),信度必須要高。測驗(yàn)的信度與項(xiàng)目的區(qū)分度有著密

切的關(guān)系,事實(shí)上,由試題的區(qū)分度還可以估計(jì)測驗(yàn)的信度。整個(gè)測

驗(yàn)中各試題的區(qū)分度值的平均數(shù)越高,測驗(yàn)的信度就越高。值的平均

數(shù)與信度的關(guān)系如右表。

(三)區(qū)分度計(jì)算方法

1、極端分組法

(1)客觀性試題區(qū)分度的計(jì)算公式:D=PH-PL

按測驗(yàn)總分從高到低排序

確定測驗(yàn)總分最高的27%的被試作為高分組,最低的27%的被試為低

分別求出這兩組被試通過試題的百分比

(2)主觀性試題區(qū)分度的計(jì)算公式:N(H-L)

說明:XH:高分組所得總分;XL:低分組所得總分;H:該題最高

分;L:該題最低分;N:考生總?cè)藬?shù)的25%

步驟:

按測驗(yàn)總分由高到低排序;分別確定測驗(yàn)總分的25%、25%作為高低

分組;列出試題分析表;將數(shù)據(jù)帶入以上公式加以計(jì)算

2、相關(guān)法

考慮中間數(shù)據(jù)

以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(效標(biāo)分?jǐn)?shù)不易得到時(shí),以測驗(yàn)總分代替)的

相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)

相關(guān)越高,區(qū)分能力越好

具體方法:

①點(diǎn)二列相關(guān):適用于一類變量為二分稱名變量,另一類變量為連續(xù)

變量的成對(duì)變量的相關(guān)計(jì)算。

②二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類。

③相關(guān):適用于兩個(gè)變量均為二分稱名變量。

積差相關(guān)法,點(diǎn)二列相關(guān),二列相關(guān),牛相關(guān)

區(qū)分度許價(jià)

04。肚域弱

0.3H.39眠如微枷更隹

0.2H.29尚可,仍需赧1

0.19以下徽必衡微或加以赧

提高區(qū)分度的方法

使試題的難度適中,使整個(gè)考試難度適中

著重考察復(fù)雜的學(xué)習(xí)結(jié)果

區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)

以上標(biāo)準(zhǔn)僅作參考,不是絕對(duì)的。事實(shí)上,項(xiàng)目區(qū)分度的要求應(yīng)根據(jù)

測驗(yàn)?zāi)康亩?,若測驗(yàn)?zāi)康脑谟谶x人,主要評(píng)判被試的個(gè)別差異,那

么區(qū)分度要求高些;若測驗(yàn)只是考察被試對(duì)所學(xué)知識(shí)的掌握情況,可

不過多考慮區(qū)分度。

三、項(xiàng)目分析的特殊問題

(-)選擇題反應(yīng)模式的分析

對(duì)于選擇題,除了分析其難度的區(qū)分度外,還要分析被試對(duì)每個(gè)備選

答案的反應(yīng)情況。一般要做以下分析:

1、如果正確的備選答案被所有被試所選擇,則說明該題目太易或者題

目中可能提供了某種暗示;

2、如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇,說明該選項(xiàng)不具迷惑性,錯(cuò)

得過于明顯,一般說來,除非有2%以上的人選擇,否則這個(gè)備選答案

就應(yīng)該修改。

3、如果所有被試的選擇了同一個(gè)錯(cuò)誤答案,可能是編制測驗(yàn)時(shí)把答案

定錯(cuò)了,也可能是教學(xué)中發(fā)生了錯(cuò)誤。

4、如果所有被試的選擇集中在兩個(gè)答案上,二者選擇率相近,,說明

該題可能有兩個(gè)正確答案或另一個(gè)答案也有一定道理。

5、如果高分組對(duì)正確答案的選擇與低分組相等或低于,說明所考察的

東西與水平無關(guān)。

6、如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)備選答案人數(shù)相等則說

明題目過難或題意不清。

(二)標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析

標(biāo)準(zhǔn)參照測驗(yàn)主要用于判斷被試是否掌握了某些知識(shí)技能,是達(dá)到了

一個(gè)事先確定的標(biāo)準(zhǔn),測驗(yàn)結(jié)果只與既定標(biāo)準(zhǔn)比較而不在被試之間作

比較。因此測驗(yàn)分?jǐn)?shù)的變異性不是標(biāo)準(zhǔn)參照測驗(yàn)的必要條件。所以,

常模參照測驗(yàn)的項(xiàng)目分析方法不完全適用于標(biāo)準(zhǔn)參照測驗(yàn)。

1、難度分析

標(biāo)準(zhǔn)參照測驗(yàn)可以采用常模參照測驗(yàn)的方法計(jì)算難度,但是在篩選項(xiàng)

目時(shí),對(duì)難度水平的要求與常模參照測驗(yàn)不同。

由于標(biāo)準(zhǔn)參照測驗(yàn)的目的是為了考察被試對(duì)某方面的知識(shí)技能的掌握

情況,因此,只要能反映教育目標(biāo)或教育者認(rèn)為重要的內(nèi)容,無論其

難度為多少,都可以編入測驗(yàn)。

2、區(qū)分度分析

標(biāo)準(zhǔn)參照測驗(yàn)一般分?jǐn)?shù)變異較小,不適合用相關(guān)法來計(jì)算區(qū)分度,但

是可以采用鑒別指數(shù)的方法計(jì)算,即比較兩組的通過率。

方法一

根據(jù)測驗(yàn)分?jǐn)?shù)將被試分為達(dá)標(biāo)組與未達(dá)標(biāo)組,然后分別計(jì)算它們在某

一項(xiàng)目上的通過率,兩組考生通過率之差,便是該項(xiàng)目的區(qū)分度,其

公式為:

D=ps-pn

式中ps、pn為達(dá)標(biāo)組與未達(dá)標(biāo)組在某一項(xiàng)目上的通過率。

這種方法主要的問題是分組標(biāo)準(zhǔn)不同,得到的區(qū)分度值不同。

方法二

用同一測驗(yàn)對(duì)同一組被試在教學(xué)前后各施測一次,分別統(tǒng)計(jì)各項(xiàng)目前

后測的通過率,二者之差便是項(xiàng)目的區(qū)分度。其公式為:

D=ppost-ppre

D值越高,說明項(xiàng)目對(duì)教學(xué)效果越敏感,所以有人將其稱做教學(xué)效果

敏感指數(shù),其公式也可寫為

其中S為敏感指數(shù),RA、RB分別為前測、后測通過人數(shù),N為總?cè)?/p>

數(shù)。

此種方法的主要缺點(diǎn)是:(1)同一測驗(yàn)施測兩次可能會(huì)產(chǎn)生練習(xí)效應(yīng),

成績的提高究竟是由教學(xué)引起的,還是由練習(xí)引起的難以分辨;(2)

只有等兩次施測后才能進(jìn)行項(xiàng)目分析;(3)當(dāng)D值低時(shí),難于做出明

確的解釋,無法確定是由試題不良還是由教學(xué)不當(dāng)所致。

式中ppost.ppre分別為項(xiàng)目在后測和前測中的通過率。

方法三

取兩組條件相近的考生,一組接受過同測驗(yàn)有關(guān)的學(xué)科教學(xué),另一組

沒有接受過此種教學(xué)。施測同一測驗(yàn)后,分別統(tǒng)計(jì)每組考生答對(duì)某題

的人數(shù),兩組考生通過率之差便是該題的區(qū)分度。公式為D=pi-pu

式中pi、pu分別為教學(xué)組和未經(jīng)教學(xué)組對(duì)某題的通過率。

此方法的缺點(diǎn)是,兩組考生除在教學(xué)方面不同外在其他有關(guān)方面必須

同質(zhì),而這一點(diǎn)是難以做到的。

項(xiàng)目特征曲線:是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式,它反映

了被試對(duì)某一測驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)

的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項(xiàng)目分析,而且也

適用于某些測驗(yàn)量表的編制。

A項(xiàng)目特征曲線可圖解測驗(yàn)的鑒別力,項(xiàng)目鑒別力的高低主要在于其

曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預(yù)測的誤差越小。

B項(xiàng)目特征曲線可以圖解項(xiàng)目難度。

C項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。

第三章測量的誤差及其檢驗(yàn)

[教學(xué)目的與要求]

(1)了解測量誤差的種類與來源

(2)掌握信度的定義、意義及其估計(jì)方法

(3)掌握效度的定義、意義及其估計(jì)方法

[教學(xué)重點(diǎn)與難點(diǎn)]信度與效度的估計(jì)

第一節(jié)測量的誤差

一、誤差的種類

(-)誤差的定義

誤差是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)

果。

(二)誤差的種類

1、隨機(jī)誤差:與測量目的無關(guān)的偶然因素引起的變化規(guī)律的誤差,使

得多次的測量結(jié)果不一致,這種誤差的大小和方向是隨機(jī)的。既影響

測量的準(zhǔn)確性又影響一致性。

2、系統(tǒng)誤差:與測量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差,它

穩(wěn)定地存在于每一次測量中。只影響測量的準(zhǔn)確性。

二、誤差的來源

(-)測驗(yàn)自身引起的誤差

主要來源于測驗(yàn)的編制過程,其中項(xiàng)目取樣影響最大。

(-)施測過程引起的誤差

1、測試環(huán)境

2、測試時(shí)間

3、主試因素

4、意外干擾

5、評(píng)分記分

(三)被試引起的誤差

1、應(yīng)試動(dòng)機(jī)

2、測驗(yàn)焦慮

3、測驗(yàn)經(jīng)驗(yàn)

4、練習(xí)效應(yīng)

5、反應(yīng)傾向

6、生理變因

三、真分?jǐn)?shù)

(-)含義

真分?jǐn)?shù)是指測量沒有誤差時(shí)所得到的真值。其操作定義是無數(shù)次測量

結(jié)果的平均值。

(-)數(shù)學(xué)模型及其假設(shè)

1、CTT模型——經(jīng)典測驗(yàn)理論假定,觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)

之間是一種線性關(guān)系,并只相差下個(gè)隨機(jī)誤差(E),即乂=丁+£這里的

測量誤差E指的是引起測量不一致的變因所產(chǎn)生的效應(yīng),即指隨機(jī)誤

差,不包括系統(tǒng)誤差。

分析假設(shè)公理:

(1)若一具人的某種心理特質(zhì)可以用平行的測驗(yàn)分?jǐn)?shù)反復(fù)測量足夠多

次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即E(X)=T或E(E)

=10

(2)真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。

即P(T,E)=0

(3)各平行測驗(yàn)上的誤差分?jǐn)?shù)之間的相關(guān)為零。

2、引申:

(1)在一次測量中,被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分

數(shù)方差之和。S2X=ST2+S2E

(2)真分?jǐn)?shù)可以分成兩部分:與測量目的有關(guān)變異S2V和與測量目的

無關(guān)的變異S2L即:ST2=S2V+S2I

(3)一次測驗(yàn)中,一個(gè)團(tuán)體的實(shí)測分?jǐn)?shù)之間的變異性是由與測量目的

有關(guān)的變異數(shù)SV2、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和測量誤差

的變異數(shù)SE2所決定的。

即:S2X=SV2+SI2+SE2

第二節(jié)信度(reliability)

一、什么是信度

定義:指的是測量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在

不同時(shí)間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)

果的一致程度。

1、理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測驗(yàn)的實(shí)得分?jǐn)?shù)(X)總

是由真實(shí)分?jǐn)?shù)(T)和誤差(E),兩個(gè)部份構(gòu)成的,公式為:

X=T+E

討論一組測驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差導(dǎo)標(biāo)具體分?jǐn)?shù),公式:

(測驗(yàn)實(shí)得分?jǐn)?shù)的方差)=(測驗(yàn)真分?jǐn)?shù)的方差)+(測驗(yàn)誤差的方

差)

2、操作定義:

定義1:一組測量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差)與總變異數(shù)(總方差、

實(shí)得分?jǐn)?shù)的方差)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。

計(jì)算公式:

rxx=ST2/SX2

定義2:信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平

方。即

rxx=ptx2

定義3:信度乃是一個(gè)測驗(yàn)X(A卷)與它的任意一個(gè)“平行測驗(yàn)”

X/(B卷)的相關(guān)系數(shù)。即rxx=pXX'2

二、信度的指標(biāo)

(一)信度系數(shù):大部分情況下,信度是信度系數(shù)為指標(biāo),它是一種

相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式

是:rxx=ptx2

(-)信度指數(shù):是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值,公式

是:

信度指數(shù)的平方就是信度系數(shù)rxx=ST2/SX2

(三)標(biāo)準(zhǔn)誤:指出個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。信度系數(shù)表示一組測量

的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,標(biāo)注誤表示個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。

用一組被試兩次測量結(jié)果來代替同一個(gè)人反復(fù)實(shí)測,有了信度的另一

個(gè)指標(biāo):

測量標(biāo)準(zhǔn)誤。測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系:標(biāo)準(zhǔn)誤越小,信

度越;標(biāo)準(zhǔn)誤越大,信度越低。

三、信度與測驗(yàn)分?jǐn)?shù)的解釋

(-)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)

(二)比較信度可以接受的水平

(三)解釋個(gè)人分?jǐn)?shù)的意義:

(四)比較不同測驗(yàn)分?jǐn)?shù)的差異:

四、信度的類型及估計(jì)方法

(-)重測信度(再測信度):

1、含義與計(jì)算

又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測法,即使用同一測驗(yàn),在

同樣條件下對(duì)同一組被試前后施測兩次測驗(yàn),求兩次得分間的相關(guān)系

_YXY-NXY

數(shù)?!耙籒w

2、使用的前提條件

(1)所測量的心理特性必須是穩(wěn)定的。

(2)遺忘和練習(xí)的效果基本上相互抵消。

(3)在時(shí)間間隔中沒有學(xué)習(xí)另外的與測驗(yàn)有關(guān)的東西,或者說每人學(xué)

習(xí)其他東西的程度都一樣。

3、優(yōu)缺點(diǎn):

優(yōu)點(diǎn):

它最符合重復(fù)測驗(yàn)的涵義,是重復(fù)測驗(yàn)最簡單最明確的方式

(2)首測和再測只需要一套測驗(yàn)題目,省時(shí),省力

(3)同一套題目無論施測兒次,所測的屬性是完全相同的。

缺點(diǎn):

(1)同一組被試對(duì)同一個(gè)測驗(yàn)先后兩次作答相互之間是不獨(dú)立的。

(2)如果兩次施測時(shí)間間隔較長,在此期間被試的身心發(fā)展,新知識(shí)

的獲得,都會(huì)使兩次測驗(yàn)結(jié)果不相同。

(3)同一個(gè)被試對(duì)現(xiàn)一個(gè)測驗(yàn)先后兩次作答,對(duì)測驗(yàn)的興趣不同,影

響測驗(yàn)結(jié)果。

(4)兩次施測的環(huán)境不同,也是產(chǎn)生測量誤差的因素。

(二)復(fù)本信度(Alternate-formreliability)

1、含義與計(jì)算:

含義:又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測驗(yàn)(等值但題目

不同)來測量同一群體,然后求得被試在兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù),

這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗(yàn)在內(nèi)

容上的等值性,故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測

驗(yàn)的選擇。

2、使用的前提條件:

(1)要兩份或兩份以上真正平行的測驗(yàn)

(2)被試要有條件接受兩個(gè)測驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。

3、優(yōu)缺點(diǎn):

優(yōu)點(diǎn):

(1)一個(gè)測驗(yàn)的復(fù)本使得測驗(yàn)數(shù)目的增加,對(duì)于所欲測量的屬性相聯(lián)

系的行為總體代表性強(qiáng),因此,一個(gè)測驗(yàn)的兩個(gè)復(fù)本在兩三天至一周

對(duì)同一組被試施測時(shí),獲得的復(fù)本信度系數(shù)是相當(dāng)準(zhǔn)確的。

(2)測驗(yàn)的兩個(gè)復(fù)本,如果在不同時(shí)間使用,其信度不僅可以反映在

不同時(shí)間的穩(wěn)定性,而且還可以反映對(duì)于不同測題的一致性。

(3)兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測驗(yàn)信度的缺點(diǎn)。

缺點(diǎn):

(1)編制兩個(gè)完全相等的測驗(yàn)是很困難的,

(2)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。

(3)被試同時(shí)接受性質(zhì)相似的兩個(gè)測驗(yàn)可能減少完成測驗(yàn)的積極性。

4、適用范圍

(1)如果兩個(gè)復(fù)本的施測相隔一段時(shí)間,則稱穩(wěn)定與等值系數(shù)。穩(wěn)定

與等值系數(shù)既考慮了測驗(yàn)在時(shí)間上的穩(wěn)定性,也考慮了不同題目樣本

反應(yīng)的一致性,因而是更為嚴(yán)格的信度考察方法,也是應(yīng)用較為廣泛

的方法。

(2)在實(shí)際應(yīng)用時(shí),為了抵消施測順序的效應(yīng),應(yīng)該有半數(shù)的被試先

作A本再作B本,另一半被試先作B本再作A本。

(3)復(fù)本測驗(yàn)不僅適用于難度測驗(yàn),也是估計(jì)速度測驗(yàn)信度的最好方

法。

(三)分半信度(split-halfreliability)

1、含義與計(jì)算

指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種

測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分

為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,求出這兩

半分?jǐn)?shù)的相關(guān)系數(shù)。

常見的是將測題按其序列號(hào)的奇偶分,這種分法的前提是:測題并非

隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,

則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測驗(yàn)

有多個(gè)分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組

合起來求相關(guān)。

2、計(jì)算

(1)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性)

先計(jì)算兩半測驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行校正。常用的修正公式是:

r=2%,

斯皮爾曼-布朗公式:“-1+如

(2)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊),可采用:

弗朗那根公式I工J

r=l-4

s.

或盧倫公式其中s;為兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù),s;為測驗(yàn)總分的變異數(shù).中的

任----個(gè)。

例題:對(duì)初一年級(jí)學(xué)生進(jìn)行地理成績測驗(yàn),每答對(duì)1題得1分,答錯(cuò)1

題得0分,測題從易到難排列如表所示,試估計(jì)該測驗(yàn)的分半信度。

學(xué)12345678910

奇1022132213

數(shù)

分X

偶0101123223

數(shù)

分Y

總1123255436

由計(jì)算器算得a=1.7,4=0.9468,7=1.5,<TV=1.08012

Sxy=30,<r,=1.75119

尸=4=-

3、使用條件及范圍

分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。而且,在

使用斯皮爾-布朗公式時(shí)要求全體被試在兩半測驗(yàn)上得分的變異數(shù)要相

等。當(dāng)一個(gè)測驗(yàn)無法分成對(duì)等的兩半時(shí),分半信度不宜使用。

(四)同質(zhì)性信度(homogeneityreliability)

1、含義:指測驗(yàn)內(nèi)部所有題目間的一致性。

題目的一致性有兩層含義:其一是指所有題目都測的是同一種心理特

質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊?,同質(zhì)性信度

就是一個(gè)測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。

2、測量同質(zhì)性的基本公式:

%一

1+(1)虧

其中K為構(gòu)成測驗(yàn)的項(xiàng)目數(shù),虧為項(xiàng)目間相關(guān)系數(shù)的平均數(shù),%為同質(zhì)性信度值.

3、庫德-理查遜公式:適用于客觀性試題(0、1記分)

K-ao公式:

K表示構(gòu)成測驗(yàn)的題目數(shù),Pj為通過第i題的人數(shù)比例,q1為未通過第i題的人數(shù)比例為測驗(yàn)總分的變異:

K-4I公式:

kS^-X(k-X)

二-d)s;-

K表示構(gòu)成測驗(yàn)的題目數(shù),又為測驗(yàn)總分的平均數(shù),s:為測驗(yàn)總分的變異數(shù).

3、克倫巴赫系數(shù)(多重記分測驗(yàn))

其中K為測驗(yàn)的題目數(shù),S:為某一題目分?jǐn)?shù)的變異數(shù),S;為測驗(yàn)總分的變異數(shù).

例題:某態(tài)度量表共7題,100個(gè)被試在各題上的得分方差分別是

0.81,0.82,0.79,0.83,0.85,0.76,0.77,測驗(yàn)總分的方差為14.00,則此測量的

的信度為0.70.

4、注意:

當(dāng)各個(gè)測題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,

測驗(yàn)即為同質(zhì)的;若所有題目看起來好像測量的是同一特質(zhì),但相關(guān)

很低或?yàn)樨?fù)相關(guān)時(shí).,測驗(yàn)即為異質(zhì)的。

對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測驗(yàn)是不行

的,因而常常采用若干相對(duì)異質(zhì)的分測驗(yàn),并使每個(gè)分測驗(yàn)內(nèi)容具有

同質(zhì)性,這樣每個(gè)分測驗(yàn)就能用來預(yù)測異質(zhì)效標(biāo)的某一方面。

(五)評(píng)分者信度(scorerreliability)

1、含義與計(jì)算:指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致

性程度。是用于測量不同評(píng)分者之間所產(chǎn)生的誤差。

^K2(N3-N)

式中W為和諧系數(shù),K為評(píng)分者的人數(shù),N為被評(píng)對(duì)象數(shù),RI為每一

對(duì)象被評(píng)的等級(jí)總和。

例子:假設(shè)有三位專家給六篇論文評(píng)等級(jí),結(jié)果如表所示,試計(jì)算此

次評(píng)分者的評(píng)分者信度。

C家123456

1241563

2341562

3351462

Ri813314187

解:分別求出各篇論文等級(jí)之各Ri,

則有ZR:=63,ZR:=811,k=3,n=6

LK2(N3-N

121

=0.95

2、注意的問題:為了衡量評(píng)分者之間的信度高低,可隨機(jī)抽取若干份

測驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測驗(yàn)卷

的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練

的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)

評(píng)分者評(píng)定多個(gè)對(duì)象,并以等級(jí)法記分時(shí),可采用肯德爾和諧系數(shù)作

為評(píng)分者信度的估計(jì)。

五、標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)

1、對(duì)相關(guān)法信度系數(shù)進(jìn)行校正

為了對(duì)標(biāo)準(zhǔn)參照測驗(yàn)的信度做出較為準(zhǔn)確的估計(jì),利文斯頓提出了對(duì)

相關(guān)法信度系數(shù)的校正公式:

"+(、-Of

52+(X-C)2

式中公為標(biāo)準(zhǔn)參照測驗(yàn)的信度,〃為任何一種相關(guān)法信度系數(shù),

S為分?jǐn)?shù)的標(biāo)準(zhǔn)差,又為分?jǐn)?shù)的均值,C為達(dá)標(biāo)分?jǐn)?shù)或分?jǐn)?shù)線.

2、用決策的一致性作為信度指標(biāo)

林德曼與梅倫達(dá)的一致性公式:

C=…

+v(n+/7+?)

C為一致性,n為在兩次施測中均未達(dá)到標(biāo)的人數(shù),b為在兩次施測中

均已達(dá)標(biāo)的人數(shù),f為只在第一次施測中達(dá)標(biāo)的人數(shù),s為只在第二次

施測中達(dá)標(biāo)的人數(shù),v為f或s中較小的值。

六、各種信度系數(shù)相應(yīng)誤差方差的來源

信度系數(shù)類型誤差方差來源

重測信度時(shí)間取樣

復(fù)本信度(連續(xù)施測)內(nèi)容取樣

復(fù)本信度(間隔施測)時(shí)間和內(nèi)容取樣

分半信度內(nèi)容取樣

同質(zhì)性信度內(nèi)容的異質(zhì)性

評(píng)分者信度評(píng)分者之間的差異

七、影響信度的因素

(-)樣本的特征:信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系

數(shù),相關(guān)系數(shù)受樣本團(tuán)體得分分布、樣本是否異質(zhì)及樣本團(tuán)體平均能

力水平的影響。

1、樣本團(tuán)體分?jǐn)?shù)分布的影響:當(dāng)分布范圍增大時(shí),其信度估計(jì)就較高;

當(dāng)分布范圍減小時(shí),相關(guān)系數(shù)隨之下降,信度值則較低。

2、樣本團(tuán)體異質(zhì)性的影響:若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往

往會(huì)高估測驗(yàn)的信度,相反則會(huì)低估測驗(yàn)的信度。

3、樣本團(tuán)體平均能力水平的影響:對(duì)于不同水平的團(tuán)體,題目具有不

同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。

(-)測驗(yàn)的長度:

1、測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣越有代表性。

2、測驗(yàn)越長,被試的猜測因素影響就越小。

3、測驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。

1+(1股

式中k為改變后長度與原長度之比,2為原測驗(yàn)的信度,

%為測驗(yàn)長度是原來的k倍時(shí)的信度估計(jì).

(三)測驗(yàn)的難度:難度對(duì)信度的影響只存在于某些測驗(yàn)中,如智力

測驗(yàn)、成就測驗(yàn)、

能力傾向測驗(yàn)等。如果一個(gè)測驗(yàn)對(duì)某團(tuán)體而言太容易,會(huì)使所得分?jǐn)?shù)

都集中在高分端;當(dāng)題目太困難時(shí);得分就會(huì)集中在低分端。兩種情

況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄,從而使測驗(yàn)變得不夠可靠。從理

論上說,只有難度水平為50%時(shí),才能使測驗(yàn)分?jǐn)?shù)分布范圍最大,求

得的信度也最I(lǐng)WJ。

(四)測驗(yàn)的時(shí)間間隔:以再測法或復(fù)本法求信度,兩次測驗(yàn)相隔時(shí)

間越短,其信度系數(shù)越大;間隔時(shí)間越久,其它變因介入的可能性越

大,受外界的影響越大,信度系數(shù)便越低。

第三節(jié)測驗(yàn)的效度

在測量活動(dòng)中,測量者對(duì)所使用的測量工具非常信任,他會(huì)采取復(fù)測

行為以判斷測量有無誤差;如果測量者對(duì)所使用的測量工具發(fā)生懷疑,

那他往往會(huì)去找一公認(rèn)非常準(zhǔn)確的測量工具對(duì)先前的測值進(jìn)行檢驗(yàn)。

這種在原測量工具之外尋求新的證據(jù)來肯定或否定某一測量工具準(zhǔn)確

性的做法就是在研究測量的效度問題。心理測量是一種間接測量,心

理測量更重視測量的效度研究。

一、效度(validity)

(-)定義:效度是指所測量的與所要測量的心理特點(diǎn)之間符合的程

度,或者簡單地說是指一個(gè)心理測驗(yàn)的準(zhǔn)確性?;蚴侵敢粋€(gè)測驗(yàn)或量

表實(shí)際能測出其所要測的心理特質(zhì)的程度。

1、關(guān)于效度的概念,我們要特別注意以下幾點(diǎn):

(1)效度是一個(gè)相對(duì)的概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面:

①效度是相對(duì)于一定的測量目的而言的。

②心理特質(zhì)是較隱蔽的特性,只能通過他的行為表現(xiàn)來進(jìn)行推測,因

此,心理測量不可能達(dá)到百分之百的準(zhǔn)確,而只能達(dá)到某種程度的準(zhǔn)

確。

(2)效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。任一誤差的存在,

測量的效度都會(huì)受到影響

(3)判斷一個(gè)測量是否有效要從多方面收集證據(jù)

2、在測驗(yàn)理論中,效度被定義為在一組測量中,與測量目標(biāo)有關(guān)的真

實(shí)方差(或稱有效方差,由所要測量的變因引起的有效變異)與總方

差(實(shí)得變異數(shù))的比率,即

X),_2

?x

3、一組測驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差

又可分為兩部分,即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差,后者也就是

所謂系統(tǒng)誤差帶來的方差S2X=SV2+SI2+SE2

由于有效方差是一個(gè)理論值,無法測量,所以效度和信度一樣是一個(gè)

理論上的概念。

二、效度和信度的關(guān)系

(-)信度是效度的必要而非充分條件。

(-)效度是受信度制約的:信度系數(shù)的平方根是效度系數(shù)的最高限

度,

可見,一個(gè)測驗(yàn)的效度總是受它的信度所制約。

三、效度的類型及評(píng)估方法

(一)內(nèi)容效度(ContentValidity)

1、定義:指的是項(xiàng)目對(duì)欲測的內(nèi)容或行為范圍的取樣的適當(dāng)程度。也

即測驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗(yàn)是否是所

欲測量的行為領(lǐng)域的代表性取樣。

一個(gè)測驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件:

(1)要確定好內(nèi)容范圍,并使測驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。所謂內(nèi)

容范圍可以是具體知識(shí)或技能,也可以是復(fù)雜的行為。要對(duì)所測量的

心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān)。

(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。

2、內(nèi)容效度的評(píng)估方法:

(1)專家判斷法:

(2)統(tǒng)計(jì)分析法

(3)經(jīng)驗(yàn)推測法:3、內(nèi)容效度的應(yīng)用

(1)是編制任何測驗(yàn)應(yīng)加以考慮的基本方面。

(2)較適用于評(píng)價(jià)教育成就測驗(yàn)和職業(yè)選拔測驗(yàn)。

(3)對(duì)標(biāo)準(zhǔn)參照測驗(yàn)更為重要,是因?yàn)樵跇?biāo)準(zhǔn)參照測驗(yàn)中我們主要關(guān)

心的是被試對(duì)一定范圍的知識(shí)、技能掌握得如何。

(4)注意內(nèi)容效度與表面效度的關(guān)系(5)它缺乏可靠的數(shù)量指標(biāo),

因而妨礙了各測驗(yàn)間的相互比較。

(二)構(gòu)想效度(constructValidity)

1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測驗(yàn)?zāi)?/p>

夠測量到理論上的構(gòu)想和特質(zhì)的程度,即測驗(yàn)的結(jié)果是否能證實(shí)或解

釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。

1、構(gòu)想效度的特點(diǎn):

(1)其大小首先取決于事先假定的心理特質(zhì)理論

(2)當(dāng)實(shí)際測量的資料無法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明

該測驗(yàn)結(jié)構(gòu)效不高,因?yàn)檫€有可能是理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)

計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況,當(dāng)然這就使得結(jié)構(gòu)效度的獲取

更為困難。

(3)結(jié)構(gòu)效度通過測量什么、不測量什么的證據(jù)累積起來給以確定,

因而不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。

結(jié)構(gòu)效度主要應(yīng)用于智力測驗(yàn)、人格測驗(yàn)等一些心理測驗(yàn)方面。

2、結(jié)構(gòu)效度的確定方法:

(1)提出理論假設(shè),并把這一假設(shè)分解成一些細(xì)小的綱目,以解釋被

試在測驗(yàn)上的表現(xiàn)。

(2)依據(jù)理論框架,推演出有關(guān)測驗(yàn)成績的假設(shè)。

(3)用邏輯和實(shí)證的方法來驗(yàn)證假設(shè)。

3、構(gòu)想效度的估計(jì)方法:

(1)測驗(yàn)內(nèi)法(對(duì)測驗(yàn)本身的分析):

(2)測驗(yàn)間的相互比較:

①相容效度

②區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。

③因素效度:(3)效標(biāo)關(guān)聯(lián)法,效度的研究證明:一個(gè)測驗(yàn)若效標(biāo)度

理想,那么該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗(yàn)構(gòu)

思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。

(4)實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)

思效度的方法。

3、對(duì)構(gòu)想效度的評(píng)價(jià)

(1)構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上,使

得測驗(yàn)成為理論研究的重要工具,而不再只是實(shí)際決策的輔助工具,

從而使測驗(yàn)有了更廣闊的發(fā)展情景。

(2)主要缺點(diǎn)是,有些構(gòu)想概論模糊,沒有一致的定義,確定效度時(shí)

沒有明確的操作步驟,沒有單一的數(shù)量指標(biāo)來描述有效程度。

(三)效標(biāo)效度

1、定義:又稱實(shí)證效度,反映的是測驗(yàn)預(yù)測個(gè)體在某種情境下行為表

現(xiàn)的有效性程度。被預(yù)測的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。由于

這種效度是看測驗(yàn)對(duì)效標(biāo)預(yù)測如何,所以叫效標(biāo)效度。這種效度需在

實(shí)踐中檢驗(yàn),所以又稱為實(shí)證效標(biāo)。

2、分類:根據(jù)效標(biāo)資料是否與測驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度

和預(yù)測效度兩類。同時(shí)效度即測驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證,通常

與心理特征的評(píng)估及診斷有關(guān)。

3、效標(biāo)和效標(biāo)測量:效標(biāo),即衡量測驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可

以直接而且獨(dú)立測量的我們感興趣的行為。效標(biāo)可以分為兩個(gè)層次,

其一是理論水平的觀念效標(biāo),其二是操作定義水平的效標(biāo)測量。

4、常用的效標(biāo)包括:

(1)學(xué)業(yè)成就;

(2)實(shí)際工作表現(xiàn)

(3)特殊訓(xùn)練成績

(4)精神病診斷

(5)等級(jí)評(píng)定

(6)效標(biāo)團(tuán)體的比較

(7)先前有效的測驗(yàn)

5、效標(biāo)效度的表示方法

(1)相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是

以皮爾遜積差相關(guān)系數(shù)來表示的,主要反映測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相

關(guān)。當(dāng)測驗(yàn)成績是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系

數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測驗(yàn)分?jǐn)?shù)為連續(xù)變量,效

標(biāo)資料為等級(jí)評(píng)定時(shí),可用賈斯朋多系列相關(guān)公式計(jì)算。

(2)區(qū)分法:是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的

一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,

說明該測驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體,否則,測驗(yàn)是無效的。

重疊百分比可以通過計(jì)算每一組內(nèi)得分超過(或低于)另一組平均數(shù)

的人數(shù)百分比得出;另外,還可以計(jì)算兩組分布的共同區(qū)的百分比。

重疊量越大,說明兩組分?jǐn)?shù)差異越小,即測驗(yàn)的效度越差。

(3)命中率法:是當(dāng)測驗(yàn)用來做取舍的依據(jù)時(shí),用其正確決定的比例

作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法,一是計(jì)算總命

中率,另一種是計(jì)算正命中率。

命中表

失?。?)成功(+)

成功(+)A(失誤)B(命中)

失敗(-)C(命中)D(失誤)

總命中率:p=-命中—〃x100%=―5^—X100%

命中+失誤A+B+C+D

正命中率黑管'1°°%=焉-°°%

(4)預(yù)期表法:是一種雙向表格,預(yù)測分?jǐn)?shù)排在表的左邊,效標(biāo)排在

表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)

字越小,表示測驗(yàn)的效標(biāo)效度越高;反之,數(shù)字越分散,則效度越低。

(5)功利率法:使用測驗(yàn)所花掉的費(fèi)用與得到的利益進(jìn)行比較,此種

效度指標(biāo)叫功利率。

四章測驗(yàn)分?jǐn)?shù)的合成與解釋

[教學(xué)目的與要求]

(1)了解分?jǐn)?shù)合成的方法

(2)掌握分?jǐn)?shù)解釋要注意的問題

[教學(xué)重點(diǎn)與難點(diǎn)]常模及其意義

第一節(jié)分?jǐn)?shù)的合成

分?jǐn)?shù)的組合可以在不同層面上進(jìn)行,一般情況下有以下幾種方法:

項(xiàng)目的組合:不同項(xiàng)目可以組合成量表或分測驗(yàn),所有項(xiàng)目可以合成

一個(gè)測驗(yàn)總分。

分測驗(yàn)或量表的組合:幾個(gè)分測驗(yàn)可量表的分?jǐn)?shù)組合到一起得到一個(gè)

合成分?jǐn)?shù)。

測驗(yàn)或預(yù)測源的組合:幾個(gè)測驗(yàn)或預(yù)測源同時(shí)使用。

一、組合變量的方法

(―)臨床判斷MMPI

根據(jù)直覺經(jīng)驗(yàn),主觀地將各種因素組合以得出結(jié)論或預(yù)測的方法叫臨

床判斷。

優(yōu)點(diǎn):

1、能從整體上對(duì)各個(gè)因素加以綜合考慮

2、每個(gè)判斷都是針對(duì)特定的個(gè)人做出的,能考慮到每個(gè)人具體情況。

缺點(diǎn):

1、主觀加權(quán)可能受判斷者的偏見的影響,不夠客觀;

2、沒有精確的數(shù)量指標(biāo);

3、判斷者需要受過訓(xùn)練并具有豐富經(jīng)驗(yàn)

(―)推理方法

不考慮各個(gè)變量的經(jīng)驗(yàn)關(guān)系,而是根據(jù)某種先驗(yàn)的理想程序來作推理

性加權(quán)。

1、單位加權(quán):將各個(gè)變量直接相加而得一個(gè)合成分?jǐn)?shù)

2、等量加權(quán):將所有分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后再把它們加以組合。

(三)多重分段:假設(shè)預(yù)測源間不具互償性。

把人分成達(dá)到最低標(biāo)準(zhǔn)(接受)與未達(dá)到最低標(biāo)準(zhǔn)(拒絕)兩類,而

不在這兩組人內(nèi)部作進(jìn)一步區(qū)分。

1、綜合分段

把風(fēng)個(gè)預(yù)測源與效標(biāo)的關(guān)系綜合起來考慮,在保證合成體的預(yù)測效度

最高的前提下,分別確定出每個(gè)預(yù)測源的最佳分?jǐn)?shù)線。

2、連續(xù)柵欄

當(dāng)預(yù)測源分?jǐn)?shù)只能陸續(xù)得到,而每個(gè)變量又具有自己特定的閾限時(shí),

不必讓每個(gè)申請(qǐng)者都在所有預(yù)測源上嘗試,只有通過第一項(xiàng),才能進(jìn)

行下一項(xiàng)。

(四)多重回歸

當(dāng)同時(shí)采用幾個(gè)預(yù)測源來預(yù)測一個(gè)效標(biāo),而這些預(yù)測源變量之間又具

有互償性時(shí),采用多重回歸。

(五)合成分?jǐn)?shù)

1、完形記分

將各個(gè)變量看做一個(gè)整體,不是孤立地看第一個(gè)反應(yīng)結(jié)果,而是看總

的反應(yīng)模式。

2、輪廓分析

考慮被試在各個(gè)測驗(yàn)或量表上所得分?jǐn)?shù)的輪廓,而不是將各個(gè)變量作

簡單的線性組合。

二、各種組合方法的比較

(一)應(yīng)用范圍

1、選人:以多重分段或多重回歸方法來組合預(yù)測分?jǐn)?shù)

2、安置:多重回歸

3、描述:所有方法均可

(-)資料特征

1、輸入資料的種類

2、輸出資料的方式

(三)效度

1、合成體的效度

2、元素的效度

3、效度的比較

(1)推理法與實(shí)證法的比較

(2)分段法與回歸法的比較

(3)臨床法與統(tǒng)計(jì)法的比較

第二節(jié)分?jǐn)?shù)的解釋

一、常模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論