版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第一章心理測驗(yàn)總論
[教學(xué)目的與要求]
(1)識(shí)記并了解心理測驗(yàn)的發(fā)展歷史
(2)掌握心理測驗(yàn)的性質(zhì)
(3)了解心理測驗(yàn)的種類
[教學(xué)重點(diǎn)與難點(diǎn)]心理測驗(yàn)的性質(zhì)
第一節(jié)心理測驗(yàn)的歷史
一、中國古代的心理測驗(yàn)思想
1、孔子:把人分為中人、中人以上、中人以下三個(gè)類別,“中人以上,
可以語上也;中人以下,不可以語上也”。(相當(dāng)于現(xiàn)代測量學(xué)中的命
名量表和次序量表)
2、孟子:“權(quán),然后知輕重;度,然后知長短。物皆然,心為甚?!泵?/p>
確指出了心理能力和心理特征與物理現(xiàn)象一樣,具有可測量的特性。
3、(南朝)劉勰:世界上最早的“分心測驗(yàn)”,認(rèn)為一心不能二用。
4、(南北朝)顏之推:周歲試兒,其是1925年格塞爾嬰兒發(fā)展量表的
前導(dǎo)。
5、“七巧板”又稱益智圖、唐圖(Tangram),為當(dāng)代多數(shù)智力測驗(yàn)和
創(chuàng)造力測驗(yàn)所使用。
6、隋煬帝科舉制度的開端,被認(rèn)為是世界上最早的心理測驗(yàn)的實(shí)踐。
當(dāng)時(shí)的考試方法:貼經(jīng)和對(duì)偶,類似于現(xiàn)代西方言語測驗(yàn)中常見的填
字和類比。
7、、中國古代心理測驗(yàn)的思想,包含著典型的東方文化特點(diǎn):
A、他們都是描述性的,沒有定量的標(biāo)準(zhǔn);
B、往往將心理特點(diǎn)與道德觀念聯(lián)系起來(局限性)
二、科學(xué)心理測驗(yàn)產(chǎn)生的原因
(-)對(duì)智力落后著分類和訓(xùn)練的早期關(guān)注
1、心理測驗(yàn)產(chǎn)生的最初原因:對(duì)智力落后和精神病人治療的需要。
2、法國醫(yī)生埃斯克羅:1838年出版了兩卷本著作,第一次明確地對(duì)智
力落后與精神病人作出了區(qū)分,他認(rèn)為精神病是以情緒障礙為標(biāo)志。(發(fā)
現(xiàn)一個(gè)人的語言能力是他智力水平的最可靠的指標(biāo))
3、法國醫(yī)生塞國恩(E.Sequin):訓(xùn)練智力落后者的先驅(qū)。1837年,
他創(chuàng)建了第一座教育智力落后兒童的學(xué)校,1846年出版了《白癡:用
生理方法進(jìn)行診斷和治療》。其首創(chuàng)方法感官訓(xùn)練(sense-training)、肌
肉訓(xùn)練(muscle-training)至今仍在全世界范圍內(nèi)的智力落后兒童教育機(jī)
構(gòu)。其SequinFormBoard拼圖板被心理測驗(yàn)的非語言測驗(yàn)所采用,其
操作方法是要求受測者盡快地將不同形狀的圖片嵌入適當(dāng)?shù)陌疾蹆?nèi)。
4、法國心理學(xué)家比奈開始致力于推動(dòng)建立鑒別不能適應(yīng)正常學(xué)校學(xué)習(xí)
但是可教育兒童的方法,鑒別出后安排接受一系列特殊教育課程。比
奈與“兒童心理學(xué)研究會(huì)”的同事們努力推動(dòng)法國公共教育部開展一
項(xiàng)促進(jìn)智能不足兒童學(xué)習(xí)能力計(jì)劃,并成立了專門的研究小組,這個(gè)
小組的成立是心理測驗(yàn)發(fā)展史上一個(gè)極為重大的歷史事件。
(-)實(shí)驗(yàn)心理學(xué)的發(fā)展
1、馮特:1879年他在德國萊比錫大學(xué)建立了心理學(xué)史上第一個(gè)實(shí)驗(yàn)室,
引發(fā)了個(gè)別差異的研究。
2、實(shí)驗(yàn)心理學(xué)的誕生和發(fā)展,給心理測驗(yàn)帶來了另一個(gè)副產(chǎn)品:嚴(yán)格
的標(biāo)準(zhǔn)化程序。
三、心理測驗(yàn)的發(fā)展(金瑜P7-9)
1、高爾頓:英國生物學(xué)家和心理學(xué)家高爾頓是倡導(dǎo)測驗(yàn)運(yùn)動(dòng)的主要人
物。他設(shè)計(jì)了測量差異的方法,1884年,他在倫敦國際博覽會(huì)中專門
設(shè)立了個(gè)“人體測量學(xué)實(shí)驗(yàn)室”六年中積累了9337人的資料,雖不是
正式的心理測驗(yàn),但可視為心理測驗(yàn)的開端。他還是評(píng)定量表和問卷
法應(yīng)用的先驅(qū),他的另一個(gè)重要貢獻(xiàn)是為心理測驗(yàn)奠定了統(tǒng)計(jì)學(xué)基礎(chǔ),
并第一個(gè)提出了相關(guān)的概念。(皮爾遜相關(guān))
2、卡特爾:美國心理學(xué)家,從師馮特。1890年,卡特爾在《心理》雜
志上發(fā)表“心理測驗(yàn)與測量”,這是心理測驗(yàn)第一次出現(xiàn)于心理學(xué)文獻(xiàn)
中。
3、世界上第一個(gè)智力測驗(yàn):比內(nèi)與助手西蒙在《心理學(xué)年報(bào)》上發(fā)表
了一篇文章,題為:“診斷異常兒童智力的新方法”,是世界上第一個(gè)
正式的心理測驗(yàn)。比內(nèi)一西蒙量表自1905年發(fā)表后,在1908年修訂,
1908年量表題目總數(shù)達(dá)到了59個(gè),所有測題按年齡分組,組別從3-13
歲,測驗(yàn)的結(jié)果用“智力水平”表示,但其通常翻譯和提法為“智力
年齡”。后又經(jīng)1911年修訂一次。
4、心理測驗(yàn)的蓬勃發(fā)展:
(1)操作測驗(yàn)的發(fā)展:理論上的缺陷和實(shí)際上的需要,所以就有操作
測驗(yàn)的問世和發(fā)展。
(2)團(tuán)體智力測驗(yàn)的發(fā)展:這是心理測驗(yàn)方式的極大進(jìn)步,也擴(kuò)大了
測驗(yàn)的應(yīng)用范圍。
(3)能力傾向測驗(yàn)的發(fā)展:韋克斯勒所編的學(xué)前兒童、學(xué)齡兒童、成
人智力量表。
(4)人格測驗(yàn)的發(fā)展:心理測驗(yàn)的另一領(lǐng)域是涉及情感或行為等非智
力方面的人格評(píng)估,通常包括對(duì)性格、氣質(zhì)、情緒狀態(tài)、人際關(guān)系、
動(dòng)機(jī)、興趣和態(tài)度的測量。
(5)現(xiàn)代西方心理測驗(yàn)的發(fā)展,受到計(jì)算機(jī)的產(chǎn)生和發(fā)展,以及統(tǒng)計(jì)
方法的改進(jìn)的極大影響。
四、現(xiàn)代心理測驗(yàn)在中國的發(fā)展:以1949年中華人民共和國成立為分
期
(-)中華人民共和國成立前心理測驗(yàn)的發(fā)展
1、1916年,樊炳清先生首先介紹了比內(nèi)一西蒙智力量表;
2、1920年,廖世承和陳鶴琴在南京高等師范學(xué)校開設(shè)心理測驗(yàn)課,
并用心理測驗(yàn)試測投考該校的學(xué)生,這便是中國正式開始的科學(xué)心理
測驗(yàn);
3、1921年,他倆正式出版《心理測驗(yàn)法》一書,成為中國最早的心理
測驗(yàn)專著;
4、1922年,中華教育改進(jìn)社聘請(qǐng)美國教育心理測驗(yàn)專家麥考爾來華講
學(xué),并主持編制心理測驗(yàn)事宜;
5、1924年,陸志韋發(fā)表了《訂正比內(nèi)西蒙智力測驗(yàn)說明書》,30年
代又與吳天敏再次做了修訂;
6、1931年,由艾偉、陸志韋、陳鶴琴、蕭孝嵯等倡議,組織并成立
了中國測驗(yàn)學(xué)會(huì);
7、1932年,《測驗(yàn)》雜志創(chuàng)刊。
(-)中華人民共和國成立后心理測驗(yàn)的發(fā)展
1、1979年,林傳鼎、張厚粲等以國外資料為參考,編制了少年兒童
學(xué)習(xí)能力測驗(yàn);
2、1989年,成立中國心理學(xué)會(huì)心理測驗(yàn)專業(yè)委員會(huì),標(biāo)志著中國心
理測驗(yàn)已進(jìn)入了一個(gè)新的高速發(fā)展時(shí)期。
第二節(jié)心理測驗(yàn)的性質(zhì)
一、測量的基本問題
(-)測量的定義
1、定義:測量就是根據(jù)一定的法則,用數(shù)字對(duì)事物加以確定。
a一定的法則:是指測量行為發(fā)生時(shí)采用的規(guī)則或方法。
b事物:是指我們要測量的感興趣的事物的屬性或特征。
c數(shù)字:可以表示數(shù)量,也可以不表示數(shù)量。
d通常人們所說的測量,指的是給事物確定出一種數(shù)量化的價(jià)值。
2、測量的要素:一是參照點(diǎn),二是單位
a參照點(diǎn):一種是絕對(duì)的零點(diǎn);一種是相對(duì)參照點(diǎn),是認(rèn)為確定的。最
理想的參照點(diǎn)是絕對(duì)零點(diǎn),心理測驗(yàn)中所用的參照點(diǎn)都是相對(duì)的,因
而測量的結(jié)果常常不能以“倍數(shù)”的方式解釋。
b理想的單位的條件:有明確的意義和有相等的價(jià)值。
3、測量的量表:量表就是有參照點(diǎn)和單位的連續(xù)體。斯蒂文斯將量表
由低到高依次為:
a命名量表:是水平最低的一種測量量表,用數(shù)字來代替事物或?qū)κ?/p>
物進(jìn)行分類;
b順序量表:不僅表明類別,還能表明不通類別的大小等級(jí),或具有某
種屬性的程度;
c等距量表:不僅有大小關(guān)系,而且又有相等的單位,因此可以加減運(yùn)
算,但沒有絕對(duì)零點(diǎn),所以不能做乘除運(yùn)算;
d比例量表:是最精確的測量,既有相等的單位,又有絕對(duì)零點(diǎn)。
二、心理測量的基本概念
1、定義:是根據(jù)一定的法則用數(shù)字對(duì)人的行為加以確定,即依據(jù)一定
的心理學(xué)理論,使用一定的操作程序,給人的行為和心理屬性確定出
一種數(shù)量化的價(jià)值。
2、特點(diǎn):
(1)心理測量的間接性
(2)心理測量的相對(duì)性
3、心理測量的水平
心理測量,不論是對(duì)智力,還是對(duì)能力傾向或人格的測量,都只具有
等級(jí)量表的特征。測驗(yàn)分?jǐn)?shù)一般只能顯示個(gè)體智力、能力、人格上的
等級(jí)位次,而沒有一個(gè)相等的單位,故它不是一個(gè)等距量表。但由于
多數(shù)心理特征具有常態(tài)分布的特征,且沒有絕對(duì)零點(diǎn),所以我們也可
以把測量后直接得到的原始分?jǐn)?shù)轉(zhuǎn)化為常態(tài)分布下的標(biāo)準(zhǔn)分?jǐn)?shù),把這
些量表當(dāng)作等距量表來處理。
三、心理測驗(yàn)的基本問題
(-)心理測驗(yàn)和心理測量的的聯(lián)系和區(qū)別
心理測驗(yàn)是了解人心理的工具,主要在名詞上使用。而心理測量則是
運(yùn)用測驗(yàn)為工具,達(dá)到了解人類心理的實(shí)踐活動(dòng),它主要是在“動(dòng)詞”
意義上使用。因此,相對(duì)而言,心理測量的意義范圍更廣一些。能被
應(yīng)用于實(shí)際心理測量的心理測驗(yàn)才是真正有效的測驗(yàn)工具才是真正有
效的測驗(yàn)工具。
(二)心理測驗(yàn)的定義
心理測驗(yàn)就是通過觀察人的少數(shù)有代表性行為,對(duì)于貫穿在人的全部
行為活動(dòng)中心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。
心理測驗(yàn)即是依據(jù)一定的心理學(xué)理論,使用一定的操作程序,給人的
行為確定出一種數(shù)量化的價(jià)值。
(三)心理測驗(yàn)的要素
1、行為樣本:對(duì)少數(shù)經(jīng)過慎重選擇的樣本進(jìn)行觀察,來間接推知被試
的心理特征。
2、標(biāo)準(zhǔn)化:是指測驗(yàn)編制、實(shí)施、記分以及測驗(yàn)分?jǐn)?shù)解釋程序的一致
性,標(biāo)準(zhǔn)化的量一個(gè)重要步驟是建立有代表性的常模。
3、客觀性:在不受被試主觀判斷支配的范圍內(nèi),測驗(yàn)的實(shí)施、評(píng)分、
解釋應(yīng)是客觀的,要盡量減少主試和被試的隨意程度。客觀性另一個(gè)
主要方面是測題或整個(gè)測驗(yàn)的難度水平的確定必須客觀。神經(jīng)心理測
驗(yàn)客觀性最高,智力測驗(yàn)較高,人格問卷次之,投射測驗(yàn)的客觀性較
低。
(四)心理測驗(yàn)的性質(zhì)
1、心理測驗(yàn)的間接性;
2、心理測驗(yàn)的相對(duì)性;
3、心理測驗(yàn)的客觀性:心理測驗(yàn)標(biāo)準(zhǔn)化包括:
①測驗(yàn)用的項(xiàng)目或作業(yè)、實(shí)測說明、實(shí)測者的言語態(tài)度及實(shí)測時(shí)的物
理環(huán)境等,均經(jīng)過標(biāo)準(zhǔn)化。
②評(píng)分記分的原則和手續(xù)經(jīng)過了標(biāo)準(zhǔn)化,對(duì)反應(yīng)的量化是客觀的。
③分?jǐn)?shù)轉(zhuǎn)換和解釋經(jīng)過了標(biāo)準(zhǔn)化,對(duì)結(jié)果的推論是客觀的。
第三節(jié)心理測驗(yàn)的種類
一、按測驗(yàn)功能分類:
1、能力測驗(yàn):智力測驗(yàn):比內(nèi)一西蒙智力測驗(yàn)、韋克斯勒兒童和成人
智力量表。特殊能力測驗(yàn):如音樂、繪畫等
2、成就測驗(yàn):用于測量個(gè)人(團(tuán)體)經(jīng)過某種正式教育或訓(xùn)練之后對(duì)
知識(shí)和技能掌握的程度。學(xué)科測驗(yàn)
3、人格測驗(yàn):用于測量性格、氣質(zhì)、興趣、態(tài)度、品德、情緒、動(dòng)機(jī)、
信念、價(jià)值觀等方面的個(gè)性心理特征,即個(gè)性中除能力以外的部分。
明尼蘇達(dá)多項(xiàng)人格調(diào)查表(MMPI)、16種人格因素問卷(16PF)、艾
森克人格問卷(EPQ)、羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)(TAT)o
二、按測驗(yàn)對(duì)象分類
1、個(gè)別測驗(yàn):優(yōu)點(diǎn):主試可以仔細(xì)觀察被試的言語情緒,并有充分的
機(jī)會(huì)與被試合作,所以其結(jié)果正確可靠。缺點(diǎn):時(shí)間不經(jīng)濟(jì),不能在
短時(shí)間呢您收集到大量的資料。
2、團(tuán)體測驗(yàn):優(yōu)點(diǎn):時(shí)間經(jīng)濟(jì),主試不必接受嚴(yán)格的專業(yè)訓(xùn)練即可擔(dān)
任。缺點(diǎn):主試對(duì)被試的行為不能作切實(shí)的控制,所得結(jié)果不及個(gè)別
測驗(yàn)正確可靠。
三、按測驗(yàn)方式分類:
1、紙筆測驗(yàn):言語作為刺激。MMPLEPQ、16PF及韋克斯勒兒童和
成人智力量表中的言語量表部分。
優(yōu)點(diǎn):實(shí)施方便,團(tuán)體測驗(yàn)多用,有肢體殘疾而無言語困難的病人只
能用此。
缺點(diǎn):受被試文化程度的影響。
2、操作測驗(yàn):也稱非文字測驗(yàn)。羅夏墨跡測驗(yàn)、主題統(tǒng)覺測驗(yàn)、瑞文
測驗(yàn)及韋克斯勒兒童和成人智力量表中的操作量表部分。
優(yōu)點(diǎn):不受文化因素的限制。
3、口頭測驗(yàn)
4、電腦測驗(yàn)
四、按測驗(yàn)?zāi)康姆诸悾?/p>
1、描述性測驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的能力、性格、興趣、知識(shí)水
平等進(jìn)行描述。
2、診斷性測驗(yàn):目的在于對(duì)個(gè)人或團(tuán)體的某種行為問題進(jìn)行診斷。
3、預(yù)示性測驗(yàn):目的在于通過測驗(yàn)分?jǐn)?shù)預(yù)示一個(gè)人將來的表現(xiàn)和所能
達(dá)到的水平。
五、按測驗(yàn)難度分類
1、速度測驗(yàn)
2、難度測驗(yàn)
六、按測驗(yàn)要求分類
1、最高作為測驗(yàn)
2、典型作為測驗(yàn)
七、按測驗(yàn)性質(zhì)分類
1、構(gòu)造性測驗(yàn):在此種測驗(yàn)中,所呈現(xiàn)的刺激和被試的任務(wù)是明確的。
2、投射性測驗(yàn):在此種測驗(yàn)中,刺激沒有明確意義,問題模糊,對(duì)被
試的反應(yīng)也沒有明確規(guī)定。
八、按測驗(yàn)解釋分類
1、常模參照測驗(yàn)
2、標(biāo)準(zhǔn)參照測驗(yàn)
九、按測驗(yàn)應(yīng)用分類
1、教育測驗(yàn)
2、職業(yè)測驗(yàn)
3、臨床測驗(yàn)
第四節(jié)心理測驗(yàn)的功能與應(yīng)用
一、心理測驗(yàn)的功能:最基本的功能是測量個(gè)體差異或行為反應(yīng)。
(-)從實(shí)際應(yīng)用角度看:
①人才選拔;
②崗位安置
③臨床診斷;
④教育評(píng)價(jià);
⑤心理咨詢和治療
(-)從理論研究角度看:
①搜集材料:心理測驗(yàn)是收集個(gè)體差異資料最快捷的辦法。
②提出和驗(yàn)證假設(shè)
③實(shí)驗(yàn)分組
二、測驗(yàn)的應(yīng)用
(-)錯(cuò)誤的測驗(yàn)觀
1、測驗(yàn)萬能論
2、測驗(yàn)無用論:
①某些人格測驗(yàn)侵犯了個(gè)人隱私;
②測驗(yàn)為宿命論和種族歧視提供了心理學(xué)依據(jù)。
3、心理測驗(yàn)即智力測驗(yàn)
(-)正確的測驗(yàn)觀
1、重要的心理學(xué)研究方法和決策的輔助工具:心理測驗(yàn)法的出現(xiàn)是心
理科學(xué)發(fā)展史上的一大進(jìn)步,是心理學(xué)研究中不可缺少的研究方法之
O
2、作為研究方法和測量工具尚不完善:過分夸大心理測驗(yàn)的科學(xué)性和
準(zhǔn)確性是不對(duì)的。
3、科學(xué)地看待心理測驗(yàn),防止亂用測驗(yàn):
①測驗(yàn)使用者必須具備一定的資格;
②慎重選擇測驗(yàn)量表;
③與被試建立良好的協(xié)調(diào)關(guān)系;
④正確解釋測驗(yàn)結(jié)果;
⑤注意測驗(yàn)的保密。
第二章心理測驗(yàn)的編制
[教學(xué)目的與要求]
(1)掌握心理測驗(yàn)編制的一般程序
(2)心理測驗(yàn)的難度與區(qū)分度的定義及
[教學(xué)重點(diǎn)與難點(diǎn)]心理測驗(yàn)的項(xiàng)目分析
第一節(jié)編制測驗(yàn)的一般程序
一、確定測驗(yàn)?zāi)康?/p>
(-)心理測驗(yàn)的對(duì)象:首先要明確測量的對(duì)象,也就是測驗(yàn)編成后要
用于哪些團(tuán)體。
A年齡
B教育水平:在編制兒童測驗(yàn)時(shí),要同時(shí)考慮教育水平和年齡的影響。
在承認(rèn)測驗(yàn)中,一般只考慮教育水平的影響。
C文化背景
(-)測驗(yàn)的目標(biāo):是指編制的測驗(yàn)是測什么的,即用來測量什么樣
的心理變量或行為特征。目標(biāo)分析以測驗(yàn)不同而異,一般分為三種情
況:
A工作分析:主要任務(wù)是對(duì)所預(yù)測的行為活動(dòng)作具體分析,我們稱之
為任務(wù)分析或工作分析。
B對(duì)特定概念下定義:如果測驗(yàn)是為了測量某種特殊的心理品質(zhì)或特
點(diǎn),那么測驗(yàn)編制者就必須給所要測量的心理或行為特質(zhì)下定義,然
后必須發(fā)現(xiàn)該特質(zhì)所包含的維量將通過什么行為表現(xiàn)出來或怎樣進(jìn)行
測量。
C確定測驗(yàn)的具體內(nèi)容:如果測驗(yàn)是描述性的顯示測驗(yàn),它的目標(biāo)分
析的主要任務(wù)則是確定顯示的內(nèi)容和技能。
(三)測驗(yàn)用途:所編出的測驗(yàn)是要對(duì)被試做描述,還是做診斷,抑
或是選拔和預(yù)示。
二、擬定編制計(jì)劃
編制計(jì)劃,實(shí)際上是對(duì)測驗(yàn)的總體設(shè)計(jì),指出測驗(yàn)的內(nèi)容結(jié)構(gòu)和項(xiàng)目
形式等,以及對(duì)每個(gè)內(nèi)容、目標(biāo)的相對(duì)重視程度。
根據(jù)布魯姆最早提出教育目標(biāo)的分類問題。他把學(xué)習(xí)的心理活動(dòng)分成
認(rèn)知、精神運(yùn)動(dòng)和情感三個(gè)領(lǐng)域,又把認(rèn)知領(lǐng)域具體分為知識(shí)、理解、
應(yīng)用、分析和綜合、評(píng)價(jià)。
三、設(shè)計(jì)測試項(xiàng)目
(-)搜集有關(guān)資料
1、資料要豐富
2、資料要有普遍性
(-)選擇項(xiàng)目形式
1、測驗(yàn)的目的和材料性質(zhì)
2、接受測驗(yàn)的團(tuán)體的特點(diǎn)
3、各種實(shí)際因素:時(shí)間,人數(shù)、經(jīng)費(fèi)等
(三)編寫和修訂項(xiàng)目
1、項(xiàng)目的范圍要與測驗(yàn)計(jì)劃相一致
2、項(xiàng)目的數(shù)量要比最后所需的數(shù)目多一倍至幾倍,以備篩選和編制復(fù)
本
3、項(xiàng)目的難度必須符合測驗(yàn)?zāi)康男枰?/p>
4、項(xiàng)目的說明必須清楚
四、項(xiàng)目的試測和分析
(-)試測
1、預(yù)測對(duì)象應(yīng)取自將來正式測驗(yàn)準(zhǔn)備應(yīng)用的群體
2、預(yù)測的實(shí)施過程與情境應(yīng)力求與將來正式測試時(shí)的情況相近似
3、預(yù)測的時(shí)限可稍寬一些,最好使每個(gè)被試都能將項(xiàng)目做完,以搜集
較充分的反應(yīng)資料-,使統(tǒng)計(jì)分析的結(jié)果更為可靠。
4、在預(yù)測過程中應(yīng)隨時(shí)記錄被試的反應(yīng)情形,如在不同時(shí)限內(nèi)一般被
試所完成的題數(shù)、題意不清之處及其他有關(guān)問題。
(-)項(xiàng)目分析
包括質(zhì)的分析和量的分析
質(zhì)的分析是從內(nèi)容取樣的適當(dāng)性、題目的思想性以及表達(dá)是否清楚等
方面加以分析。
量的分析是對(duì)預(yù)測結(jié)果進(jìn)行統(tǒng)計(jì)分析,確定項(xiàng)目的難度、區(qū)分度、備
選答案的適宜性等。
五、合成測驗(yàn)
1、項(xiàng)目的選擇:要考慮測驗(yàn)的目的、性質(zhì)與功能,區(qū)分度,難度
2、項(xiàng)目的編排:由易到難,有并列直進(jìn)式,混合螺旋式
A一般原則:a測題的難度排列易逐步上升;b盡可能將同類型的測題
組合在一起;c各種類型測題本身的特點(diǎn);
B常見試題排列方式:a并列直進(jìn)式b混合螺旋式
3、編造復(fù)本
測驗(yàn)的各份復(fù)本必須等值,所謂等值需符合下列幾個(gè)條件:
(1)各份測驗(yàn)測量的是同一種心理特質(zhì);
(2)各份測驗(yàn)包含相同的內(nèi)容范圍,但題目不應(yīng)有重復(fù);
(3)各份測驗(yàn)題型相同,題目數(shù)量相等,并且有大體相同的難度分布。
六、測驗(yàn)使用的標(biāo)準(zhǔn)化
1、施測過程標(biāo)準(zhǔn)化
2、評(píng)分計(jì)分標(biāo)準(zhǔn)化
3、分?jǐn)?shù)解釋標(biāo)準(zhǔn)化
七、搜集信度、效度資料
(-)信度
指的是測量的可靠性或一致性。
(-)效度
指的是測量的有效性或正確性。
A搜集有關(guān)資料:題目的有關(guān)來源
a已出版的標(biāo)準(zhǔn)測驗(yàn)
b理論和專家的經(jīng)驗(yàn)
C臨床觀察和記錄
B命題的原則及編寫要領(lǐng)
a命題的原則(理解):
O1內(nèi)容方面:符合測驗(yàn)的目的,取樣有代表性,相互獨(dú)立,互不牽掛;
02文字方面:準(zhǔn)確,簡明扼要,少使用雙重否定句;
03理解方面:不要超出受測團(tuán)體的知識(shí)水平和理解能力,不要有爭議
誤解;
04社會(huì)敏感性方面:應(yīng)盡量避開社會(huì)敏感性問題,如涉及社會(huì)禁忌或
個(gè)人隱私的題目不應(yīng)使用。
菲利普對(duì)于涉及社會(huì)敏感性問題,怎樣鼓勵(lì)被試作出真實(shí)回答的策略:
O1命題時(shí)假定被試具有某種行為,使他不得不在確實(shí)沒有該行為時(shí)才
否定,可避免否定過多的傾向。
?2命題時(shí)假定規(guī)范不一致。
?3指出該行為是常見的,雖然是違規(guī)的。
b測題的編制要領(lǐng):根據(jù)被試的要求不同分為
O1提供型:要求被試給出正確答案。
02選擇題:要求被試在有限幾個(gè)答案中選擇正確的答案。由題干和選
項(xiàng)構(gòu)成。
題干:呈現(xiàn)一個(gè)問題的情境,一般由直接問句或不完全的陳述句構(gòu)成。
選項(xiàng):問題的多種可能答案,常常是包含一個(gè)正確答案,若干(一般
是1?5個(gè))錯(cuò)誤答案,其中的錯(cuò)誤的答案叫做“誘答”。
八、編寫測驗(yàn)手冊
1、本測驗(yàn)的目的和功用
2、測驗(yàn)的理論背景以及選擇項(xiàng)目的根據(jù)
3、測驗(yàn)的實(shí)施方法、時(shí)限及注意事項(xiàng)
4、測驗(yàn)的標(biāo)準(zhǔn)答案和記分方法
5、常模表或其他有助于分?jǐn)?shù)轉(zhuǎn)化與解釋的資料
6、測驗(yàn)的信度、效度資料?,包括信度系數(shù)、效度系數(shù)以及這些數(shù)據(jù)是
在什么情境下得到的
第二節(jié)測驗(yàn)的項(xiàng)目分析
一、項(xiàng)目的難度分析
(-)定義:
1、難度:是指項(xiàng)目的難易程度。P在能力測驗(yàn)中通常需要一個(gè)反映難
度水平的指標(biāo),在非能力測驗(yàn)中,類似的指標(biāo)是“通俗性”,即取自相
同總體的樣本中,能在答案方向上回答該題的的人數(shù)。
P=&
2、難度的指標(biāo):N
以通過率表示難度時(shí)?,通過人數(shù)越多,即P值越大,難度就越低;P
值越小,難度越高。因?yàn)镻值大小與難度高低成反比,有人將其稱
作易度。
(二)難度的計(jì)算
1、原始定義法
p=—
(1)客觀試題(二分法記分):N
R:答對(duì)該題的人數(shù);N:參加測驗(yàn)的總?cè)藬?shù)
由于選擇題允許猜測,所以通過率可能因機(jī)遇作用而變大。備選答案
的數(shù)目越少,機(jī)遇的作用越大,越不能真正反映測驗(yàn)的難度。為此,
…KP-l
CP=--------
吉爾福特提出了一個(gè)P值校正公式。K-1
CP:校正后的難度值;P:實(shí)際得到的通過率;K:選項(xiàng)數(shù)目
例題:假定某題有75%的被試通過,若該題有5個(gè)備選答案,則校正
后的通過率為:
當(dāng)有4個(gè)備選答案時(shí),CP=0.67;有3個(gè),CP=0.63;有2個(gè),CP=0.54)
b非二分記分:例題某一數(shù)學(xué)能力測驗(yàn)題的滿分為20分,全體被試在
該題上的平均分?jǐn)?shù)為15分,則該題的難度為:P=15/20=0.75
例:一個(gè)題目的難度值為0.75,分別計(jì)算此題有四個(gè)選項(xiàng)、三個(gè)選項(xiàng)、
兩個(gè)選項(xiàng)時(shí)大的難度值
p=X
(2)主觀題的平均數(shù)法
2、極端分組法
(1)客觀題的極端分組法
根據(jù)測驗(yàn)分?jǐn)?shù)按高低排序,用兩個(gè)極端組在某項(xiàng)目上的平均通過率表
p=「H'PL
示項(xiàng)目的難度—2PH、PL分別為高分組與低分組的通過率。
步驟:
A、按測驗(yàn)總分由高到低排序
B、從高分段向下選出全部試卷的27%作為高分組
C、從低分段向上選出全部試卷的27%作為低分組
D、按照上述公式計(jì)算項(xiàng)目難度值
例:100人參加某測驗(yàn),高分組與低分組各取27人,其中第一題高分
組20人答對(duì),低分組10人答對(duì)。這道題的難度系數(shù)是多少?
(2)主觀題的極端分組法
步驟:
A、按測驗(yàn)總分由高到低排序
B、從高分段向下選出全部試卷的25%作為高分組
C、從低分段向上選出全部試卷的25%作為低分組
D、按照上述公式計(jì)算項(xiàng)目難度值
P;XH+X「2NL
2N(H-L)
XH:高分組所得總分;
XL:低分組所得總分;H:該題最高分;L:該題最低分;N:考生總
人數(shù)的25%
(三)難度對(duì)測驗(yàn)的影響
1、難度對(duì)測驗(yàn)分?jǐn)?shù)分布的影響
(DP值越小一測驗(yàn)項(xiàng)目越難一測驗(yàn)分?jǐn)?shù)集中在低分端一分?jǐn)?shù)分布呈
正偏態(tài)分布。
(2)P值越大一測驗(yàn)項(xiàng)目越易一測驗(yàn)分?jǐn)?shù)集中在高分端一分?jǐn)?shù)分布呈
負(fù)偏態(tài)分布。
即:測驗(yàn)項(xiàng)目過份容易或過份難,都會(huì)造成測驗(yàn)分?jǐn)?shù)偏離正態(tài)分
布,而使測驗(yàn)分?jǐn)?shù)的離散程度變小。
2、難度對(duì)測驗(yàn)鑒別力的影響
測驗(yàn)的主要功效之一就是鑒別考生實(shí)際水平的高低。自欺欺人適量難
度可以加大考生得分的差異,從而提高測驗(yàn)的鑒別力。
P值越接近0.50,試題的鑒別能力就越高;相反,P值越接近1.00或0,
試題的鑒別能力就越低。
3、難度與測驗(yàn)?zāi)康牡年P(guān)系
項(xiàng)目難度應(yīng)根據(jù)測驗(yàn)?zāi)康膩泶_定,不能認(rèn)為測驗(yàn)項(xiàng)目都必須保持值等
于0.50最好。事實(shí)上,一方面,如果每個(gè)項(xiàng)目的難度都等于0.50,測
驗(yàn)項(xiàng)目之間存在高度相關(guān),會(huì)使測驗(yàn)分?jǐn)?shù)的分布呈雙峰狀態(tài),即有5%
的人所有題目都答對(duì),得滿分,另外5%的人全部答錯(cuò),得0分。
為此,難度水平的確定應(yīng)根據(jù)測驗(yàn)的目的,性質(zhì)及題目的形成。
(1)對(duì)于一般的常模、參照測驗(yàn)而言,其目的在于測量個(gè)體差異,一
般只要求測驗(yàn)題目的平均難度為0.50,而個(gè)題難度可在0.50+0.20之
間。
(2)當(dāng)測驗(yàn)用與選拔或診斷時(shí),題目的難度值應(yīng)更多地接近錄取率。
(3)就選擇題而言,P值應(yīng)大于概率水平。P值若等于概率,說明被
試純粹憑猜測作答;P值若小于概率,說明題目很可能存在問題。
(4)整個(gè)測驗(yàn)的難度水平取決于組成測驗(yàn)的題目的難度。
(四)難度的轉(zhuǎn)換
難度指出的僅僅是題目的相對(duì)難度,不能客觀地指出題目難度之間差
異大小
P向Z的轉(zhuǎn)換
n假定每個(gè)試題所要測量地潛在特質(zhì)或能力是呈正態(tài)分布的,可將P
值作為正態(tài)曲線下的概率面積,以此轉(zhuǎn)換成Z分?jǐn)?shù)
二、項(xiàng)目的區(qū)分度D
(-)區(qū)分度的概念
區(qū)分度是測驗(yàn)對(duì)被試實(shí)際水平的區(qū)分程度。是測驗(yàn)項(xiàng)目分析的重要內(nèi)
容
是作為評(píng)價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù)
通常用D表示,取值范圍為+1.00至-1.00
D越高時(shí),試題的質(zhì)量越好,D值范圍在-1.00和+1.00之間,值越大,
試題的區(qū)分能力越強(qiáng)。當(dāng)D為正值時(shí),說明試題是積極區(qū)分,即高分
組通過率高,低分組通過率低。為D負(fù)值時(shí),說明試題有消極區(qū)分,
高組通過率低,低組通過率高。D為0時(shí),說明試題無區(qū)分用
(二)區(qū)分度對(duì)測驗(yàn)的影響
1.區(qū)分度與難度的關(guān)系
1試題的區(qū)分度與難度有密切關(guān)系。試題難度過大或過小,其區(qū)分度都
較低。當(dāng)難度值為1.00或0時(shí),高分組和低分組或全部通過得滿分,
或全部未通過得0分,這時(shí)區(qū)分度都為0分。這兩種情況,都表示試
題沒有鑒別考生水平高低的能力。所以,調(diào)整試題難度是提高試題區(qū)
分度的重要方法。右表可說明難度與區(qū)分度的關(guān)系。
5?厘(P)
1.OOO.OO
O.QOO.20
O.-7OO.0O
O.501.OO
O.30O.do
0.10O.NO
O.OOO.OO
A、假如樣本中通過某一項(xiàng)目的人數(shù)比率為1.00或0,說明高分組與低
分組在通過率上不存在差異,因此D為0;假如項(xiàng)目的通過率為0.50,
則可能是高分組的所有人都通過了,而低分組卻無人通過,這樣D的
最大值可能達(dá)到l.OOo
B、為了使整個(gè)測驗(yàn)項(xiàng)目的潛在區(qū)分度最大,似乎應(yīng)該使每個(gè)項(xiàng)目的難
度處于0.50水平,但事實(shí)并非如此簡單。如果每一個(gè)項(xiàng)目的難度均處
于0.50,由于項(xiàng)目難度相同,有可能大多趨向于有關(guān)的內(nèi)容或技能,
結(jié)果造成項(xiàng)目同質(zhì)性提高。在極端情況下,有可能50%的被試全部通
過各項(xiàng)目得滿分,另外50%的被試全部為。分,形成U形分布,這樣
反而降低總分的區(qū)分能力。如果測驗(yàn)的所有項(xiàng)目都是中等難度,只有
項(xiàng)目的內(nèi)在相關(guān)為0時(shí),整個(gè)測驗(yàn)才能產(chǎn)生常態(tài)分布。考慮到一般測
驗(yàn)項(xiàng)目之間具有某種程度的相關(guān)難度的分布要廣一些,梯度多一些,
是合乎需要的。
2.區(qū)分度與信度的關(guān)系
O.1NN50.00
0.16OYN
0.20
0.30O.W夕
0.-^00.915
O.SOO.OV。
一個(gè)良好的測驗(yàn),信度必須要高。測驗(yàn)的信度與項(xiàng)目的區(qū)分度有著密
切的關(guān)系,事實(shí)上,由試題的區(qū)分度還可以估計(jì)測驗(yàn)的信度。整個(gè)測
驗(yàn)中各試題的區(qū)分度值的平均數(shù)越高,測驗(yàn)的信度就越高。值的平均
數(shù)與信度的關(guān)系如右表。
(三)區(qū)分度計(jì)算方法
1、極端分組法
(1)客觀性試題區(qū)分度的計(jì)算公式:D=PH-PL
按測驗(yàn)總分從高到低排序
確定測驗(yàn)總分最高的27%的被試作為高分組,最低的27%的被試為低
分
分別求出這兩組被試通過試題的百分比
(2)主觀性試題區(qū)分度的計(jì)算公式:N(H-L)
說明:XH:高分組所得總分;XL:低分組所得總分;H:該題最高
分;L:該題最低分;N:考生總?cè)藬?shù)的25%
步驟:
按測驗(yàn)總分由高到低排序;分別確定測驗(yàn)總分的25%、25%作為高低
分組;列出試題分析表;將數(shù)據(jù)帶入以上公式加以計(jì)算
2、相關(guān)法
考慮中間數(shù)據(jù)
以項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)(效標(biāo)分?jǐn)?shù)不易得到時(shí),以測驗(yàn)總分代替)的
相關(guān)作為項(xiàng)目區(qū)分度的指標(biāo)
相關(guān)越高,區(qū)分能力越好
具體方法:
①點(diǎn)二列相關(guān):適用于一類變量為二分稱名變量,另一類變量為連續(xù)
變量的成對(duì)變量的相關(guān)計(jì)算。
②二列相關(guān):適用于兩個(gè)連續(xù)變量,但其中一個(gè)變量被人為分成兩類。
③相關(guān):適用于兩個(gè)變量均為二分稱名變量。
積差相關(guān)法,點(diǎn)二列相關(guān),二列相關(guān),牛相關(guān)
區(qū)分度許價(jià)
04。肚域弱
0.3H.39眠如微枷更隹
0.2H.29尚可,仍需赧1
0.19以下徽必衡微或加以赧
提高區(qū)分度的方法
使試題的難度適中,使整個(gè)考試難度適中
著重考察復(fù)雜的學(xué)習(xí)結(jié)果
區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)
以上標(biāo)準(zhǔn)僅作參考,不是絕對(duì)的。事實(shí)上,項(xiàng)目區(qū)分度的要求應(yīng)根據(jù)
測驗(yàn)?zāi)康亩?,若測驗(yàn)?zāi)康脑谟谶x人,主要評(píng)判被試的個(gè)別差異,那
么區(qū)分度要求高些;若測驗(yàn)只是考察被試對(duì)所學(xué)知識(shí)的掌握情況,可
不過多考慮區(qū)分度。
三、項(xiàng)目分析的特殊問題
(-)選擇題反應(yīng)模式的分析
對(duì)于選擇題,除了分析其難度的區(qū)分度外,還要分析被試對(duì)每個(gè)備選
答案的反應(yīng)情況。一般要做以下分析:
1、如果正確的備選答案被所有被試所選擇,則說明該題目太易或者題
目中可能提供了某種暗示;
2、如果某個(gè)錯(cuò)誤答案沒有一個(gè)被試選擇,說明該選項(xiàng)不具迷惑性,錯(cuò)
得過于明顯,一般說來,除非有2%以上的人選擇,否則這個(gè)備選答案
就應(yīng)該修改。
3、如果所有被試的選擇了同一個(gè)錯(cuò)誤答案,可能是編制測驗(yàn)時(shí)把答案
定錯(cuò)了,也可能是教學(xué)中發(fā)生了錯(cuò)誤。
4、如果所有被試的選擇集中在兩個(gè)答案上,二者選擇率相近,,說明
該題可能有兩個(gè)正確答案或另一個(gè)答案也有一定道理。
5、如果高分組對(duì)正確答案的選擇與低分組相等或低于,說明所考察的
東西與水平無關(guān)。
6、如果一個(gè)題目被試未答人數(shù)過多或選擇各個(gè)備選答案人數(shù)相等則說
明題目過難或題意不清。
(二)標(biāo)準(zhǔn)參照測驗(yàn)的項(xiàng)目分析
標(biāo)準(zhǔn)參照測驗(yàn)主要用于判斷被試是否掌握了某些知識(shí)技能,是達(dá)到了
一個(gè)事先確定的標(biāo)準(zhǔn),測驗(yàn)結(jié)果只與既定標(biāo)準(zhǔn)比較而不在被試之間作
比較。因此測驗(yàn)分?jǐn)?shù)的變異性不是標(biāo)準(zhǔn)參照測驗(yàn)的必要條件。所以,
常模參照測驗(yàn)的項(xiàng)目分析方法不完全適用于標(biāo)準(zhǔn)參照測驗(yàn)。
1、難度分析
標(biāo)準(zhǔn)參照測驗(yàn)可以采用常模參照測驗(yàn)的方法計(jì)算難度,但是在篩選項(xiàng)
目時(shí),對(duì)難度水平的要求與常模參照測驗(yàn)不同。
由于標(biāo)準(zhǔn)參照測驗(yàn)的目的是為了考察被試對(duì)某方面的知識(shí)技能的掌握
情況,因此,只要能反映教育目標(biāo)或教育者認(rèn)為重要的內(nèi)容,無論其
難度為多少,都可以編入測驗(yàn)。
2、區(qū)分度分析
標(biāo)準(zhǔn)參照測驗(yàn)一般分?jǐn)?shù)變異較小,不適合用相關(guān)法來計(jì)算區(qū)分度,但
是可以采用鑒別指數(shù)的方法計(jì)算,即比較兩組的通過率。
方法一
根據(jù)測驗(yàn)分?jǐn)?shù)將被試分為達(dá)標(biāo)組與未達(dá)標(biāo)組,然后分別計(jì)算它們在某
一項(xiàng)目上的通過率,兩組考生通過率之差,便是該項(xiàng)目的區(qū)分度,其
公式為:
D=ps-pn
式中ps、pn為達(dá)標(biāo)組與未達(dá)標(biāo)組在某一項(xiàng)目上的通過率。
這種方法主要的問題是分組標(biāo)準(zhǔn)不同,得到的區(qū)分度值不同。
方法二
用同一測驗(yàn)對(duì)同一組被試在教學(xué)前后各施測一次,分別統(tǒng)計(jì)各項(xiàng)目前
后測的通過率,二者之差便是項(xiàng)目的區(qū)分度。其公式為:
D=ppost-ppre
D值越高,說明項(xiàng)目對(duì)教學(xué)效果越敏感,所以有人將其稱做教學(xué)效果
敏感指數(shù),其公式也可寫為
其中S為敏感指數(shù),RA、RB分別為前測、后測通過人數(shù),N為總?cè)?/p>
數(shù)。
此種方法的主要缺點(diǎn)是:(1)同一測驗(yàn)施測兩次可能會(huì)產(chǎn)生練習(xí)效應(yīng),
成績的提高究竟是由教學(xué)引起的,還是由練習(xí)引起的難以分辨;(2)
只有等兩次施測后才能進(jìn)行項(xiàng)目分析;(3)當(dāng)D值低時(shí),難于做出明
確的解釋,無法確定是由試題不良還是由教學(xué)不當(dāng)所致。
式中ppost.ppre分別為項(xiàng)目在后測和前測中的通過率。
方法三
取兩組條件相近的考生,一組接受過同測驗(yàn)有關(guān)的學(xué)科教學(xué),另一組
沒有接受過此種教學(xué)。施測同一測驗(yàn)后,分別統(tǒng)計(jì)每組考生答對(duì)某題
的人數(shù),兩組考生通過率之差便是該題的區(qū)分度。公式為D=pi-pu
式中pi、pu分別為教學(xué)組和未經(jīng)教學(xué)組對(duì)某題的通過率。
此方法的缺點(diǎn)是,兩組考生除在教學(xué)方面不同外在其他有關(guān)方面必須
同質(zhì),而這一點(diǎn)是難以做到的。
項(xiàng)目特征曲線:是項(xiàng)目特征函數(shù)或項(xiàng)目反應(yīng)函數(shù)的圖解形式,它反映
了被試對(duì)某一測驗(yàn)項(xiàng)目的正確反應(yīng)概率與該項(xiàng)目所對(duì)應(yīng)的能力或特質(zhì)
的水平之間的一種函數(shù)關(guān)系。這一方法不僅適用于項(xiàng)目分析,而且也
適用于某些測驗(yàn)量表的編制。
A項(xiàng)目特征曲線可圖解測驗(yàn)的鑒別力,項(xiàng)目鑒別力的高低主要在于其
曲線的傾斜度,曲線坡度越陡,鑒別能力越好,預(yù)測的誤差越小。
B項(xiàng)目特征曲線可以圖解項(xiàng)目難度。
C項(xiàng)目特征曲線還可以圖解選擇題的誘答反應(yīng)。
第三章測量的誤差及其檢驗(yàn)
[教學(xué)目的與要求]
(1)了解測量誤差的種類與來源
(2)掌握信度的定義、意義及其估計(jì)方法
(3)掌握效度的定義、意義及其估計(jì)方法
[教學(xué)重點(diǎn)與難點(diǎn)]信度與效度的估計(jì)
第一節(jié)測量的誤差
一、誤差的種類
(-)誤差的定義
誤差是在測量中與目的無關(guān)的因素所產(chǎn)生的不準(zhǔn)確的或不一致的結(jié)
果。
(二)誤差的種類
1、隨機(jī)誤差:與測量目的無關(guān)的偶然因素引起的變化規(guī)律的誤差,使
得多次的測量結(jié)果不一致,這種誤差的大小和方向是隨機(jī)的。既影響
測量的準(zhǔn)確性又影響一致性。
2、系統(tǒng)誤差:與測量目的無關(guān)的因素引起的恒定的有規(guī)律的誤差,它
穩(wěn)定地存在于每一次測量中。只影響測量的準(zhǔn)確性。
二、誤差的來源
(-)測驗(yàn)自身引起的誤差
主要來源于測驗(yàn)的編制過程,其中項(xiàng)目取樣影響最大。
(-)施測過程引起的誤差
1、測試環(huán)境
2、測試時(shí)間
3、主試因素
4、意外干擾
5、評(píng)分記分
(三)被試引起的誤差
1、應(yīng)試動(dòng)機(jī)
2、測驗(yàn)焦慮
3、測驗(yàn)經(jīng)驗(yàn)
4、練習(xí)效應(yīng)
5、反應(yīng)傾向
6、生理變因
三、真分?jǐn)?shù)
(-)含義
真分?jǐn)?shù)是指測量沒有誤差時(shí)所得到的真值。其操作定義是無數(shù)次測量
結(jié)果的平均值。
(-)數(shù)學(xué)模型及其假設(shè)
1、CTT模型——經(jīng)典測驗(yàn)理論假定,觀察分?jǐn)?shù)(X)與真分?jǐn)?shù)(T)
之間是一種線性關(guān)系,并只相差下個(gè)隨機(jī)誤差(E),即乂=丁+£這里的
測量誤差E指的是引起測量不一致的變因所產(chǎn)生的效應(yīng),即指隨機(jī)誤
差,不包括系統(tǒng)誤差。
分析假設(shè)公理:
(1)若一具人的某種心理特質(zhì)可以用平行的測驗(yàn)分?jǐn)?shù)反復(fù)測量足夠多
次,則其觀察分?jǐn)?shù)的平均值會(huì)接近于真分?jǐn)?shù)。即E(X)=T或E(E)
=10
(2)真分?jǐn)?shù)和誤差分?jǐn)?shù)之間的相關(guān)為零。
即P(T,E)=0
(3)各平行測驗(yàn)上的誤差分?jǐn)?shù)之間的相關(guān)為零。
2、引申:
(1)在一次測量中,被試觀察分?jǐn)?shù)的方差等于其真分?jǐn)?shù)方差與誤差分
數(shù)方差之和。S2X=ST2+S2E
(2)真分?jǐn)?shù)可以分成兩部分:與測量目的有關(guān)變異S2V和與測量目的
無關(guān)的變異S2L即:ST2=S2V+S2I
(3)一次測驗(yàn)中,一個(gè)團(tuán)體的實(shí)測分?jǐn)?shù)之間的變異性是由與測量目的
有關(guān)的變異數(shù)SV2、穩(wěn)定的但出自無關(guān)來源的變異數(shù)SI2和測量誤差
的變異數(shù)SE2所決定的。
即:S2X=SV2+SI2+SE2
第二節(jié)信度(reliability)
一、什么是信度
定義:指的是測量結(jié)果的穩(wěn)定性程度(或叫可靠性)。也指同一被試在
不同時(shí)間內(nèi)用同一測驗(yàn)(或用另一套相等的測驗(yàn))重復(fù)測量,所得結(jié)
果的一致程度。
1、理論定義:傳統(tǒng)的信度理論認(rèn)為,每一個(gè)測驗(yàn)的實(shí)得分?jǐn)?shù)(X)總
是由真實(shí)分?jǐn)?shù)(T)和誤差(E),兩個(gè)部份構(gòu)成的,公式為:
X=T+E
討論一組測驗(yàn)分?jǐn)?shù)的特性時(shí),可用方差導(dǎo)標(biāo)具體分?jǐn)?shù),公式:
(測驗(yàn)實(shí)得分?jǐn)?shù)的方差)=(測驗(yàn)真分?jǐn)?shù)的方差)+(測驗(yàn)誤差的方
差)
2、操作定義:
定義1:一組測量分?jǐn)?shù)的真分?jǐn)?shù)變異數(shù)(方差)與總變異數(shù)(總方差、
實(shí)得分?jǐn)?shù)的方差)的比率,或者是真實(shí)分?jǐn)?shù)方差占總方差的的百分比。
計(jì)算公式:
rxx=ST2/SX2
定義2:信度乃是一個(gè)被試團(tuán)體的真分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)系數(shù)的平
方。即
rxx=ptx2
定義3:信度乃是一個(gè)測驗(yàn)X(A卷)與它的任意一個(gè)“平行測驗(yàn)”
X/(B卷)的相關(guān)系數(shù)。即rxx=pXX'2
二、信度的指標(biāo)
(一)信度系數(shù):大部分情況下,信度是信度系數(shù)為指標(biāo),它是一種
相關(guān)系數(shù)。理論上說就是真分?jǐn)?shù)方差與實(shí)得分?jǐn)?shù)的方差的比值,公式
是:rxx=ptx2
(-)信度指數(shù):是真分?jǐn)?shù)標(biāo)準(zhǔn)差與實(shí)得分?jǐn)?shù)的標(biāo)準(zhǔn)差的比值,公式
是:
信度指數(shù)的平方就是信度系數(shù)rxx=ST2/SX2
(三)標(biāo)準(zhǔn)誤:指出個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。信度系數(shù)表示一組測量
的實(shí)得分?jǐn)?shù)與真分?jǐn)?shù)的符合程度,標(biāo)注誤表示個(gè)人測驗(yàn)分?jǐn)?shù)的變異量。
用一組被試兩次測量結(jié)果來代替同一個(gè)人反復(fù)實(shí)測,有了信度的另一
個(gè)指標(biāo):
測量標(biāo)準(zhǔn)誤。測量的標(biāo)準(zhǔn)誤與信度之間呈反比關(guān)系:標(biāo)準(zhǔn)誤越小,信
度越;標(biāo)準(zhǔn)誤越大,信度越低。
三、信度與測驗(yàn)分?jǐn)?shù)的解釋
(-)解釋真實(shí)分?jǐn)?shù)與實(shí)得分?jǐn)?shù)的相關(guān)
(二)比較信度可以接受的水平
(三)解釋個(gè)人分?jǐn)?shù)的意義:
(四)比較不同測驗(yàn)分?jǐn)?shù)的差異:
四、信度的類型及估計(jì)方法
(-)重測信度(再測信度):
1、含義與計(jì)算
又稱穩(wěn)定性系數(shù)。他的計(jì)算方法是采用重測法,即使用同一測驗(yàn),在
同樣條件下對(duì)同一組被試前后施測兩次測驗(yàn),求兩次得分間的相關(guān)系
_YXY-NXY
數(shù)?!耙籒w
2、使用的前提條件
(1)所測量的心理特性必須是穩(wěn)定的。
(2)遺忘和練習(xí)的效果基本上相互抵消。
(3)在時(shí)間間隔中沒有學(xué)習(xí)另外的與測驗(yàn)有關(guān)的東西,或者說每人學(xué)
習(xí)其他東西的程度都一樣。
3、優(yōu)缺點(diǎn):
優(yōu)點(diǎn):
它最符合重復(fù)測驗(yàn)的涵義,是重復(fù)測驗(yàn)最簡單最明確的方式
(2)首測和再測只需要一套測驗(yàn)題目,省時(shí),省力
(3)同一套題目無論施測兒次,所測的屬性是完全相同的。
缺點(diǎn):
(1)同一組被試對(duì)同一個(gè)測驗(yàn)先后兩次作答相互之間是不獨(dú)立的。
(2)如果兩次施測時(shí)間間隔較長,在此期間被試的身心發(fā)展,新知識(shí)
的獲得,都會(huì)使兩次測驗(yàn)結(jié)果不相同。
(3)同一個(gè)被試對(duì)現(xiàn)一個(gè)測驗(yàn)先后兩次作答,對(duì)測驗(yàn)的興趣不同,影
響測驗(yàn)結(jié)果。
(4)兩次施測的環(huán)境不同,也是產(chǎn)生測量誤差的因素。
(二)復(fù)本信度(Alternate-formreliability)
1、含義與計(jì)算:
含義:又稱等值性系數(shù)。它是以兩個(gè)平行或復(fù)本的測驗(yàn)(等值但題目
不同)來測量同一群體,然后求得被試在兩個(gè)測驗(yàn)上得分的相關(guān)系數(shù),
這個(gè)相關(guān)系數(shù)就代表了復(fù)本信度的高低。復(fù)本信度反映的是測驗(yàn)在內(nèi)
容上的等值性,故稱等值性系數(shù)。復(fù)本信度的高低關(guān)鍵取決于復(fù)本測
驗(yàn)的選擇。
2、使用的前提條件:
(1)要兩份或兩份以上真正平行的測驗(yàn)
(2)被試要有條件接受兩個(gè)測驗(yàn)。主要取決于時(shí)間、經(jīng)費(fèi)等幾方面。
3、優(yōu)缺點(diǎn):
優(yōu)點(diǎn):
(1)一個(gè)測驗(yàn)的復(fù)本使得測驗(yàn)數(shù)目的增加,對(duì)于所欲測量的屬性相聯(lián)
系的行為總體代表性強(qiáng),因此,一個(gè)測驗(yàn)的兩個(gè)復(fù)本在兩三天至一周
對(duì)同一組被試施測時(shí),獲得的復(fù)本信度系數(shù)是相當(dāng)準(zhǔn)確的。
(2)測驗(yàn)的兩個(gè)復(fù)本,如果在不同時(shí)間使用,其信度不僅可以反映在
不同時(shí)間的穩(wěn)定性,而且還可以反映對(duì)于不同測題的一致性。
(3)兩個(gè)復(fù)本在同時(shí)使用時(shí),可以避免再測驗(yàn)信度的缺點(diǎn)。
缺點(diǎn):
(1)編制兩個(gè)完全相等的測驗(yàn)是很困難的,
(2)復(fù)本法只能減少而不能完全排除練習(xí)和記憶的影響。
(3)被試同時(shí)接受性質(zhì)相似的兩個(gè)測驗(yàn)可能減少完成測驗(yàn)的積極性。
4、適用范圍
(1)如果兩個(gè)復(fù)本的施測相隔一段時(shí)間,則稱穩(wěn)定與等值系數(shù)。穩(wěn)定
與等值系數(shù)既考慮了測驗(yàn)在時(shí)間上的穩(wěn)定性,也考慮了不同題目樣本
反應(yīng)的一致性,因而是更為嚴(yán)格的信度考察方法,也是應(yīng)用較為廣泛
的方法。
(2)在實(shí)際應(yīng)用時(shí),為了抵消施測順序的效應(yīng),應(yīng)該有半數(shù)的被試先
作A本再作B本,另一半被試先作B本再作A本。
(3)復(fù)本測驗(yàn)不僅適用于難度測驗(yàn),也是估計(jì)速度測驗(yàn)信度的最好方
法。
(三)分半信度(split-halfreliability)
1、含義與計(jì)算
指采用分半法估計(jì)所得的信度系數(shù)。這種方法估計(jì)信度系數(shù)只需一種
測驗(yàn)形式,實(shí)施一次測驗(yàn)。通常是在測驗(yàn)實(shí)施后將測驗(yàn)按奇、偶數(shù)分
為等值的兩半,并分別計(jì)算每位被試在兩半測驗(yàn)上的得分,求出這兩
半分?jǐn)?shù)的相關(guān)系數(shù)。
常見的是將測題按其序列號(hào)的奇偶分,這種分法的前提是:測題并非
隨機(jī)排列,而是按某種順序(如難度)排列;如果隨機(jī)排列的題目,
則必須是所有題目平等的(要么難度相等,要么性質(zhì)一樣);如果測驗(yàn)
有多個(gè)分量表,應(yīng)該在分量表內(nèi)部排好順序,再把各分量表分兩半組
合起來求相關(guān)。
2、計(jì)算
(1)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)相等(方差齊性)
先計(jì)算兩半測驗(yàn)的積差相關(guān)系數(shù),再進(jìn)行校正。常用的修正公式是:
r=2%,
斯皮爾曼-布朗公式:“-1+如
(2)兩半測驗(yàn)分?jǐn)?shù)的變異數(shù)不等(方差不齊),可采用:
弗朗那根公式I工J
r=l-4
s.
或盧倫公式其中s;為兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù),s;為測驗(yàn)總分的變異數(shù).中的
任----個(gè)。
例題:對(duì)初一年級(jí)學(xué)生進(jìn)行地理成績測驗(yàn),每答對(duì)1題得1分,答錯(cuò)1
題得0分,測題從易到難排列如表所示,試估計(jì)該測驗(yàn)的分半信度。
學(xué)12345678910
生
奇1022132213
數(shù)
題
得
分X
偶0101123223
數(shù)
題
得
分Y
總1123255436
分
由計(jì)算器算得a=1.7,4=0.9468,7=1.5,<TV=1.08012
Sxy=30,<r,=1.75119
尸=4=-
3、使用條件及范圍
分半信度通常是在只能施測一次或沒有復(fù)本的情況下使用。而且,在
使用斯皮爾-布朗公式時(shí)要求全體被試在兩半測驗(yàn)上得分的變異數(shù)要相
等。當(dāng)一個(gè)測驗(yàn)無法分成對(duì)等的兩半時(shí),分半信度不宜使用。
(四)同質(zhì)性信度(homogeneityreliability)
1、含義:指測驗(yàn)內(nèi)部所有題目間的一致性。
題目的一致性有兩層含義:其一是指所有題目都測的是同一種心理特
質(zhì);其二是指所有題目之間都具有較高的正相關(guān)??傊?,同質(zhì)性信度
就是一個(gè)測驗(yàn)所測內(nèi)容或特質(zhì)的相同程度。
2、測量同質(zhì)性的基本公式:
%一
1+(1)虧
其中K為構(gòu)成測驗(yàn)的項(xiàng)目數(shù),虧為項(xiàng)目間相關(guān)系數(shù)的平均數(shù),%為同質(zhì)性信度值.
3、庫德-理查遜公式:適用于客觀性試題(0、1記分)
K-ao公式:
K表示構(gòu)成測驗(yàn)的題目數(shù),Pj為通過第i題的人數(shù)比例,q1為未通過第i題的人數(shù)比例為測驗(yàn)總分的變異:
K-4I公式:
kS^-X(k-X)
二-d)s;-
K表示構(gòu)成測驗(yàn)的題目數(shù),又為測驗(yàn)總分的平均數(shù),s:為測驗(yàn)總分的變異數(shù).
3、克倫巴赫系數(shù)(多重記分測驗(yàn))
其中K為測驗(yàn)的題目數(shù),S:為某一題目分?jǐn)?shù)的變異數(shù),S;為測驗(yàn)總分的變異數(shù).
例題:某態(tài)度量表共7題,100個(gè)被試在各題上的得分方差分別是
0.81,0.82,0.79,0.83,0.85,0.76,0.77,測驗(yàn)總分的方差為14.00,則此測量的
的信度為0.70.
4、注意:
當(dāng)各個(gè)測題的得分有較高的正相關(guān)時(shí),不論題目的內(nèi)容和形式如何,
測驗(yàn)即為同質(zhì)的;若所有題目看起來好像測量的是同一特質(zhì),但相關(guān)
很低或?yàn)樨?fù)相關(guān)時(shí).,測驗(yàn)即為異質(zhì)的。
對(duì)于一些復(fù)雜的、異質(zhì)的心理學(xué)變量,采用單一的同質(zhì)性測驗(yàn)是不行
的,因而常常采用若干相對(duì)異質(zhì)的分測驗(yàn),并使每個(gè)分測驗(yàn)內(nèi)容具有
同質(zhì)性,這樣每個(gè)分測驗(yàn)就能用來預(yù)測異質(zhì)效標(biāo)的某一方面。
(五)評(píng)分者信度(scorerreliability)
1、含義與計(jì)算:指的是多個(gè)評(píng)分者給同一批人的答卷進(jìn)行評(píng)分的一致
性程度。是用于測量不同評(píng)分者之間所產(chǎn)生的誤差。
^K2(N3-N)
式中W為和諧系數(shù),K為評(píng)分者的人數(shù),N為被評(píng)對(duì)象數(shù),RI為每一
對(duì)象被評(píng)的等級(jí)總和。
例子:假設(shè)有三位專家給六篇論文評(píng)等級(jí),結(jié)果如表所示,試計(jì)算此
次評(píng)分者的評(píng)分者信度。
C家123456
1241563
2341562
3351462
Ri813314187
解:分別求出各篇論文等級(jí)之各Ri,
則有ZR:=63,ZR:=811,k=3,n=6
LK2(N3-N
121
=0.95
2、注意的問題:為了衡量評(píng)分者之間的信度高低,可隨機(jī)抽取若干份
測驗(yàn)卷,由兩位評(píng)分者按評(píng)分標(biāo)準(zhǔn)分別給分,然后再根據(jù)每份測驗(yàn)卷
的兩個(gè)分?jǐn)?shù)計(jì)算相關(guān),即得評(píng)分者信度。一般要求在成對(duì)的受過訓(xùn)練
的評(píng)分者之間平均一致性達(dá)0.90以上,才認(rèn)為評(píng)分是客觀的。當(dāng)多個(gè)
評(píng)分者評(píng)定多個(gè)對(duì)象,并以等級(jí)法記分時(shí),可采用肯德爾和諧系數(shù)作
為評(píng)分者信度的估計(jì)。
五、標(biāo)準(zhǔn)參照測驗(yàn)的信度估計(jì)
1、對(duì)相關(guān)法信度系數(shù)進(jìn)行校正
為了對(duì)標(biāo)準(zhǔn)參照測驗(yàn)的信度做出較為準(zhǔn)確的估計(jì),利文斯頓提出了對(duì)
相關(guān)法信度系數(shù)的校正公式:
"+(、-Of
52+(X-C)2
式中公為標(biāo)準(zhǔn)參照測驗(yàn)的信度,〃為任何一種相關(guān)法信度系數(shù),
S為分?jǐn)?shù)的標(biāo)準(zhǔn)差,又為分?jǐn)?shù)的均值,C為達(dá)標(biāo)分?jǐn)?shù)或分?jǐn)?shù)線.
2、用決策的一致性作為信度指標(biāo)
林德曼與梅倫達(dá)的一致性公式:
C=…
+v(n+/7+?)
C為一致性,n為在兩次施測中均未達(dá)到標(biāo)的人數(shù),b為在兩次施測中
均已達(dá)標(biāo)的人數(shù),f為只在第一次施測中達(dá)標(biāo)的人數(shù),s為只在第二次
施測中達(dá)標(biāo)的人數(shù),v為f或s中較小的值。
六、各種信度系數(shù)相應(yīng)誤差方差的來源
信度系數(shù)類型誤差方差來源
重測信度時(shí)間取樣
復(fù)本信度(連續(xù)施測)內(nèi)容取樣
復(fù)本信度(間隔施測)時(shí)間和內(nèi)容取樣
分半信度內(nèi)容取樣
同質(zhì)性信度內(nèi)容的異質(zhì)性
評(píng)分者信度評(píng)分者之間的差異
七、影響信度的因素
(-)樣本的特征:信度常用信度系數(shù)來表示,信度系數(shù)就是相關(guān)系
數(shù),相關(guān)系數(shù)受樣本團(tuán)體得分分布、樣本是否異質(zhì)及樣本團(tuán)體平均能
力水平的影響。
1、樣本團(tuán)體分?jǐn)?shù)分布的影響:當(dāng)分布范圍增大時(shí),其信度估計(jì)就較高;
當(dāng)分布范圍減小時(shí),相關(guān)系數(shù)隨之下降,信度值則較低。
2、樣本團(tuán)體異質(zhì)性的影響:若獲得信度的取樣團(tuán)體較為異質(zhì)的話,往
往會(huì)高估測驗(yàn)的信度,相反則會(huì)低估測驗(yàn)的信度。
3、樣本團(tuán)體平均能力水平的影響:對(duì)于不同水平的團(tuán)體,題目具有不
同的難度,每個(gè)題目在難度上的微小差異累計(jì)起來便會(huì)影響信度。
(-)測驗(yàn)的長度:
1、測驗(yàn)越長,測驗(yàn)的測題取樣或內(nèi)容取樣越有代表性。
2、測驗(yàn)越長,被試的猜測因素影響就越小。
3、測驗(yàn)的項(xiàng)目越多,在每個(gè)項(xiàng)目上的隨機(jī)誤差就可以相互抵消。
1+(1股
式中k為改變后長度與原長度之比,2為原測驗(yàn)的信度,
%為測驗(yàn)長度是原來的k倍時(shí)的信度估計(jì).
(三)測驗(yàn)的難度:難度對(duì)信度的影響只存在于某些測驗(yàn)中,如智力
測驗(yàn)、成就測驗(yàn)、
能力傾向測驗(yàn)等。如果一個(gè)測驗(yàn)對(duì)某團(tuán)體而言太容易,會(huì)使所得分?jǐn)?shù)
都集中在高分端;當(dāng)題目太困難時(shí);得分就會(huì)集中在低分端。兩種情
況均會(huì)使信度樣本的分?jǐn)?shù)范圍變窄,從而使測驗(yàn)變得不夠可靠。從理
論上說,只有難度水平為50%時(shí),才能使測驗(yàn)分?jǐn)?shù)分布范圍最大,求
得的信度也最I(lǐng)WJ。
(四)測驗(yàn)的時(shí)間間隔:以再測法或復(fù)本法求信度,兩次測驗(yàn)相隔時(shí)
間越短,其信度系數(shù)越大;間隔時(shí)間越久,其它變因介入的可能性越
大,受外界的影響越大,信度系數(shù)便越低。
第三節(jié)測驗(yàn)的效度
在測量活動(dòng)中,測量者對(duì)所使用的測量工具非常信任,他會(huì)采取復(fù)測
行為以判斷測量有無誤差;如果測量者對(duì)所使用的測量工具發(fā)生懷疑,
那他往往會(huì)去找一公認(rèn)非常準(zhǔn)確的測量工具對(duì)先前的測值進(jìn)行檢驗(yàn)。
這種在原測量工具之外尋求新的證據(jù)來肯定或否定某一測量工具準(zhǔn)確
性的做法就是在研究測量的效度問題。心理測量是一種間接測量,心
理測量更重視測量的效度研究。
一、效度(validity)
(-)定義:效度是指所測量的與所要測量的心理特點(diǎn)之間符合的程
度,或者簡單地說是指一個(gè)心理測驗(yàn)的準(zhǔn)確性?;蚴侵敢粋€(gè)測驗(yàn)或量
表實(shí)際能測出其所要測的心理特質(zhì)的程度。
1、關(guān)于效度的概念,我們要特別注意以下幾點(diǎn):
(1)效度是一個(gè)相對(duì)的概念。這種相對(duì)性表現(xiàn)在兩個(gè)方面:
①效度是相對(duì)于一定的測量目的而言的。
②心理特質(zhì)是較隱蔽的特性,只能通過他的行為表現(xiàn)來進(jìn)行推測,因
此,心理測量不可能達(dá)到百分之百的準(zhǔn)確,而只能達(dá)到某種程度的準(zhǔn)
確。
(2)效度是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。任一誤差的存在,
測量的效度都會(huì)受到影響
(3)判斷一個(gè)測量是否有效要從多方面收集證據(jù)
2、在測驗(yàn)理論中,效度被定義為在一組測量中,與測量目標(biāo)有關(guān)的真
實(shí)方差(或稱有效方差,由所要測量的變因引起的有效變異)與總方
差(實(shí)得變異數(shù))的比率,即
X),_2
?x
3、一組測驗(yàn)分?jǐn)?shù)的總方差等于真實(shí)方差與誤差方差之和,而真實(shí)方差
又可分為兩部分,即有關(guān)的方差和無關(guān)的但穩(wěn)定的方差,后者也就是
所謂系統(tǒng)誤差帶來的方差S2X=SV2+SI2+SE2
由于有效方差是一個(gè)理論值,無法測量,所以效度和信度一樣是一個(gè)
理論上的概念。
二、效度和信度的關(guān)系
(-)信度是效度的必要而非充分條件。
(-)效度是受信度制約的:信度系數(shù)的平方根是效度系數(shù)的最高限
度,
可見,一個(gè)測驗(yàn)的效度總是受它的信度所制約。
三、效度的類型及評(píng)估方法
(一)內(nèi)容效度(ContentValidity)
1、定義:指的是項(xiàng)目對(duì)欲測的內(nèi)容或行為范圍的取樣的適當(dāng)程度。也
即測驗(yàn)題目對(duì)有關(guān)內(nèi)容或行為取樣的適用性,從而確定測驗(yàn)是否是所
欲測量的行為領(lǐng)域的代表性取樣。
一個(gè)測驗(yàn)要具備較好的內(nèi)容效度必須滿足兩個(gè)條件:
(1)要確定好內(nèi)容范圍,并使測驗(yàn)的全部項(xiàng)目均在此范圍內(nèi)。所謂內(nèi)
容范圍可以是具體知識(shí)或技能,也可以是復(fù)雜的行為。要對(duì)所測量的
心理特性有個(gè)明確的概念,并劃定出哪些行為與這心理特性有關(guān)。
(2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。
2、內(nèi)容效度的評(píng)估方法:
(1)專家判斷法:
(2)統(tǒng)計(jì)分析法
(3)經(jīng)驗(yàn)推測法:3、內(nèi)容效度的應(yīng)用
(1)是編制任何測驗(yàn)應(yīng)加以考慮的基本方面。
(2)較適用于評(píng)價(jià)教育成就測驗(yàn)和職業(yè)選拔測驗(yàn)。
(3)對(duì)標(biāo)準(zhǔn)參照測驗(yàn)更為重要,是因?yàn)樵跇?biāo)準(zhǔn)參照測驗(yàn)中我們主要關(guān)
心的是被試對(duì)一定范圍的知識(shí)、技能掌握得如何。
(4)注意內(nèi)容效度與表面效度的關(guān)系(5)它缺乏可靠的數(shù)量指標(biāo),
因而妨礙了各測驗(yàn)間的相互比較。
(二)構(gòu)想效度(constructValidity)
1954年提出,有人翻譯為構(gòu)思效度,也有叫結(jié)構(gòu)效度。它是指測驗(yàn)?zāi)?/p>
夠測量到理論上的構(gòu)想和特質(zhì)的程度,即測驗(yàn)的結(jié)果是否能證實(shí)或解
釋某一理論的假設(shè)、術(shù)語或構(gòu)想,解釋的程度如何。
1、構(gòu)想效度的特點(diǎn):
(1)其大小首先取決于事先假定的心理特質(zhì)理論
(2)當(dāng)實(shí)際測量的資料無法證實(shí)我們的理論假設(shè)時(shí),并不一定就表明
該測驗(yàn)結(jié)構(gòu)效不高,因?yàn)檫€有可能是理論假設(shè)不成立,或者該實(shí)驗(yàn)設(shè)
計(jì)不能對(duì)該假設(shè)作適當(dāng)?shù)臋z驗(yàn)等情況,當(dāng)然這就使得結(jié)構(gòu)效度的獲取
更為困難。
(3)結(jié)構(gòu)效度通過測量什么、不測量什么的證據(jù)累積起來給以確定,
因而不可能有單一的數(shù)量指標(biāo)來描述結(jié)構(gòu)效度。
結(jié)構(gòu)效度主要應(yīng)用于智力測驗(yàn)、人格測驗(yàn)等一些心理測驗(yàn)方面。
2、結(jié)構(gòu)效度的確定方法:
(1)提出理論假設(shè),并把這一假設(shè)分解成一些細(xì)小的綱目,以解釋被
試在測驗(yàn)上的表現(xiàn)。
(2)依據(jù)理論框架,推演出有關(guān)測驗(yàn)成績的假設(shè)。
(3)用邏輯和實(shí)證的方法來驗(yàn)證假設(shè)。
3、構(gòu)想效度的估計(jì)方法:
(1)測驗(yàn)內(nèi)法(對(duì)測驗(yàn)本身的分析):
(2)測驗(yàn)間的相互比較:
①相容效度
②區(qū)分效度是構(gòu)思效度的又一個(gè)證據(jù)。
③因素效度:(3)效標(biāo)關(guān)聯(lián)法,效度的研究證明:一個(gè)測驗(yàn)若效標(biāo)度
理想,那么該測驗(yàn)所預(yù)測的效標(biāo)的性質(zhì)和種類就可以作為分析測驗(yàn)構(gòu)
思效度的指標(biāo),另一種證實(shí)構(gòu)思效度的方法是心理特質(zhì)的發(fā)展變化。
(4)實(shí)驗(yàn)法和觀察法證實(shí):觀察實(shí)驗(yàn)前和實(shí)驗(yàn)后分?jǐn)?shù)的差異是驗(yàn)證構(gòu)
思效度的方法。
3、對(duì)構(gòu)想效度的評(píng)價(jià)
(1)構(gòu)想效度促使研究者把著眼點(diǎn)放在提出假設(shè)上、檢驗(yàn)假設(shè)上,使
得測驗(yàn)成為理論研究的重要工具,而不再只是實(shí)際決策的輔助工具,
從而使測驗(yàn)有了更廣闊的發(fā)展情景。
(2)主要缺點(diǎn)是,有些構(gòu)想概論模糊,沒有一致的定義,確定效度時(shí)
沒有明確的操作步驟,沒有單一的數(shù)量指標(biāo)來描述有效程度。
(三)效標(biāo)效度
1、定義:又稱實(shí)證效度,反映的是測驗(yàn)預(yù)測個(gè)體在某種情境下行為表
現(xiàn)的有效性程度。被預(yù)測的行為是檢驗(yàn)效度的標(biāo)準(zhǔn),簡稱效標(biāo)。由于
這種效度是看測驗(yàn)對(duì)效標(biāo)預(yù)測如何,所以叫效標(biāo)效度。這種效度需在
實(shí)踐中檢驗(yàn),所以又稱為實(shí)證效標(biāo)。
2、分類:根據(jù)效標(biāo)資料是否與測驗(yàn)分?jǐn)?shù)同時(shí)獲得,又可分為同時(shí)效度
和預(yù)測效度兩類。同時(shí)效度即測驗(yàn)所得分?jǐn)?shù)可與效標(biāo)同時(shí)驗(yàn)證,通常
與心理特征的評(píng)估及診斷有關(guān)。
3、效標(biāo)和效標(biāo)測量:效標(biāo),即衡量測驗(yàn)有效性的參照標(biāo)準(zhǔn),指的是可
以直接而且獨(dú)立測量的我們感興趣的行為。效標(biāo)可以分為兩個(gè)層次,
其一是理論水平的觀念效標(biāo),其二是操作定義水平的效標(biāo)測量。
4、常用的效標(biāo)包括:
(1)學(xué)業(yè)成就;
(2)實(shí)際工作表現(xiàn)
(3)特殊訓(xùn)練成績
(4)精神病診斷
(5)等級(jí)評(píng)定
(6)效標(biāo)團(tuán)體的比較
(7)先前有效的測驗(yàn)
5、效標(biāo)效度的表示方法
(1)相關(guān)法:效度系數(shù)是最常用的效度指標(biāo),尤其是效標(biāo)效度。它是
以皮爾遜積差相關(guān)系數(shù)來表示的,主要反映測驗(yàn)分?jǐn)?shù)與效標(biāo)測量的相
關(guān)。當(dāng)測驗(yàn)成績是連續(xù)變量,而效標(biāo)資料是二分變量時(shí),計(jì)算效度系
數(shù)可用點(diǎn)二列相關(guān)公式或二列相關(guān)公式;當(dāng)測驗(yàn)分?jǐn)?shù)為連續(xù)變量,效
標(biāo)資料為等級(jí)評(píng)定時(shí),可用賈斯朋多系列相關(guān)公式計(jì)算。
(2)區(qū)分法:是檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體的
一種方法。算出t值后,便可知道分?jǐn)?shù)的差異是否顯著。若差異顯著,
說明該測驗(yàn)?zāi)軌蛴行У貐^(qū)分由效標(biāo)定義的團(tuán)體,否則,測驗(yàn)是無效的。
重疊百分比可以通過計(jì)算每一組內(nèi)得分超過(或低于)另一組平均數(shù)
的人數(shù)百分比得出;另外,還可以計(jì)算兩組分布的共同區(qū)的百分比。
重疊量越大,說明兩組分?jǐn)?shù)差異越小,即測驗(yàn)的效度越差。
(3)命中率法:是當(dāng)測驗(yàn)用來做取舍的依據(jù)時(shí),用其正確決定的比例
作為效度指標(biāo)的一種方法。命中率的計(jì)算有兩種方法,一是計(jì)算總命
中率,另一種是計(jì)算正命中率。
命中表
失?。?)成功(+)
成功(+)A(失誤)B(命中)
失敗(-)C(命中)D(失誤)
總命中率:p=-命中—〃x100%=―5^—X100%
命中+失誤A+B+C+D
正命中率黑管'1°°%=焉-°°%
(4)預(yù)期表法:是一種雙向表格,預(yù)測分?jǐn)?shù)排在表的左邊,效標(biāo)排在
表的頂端。從左下至右上對(duì)角線上各百分?jǐn)?shù)字越大,而其它的百分?jǐn)?shù)
字越小,表示測驗(yàn)的效標(biāo)效度越高;反之,數(shù)字越分散,則效度越低。
(5)功利率法:使用測驗(yàn)所花掉的費(fèi)用與得到的利益進(jìn)行比較,此種
效度指標(biāo)叫功利率。
四章測驗(yàn)分?jǐn)?shù)的合成與解釋
[教學(xué)目的與要求]
(1)了解分?jǐn)?shù)合成的方法
(2)掌握分?jǐn)?shù)解釋要注意的問題
[教學(xué)重點(diǎn)與難點(diǎn)]常模及其意義
第一節(jié)分?jǐn)?shù)的合成
分?jǐn)?shù)的組合可以在不同層面上進(jìn)行,一般情況下有以下幾種方法:
項(xiàng)目的組合:不同項(xiàng)目可以組合成量表或分測驗(yàn),所有項(xiàng)目可以合成
一個(gè)測驗(yàn)總分。
分測驗(yàn)或量表的組合:幾個(gè)分測驗(yàn)可量表的分?jǐn)?shù)組合到一起得到一個(gè)
合成分?jǐn)?shù)。
測驗(yàn)或預(yù)測源的組合:幾個(gè)測驗(yàn)或預(yù)測源同時(shí)使用。
一、組合變量的方法
(―)臨床判斷MMPI
根據(jù)直覺經(jīng)驗(yàn),主觀地將各種因素組合以得出結(jié)論或預(yù)測的方法叫臨
床判斷。
優(yōu)點(diǎn):
1、能從整體上對(duì)各個(gè)因素加以綜合考慮
2、每個(gè)判斷都是針對(duì)特定的個(gè)人做出的,能考慮到每個(gè)人具體情況。
缺點(diǎn):
1、主觀加權(quán)可能受判斷者的偏見的影響,不夠客觀;
2、沒有精確的數(shù)量指標(biāo);
3、判斷者需要受過訓(xùn)練并具有豐富經(jīng)驗(yàn)
(―)推理方法
不考慮各個(gè)變量的經(jīng)驗(yàn)關(guān)系,而是根據(jù)某種先驗(yàn)的理想程序來作推理
性加權(quán)。
1、單位加權(quán):將各個(gè)變量直接相加而得一個(gè)合成分?jǐn)?shù)
2、等量加權(quán):將所有分?jǐn)?shù)轉(zhuǎn)換成標(biāo)準(zhǔn)分?jǐn)?shù),然后再把它們加以組合。
(三)多重分段:假設(shè)預(yù)測源間不具互償性。
把人分成達(dá)到最低標(biāo)準(zhǔn)(接受)與未達(dá)到最低標(biāo)準(zhǔn)(拒絕)兩類,而
不在這兩組人內(nèi)部作進(jìn)一步區(qū)分。
1、綜合分段
把風(fēng)個(gè)預(yù)測源與效標(biāo)的關(guān)系綜合起來考慮,在保證合成體的預(yù)測效度
最高的前提下,分別確定出每個(gè)預(yù)測源的最佳分?jǐn)?shù)線。
2、連續(xù)柵欄
當(dāng)預(yù)測源分?jǐn)?shù)只能陸續(xù)得到,而每個(gè)變量又具有自己特定的閾限時(shí),
不必讓每個(gè)申請(qǐng)者都在所有預(yù)測源上嘗試,只有通過第一項(xiàng),才能進(jìn)
行下一項(xiàng)。
(四)多重回歸
當(dāng)同時(shí)采用幾個(gè)預(yù)測源來預(yù)測一個(gè)效標(biāo),而這些預(yù)測源變量之間又具
有互償性時(shí),采用多重回歸。
(五)合成分?jǐn)?shù)
1、完形記分
將各個(gè)變量看做一個(gè)整體,不是孤立地看第一個(gè)反應(yīng)結(jié)果,而是看總
的反應(yīng)模式。
2、輪廓分析
考慮被試在各個(gè)測驗(yàn)或量表上所得分?jǐn)?shù)的輪廓,而不是將各個(gè)變量作
簡單的線性組合。
二、各種組合方法的比較
(一)應(yīng)用范圍
1、選人:以多重分段或多重回歸方法來組合預(yù)測分?jǐn)?shù)
2、安置:多重回歸
3、描述:所有方法均可
(-)資料特征
1、輸入資料的種類
2、輸出資料的方式
(三)效度
1、合成體的效度
2、元素的效度
3、效度的比較
(1)推理法與實(shí)證法的比較
(2)分段法與回歸法的比較
(3)臨床法與統(tǒng)計(jì)法的比較
第二節(jié)分?jǐn)?shù)的解釋
一、常模
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- GB/T 19941.1-2025皮革和毛皮甲醛含量的測定第1部分:高效液相色譜法
- 2026年歷史建筑保護(hù)保險(xiǎn)合同中
- 2026年快遞服務(wù)合同
- 2025年聊城市檢察機(jī)關(guān)公開招聘聘用制書記員77人備考題庫完整答案詳解
- 廣東2025年民生銀行汕頭分行社會(huì)招聘備考題庫完整答案詳解
- 2025年昭覺縣應(yīng)急管理局關(guān)于公開招聘綜合應(yīng)急救援隊(duì)伍人員的備考題庫完整參考答案詳解
- 春節(jié)放假通知、值班備勤表、值班巡查簽到表
- 2025年西藏革吉縣財(cái)政局招聘財(cái)會(huì)監(jiān)督人員的備考題庫帶答案詳解
- 2025年鄭州市中原銀行農(nóng)村普惠金融支付服務(wù)點(diǎn)招聘備考題庫及答案詳解參考
- 2025年煙臺(tái)市檢察機(jī)關(guān)公開招聘聘用制書記員的備考題庫(24人)及一套答案詳解
- GB/T 46785-2025風(fēng)能發(fā)電系統(tǒng)沙戈荒型風(fēng)力發(fā)電機(jī)組
- 2025年江蘇鹽城港控股集團(tuán)有限公司招聘21人備考題庫及參考答案詳解1套
- 云南民族大學(xué)附屬高級(jí)中學(xué)2026屆高三聯(lián)考卷(四)化學(xué)+答案
- 楷書簡介課件復(fù)制
- 《做酸奶》課件教學(xué)課件
- 2025西部機(jī)場集團(tuán)航空物流有限公司招聘考試筆試備考試題及答案解析
- 《教育心理學(xué)》期末重點(diǎn)鞏固專練題庫(附答案)
- 2025年秋人教版(新教材)初中數(shù)學(xué)七年級(jí)上冊期末綜合測試卷及答案
- 施工升降機(jī)操作培訓(xùn)試題及答案
- 企業(yè)檔案基礎(chǔ)知識(shí)課件
- 醫(yī)院購買物業(yè) 保潔服務(wù)項(xiàng)目方案投標(biāo)文件(技術(shù)方案)
評(píng)論
0/150
提交評(píng)論