第四章測驗(yàn)題目性能與題目編制_第1頁
第四章測驗(yàn)題目性能與題目編制_第2頁
第四章測驗(yàn)題目性能與題目編制_第3頁
第四章測驗(yàn)題目性能與題目編制_第4頁
第四章測驗(yàn)題目性能與題目編制_第5頁
已閱讀5頁,還剩92頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章測驗(yàn)題目性能與題目編制第一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心引子心理測量的工具是測驗(yàn),而題目則是構(gòu)成測驗(yàn)的基石,因此研究題目的性能及其編制至關(guān)重要,它直接影響測量工具(即測驗(yàn))的信度及效度,進(jìn)而影響測量的準(zhǔn)確性。在實(shí)際工作中,人們應(yīng)如何來編制測驗(yàn)題目?如何評(píng)價(jià)測驗(yàn)題目質(zhì)量的好差呢?本章將對(duì)這些問題做出回答。第二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心測驗(yàn)題目性能與題目編制測驗(yàn)題目類型、功能與題目編制1測驗(yàn)題目的難度與難度分布控制2測驗(yàn)題目的區(qū)分度與區(qū)分度的提高3測驗(yàn)題目的猜測度與猜測控制4選擇題的選項(xiàng)分析與選項(xiàng)修改5題目功能差異與測量偏差控制6第三頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制測驗(yàn)題目的類型功能與編制

第一節(jié)第四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第一節(jié)一、測驗(yàn)題目類型題目主要可分為客觀題和主觀題兩大類。客觀題一般有標(biāo)準(zhǔn)唯一的答案,被試的作答只有與標(biāo)準(zhǔn)答案完全一致才視為答對(duì),否則視為答錯(cuò)。主觀題無標(biāo)準(zhǔn)唯一答案,只有一個(gè)參考答案,被試的作答與參考答案相近或基本一致就可視為答對(duì)。第五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。主觀題主要包括名詞解釋、簡答題、計(jì)算題、證明題、論述題、案例分析題、作文題等。第六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心單項(xiàng)選擇題多項(xiàng)選擇題自陳式選擇題是非判斷題名詞解釋題簡答題計(jì)算題證明題論述題案例分析題組合題行為情景判斷題第七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、選擇題1、定義:選擇題指給出題干及備選項(xiàng),要求被試根據(jù)題干從備選項(xiàng)中選出正確選項(xiàng)的題目。單項(xiàng)選擇題指只有唯一正確選項(xiàng)的選擇題。2、特點(diǎn)功能:①評(píng)分標(biāo)準(zhǔn)明確,評(píng)分客觀,有利于減少評(píng)分帶來的評(píng)分誤差。②有利于對(duì)基礎(chǔ)知識(shí)和基本技能進(jìn)行考查。第八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③選擇題適合考查較低層次的能力,如識(shí)記能力、較低的理解能力等,而不宜考查較高層次的能力,如綜合能力、創(chuàng)造性和獨(dú)立思維能力。④選擇題的命題技術(shù)要求較高,尤其是干擾項(xiàng)的設(shè)置。第九頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心3、選擇題編制題干要描述清楚。應(yīng)讓答題者明白問題是什么,希望答題者解決什么題干中應(yīng)盡量避免出現(xiàn)與考核內(nèi)容無關(guān)的材料設(shè)問應(yīng)盡量正向,盡量少出現(xiàn)如“下面哪個(gè)是不對(duì)的?”的設(shè)問第十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心題干文字的字體應(yīng)盡量一致(,以減輕考生的閱讀負(fù)擔(dān)備選項(xiàng)應(yīng)避免出現(xiàn)邏輯上的包含關(guān)系備選項(xiàng)的長度、結(jié)構(gòu)、語言表達(dá)要盡量一致增加干擾項(xiàng)的迷惑性干擾項(xiàng)的設(shè)置應(yīng)能反應(yīng)考生缺乏特定的知識(shí)或技能第十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心三、填空題1、特點(diǎn)功能:①考查的能力層次范圍比較廣,主要考核識(shí)記和理解能力。②填空題要求考生把問題的最后答案或結(jié)論正確無誤地表達(dá)出來,在一定程度上是對(duì)考生的嚴(yán)謹(jǐn)、嚴(yán)密、認(rèn)真、細(xì)致的工作作風(fēng)和科學(xué)態(tài)度的檢查。第十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③評(píng)分簡單,誤差也相對(duì)要小。④填空題只要求考生寫出最后答案,而不必寫出解題的具體過程,因此,從試卷上看不出考生的推理、分析等思考過程第十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、填空題編制試題的空格處應(yīng)考查有意義的關(guān)鍵性內(nèi)容或詞語。每小題的空格數(shù)不宜過多,填寫的字?jǐn)?shù)也不能太多??崭癫糠纸y(tǒng)一用下劃線表示,長度應(yīng)能滿足答題需要若空格處考核計(jì)算能力并要求填寫數(shù)字,應(yīng)在空格后標(biāo)明數(shù)字的單位第十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心三、論述題與計(jì)算題1、定義:論述題指對(duì)某一問題或議題進(jìn)行綜合論述的題目。它用于考查被試分析、綜合、評(píng)價(jià)直至創(chuàng)新、創(chuàng)造等高層次能力。第十五頁,共九十七頁,2022年,8月28日計(jì)算題指主要是通過計(jì)算或運(yùn)算來解答的題目。計(jì)算題內(nèi)容量有大有小,常常用于考查被試的應(yīng)用能力。一般要求給出條件完備無冗余,答案唯一。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、特點(diǎn)功能:

①論述題有利于考生獨(dú)立地、創(chuàng)造性地解題。試題的能力考查涉及的知識(shí)面可以比較大,而且要求考生通過分析去找出所涉及的知識(shí)并找出它們的內(nèi)在聯(lián)系。試題從定性分析到定量計(jì)算,工作量一般比較大。

第十七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心②論述題和計(jì)算題不僅能夠考查考生較低層次的能力目標(biāo),而且能夠比較好地考查較高層次的能力目標(biāo)。第十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③論述題和計(jì)算題能夠反映考生的思維過程,因而能比較有效地考查考生接受信息、鑒別和選擇信息的能力,分析、推理、綜合應(yīng)用知識(shí)的能力,能鑒別出考生對(duì)問題解決的程度。第十九頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心④論述題和計(jì)算題可以根據(jù)試題相應(yīng)情境進(jìn)行不同層次、不同角度的設(shè)問,如可以是單問,可以是多問,也可以是分步設(shè)問,使試題的考查目標(biāo)比較明確。第二十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心⑤論述題、計(jì)算題在評(píng)分過程具有一定的主觀性。⑥論述題、計(jì)算題的最大缺點(diǎn)是閱卷評(píng)分的工作量比較大,對(duì)閱卷人員的要求比較高,閱卷工作的費(fèi)用較大。同時(shí)論述題、計(jì)算題評(píng)分誤差較難控制,在控制不好的情況下,評(píng)分誤差可能會(huì)很大。第二十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心四、行為情景判斷題1、定義:行為情景判斷題多見于心理測驗(yàn)中,它指給出一個(gè)日常生活中或工作中的具體情景,并針對(duì)該情景提供若干解決這一情景下具體問題的行為選項(xiàng),并要求受測者進(jìn)行選擇/評(píng)價(jià)的題型。第二十二頁,共九十七頁,2022年,8月28日2、特點(diǎn)功能:①與一般認(rèn)知能力有較強(qiáng)的相關(guān),平均達(dá)0.54②跟大五人格因素的多項(xiàng)因素有中度以上的相關(guān),如跟責(zé)任心的相關(guān)為0.26,跟情緒穩(wěn)定性的相關(guān)為0.32,跟宜人性的相關(guān)為0.25心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第二十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③跟所測領(lǐng)域個(gè)人的工作經(jīng)驗(yàn)、工作年限有統(tǒng)計(jì)顯著意義的相關(guān)。④有些情景判斷測驗(yàn)作探索性因素分析,可提取出一個(gè)大的一般因素,這時(shí)測驗(yàn)的內(nèi)部一致性系數(shù)可為0.86⑤對(duì)員工的工作績效有較好的預(yù)測力,平均效度系數(shù)為0.36第二十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心3、行為情景判斷題編制①題目編制前應(yīng)先確定所測特質(zhì)的結(jié)構(gòu),然后在這一所測特質(zhì)結(jié)構(gòu)下征集或編寫問題情景及行為反應(yīng)項(xiàng)②問題情景應(yīng)是現(xiàn)實(shí)生活中可能發(fā)生的,且有一具體的問題需要受測者來解決,解決問題的行為/方法不應(yīng)是唯一的而是多樣化的第二十五頁,共九十七頁,2022年,8月28日③問題情景應(yīng)盡量敘述完整,清晰,語言規(guī)范,字?jǐn)?shù)介于100-300④一般是根據(jù)相關(guān)有豐富經(jīng)驗(yàn)的專家來確定行為項(xiàng)的優(yōu)劣,然后將受測者的作答與專家的評(píng)定進(jìn)行比較,從而確定具體的計(jì)分方式及評(píng)價(jià)標(biāo)準(zhǔn)心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第二十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心⑤行為情景判斷題設(shè)問方式一般有四種形式:一是要求受測者選擇最優(yōu)行為項(xiàng),二是要求受測者選擇最差行為項(xiàng),三是要求受測者同時(shí)選擇最優(yōu)和最差行為項(xiàng),四是要求受測者針對(duì)每一行為項(xiàng)的有效性做出評(píng)價(jià)。應(yīng)根據(jù)實(shí)際選擇具體方式。第二十七頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制測驗(yàn)題目難度與測驗(yàn)分布控制

第二節(jié)第二十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第二節(jié)一、難度定義及其計(jì)算方法(一)難度定義難度是指題目的難易程度。如果一個(gè)題目絕大多數(shù)人都答對(duì)了,則這個(gè)題目比較容易;反之,若絕大多數(shù)人都答錯(cuò)了,則這個(gè)題目比較難。從難度定義可以看到,難度是題目性質(zhì)與作答者群體水平共同作用的結(jié)果。第二十九頁,共九十七頁,2022年,8月28日難度這一概念更多地用于能力測驗(yàn)中,在非能力測驗(yàn)(如人格測驗(yàn))中,一般稱為“通俗性”(popularitylevel),即取自相同總體的樣本中,在答案方向上回答該題的人數(shù)比。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第三十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(二)難度計(jì)算方法1、得分率法得分率指所有被試在題目上的平均得分占題目滿分的百分比。計(jì)算公式為

第三十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第三十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、極端分組法極端分組法是指將被試按測驗(yàn)總分分為高分組和低分組,以兩組得分率的平均值作為題目的難度。極端分組法中,首先需對(duì)被試進(jìn)行分組,根據(jù)被試的試卷總得分進(jìn)行排序,各取首尾的27%(或25%、33%),組成高分組和低分組。第三十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第三十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(三)題目難度計(jì)算實(shí)例

例4-1下表是隨機(jī)抽取22名被試在某數(shù)學(xué)測驗(yàn)中四道題目的得分情況,每題的滿分分別為1分、2分、3分和4分,請(qǐng)分析其難度。第三十五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第三十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(四)等距難度指標(biāo)及其求取題目的難度一般用通過率或得分率來表示,計(jì)算比較方便,但這類變量屬于順序變量,不具有相等的單位,不能具體比較難度的差異。第三十七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心等距轉(zhuǎn)換方法當(dāng)測驗(yàn)分?jǐn)?shù)接近正態(tài)分布,根據(jù)正態(tài)分布將試題的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等測量單位的等距量表,即Z分?jǐn)?shù)。第三十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心等距轉(zhuǎn)換但是Z值常含有負(fù)值,因此不易理解,通常需轉(zhuǎn)換為另一種等距變量,其中較為常用的是美國教育測驗(yàn)服務(wù)中心采用的難度指標(biāo):△=13+4*Z式中△表示題目的難度,Z表示由P轉(zhuǎn)換得來的標(biāo)準(zhǔn)分?jǐn)?shù)。第三十九頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、難度分布及其控制(一)測驗(yàn)試題難度分布對(duì)測驗(yàn)分?jǐn)?shù)的影響

1、難度對(duì)測驗(yàn)分?jǐn)?shù)分布形態(tài)的影響當(dāng)測驗(yàn)題目過難時(shí),測驗(yàn)分?jǐn)?shù)呈負(fù)偏態(tài)分布;當(dāng)測驗(yàn)題目過易時(shí),測驗(yàn)分?jǐn)?shù)呈正偏態(tài)分布;當(dāng)測驗(yàn)題目趨近中等難度,測驗(yàn)分?jǐn)?shù)基本可呈正態(tài)分布。第四十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、難度對(duì)測驗(yàn)分?jǐn)?shù)離散程度的影響測驗(yàn)過難或過易,會(huì)使測驗(yàn)分?jǐn)?shù)相對(duì)地集中低分端或高分端,這樣被試的差異較小,即測驗(yàn)分?jǐn)?shù)的離散程度很小,只有當(dāng)測驗(yàn)趨近中等難度時(shí),測驗(yàn)分?jǐn)?shù)分布范圍較廣,離散程度就會(huì)大。第四十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(二)、合理難度及合理難度分布

對(duì)于常模參照性測驗(yàn)而言,測驗(yàn)?zāi)康氖菫榱藚^(qū)分被試、最大限度地將被試得分“拉開距離”。對(duì)所有被試而言,合理項(xiàng)目難度為0.5,分布范圍應(yīng)在0.3到0.7之間。第四十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心對(duì)于目標(biāo)參照性測驗(yàn)而言,其合理難度分布是:對(duì)于恰好合格被試而言難度為0.5左右窄全距分布,也即測驗(yàn)在合格與合格被試處有較高的區(qū)分能力。第四十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(三)、合理難度及合理難度分布的控制

(1)對(duì)題目難度的控制主要從考核的知識(shí)點(diǎn)及其能力層次等方面進(jìn)行控制??己藛我恢R(shí)點(diǎn)的題目相對(duì)考核較多同類知識(shí)點(diǎn)的題目要容易。第四十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心考核能力層次相對(duì)要低(如識(shí)記和記憶)的題目,其難度相對(duì)低,而對(duì)于考核能力層次高(如理解、綜合應(yīng)用)的題目,其難度相對(duì)會(huì)高。因而可以通過控制題目考核的知識(shí)點(diǎn)及其能力層次來達(dá)到控制試題難度。第四十五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(2)對(duì)試卷難度分布的控制控制試卷難度分布是在控制試題難度的前提下進(jìn)行,它主要是通過控制不同難度題目的比例從而達(dá)到所需的難度分布。第四十六頁,共九十七頁,2022年,8月28日如果測驗(yàn)是選拔性測驗(yàn),則難、易題目所占比例應(yīng)充分考慮選拔的比例;如果是常模參照性測驗(yàn),則中等難度題比例要多,而偏難偏易的題比例要少;如果是目標(biāo)參照性測驗(yàn),不同難度題的比例應(yīng)結(jié)合“目標(biāo)”(如課程標(biāo)準(zhǔn)或《考試大綱》)本身來確定。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第四十七頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制測驗(yàn)題目的區(qū)分度與區(qū)分度的提高

第三節(jié)第四十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心一、區(qū)分度的定義及其計(jì)算方法(一)、區(qū)分度定義

區(qū)分度指題目對(duì)被試特質(zhì)差異的區(qū)分能力。若所有考生在某個(gè)題目均答對(duì)或均答錯(cuò),則此題目不能區(qū)分不同特質(zhì)的被試,即此題目無區(qū)分能力。第三節(jié)第四十九頁,共九十七頁,2022年,8月28日一般來講,題目是否有區(qū)分能力,主要是看不同能力的被試在同一題目上得分是否不同。理論上,如果題目具有高區(qū)分力,那么高能力的被試在題目上應(yīng)得高分,低能力被試在題目應(yīng)得低分,也即被試的能力與在題目上的得分應(yīng)存高相關(guān)。

心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第五十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(二)、區(qū)分度的計(jì)算方法1、相關(guān)系數(shù)法該方法的基本思想是,若題目有好的區(qū)分度,則高能力的被試在該題上應(yīng)得高分,低能力被試應(yīng)得低分,即被試在題目上的得分應(yīng)與測驗(yàn)總分相一致。其基本假設(shè)是測驗(yàn)得高分的被試即為高能力被試,測驗(yàn)得低分的被試即為低能力被試。第五十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(1)點(diǎn)二列相關(guān)法

第五十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(2)積差相關(guān)法第五十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、鑒別指數(shù)法

第五十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(三)、題目區(qū)分度計(jì)算實(shí)例例4-2下表是隨機(jī)抽取22名被試在某語文測驗(yàn)中四道題目的得分情況,四題滿分分別為1分、3分、5分和60分,其中第4題為作文題,請(qǐng)計(jì)算四題的區(qū)分度。第五十五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第五十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第五十七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)及其提高(一)、區(qū)分度的評(píng)價(jià)標(biāo)準(zhǔn)

區(qū)分度的取值范圍為[-1,1],區(qū)分度為負(fù)的(消極區(qū)分),題目性能不好,這種題目對(duì)測驗(yàn)總分合成起著不良的干擾作用。1965年美國測量學(xué)家伊貝爾根據(jù)長期經(jīng)驗(yàn)提出如下標(biāo)準(zhǔn)。

第五十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第五十九頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(二)、影響題目區(qū)分度的因素(1)題目難度(2)被試群體的同質(zhì)性(3)全卷各題所測心理品質(zhì)的一致性。(4)題目本身的文字與內(nèi)容的質(zhì)量也會(huì)影響題目的區(qū)分度第六十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(三)、提高題目區(qū)分度方法

(1)控制好題目難度。將題目難度在0.5左右時(shí),區(qū)分能力理論上會(huì)比較高。(2)保證題目所測心理品質(zhì)與全卷所測心理品質(zhì)的一致性。(3)題干及答案無歧義。(4)語言準(zhǔn)確規(guī)范。(5)借助選項(xiàng)分析提供的信息對(duì)不良選項(xiàng)進(jìn)行修改,以提高題目區(qū)分能力。第六十一頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制測驗(yàn)題目的猜測度與猜測度的控制

第四節(jié)第六十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第四節(jié)一、猜測行為與猜測度客觀題中,當(dāng)被試不知道正確答案時(shí),被試可能會(huì)進(jìn)行猜測。就目前而言,理論界對(duì)于猜測行為有兩種截然相反的觀點(diǎn):一種認(rèn)為應(yīng)對(duì)猜測行為加于控制,另一種認(rèn)為無需控制猜測行為。中。

第六十三頁,共九十七頁,2022年,8月28日猜測度是指被試全憑隨機(jī)猜測而答對(duì)題目的概率。猜測行為主要出現(xiàn)在客觀題(如選擇題、是非判斷題、配對(duì)題等)心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第六十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、猜測度控制①增加選擇題選擇項(xiàng)的個(gè)數(shù)(一般不少于四個(gè))。②增加干擾項(xiàng)的迷惑性。③控制存在猜測行為的總題量,以保證猜測誤差控制在較小范圍。④如有特殊需要,還可采用警告、扣分等方式控制被試的猜測行為。第六十五頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制選擇題的選項(xiàng)分析與選項(xiàng)修改

第五節(jié)第六十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第五節(jié)一、選項(xiàng)分析基本過程1、根據(jù)被試的測驗(yàn)總分,對(duì)被試進(jìn)行排序2、確定高分組和低分組被試3、分別登記高分組被試和低分組被試在每個(gè)備選項(xiàng)的人數(shù)及未作答人數(shù)(也可以是人數(shù)百分比),最終整理成類似表中的數(shù)據(jù)資料第六十七頁,共九十七頁,2022年,8月28日4、根據(jù)第3步整理好的數(shù)據(jù)資料,進(jìn)行具體分析心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第六十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心二、選項(xiàng)分析的方法及選項(xiàng)修改原則

1、首先分析兩組平均選答率一般正確答案的選答率應(yīng)該在0.4到0.6之間,每個(gè)干擾項(xiàng)應(yīng)該平均分剩余的選答率。如果正確答案的選答率過高或過低,這都不利于區(qū)分高分組和低分組被試。第六十九頁,共九十七頁,2022年,8月28日如果某干擾項(xiàng)選答率特低,則說明該干擾項(xiàng)錯(cuò)的過于明顯應(yīng)加以淘汰;若某干擾項(xiàng)選答率特高,則要考慮該題正確答案是否錯(cuò)誤或有兩個(gè)正確答案。心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第七十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心2、對(duì)于正確答案主要考察高分組和低分組被試在正確答案上的選答率是否是正差,及這一差距是否足夠大。只有當(dāng)高分組和低分組被試在正確答案上的選答率是正差,且這一差距足夠大時(shí),這時(shí)題目質(zhì)量較佳。第七十一頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心3、對(duì)于干擾項(xiàng)考察高分組和低分組被試在干擾項(xiàng)上的選答率是否是負(fù)差,及這一差距是否足夠大。只有當(dāng)高分組和低分組被試在正確答案上的選答率是負(fù)差,且這一距差足夠大時(shí),這時(shí)干擾項(xiàng)的設(shè)置比較合理,否則干擾項(xiàng)設(shè)置不合理,應(yīng)對(duì)干擾項(xiàng)進(jìn)行刪除或修改。第七十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心4、其它①如果高分組被試的選答集中在兩個(gè)答案上,且人數(shù)又相近,說明此題可能有兩個(gè)正確答案,或者在某種意義上另一個(gè)選擇項(xiàng)也有一定道理。應(yīng)考慮題目本身是否存有歧義或有兩個(gè)正確答案。第七十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心②如果高分組對(duì)正確答案的選答率與低分組相等或低于后者,說明該題所考察東西與被試水平無關(guān),即不具有鑒別力,此題應(yīng)作大修改或刪除。③如果一個(gè)題目被試未作答的人數(shù)較多(速度測驗(yàn)除外),或選擇各個(gè)備選項(xiàng)答案的人數(shù)相等,說明該題目過難或題意不清,被試無法作答或全憑猜測。應(yīng)修改或刪除本題。第七十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心例4-3

下表為一個(gè)由370人參加的英語測驗(yàn)中四道選擇題的統(tǒng)計(jì)結(jié)果,試分析每題難度、區(qū)分度是如何計(jì)算出來的?并對(duì)這四題的選項(xiàng)質(zhì)量進(jìn)行評(píng)價(jià)。

第七十五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第七十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心③選項(xiàng)分析:第1題,正確答案和干擾項(xiàng)的兩組平均選答率都基本正常,在正確答案上高分組的被試選擇人數(shù)要多于低分組被試,且在非正確選項(xiàng)上,高分組的被試選擇人數(shù)要少于低分組被試,這符合實(shí)際情況,四個(gè)選項(xiàng)的設(shè)置均較合理;第七十七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第2題,正確答案和干擾項(xiàng)B的兩兩組平均選答率基本一致,且正確答案上高分組的被試選擇人數(shù)要少于低分組被試,而在非正確選項(xiàng)B、D上,高分組的被試選擇人數(shù)要多于低分組被試,這均不符合實(shí)際情況,且高分組被試中選擇人數(shù)最多的為選項(xiàng)B,則要考慮該是否有2個(gè)正確選項(xiàng),因此該題選項(xiàng)設(shè)置較差,因此整題質(zhì)量較差。第七十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第3題,選項(xiàng)A、B、D兩組平均選答率都基本正常、設(shè)置均較合理,但選項(xiàng)C需修改;第4題,選項(xiàng)A、D設(shè)置合理,選項(xiàng)C設(shè)置不合理需修改,不論高分還是低分組被試均無人選擇B,該選項(xiàng)無任何迷惑作用,可刪除該選項(xiàng),并換其它具有迷惑性的選項(xiàng)。第七十九頁,共九十七頁,2022年,8月28日第四章測驗(yàn)題目的性能與題目編制題目功能差異與測量偏差控制

第六節(jié)第八十頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心第六節(jié)一、

題目功能差異、測量偏差定義及其偵查方法(一)、題目功能差異及測量偏差定義“某年的高考實(shí)驗(yàn)試卷有一道關(guān)于魚頭和魚尾作文題:第一幅是母親把魚中段夾給年幼的兒子,自己吃魚頭魚尾;第二幅漫畫是兒子長大了,把魚頭魚尾留給母親吃,自己吃魚中段。要求被試就此發(fā)表議論,寫一篇作文?!钡诎耸豁摚簿攀唔?,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心題目功能差異(differentialitemfunction,DIF)是指不同群體對(duì)同一題目的答對(duì)概率(或得分率)不同,即不同群體在同一題目上得分存在差異。造成題目功能差異的原因可能是群體間本身水平存在差異,也可能是群體本身水平不存在差異而由于其它原因(如風(fēng)俗習(xí)慣、性別、種族、地域)所致。第八十二頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心若題目功能差異是由前者引起,則稱為良性題目功能差異;若是由后者引起,則稱為不良題目功能差異,即存在測量偏差。題目功能差異主要是針對(duì)不同群體而言,目前測量學(xué)領(lǐng)域關(guān)注較多群體差異主要有性別差異、地區(qū)差異、種族差異、跨文化差異等。第八十三頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心因此有DIF的題目不一定存在測量偏差,良性DIF不存在測量偏差,不良DIF才存在測量偏差;但有測量偏差的題目一定存在DIF。

第八十四頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心在題目功能差異研究中還有一對(duì)重要概念:一致性DIF和不一致性DIF。一致性DIF是指被試的能力水平與其組別之間不存在交互作用,即在所有的能力水平上,一組被試回答某一項(xiàng)目的正確率都大于另一組。當(dāng)被試的能力水平與其組別之間存在交互作用時(shí),則表現(xiàn)為非一致性DFI。第八十五頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(二)、題目功能差異及測量偏差偵查方法

要偵查題目是否存在測量偏差,首先應(yīng)偵查題目是否存在DIF,若不存在DIF,則不存在測量偏差,若存在DIF,還應(yīng)分析是良性DIF還是不良DIF,只有不良DIF才會(huì)造成測量偏差。第八十六頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心1、DIF及測驗(yàn)偏差偵查的一般步驟(1)被試群體的確定及數(shù)據(jù)資料的準(zhǔn)備根據(jù)測驗(yàn)特征,確定哪兩類被試群體可能會(huì)存在DIF。然后再隨機(jī)抽取這兩類被試群體的測驗(yàn)反應(yīng)數(shù)據(jù)。所抽取的被試總量應(yīng)足夠多(一般不少于1000人)。第八十七頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(2)目標(biāo)組和參照組的確定根據(jù)題目特征,確定題目對(duì)以上確定的哪類群體有利,若第(1)步確定為男生和女生兩個(gè)群體,且認(rèn)為題目可能對(duì)男生有利,那么一般把男生樣本作為參照組,女生樣本作為對(duì)照組。第八十八頁,共九十七頁,2022年,8月28日心理測量學(xué)江西師大心理與教育統(tǒng)計(jì)測量中心(3)匹配變量的確定一般以測驗(yàn)總分作為匹配變量,將兩個(gè)群體中相同測驗(yàn)總分的被試一一匹配,采用適當(dāng)?shù)腄IF偵查方法進(jìn)行分析,找出并剔除存在DIF的題目,從而組成一個(gè)不含DIF的子測驗(yàn)。然后再

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論