第六章 心理測驗的編制.ppt_第1頁
第六章 心理測驗的編制.ppt_第2頁
第六章 心理測驗的編制.ppt_第3頁
第六章 心理測驗的編制.ppt_第4頁
第六章 心理測驗的編制.ppt_第5頁
已閱讀5頁,還剩107頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第四章測驗題目性能與題目編制,心理測量學,引子,心理測量的工具是測驗,而題目則是構(gòu)成測驗的基石,因此研究題目的性能及其編制至關(guān)重要,它直接影響測量工具(即測驗)的信度及效度,進而影響測量的準確性。在實際工作中,人們應如何來編制測驗題目?如何評價測驗題目質(zhì)量的好差呢?本章將對這些問題做出回答。,心理測量學,測驗題目性能與題目編制,第六章 心理測驗的編制 第一節(jié) 心理測驗編制的基本程序與原則 一、心理測驗編制的一般程序 準備階段 正式編制階段 完善階段,1、確定測驗目的 (1)明確測量用途 用于描述、還是診斷,或用于預 (2)明確測量目標 心理變量或行為特征必須有操作定義,目標要非常具體。 (3)

2、明確測量對象 年齡、性別、職業(yè)、受教育程度、經(jīng)濟狀況、民族、文化背景等。,(一)準備階段:確定目的與制定計劃,2、制定編題計劃 通常是一張雙向細目表,指出測驗所包含的內(nèi)容和要測定的各種技能,以及對每一個內(nèi)容和技能的相對重視程度。 例:小學自然常識測驗編題計劃,(二)正式編制階段:產(chǎn)生測題與合成測驗 (二)正式編制階段:產(chǎn)生測題與合成測驗 1、產(chǎn)生測題 (一)收集測驗資料 (1)資料要豐富 (2)資料要有普遍性 (3)資料要有趣味性,(2)選擇項目形式 紙筆測驗還是操作測驗?是客觀題還是主觀題? 概念和原理的記憶簡答題 辨別和判斷選擇題 綜合運用論文題 幼兒口頭測驗 文盲、半文盲、聾啞操作測驗

3、人多、經(jīng)費有限團體測驗 人少個體測驗,(3)編寫測驗項目 題目范圍要與雙向細目表一致; 題目數(shù)量要比最終所需要的數(shù)量多,以便篩選或編制復本; 題目的難度應有一定的分布范圍; 用詞力求清楚明白。,2、合成測驗 (1)試測與復核 應取自將來正式測驗準備應用的群體 施測過程與施測情景 時限可稍寬一些 記錄被試的各種反應。,(2)項目選擇與編排 項目選擇 質(zhì)的分析:內(nèi)容取樣、題目的思想性、表達是否清楚 量的分析:難度、區(qū)分度、備選項分析 測驗項目的編排 直接遞增式 并列直進式 混合螺旋式,(3)編制復本 各份復本必須等值。等值要符合下列條件: 各份測驗測量的是同一種心理特性。 各份測驗具有相同的內(nèi)容和

4、形式。 各份測驗的題目不應重復。 各份測驗題目數(shù)量相等,難度和區(qū)分度大體相同。 各份測驗的分數(shù)分布(平均數(shù)和標準差)大致相等。 復本編好后,應再測一次,以確保各份測驗的等值。,(三)完善階段:測驗標準化與性能評估,1、測驗標準化 測驗的標準化是指測驗的編制、實施、評分以及分數(shù)解釋都有統(tǒng)一的標準,以減少無關(guān)因素對測驗的影響。 (1)測驗內(nèi)容 指測驗內(nèi)容對所有被試都一樣。 (2)施測過程 測驗情景 指導語 時限,(3)測驗評分 為使評分盡可能客觀,有三點要求: 對被試反應的及時和清楚的記錄。特別是對口試和操作測驗。 要有一張標準答案或正確反應的表格,即計分鍵。 將被試的反應和計分鍵比較,對反應進行

5、分類。 (4)測驗分數(shù)的解釋 常模參照 標準參照:內(nèi)容參照,結(jié)果參照,2、測驗性能評估 (1)信度(2)效度(3)測驗量表與常模 3、編寫測驗說明書 測驗的目的和功用; 編制測驗的理論背景以及選擇題目的根據(jù)和測驗的構(gòu)成; 測驗的實施方法、時限及注意事項; 測驗的標準答案和評分方法; 測驗的信度和效度資料; 常模資料。,二、心理測驗編制的主要原則,(一)心理測驗編制的基本原則 信度好 效度高 難度適中 區(qū)分度強,(二)心理測驗編制的具體要求 1.針對題目內(nèi)容的要求 (1)試題要符合測驗的目的。 (2)內(nèi)容取樣要有代表性。 (3)各個題目必須彼此獨立,不可互相牽連,不要使一個題目的回答影響另一個題

6、目的回答。 2. 針對題目語言的要求 (1)文句要簡明扼要,既排除與解題無關(guān)的因素,又不可遺漏解題所依據(jù)的必要條件。要避免使用艱深的字詞。 (2)一個概念一句話。 (3)意義明確肯定,避免使用雙重否定句。,三、心理測驗編制的具體技術(shù),3.針對題目表達的要求 (1)題目中不可含有暗示本題或其他題正確答案的線索。 (2)所提問題應避免涉及社會禁忌與個人隱私。 (3)避免使用主觀情緒化字句和問題 4.針對題目理解的要求 (1)應有不致引起爭論的確定答案(創(chuàng)造力測驗、人格測驗除外)。 (2)題目格式不要使被試產(chǎn)生誤解。 (3)題目內(nèi)容不要超出受測團體的知識和能力。,第四章測驗題目的性能與題目編制,心理

7、測量學,第一節(jié),一、測驗題目類型 題目主要可分為客觀題和主觀題兩大類。 客觀題一般有標準唯一的答案,被試的作答只有與標準答案完全一致才視為答對,否則視為答錯。 主觀題無標準唯一答案,只有一個參考答案,被試的作答與參考答案相近或基本一致就可視為答對。,心理測量學,客觀題主要包括選擇題(含自陳式選擇題)、填空題、是非判斷題、匹配題、行為情景判斷題等。 主觀題主要包括名詞解釋、簡答題、計算題、證明題、論述題、案例分析題、作文題等。,心理測量學,單項選擇題 多項選擇題 自陳式選擇題 是非判斷題 名詞解釋題 簡答題,計算題 證明題 論述題 案例分析題 組合題 行為情景判斷題,心理測量學,二、選擇題 1、

8、定義:選擇題指給出題干及備選項,要求被試根據(jù)題干從備選項中選出正確選項的題目。單項選擇題指只有唯一正確選項的選擇題。 2、特點功能: 評分標準明確,評分客觀,有利于減少評分帶來的評分誤差。 有利于對基礎(chǔ)知識和基本技能進行考查。,心理測量學,選擇題適合考查較低層次的能力,如識記能力、較低的理解能力等,而不宜考查較高層次的能力,如綜合能力、創(chuàng)造性和獨立思維能力。 選擇題的命題技術(shù)要求較高,尤其是干擾項的設置。,心理測量學,3、選擇題編制 題干要描述清楚。應讓答題者明白問題是什么,希望答題者解決什么 題干中應盡量避免出現(xiàn)與考核內(nèi)容無關(guān)的材料 設問應盡量正向,盡量少出現(xiàn)如“下面哪個是不對的?”的設問,

9、心理測量學,題干文字的字體應盡量一致(,以減輕考生的閱讀負擔 備選項應避免出現(xiàn)邏輯上的包含關(guān)系 備選項的長度、結(jié)構(gòu)、語言表達要盡量一致 增加干擾項的迷惑性 干擾項的設置應能反應考生缺乏特定的知識或技能,心理測量學,三、填空題 1、特點功能: 考查的能力層次范圍比較廣,主要考核識記和理解能力。 填空題要求考生把問題的最后答案或結(jié)論正確無誤地表達出來,在一定程度上是對考生的嚴謹、嚴密、認真、細致的工作作風和科學態(tài)度的檢查。,心理測量學,評分簡單,誤差也相對要小。 填空題只要求考生寫出最后答案,而不必寫出解題的具體過程,因此,從試卷上看不出考生的推理、分析等思考過程,心理測量學,2、填空題編制 試題

10、的空格處應考查有意義的關(guān)鍵性內(nèi)容或詞語。 每小題的空格數(shù)不宜過多,填寫的字數(shù)也不能太多。 空格部分統(tǒng)一用下劃線表示,長度應能滿足答題需要 若空格處考核計算能力并要求填寫數(shù)字,應在空格后標明數(shù)字的單位,心理測量學,三、論述題與計算題 1、定義: 論述題指對某一問題或議題進行綜合論述的題目。它用于考查被試分析、綜合、評價直至創(chuàng)新、創(chuàng)造等高層次能力。,計算題指主要是通過計算或運算來解答的題目。計算題內(nèi)容量有大有小,常常用于考查被試的應用能力。一般要求給出條件完備無冗余,答案唯一。,心理測量學,心理測量學,2、特點功能: 論述題有利于考生獨立地、創(chuàng)造性地解題。試題的能力考查涉及的知識面可以比較大,而且

11、要求考生通過分析去找出所涉及的知識并找出它們的內(nèi)在聯(lián)系。試題從定性分析到定量計算,工作量一般比較大。,心理測量學,論述題和計算題不僅能夠考查考生較低層次的能力目標,而且能夠比較好地考查較高層次的能力目標。,心理測量學,論述題和計算題能夠反映考生的思維過程,因而能比較有效地考查考生接受信息、鑒別和選擇信息的能力,分析、推理、綜合應用知識的能力,能鑒別出考生對問題解決的程度。,心理測量學,論述題和計算題可以根據(jù)試題相應情境進行不同層次、不同角度的設問,如可以是單問,可以是多問,也可以是分步設問,使試題的考查目標比較明確。,心理測量學,論述題、計算題在評分過程具有一定的主觀性。 論述題、計算題的最大

12、缺點是閱卷評分的工作量比較大,對閱卷人員的要求比較高,閱卷工作的費用較大。同時論述題、計算題評分誤差較難控制,在控制不好的情況下,評分誤差可能會很大。,心理測量學,四、行為情景判斷題 1、定義: 行為情景判斷題多見于心理測驗中,它指給出一個日常生活中或工作中的具體情景,并針對該情景提供若干解決這一情景下具體問題的行為選項,并要求受測者進行選擇/評價的題型。,2、特點功能: 與一般認知能力有較強的相關(guān),平均達0. 54 跟大五人格因素的多項因素有中度以上的相關(guān),如跟責任心的相關(guān)為0. 26 ,跟情緒穩(wěn)定性的相關(guān)為0. 32 ,跟宜人性的相關(guān)為0. 25,心理測量學,心理測量學,跟所測領(lǐng)域個人的工

13、作經(jīng)驗、工作年限有統(tǒng)計顯著意義的相關(guān)。 有些情景判斷測驗作探索性因素分析,可提取出一個大的一般因素,這時測驗的內(nèi)部一致性系數(shù)可為0. 86 對員工的工作績效有較好的預測力,平均效度系數(shù)為0. 36,心理測量學,3、行為情景判斷題編制 題目編制前應先確定所測特質(zhì)的結(jié)構(gòu),然后在這一所測特質(zhì)結(jié)構(gòu)下征集或編寫問題情景及行為反應項 問題情景應是現(xiàn)實生活中可能發(fā)生的,且有一具體的問題需要受測者來解決,解決問題的行為/方法不應是唯一的而是多樣化的,問題情景應盡量敘述完整,清晰,語言規(guī)范,字數(shù)介于100-300 一般是根據(jù)相關(guān)有豐富經(jīng)驗的專家來確定行為項的優(yōu)劣,然后將受測者的作答與專家的評定進行比較,從而確定

14、具體的計分方式及評價標準,心理測量學,心理測量學,行為情景判斷題設問方式一般有四種形式:一是要求受測者選擇最優(yōu)行為項,二是要求受測者選擇最差行為項,三是要求受測者同時選擇最優(yōu)和最差行為項,四是要求受測者針對每一行為項的有效性做出評價。應根據(jù)實際選擇具體方式。,第六章測驗題目的性能與題目編制,心理測量學,第二節(jié),一、難度定義及其計算方法 (一)難度定義 難度是指題目的難易程度。如果一個題目絕大多數(shù)人都答對了,則這個題目比較容易;反之,若絕大多數(shù)人都答錯了,則這個題目比較難。從難度定義可以看到,難度是題目性質(zhì)與作答者群體水平共同作用的結(jié)果。,難度這一概念更多地用于能力測驗中,在非能力測驗(如人格測

15、驗)中,一般稱為“通俗性”(popularity level),即取自相同總體的樣本中,在答案方向上回答該題的人數(shù)比。,心理測量學,心理測量學,(二)難度計算方法 1、得分率法 得分率指所有被試在題目上的平均得分占題目滿分的百分比。計算公式為,心理測量學,心理測量學,2、極端分組法 極端分組法是指將被試按測驗總分分為高分組和低分組,以兩組得分率的平均值作為題目的難度。 極端分組法中,首先需對被試進行分組,根據(jù)被試的試卷總得分進行排序,各取首尾的27%(或25%、33%),組成高分組和低分組。,心理測量學,心理測量學,心理測量學,心理測量學,(四)等距難度指標及其求取 題目的難度一般用通過率或得

16、分率來表示,計算比較方便,但這類變量屬于順序變量,不具有相等的單位,不能具體比較難度的差異。,心理測量學,等距轉(zhuǎn)換方法 當測驗分數(shù)接近正態(tài)分布,根據(jù)正態(tài)分布將試題的難度P作為正態(tài)曲線下的面積,轉(zhuǎn)換成具有相等測量單位的等距量表,即Z分數(shù)。,心理測量學,等距轉(zhuǎn)換 但是Z值常含有負值,因此不易理解,通常需轉(zhuǎn)換為另一種等距變量,其中較為常用的是美國教育測驗服務中心采用的難度指標: 13+4*Z 式中表示題目的難度,Z表示由P轉(zhuǎn)換得來的標準分數(shù)。,心理測量學,二、難度分布及其控制 (一)測驗試題難度分布對測驗分數(shù)的影響 1、難度對測驗分數(shù)分布形態(tài)的影響 當測驗題目過難時,測驗分數(shù)呈負偏態(tài)分布; 當測驗題

17、目過易時,測驗分數(shù)呈正偏態(tài)分布; 當測驗題目趨近中等難度,測驗分數(shù)基本可呈正態(tài)分布。,心理測量學,2、難度對測驗分數(shù)離散程度的影響 測驗過難或過易,會使測驗分數(shù)相對地集中低分端或高分端,這樣被試的差異較小,即測驗分數(shù)的離散程度很小,只有當測驗趨近中等難度時,測驗分數(shù)分布范圍較廣,離散程度就會大。,心理測量學,(二)、合理難度及合理難度分布 對于常模參照性測驗而言,測驗目的是為了區(qū)分被試、最大限度地將被試得分“拉開距離”。對所有被試而言,合理項目難度為0.5,分布范圍應在0.3到0.7之間。,心理測量學,對于目標參照性測驗而言,其合理難度分布是:對于恰好合格被試而言難度為0.5左右窄全距分布,也

18、即測驗在合格與合格被試處有較高的區(qū)分能力。,心理測量學,(三)、合理難度及合理難度分布的控制 (1)對題目難度的控制 主要從考核的知識點及其能力層次等方面進行控制。 考核單一知識點的題目相對考核較多同類知識點的題目要容易。,心理測量學,考核能力層次相對要低(如識記和記憶)的題目,其難度相對低,而對于考核能力層次高(如理解、綜合應用)的題目,其難度相對會高。 因而可以通過控制題目考核的知識點及其能力層次來達到控制試題難度。,心理測量學,(2)對試卷難度分布的控制 控制試卷難度分布是在控制試題難度的前提下進行,它主要是通過控制不同難度題目的比例從而達到所需的難度分布。,如果測驗是選拔性測驗,則難、

19、易題目所占比例應充分考慮選拔的比例; 如果是常模參照性測驗,則中等難度題比例要多,而偏難偏易的題比例要少;如果是目標參照性測驗,不同難度題的比例應結(jié)合“目標”(如課程標準或考試大綱)本身來確定。,心理測量學,第四章測驗題目的性能與題目編制,心理測量學,一、區(qū)分度的定義及其計算方法 (一)、區(qū)分度定義 區(qū)分度指題目對被試特質(zhì)差異的區(qū)分能力。若所有考生在某個題目均答對或均答錯,則此題目不能區(qū)分不同特質(zhì)的被試,即此題目無區(qū)分能力。,第三節(jié),一般來講,題目是否有區(qū)分能力,主要是看不同能力的被試在同一題目上得分是否不同。理論上,如果題目具有高區(qū)分力,那么高能力的被試在題目上應得高分,低能力被試在題目應得

20、低分,也即被試的能力與在題目上的得分應存高相關(guān)。,心理測量學,心理測量學,(二)、區(qū)分度的計算方法 1、相關(guān)系數(shù)法 該方法的基本思想是,若題目有好的區(qū)分度,則高能力的被試在該題上應得高分,低能力被試應得低分,即被試在題目上的得分應與測驗總分相一致。 其基本假設是測驗得高分的被試即為高能力被試,測驗得低分的被試即為低能力被試。,心理測量學,(1)點二列相關(guān)法,心理測量學,(2)積差相關(guān)法,心理測量學,2、鑒別指數(shù)法,心理測量學,(三)、題目區(qū)分度計算實例 例4-2 下表是隨機抽取22名被試在某語文測驗中四道題目的得分情況,四題滿分分別為1分、3分、5分和60分,其中第4題為作文題,請計算四題的區(qū)

21、分度。,心理測量學,心理測量學,心理測量學,二、區(qū)分度的評價標準及其提高 (一)、區(qū)分度的評價標準 區(qū)分度的取值范圍為-1,1,區(qū)分度為負的(消極區(qū)分),題目性能不好,這種題目對測驗總分合成起著不良的干擾作用。1965年美國測量學家伊貝爾根據(jù)長期經(jīng)驗提出如下標準。,心理測量學,心理測量學,(二)、影響題目區(qū)分度的因素 (1)題目難度 (2)被試群體的同質(zhì)性 (3)全卷各題所測心理品質(zhì)的一致性。 (4)題目本身的文字與內(nèi)容的質(zhì)量也會影響 題目的區(qū)分度,心理測量學,(三)、提高題目區(qū)分度方法 (1)控制好題目難度。將題目難度在0.5左右時,區(qū)分能力理論上會比較高。 (2)保證題目所測心理品質(zhì)與全卷

22、所測心理品質(zhì)的一致性。 (3)題干及答案無歧義。 (4)語言準確規(guī)范。 (5)借助選項分析提供的信息對不良選項進行修改,以提高題目區(qū)分能力。,第四章測驗題目的性能與題目編制,心理測量學,第四節(jié),一、猜測行為與猜測度 客觀題中,當被試不知道正確答案時,被試可能會進行猜測。就目前而言,理論界對于猜測行為有兩種截然相反的觀點:一種認為應對猜測行為加于控制,另一種認為無需控制猜測行為。中。,猜測度是指被試全憑隨機猜測而答對題目的概率。猜測行為主要出現(xiàn)在客觀題(如選擇題、是非判斷題、配對題等),心理測量學,心理測量學,二、猜測度控制 增加選擇題選擇項的個數(shù)(一般不少于四個) 。 增加干擾項的迷惑性。 控

23、制存在猜測行為的總題量,以保證猜測誤差控制在較小范圍。 如有特殊需要,還可采用警告、扣分等方式控制被試的猜測行為。,第四章測驗題目的性能與題目編制,心理測量學,第五節(jié),一、選項分析基本過程 1、根據(jù)被試的測驗總分,對被試進行排序 2、確定高分組和低分組被試 3、分別登記高分組被試和低分組被試在每個備選項的人數(shù)及未作答人數(shù)(也可以是人數(shù)百分比),最終整理成類似表中的數(shù)據(jù)資料,4、根據(jù)第3步整理好的數(shù)據(jù)資料,進行具體分析,心理測量學,心理測量學,二、選項分析的方法及選項修改原則 1、首先分析兩組平均選答率 一般正確答案的選答率應該在0.4到0.6之間,每個干擾項應該平均分剩余的選答率。 如果正確答

24、案的選答率過高或過低,這都不利于區(qū)分高分組和低分組被試。,如果某干擾項選答率特低,則說明該干擾項錯的過于明顯應加以淘汰; 若某干擾項選答率特高,則要考慮該題正確答案是否錯誤或有兩個正確答案。,心理測量學,心理測量學,2、對于正確答案 主要考察高分組和低分組被試在正確答案上的選答率是否是正差,及這一差距是否足夠大。只有當高分組和低分組被試在正確答案上的選答率是正差,且這一差距足夠大時,這時題目質(zhì)量較佳。,心理測量學,3、對于干擾項 考察高分組和低分組被試在干擾項上的選答率是否是負差,及這一差距是否足夠大。只有當高分組和低分組被試在正確答案上的選答率是負差,且這一距差足夠大時,這時干擾項的設置比較

25、合理,否則干擾項設置不合理,應對干擾項進行刪除或修改。,心理測量學,4、其它 如果高分組被試的選答集中在兩個答案上,且人數(shù)又相近,說明此題可能有兩個正確答案,或者在某種意義上另一個選擇項也有一定道理。應考慮題目本身是否存有歧義或有兩個正確答案。,心理測量學,如果高分組對正確答案的選答率與低分組相等或低于后者,說明該題所考察東西與被試水平無關(guān),即不具有鑒別力,此題應作大修改或刪除。 如果一個題目被試未作答的人數(shù)較多(速度測驗除外),或選擇各個備選項答案的人數(shù)相等,說明該題目過難或題意不清,被試無法作答或全憑猜測。應修改或刪除本題。,心理測量學,例4-3下表為一個由370人參加的英語測驗中四道選擇

26、題的統(tǒng)計結(jié)果,試分析每題難度、區(qū)分度是如何計算出來的?并對這四題的選項質(zhì)量進行評價。,心理測量學,心理測量學,選項分析: 第1題,正確答案和干擾項的兩組平均選答率都基本正常,在正確答案上高分組的被試選擇人數(shù)要多于低分組被試,且在非正確選項上,高分組的被試選擇人數(shù)要少于低分組被試,這符合實際情況,四個選項的設置均較合理;,心理測量學,第2題,正確答案和干擾項B的兩兩組平均選答率基本一致,且正確答案上高分組的被試選擇人數(shù)要少于低分組被試,而在非正確選項B、D上,高分組的被試選擇人數(shù)要多于低分組被試,這均不符合實際情況,且高分組被試中選擇人數(shù)最多的為選項B,則要考慮該是否有2個正確選項,因此該題選項

27、設置較差,因此整題質(zhì)量較差。,心理測量學,第3題,選項A、B、D兩組平均選答率都基本正常、設置均較合理,但選項C需修改;第4題,選項A、D設置合理,選項C設置不合理需修改,不論高分還是低分組被試均無人選擇B,該選項無任何迷惑作用,可刪除該選項,并換其它具有迷惑性的選項。,第四章測驗題目的性能與題目編制,心理測量學,第六節(jié),一、題目功能差異、測量偏差定義及其偵查方法 (一)、題目功能差異及測量偏差定義 “某年的高考實驗試卷有一道關(guān)于魚頭和魚尾作文題:第一幅是母親把魚中段夾給年幼的兒子,自己吃魚頭魚尾;第二幅漫畫是兒子長大了,把魚頭魚尾留給母親吃,自己吃魚中段。要求被試就此發(fā)表議論,寫一篇作文?!?/p>

28、,心理測量學,題目功能差異(differential item function,DIF)是指不同群體對同一題目的答對概率(或得分率)不同,即不同群體在同一題目上得分存在差異。造成題目功能差異的原因可能是群體間本身水平存在差異,也可能是群體本身水平不存在差異而由于其它原因(如風俗習慣、性別、種族、地域)所致。,心理測量學,若題目功能差異是由前者引起,則稱為良性題目功能差異;若是由后者引起,則稱為不良題目功能差異,即存在測量偏差。題目功能差異主要是針對不同群體而言,目前測量學領(lǐng)域關(guān)注較多群體差異主要有性別差異、地區(qū)差異、種族差異、跨文化差異等。,心理測量學,因此有DIF的題目不一定存在測量偏差,

29、良性DIF不存在測量偏差,不良DIF才存在測量偏差;但有測量偏差的題目一定存在DIF。,心理測量學,在題目功能差異研究中還有一對重要概念:一致性DIF和不一致性DIF。一致性DIF是指被試的能力水平與其組別之間不存在交互作用,即在所有的能力水平上,一組被試回答某一項目的正確率都大于另一組。當被試的能力水平與其組別之間存在交互作用時,則表現(xiàn)為非一致性DFI。,心理測量學,(二)、題目功能差異及測量偏差偵查方法 要偵查題目是否存在測量偏差,首先應偵查題目是否存在DIF,若不存在DIF,則不存在測量偏差,若存在DIF,還應分析是良性DIF還是不良DIF,只有不良DIF才會造成測量偏差。,心理測量學,1、DIF及測驗偏差偵查的一般步驟 (1)被試群體的確定及數(shù)據(jù)資料的準備 根據(jù)測驗特征,確定哪兩類被試群體可能會存在DIF。然后再隨機抽取這兩類被試群體的測驗反應數(shù)據(jù)。所抽取的被試總量應足夠多(一般不少于1000人)。,心理測量學,(2)目標組和參照組的確定 根據(jù)題目特征,確定題目對以上確定的哪類群體有利,若第(1)步確定為男生和女生兩個群體,且認為題目可能對男

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論