2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第1頁(yè)
2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第2頁(yè)
2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第3頁(yè)
2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第4頁(yè)
2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第5頁(yè)
已閱讀5頁(yè),還剩159頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 心理測(cè)量學(xué)1 目錄緒論 心理測(cè)驗(yàn)的編制測(cè)驗(yàn)的實(shí)施和計(jì)分測(cè)驗(yàn)結(jié)果的解釋測(cè)驗(yàn)信度 測(cè)驗(yàn)效度項(xiàng)目分析學(xué)績(jī)測(cè)驗(yàn)智力測(cè)驗(yàn)人格測(cè)驗(yàn) 2 第一章 緒論第一節(jié)心理測(cè)量的歷史 一、國(guó)外心理測(cè)量發(fā)展的歷史馮特的實(shí)驗(yàn)心理學(xué)高爾頓的遺傳理論測(cè)量卡特爾的個(gè)體差異研究比納和比納西蒙智力量表的產(chǎn)生3 高爾頓的遺傳理論測(cè)量高爾頓:Hereditary Genius,1869智力可以量化測(cè)量 智力分布為倒鐘形曲線-正態(tài)分布智力可以客觀測(cè)量 不同測(cè)驗(yàn)的關(guān)系精度可用“相關(guān)”來(lái)估 天才是遺傳的 后來(lái)在社會(huì)中的應(yīng)用Sir Francis Galton (1822-1911)4 關(guān)于弗朗西斯高爾頓他是家中9 個(gè)孩子里最小的一個(gè) 出生1

2、2 個(gè)月后,認(rèn)識(shí)所有大寫字母 18 個(gè)月后則能辨別大寫和小寫兩種字母在他咿呀學(xué)語(yǔ)的時(shí)候,能背誦拉丁文 到了兩歲半左右,閱讀蛛網(wǎng)捕蠅之類的兒童讀物3 歲他學(xué)會(huì)簽名 4 歲他能寫詩(shī) 5 歲已能背誦并理解蘇格蘭敘事詩(shī)馬米翁 6 歲,已精熟荷馬史詩(shī)中伊利亞特和奧德賽 7 歲能欣賞莎士比亞名著,對(duì)博物學(xué)產(chǎn)生興趣,并按 自己的方法對(duì)昆蟲、礦物標(biāo)本進(jìn)行分類 5 心理測(cè)量的發(fā)展歷史趨勢(shì): 由解剖生理特征為依據(jù)轉(zhuǎn)向?qū)π闹腔顒?dòng)的測(cè)量 測(cè)量簡(jiǎn)單感知到復(fù)雜的認(rèn)知能力 單一量數(shù)評(píng)定個(gè)體間差異,轉(zhuǎn)為多個(gè)量數(shù)兼顧個(gè)別差異與個(gè)體間差異 心理測(cè)量與實(shí)驗(yàn)心理學(xué)的分合6 第二節(jié) 心理測(cè)量的性質(zhì)測(cè)量的基本概念 測(cè)量:兩個(gè)要素: 參照

3、點(diǎn):絕對(duì)和相對(duì)零點(diǎn) 單位:確定的意義和相等的價(jià)值 測(cè)驗(yàn):心理測(cè)量的工具和手段7 測(cè)量的量表 命名量表 順序量表 等距量表 比例量表 8 心理測(cè)量的基本概念 心理測(cè)量 與測(cè)驗(yàn)的關(guān)系 標(biāo)準(zhǔn)化測(cè)驗(yàn):標(biāo)準(zhǔn)化的三點(diǎn)優(yōu)點(diǎn)心理測(cè)量的性質(zhì) 間接性 相對(duì)性 客觀性 9 第三節(jié) 心理測(cè)驗(yàn)的分類和作用心理測(cè)驗(yàn)的分類 心理測(cè)驗(yàn)的功能 (一) 實(shí)際工作1. 選材 2. 安置 3. 診斷 4. 評(píng)價(jià) (二)理論研究 1. 搜集資料 2. 建立和檢驗(yàn)假說(shuō)3. 實(shí)驗(yàn)分組 10 練習(xí)題1. 關(guān)于測(cè)量、測(cè)驗(yàn)、評(píng)價(jià)的關(guān)系,下列說(shuō)法中正確的是() A 測(cè)驗(yàn)與測(cè)量同義 B 測(cè)驗(yàn)是一種測(cè)量的工具 C 測(cè)驗(yàn)是一種評(píng)價(jià)方法 D 評(píng)價(jià)必須利用

4、測(cè)驗(yàn)所得的資料答案:B11 2. 首先提出“測(cè)驗(yàn)”、“心理測(cè)量”術(shù)語(yǔ)的學(xué)者是() A 馮特B 比納C 卡特爾 D 高爾頓 答案:D12 3. 測(cè)量的兩個(gè)要素是()A. 對(duì)象和工作 B. 單位和參照點(diǎn) C. 目標(biāo)和量表 D. 分?jǐn)?shù)和常模答案:B13 第二章心理測(cè)驗(yàn)的編制第一節(jié) 編制測(cè)驗(yàn)的一般程序確定測(cè)驗(yàn)的目的制定編題計(jì)劃編寫題目 項(xiàng)目的預(yù)測(cè)和分析合成測(cè)驗(yàn) 將測(cè)驗(yàn)標(biāo)準(zhǔn)化 對(duì)測(cè)驗(yàn)的鑒定 編寫測(cè)驗(yàn)說(shuō)明書 14 雙向細(xì)目表15 關(guān)于常模常模(norm)是一組具有代表性的被試樣本的測(cè)驗(yàn)成績(jī)的分布結(jié)構(gòu),包括它的集中趨勢(shì) (通常用平均數(shù)表明)和離散度(通常用標(biāo)準(zhǔn)差表示)。 常模是用以比較不同被測(cè)者測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)

5、準(zhǔn),它能夠說(shuō)明某一測(cè)驗(yàn)結(jié)果分?jǐn)?shù)相對(duì)于同類被測(cè)者所處的水平。 常模是解釋測(cè)量結(jié)果的重要依據(jù)。16 17 18 第二節(jié)測(cè)驗(yàn)題目的編制技術(shù)命題的一般原則測(cè)量善良 你喜歡小動(dòng)物嗎? A、是 B、看情況,看心情 C、否并不是典型的問(wèn)題 你是否同意“自見者不明,自是者不彰,自伐者無(wú)功,自矜者不長(zhǎng)”的主張? A.同意 B.無(wú)所謂 C.不同意古文,太晦澀 猜測(cè)的校正不是永遠(yuǎn)不可以使用的。1)是 2)否 的,拗口 19 測(cè)題的種類及編制自由應(yīng)答型固定應(yīng)答型(客觀題)填充題簡(jiǎn)答題應(yīng)用題論文題聯(lián)想題操作題 多選題 是非題 匹配題20 練習(xí)題編寫學(xué)績(jī)測(cè)驗(yàn)時(shí),雙向細(xì)目表中的“雙向”是指() A 內(nèi)容與題型B 內(nèi)容與技能

6、C 技能與題型D 題型與難度答案:B21 第三章測(cè)驗(yàn)的實(shí)施和計(jì)分第一節(jié) 測(cè)驗(yàn)的實(shí)施 測(cè)驗(yàn)實(shí)施的一般程序 1. 標(biāo)準(zhǔn)化指導(dǎo)語(yǔ) 指導(dǎo)語(yǔ)(instruction)是在測(cè)量實(shí)施時(shí)說(shuō)明測(cè)量進(jìn)行方式,以及如何回答問(wèn)題的指導(dǎo)性語(yǔ)言。 類型:指示語(yǔ)有針對(duì)被試和針對(duì)主試的兩種。 要求:指示語(yǔ)應(yīng)清楚、明確、易懂、有禮貌。 樣例:有時(shí)有必要作適當(dāng)?shù)难菔荆ńo出例題和回答說(shuō)明),并且注意觀察被試的反應(yīng)。 22 指導(dǎo)語(yǔ)的內(nèi)容結(jié)構(gòu)一般來(lái)說(shuō),對(duì)被試的指示語(yǔ)包括:1) 如何選擇反應(yīng)形式(畫圈、劃勾、填數(shù)字、口答、書寫等); 2) 如何記錄這些反應(yīng)(題本或答卷紙、錄音、錄相等); 3) 說(shuō)明時(shí)間限制; 4) 如果不能確定正確反應(yīng)

7、,該如何去做(是否允許猜測(cè)等),以及計(jì)分的方法。 5) 例題。當(dāng)題目形式比較生疏時(shí),應(yīng)該給出附有正確答案的例題; 6) 某些情況下,可能告知被試測(cè)驗(yàn)?zāi)康摹?23 2. 標(biāo)準(zhǔn)時(shí)限大多數(shù)典型作業(yè)測(cè)驗(yàn)是不受時(shí)間限制的。 但在最高作業(yè)測(cè)驗(yàn)中,速度是需要考慮的重要因素之一。大多數(shù)測(cè)驗(yàn)既要考慮反應(yīng)的速度,也要考察解決有較大難度題目的能力。 通常,能力和成就測(cè)驗(yàn)的時(shí)限,以大約90%的被試能在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn)為標(biāo)準(zhǔn)。題目從易到難 排列,力求使大多數(shù)被試能在規(guī)定時(shí)間內(nèi)完成會(huì)答的題目。 確定測(cè)驗(yàn)的標(biāo)準(zhǔn)時(shí)限一般采取嘗試法,即通過(guò)預(yù)測(cè)試來(lái)確定。24 3. 測(cè)驗(yàn)的環(huán)境條件 1) 輕松,舒適。 2) 安靜、寬敞,照明,

8、通風(fēng),適宜的溫度和濕度等。3) 防止各種干擾。 噪音,閑雜無(wú)關(guān)人員,地點(diǎn)便利性 環(huán)境條件的要求并不是可有可無(wú)的。不同的環(huán)境條件可能導(dǎo)致不同的結(jié)果,導(dǎo)致測(cè)驗(yàn)分?jǐn)?shù)難以解釋。 要在施測(cè)過(guò)程中記錄下任何意外的環(huán)境因素,以便在解釋測(cè)驗(yàn)結(jié)果時(shí)加以考慮。 4.計(jì)算機(jī)輔助的測(cè)驗(yàn)實(shí)施25 1.2.3.主試的職責(zé)施測(cè)前施測(cè)中施測(cè)后 主試的影響 主試的責(zé)任十分重要,能否按照要求操作,對(duì)測(cè)量結(jié)果有很大影響: 主試不熟悉測(cè)量的要求和細(xì)節(jié),在實(shí)施中會(huì)手忙腳亂,或做出錯(cuò)誤的操作或指示。 主試的情緒如緊張,因不熟悉測(cè)量而出現(xiàn)的猶豫、困惑,會(huì)影響被試的應(yīng)試行為。 主試的態(tài)度,如對(duì)測(cè)量的嚴(yán)肅性,對(duì)被試的友善,是保證測(cè)量有效性的重

9、要因素。 主試指導(dǎo)語(yǔ)的語(yǔ)速會(huì)影響被試應(yīng)答的速度。主試操作不當(dāng)可能產(chǎn)生的后果包括: 使能力類測(cè)驗(yàn)分?jǐn)?shù)明顯降低; 使人格類測(cè)驗(yàn)分?jǐn)?shù)明顯偏差。 26 第二節(jié) 測(cè)驗(yàn)的計(jì)分和分?jǐn)?shù)的合成計(jì)分的一般程序 計(jì)分的基本步驟和要求論文題計(jì)分 客觀題計(jì)分 猜測(cè)修正公式:S=R-W/(n-1)S是正確分?jǐn)?shù),R為被試答對(duì)的題目數(shù),W為被試答錯(cuò)的題目數(shù),n為選項(xiàng)數(shù)目。 27 關(guān)于猜測(cè)修正公式反對(duì) 贊成修正公式可避免減低測(cè)驗(yàn)的信度。因?yàn)槿绻麖?qiáng)調(diào)倒扣分,被試就不敢盲目猜測(cè)。 修正公式可反映被試真正的能力和水平。使用修正公式對(duì)那些不能答完全部試題的被試來(lái)說(shuō)比較公平。 公式假設(shè)不成立,因?yàn)楸辉嚧疱e(cuò),并非完全瞎猜。多數(shù)情況下是先舍

10、棄部分誘答,再就剩下的幾個(gè)選項(xiàng)來(lái)猜測(cè)。有時(shí)答錯(cuò)試題,是因?yàn)橛^念模糊、記憶不清或者粗心大意,并非亂猜。 只要所有被試能答完全部題目,或者略去未答的題目數(shù)相同,則猜測(cè)修正無(wú)實(shí)質(zhì)作用。此種情形下其相對(duì)分?jǐn)?shù)(如z分?jǐn)?shù) 、T分?jǐn)?shù)或百分等級(jí))完全相同。 不采用猜測(cè)修正對(duì)信度并無(wú)重大影響。 實(shí)際生活中,常常需要僅憑借部分知識(shí)來(lái)作判斷,因此完全不許猜測(cè)也與實(shí)際生活不符。 28 測(cè)驗(yàn)分?jǐn)?shù)的合成 1. 題目的組合 2. 分測(cè)驗(yàn)或量表的組合3. 測(cè)驗(yàn)的組合 29 第三節(jié) 測(cè)驗(yàn)的誤差誤差的定義和種類 隨機(jī)誤差和系統(tǒng)誤差 誤差的來(lái)源 測(cè)驗(yàn)內(nèi)部引起的誤差 由施測(cè)過(guò)程引起的誤差 由受測(cè)者本身引起的誤差 測(cè)驗(yàn)的經(jīng)驗(yàn)、練習(xí)因素

11、、應(yīng)試動(dòng)機(jī)、 測(cè)驗(yàn)焦慮、反應(yīng)定勢(shì)、生理因素 30 練習(xí)題1. 測(cè)量過(guò)程中由不可控制的偶然因素引起的誤差稱為() A 系統(tǒng)誤差B 恒定誤差C 測(cè)量誤差D 隨機(jī)誤差答案:D31 2. 下述關(guān)于隨機(jī)誤差對(duì)測(cè)驗(yàn)影響的說(shuō)法中正確的是() A 影響測(cè)驗(yàn)的信度,但不影響效度B 影響測(cè)驗(yàn)的效度,但不影響信度C 影響測(cè)驗(yàn)的信度,也影響其效度D 對(duì)測(cè)驗(yàn)的信度、效度均無(wú)影響答案:C32 3. 系統(tǒng)誤差對(duì)測(cè)驗(yàn)的影響可以表述為()A 影響信度不影響效度B 影響效度,不影響信度C 既影響信度又影響效度 D 既不影響信度也不影響效度 答案:B33 4. 由偶然因素引起的、不易控制的誤差叫作()A 過(guò)失誤差B 恒定誤差C 隨

12、機(jī)誤差D 系統(tǒng)誤差答案:C34 第四章 測(cè)驗(yàn)結(jié)果的解釋原始分?jǐn)?shù):考試85分,跑步第3名導(dǎo)出分?jǐn)?shù) 原始分?jǐn)?shù)參照體系導(dǎo)出分?jǐn)?shù)參照標(biāo)準(zhǔn)不同: 常模參照分?jǐn)?shù)導(dǎo)出分?jǐn)?shù) 內(nèi)容參照分?jǐn)?shù)結(jié)果參照分?jǐn)?shù)35 第一節(jié)參照常模的分?jǐn)?shù)解釋常模:常模團(tuán)體的分?jǐn)?shù)分布常模團(tuán)體的組成 群體必須明確 代表性樣本 樣本大小要適當(dāng)時(shí)間性 一般常模與特殊常模結(jié)合36 幾種主要的常模參照分?jǐn)?shù)發(fā)展量表智力年齡:比納西蒙量表年級(jí)當(dāng)量 發(fā)展循序量表 商數(shù) 比率智商 教育商數(shù)百分位 百分等級(jí)百分位數(shù)十分位 標(biāo)準(zhǔn)分?jǐn)?shù)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù) 其他類型:T分?jǐn)?shù)、標(biāo)準(zhǔn)九分、CEEB分?jǐn)?shù)、離差智商37 標(biāo)準(zhǔn)分?jǐn)?shù) 某次測(cè)驗(yàn),全校學(xué)生數(shù)學(xué)的平均成

13、績(jī)?yōu)?0分 ,標(biāo)準(zhǔn)差為10分,語(yǔ)文平均分?jǐn)?shù)為80分,標(biāo)準(zhǔn)差為5。 甲學(xué)生數(shù)學(xué)和語(yǔ)文分別為80和60分,乙學(xué)生數(shù)學(xué)和語(yǔ)文分別為50和80分。 這兩個(gè)學(xué)生哪個(gè)學(xué)生成績(jī)更好些? 38 呈現(xiàn)常模資料的方式1.轉(zhuǎn)化表 39 2. 剖析圖40 16PF41 第二節(jié) 參照標(biāo)準(zhǔn)的分?jǐn)?shù)解釋內(nèi)容參照分?jǐn)?shù) 掌握分?jǐn)?shù) 正確百分?jǐn)?shù) 等級(jí)評(píng)定量表 結(jié)果參照測(cè)驗(yàn) 兩個(gè)先決條件 呈現(xiàn)結(jié)果參照分?jǐn)?shù)的方法42 1. 期望結(jié)果的概率(1)表格法 43 下表是由若干個(gè)工作候選人在職業(yè)選擇測(cè)驗(yàn)中得分的聯(lián) 合頻數(shù)分布構(gòu)成,表中還呈現(xiàn)了其工作領(lǐng)導(dǎo)在雇傭他們6 個(gè)月之后,給這些候選人的等級(jí)評(píng)定。 44 (2)圖示法45 2. 預(yù)期的效標(biāo)分?jǐn)?shù)

14、46 1. 最早采用智力年齡概念的是()A 比納量表 B 瑞文推理測(cè)驗(yàn) C 韋氏量表 D 斯坦福比納量表答案:A2. 提出“比率智商”概念的心理學(xué)家是()A比納 B答案:C西蒙 C推孟 D 韋克斯勒47 3. 在斯坦福-比納測(cè)驗(yàn)中,測(cè)得某兒童的智力年齡為8,這個(gè)結(jié)果的含意是() A 該兒童的智力低下 B 該兒童成績(jī)相當(dāng)于8歲兒童的平均分?jǐn)?shù) C 該兒童的智力超常 D 該兒童IQ是80 答案:B48 4. 以50為平均數(shù),以10為標(biāo)準(zhǔn)差的常模參照分?jǐn)?shù)是() A 標(biāo)準(zhǔn)九 B 標(biāo)準(zhǔn)十 C.答案:CT分?jǐn)?shù) D.C分?jǐn)?shù)5. 下列導(dǎo)出分?jǐn)?shù)中屬于內(nèi)容參照分?jǐn)?shù)的是()A 掌握分?jǐn)?shù) B 比率智商 C 百分等級(jí) D

15、 標(biāo)準(zhǔn)九答案:A49 6. 下列分?jǐn)?shù)中屬于常模參照分?jǐn)?shù)的是()A 掌握分?jǐn)?shù) B 正確百分?jǐn)?shù)C 等級(jí)評(píng)定量表 D 標(biāo)準(zhǔn)九答案:D7. 智商是一種() A 標(biāo)準(zhǔn)參照分?jǐn)?shù) B 內(nèi)容參照分?jǐn)?shù)C 結(jié)果參照分?jǐn)?shù) D 常模參照分?jǐn)?shù)答案:D50 8. 正確百分?jǐn)?shù)是一種 .A.內(nèi)容參照分?jǐn)?shù)B.常模參照分?jǐn)?shù)C.結(jié)果參照分?jǐn)?shù)D.預(yù)期效標(biāo)分?jǐn)?shù) 答案:A51 9. 如果某同學(xué)在標(biāo)準(zhǔn)化測(cè)驗(yàn)中的分?jǐn)?shù)位于75的百分等級(jí),這意味著() A 參加測(cè)驗(yàn)的人中,有75%人的分?jǐn)?shù)高于該同學(xué) B 參加測(cè)驗(yàn)的人中,有25%人的分?jǐn)?shù)低于該同學(xué) C 參加測(cè)驗(yàn)的人中,有75%人的分?jǐn)?shù)低于該同學(xué) D 該同學(xué)正確回答了75%的測(cè)驗(yàn)題答案:C52 第

16、五章 測(cè)驗(yàn)信度 第一節(jié) 信度的性質(zhì) 一、信度的定義 測(cè)量的一致性或可靠性程度。 由于接受測(cè)量時(shí)應(yīng)試者的行為可能會(huì)由于各種原因產(chǎn)生變動(dòng),偏離了其真實(shí)行為,就會(huì)使測(cè)量結(jié)果產(chǎn)生誤差。 測(cè)驗(yàn)結(jié)果的可靠性,與測(cè)驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。誤差大,分?jǐn)?shù)的可靠性就降低。 53 二、信度系數(shù)真正分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間的決定系數(shù) 即測(cè)量分?jǐn)?shù)的變化中有多少真正反映了被測(cè)者分?jǐn)?shù)的變化。 信度系數(shù)的分布是從.00到1.00的正數(shù)范圍。可以接受的信度水準(zhǔn) 一般能力與成就測(cè)驗(yàn)信度系數(shù)在0.90以上; 人格、興趣等測(cè)驗(yàn)信度系數(shù)通常在0.80到0.85之間。 一般來(lái)說(shuō),當(dāng)rxx0.70時(shí),可用于團(tuán)體間比較;rxx0.85時(shí),

17、可用于鑒別個(gè) 人。 可以用已有的同類測(cè)驗(yàn)作為比較的標(biāo)準(zhǔn)。 54 三、信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋 解釋個(gè)人分?jǐn)?shù) 兩種測(cè)驗(yàn)分?jǐn)?shù)的比較 55 第二節(jié) 信度的類型及估計(jì)方法重測(cè)信度 復(fù)本信度分半信度 同質(zhì)性信度評(píng)分者信度56 重測(cè)信度(test-retest reliability)又稱穩(wěn)定性系數(shù):用同一測(cè)驗(yàn)在不同時(shí)間對(duì)同一群體施測(cè)兩次,這兩次測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。 重測(cè)信度所考察的誤差來(lái)源是時(shí)間的變化所帶來(lái)的隨機(jī)影響。例如由氣候、偶然的噪音或其它干擾,以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒波動(dòng)、焦慮等原因造成的對(duì)測(cè)驗(yàn)結(jié)果的影響。 57 前提:當(dāng)測(cè)量的行為或特質(zhì)較為穩(wěn)定時(shí),重測(cè)信度的

18、解釋才有效。 必須注意重測(cè)間隔時(shí)間: 間隔太短,被試對(duì)測(cè)試題記憶猶新,造成假性高相關(guān); 間隔太長(zhǎng),被試身心特質(zhì)可能改變,使相關(guān)系數(shù)降低。 重測(cè)間隔多在2周到6個(gè)月之間 58 重測(cè)信度的前提假設(shè)是:每個(gè)應(yīng)試者對(duì)前一次測(cè)驗(yàn)的遺忘程度相同,而且在重測(cè)間隔期間沒(méi)有學(xué)過(guò)與該測(cè)驗(yàn)有關(guān)的其它材料, 或者說(shuō)每人所學(xué)習(xí)的程度相同。 有些解決問(wèn)題型測(cè)驗(yàn)不宜采用重測(cè)信度,因?yàn)閼?yīng)試者一旦知道答案就不容易忘記,從而造成假性高相關(guān)。 苛勒的黑猩猩的頓悟?qū)W習(xí) 一些推理和創(chuàng)造力測(cè)驗(yàn)、認(rèn)知風(fēng)格測(cè)驗(yàn),第一次測(cè)驗(yàn)被試就很容易掌握規(guī)則 59 復(fù)本信度(alternative-form reliability) 又稱等值性系數(shù),它是以

19、兩個(gè)測(cè)驗(yàn)復(fù)本(功能等值但題目?jī)?nèi)容不同)同時(shí)測(cè)量同一群體,然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。 復(fù)本信度反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。 還可在不同的時(shí)間施測(cè)兩個(gè)等值的測(cè)驗(yàn),這時(shí)所求得的是重測(cè)復(fù)本信度,或稱穩(wěn)定和等值系數(shù)。 60 復(fù)本信度的主要優(yōu)點(diǎn)在于: 能夠避免重測(cè)信度的一些問(wèn)題,如記憶效果、練習(xí)效應(yīng)等; 適用于在進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響; 減少了輔導(dǎo)或作弊的可能性。 61 復(fù)本信度的主要局限性在于:如果測(cè)量的行為易受練習(xí)的影響,則復(fù)本信度只能減少而不能消除這種影響; 有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變, 例如某些問(wèn)題解決型的測(cè)

20、驗(yàn),如果掌握了解題原則,就有可能產(chǎn)生遷移,尤其當(dāng)復(fù)本只是在題目具體內(nèi)容上有改變時(shí),這種正遷移的作用會(huì)很強(qiáng); 有些測(cè)驗(yàn)很難找到合適的復(fù)本。 62 分半信度 分半信度(split-half reliability)系數(shù)是通過(guò)將測(cè)驗(yàn)分成兩半,計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù),代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致性程度,因而也稱為內(nèi)部一致性信度系數(shù)。 在其它條件相等的情況下,測(cè)驗(yàn)越長(zhǎng),信度系數(shù)越高。因此,分半須進(jìn)行修正。 低估信度,必 問(wèn)題是:如何將測(cè)驗(yàn)分成可比較的兩部分 63 大部分測(cè)驗(yàn)的前半部分和后半部分是不可比較的,因?yàn)椋?難度水平可能不同, 準(zhǔn)備狀態(tài)、練習(xí)、疲勞、厭倦等有所不同。 奇偶分半的

21、方法,即將測(cè)驗(yàn)按奇數(shù)題和偶數(shù)題分成兩半。 前后有牽連的題目,如一組題目都與某段材 料或某個(gè)圖畫有關(guān),那么整個(gè)這組題目應(yīng)該分在同一半;否則有可能高估測(cè)驗(yàn)的信度。64 同質(zhì)性信度 同質(zhì)性指所有測(cè)驗(yàn)題目測(cè)量的只是單一特質(zhì)或內(nèi)容, 表現(xiàn)為所有測(cè)驗(yàn)題目得分的一致性。 如果同質(zhì)性差,則測(cè)驗(yàn)可能混淆了不同的內(nèi)容,其結(jié)果就無(wú)從判斷究竟反映了被測(cè)者的哪些特征。 所有測(cè)驗(yàn)項(xiàng)目都應(yīng)該保證只測(cè)量一種特質(zhì)或內(nèi)容 如果需要在一個(gè)測(cè)驗(yàn)中測(cè)量不同的內(nèi)容,應(yīng)該將測(cè)驗(yàn)設(shè)計(jì)為幾個(gè)分測(cè)驗(yàn),每個(gè)分測(cè)驗(yàn)測(cè)量一種內(nèi)容。例如:16PF的16個(gè)維度 65 同質(zhì)性的測(cè)量1. 庫(kù)德理查遜公式2. 克倫巴赫系數(shù) 3. 荷伊特信度 4. 因素分析 6

22、6 1. 下列各項(xiàng)方法中,不能用來(lái)計(jì)算項(xiàng)目間一致性的方法是() A 因素分析B 復(fù)本信度C 克倫巴赫a系數(shù)答案:BD 荷依特信度2. 克倫巴赫a系數(shù)計(jì)算的信度屬于()A 重測(cè)信度 B 分半信度 C 同質(zhì)性信度 D 評(píng)分者信度答案:C67 評(píng)分者信度 在有些測(cè)量情形中,評(píng)分者的評(píng)判也是誤差的來(lái)源之一。例如投射測(cè)驗(yàn)、創(chuàng)造力測(cè)驗(yàn) 、無(wú)領(lǐng)導(dǎo)小組討論、管理者情景模擬測(cè)驗(yàn)等,都依賴于評(píng)分者的主觀性判斷。 最簡(jiǎn)單的估計(jì)不同評(píng)分者間評(píng)分一致性的方法,是隨機(jī)抽取若干份答卷,由兩個(gè)甚至更多的獨(dú)立的評(píng)分者打分,再求這些答卷評(píng)判分?jǐn)?shù)間的相關(guān)系數(shù)。 68 一般情況下,間隔施測(cè)的復(fù)本信度(即重測(cè)復(fù)本信度)值最低;修正后的

23、分半信度值最高。 69信度系數(shù)的類型 所需復(fù)本 施測(cè)次數(shù) 誤差變異的來(lái)源 重測(cè)信度 12時(shí)間取樣 復(fù)本信度(連續(xù)施測(cè)) 21內(nèi)容取樣 復(fù)本信度(間隔施測(cè)) 22時(shí)間與內(nèi)容取樣 分半信度 11內(nèi)容取樣 同質(zhì)性信度 11內(nèi)容的異質(zhì)性 評(píng)分者信度 11評(píng)分者之間的差異 1. 計(jì)算分半信度需要的復(fù)本個(gè)數(shù)和施測(cè)次數(shù)為() A 1,1答案:AB 2,1C 2,2D 1,22. 用同一個(gè)測(cè)驗(yàn)先后對(duì)受測(cè)者群體施測(cè)兩次, 所求得的測(cè)驗(yàn)信度系數(shù)是() A重測(cè)信度 B復(fù)本信度C分半信度 D 同質(zhì)性信度答案:A70 3. 以時(shí)間取樣為誤差變異來(lái)源的信度類型是()A 分半信度 B 同質(zhì)性信度C 重測(cè)信度 D 評(píng)分者信度

24、答案:C71 第三節(jié)影響信度的因素一、被試樣本 1.團(tuán)體的異質(zhì)性取樣團(tuán)體的異質(zhì)性越大,信度系數(shù)就相對(duì)越高。 如果取樣只是一些高度同質(zhì)性的人,一旦測(cè)驗(yàn)施用于另一些類型的群體對(duì)象,信度就會(huì)降低。 72 例如一項(xiàng)測(cè)驗(yàn)分別施測(cè)于A、B兩組被試。 其中A組被試較質(zhì)(如各年級(jí)學(xué)生都有 ),其分?jǐn)?shù)分布為2090分,而B組被試同質(zhì)程度較高(都為二年級(jí)學(xué)生),其分?jǐn)?shù)分布為8090分。顯然,由于A組被試的分?jǐn)?shù)分布比B組要廣得多,按照上面所提到的分?jǐn)?shù)分布與信度的關(guān)系,可以推知,以A組被試為樣本團(tuán)體得到的信度,要比B組被試得到的信度高。因此,取樣范圍(異質(zhì)性)越大,樣本對(duì)總體的代表性越好,測(cè)量穩(wěn)定性越好。 73 2.

25、團(tuán)體的平均水平測(cè)驗(yàn)所施測(cè)的團(tuán)體的平均能力水平的不同,也會(huì)對(duì) 信度產(chǎn)生影響。 例如,在斯坦福比奈量表中,不同年齡組的信度從.83到.98不等。因?yàn)閷?duì)于年幼的團(tuán)體,他們的平均能力水平低,他們的分?jǐn)?shù)更多是憑猜測(cè)獲得的, 而靠猜測(cè)的測(cè)驗(yàn)結(jié)果總是不會(huì)很穩(wěn)定的,所以信度值較低。這種情況導(dǎo)致的信度偏差,很難用一般的統(tǒng)計(jì)公式來(lái)校正,只能通過(guò)對(duì)各種年齡及能力水平的檢驗(yàn)來(lái)確定。 74 二、題目的數(shù)量 測(cè)驗(yàn)越長(zhǎng),信度值越高。 一方面,測(cè)驗(yàn)越長(zhǎng),題目取樣或內(nèi)容取樣就越充分,結(jié)果就越容易穩(wěn)定可靠。 舉一個(gè)的例子,如果詞匯量的測(cè)驗(yàn)中只包含一個(gè)試題,僅依據(jù)應(yīng)試者對(duì)一個(gè)單詞的記憶,來(lái)確定應(yīng)試者的詞匯量的大小,其結(jié)果必定是非常

26、不可靠的。 另一方面,較長(zhǎng)的測(cè)驗(yàn)不容易受到猜測(cè)的影響。 75 三、測(cè)驗(yàn)的難度 如果測(cè)驗(yàn)難度太低,測(cè)驗(yàn)分?jǐn)?shù)出現(xiàn)天花板效應(yīng)或地板效應(yīng),都會(huì)使測(cè)量到的分?jǐn)?shù)分布太窄,導(dǎo)致信度降低。 如果只增加測(cè)驗(yàn)長(zhǎng)度,沒(méi)有控制難度, 測(cè)驗(yàn)分?jǐn)?shù)不能充分散開,并不能提高信度。 只有當(dāng)測(cè)驗(yàn)的難度水平能夠使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大時(shí),測(cè)驗(yàn)的信度才會(huì)比較理想。 一般來(lái)說(shuō),當(dāng)所有被試的平均分為測(cè)驗(yàn)總分的一半,并且分?jǐn)?shù)從分布時(shí),測(cè)量的信度最高。到滿分76 四、間隔時(shí)間 以再測(cè)法或復(fù)本法求信度,兩次測(cè)驗(yàn)相隔時(shí)間越短,其信度系數(shù)越大,間隔時(shí)間越久,信度系數(shù)越低 77 第四節(jié)信度的特殊問(wèn)題速度測(cè)驗(yàn)信度 標(biāo)準(zhǔn)參考測(cè)驗(yàn)的信度分測(cè)驗(yàn)的信度 差異的

27、信度 變遷的測(cè)量 78 練習(xí)題1. 如果一個(gè)測(cè)驗(yàn)間隔兩個(gè)月后再施測(cè)于同一群體,兩次結(jié)果高度一致,可以肯定該測(cè)驗(yàn)是() A 可信的 B 有效的 C 統(tǒng)計(jì)上顯著的 D 可推廣的答案:A79 2.對(duì)一個(gè)測(cè)驗(yàn)中題目一致性的估計(jì)屬于()A 重測(cè)信度 B 分半信度 C 同質(zhì)性信度 D 評(píng)分者信度答案:C3. 由一個(gè)受測(cè)者樣本在一個(gè)測(cè)驗(yàn)上的得分計(jì) 算得到的奇偶相關(guān)系數(shù)為0.50,則經(jīng)過(guò)校正后得到的分半信度系數(shù)應(yīng)該為() A 0.60答案:BB 0.67C 0.70D 0.7780 第六章 測(cè)驗(yàn)效度 第一節(jié) 效度的性質(zhì) 效度的定義 測(cè)量的正確性,即用一個(gè)測(cè)驗(yàn)或量具能夠測(cè)量出其所要測(cè)量東西的程度 81 效度是評(píng)

28、價(jià)測(cè)驗(yàn)好壞、選擇測(cè)驗(yàn)的重要標(biāo)準(zhǔn)之一。 效度的評(píng)估可以有多種方法,依賴于測(cè)驗(yàn)的具體目的。 某種意義上說(shuō),效度比信度的作用更為重要 。如果一個(gè)測(cè)驗(yàn)效度很低,無(wú)論它的信度有多高,這項(xiàng)測(cè)驗(yàn)都沒(méi)有應(yīng)用價(jià)值。 82 效度的性質(zhì) 實(shí)際上效度指的是“測(cè)驗(yàn)結(jié)果的效度”,是測(cè)驗(yàn)結(jié)果的準(zhǔn)確性程度。 效度是連續(xù)性的,效度高低只是程度上的差別,不是“全或無(wú)”的變量。因此應(yīng)避免簡(jiǎn)單評(píng)價(jià)某測(cè)驗(yàn)的結(jié)果為“有效”或“無(wú)效”。 效度反映了測(cè)驗(yàn)結(jié)果對(duì)測(cè)量目標(biāo)的體現(xiàn)程度。 效度不是直接測(cè)量得到的,而是從已有的證據(jù)推理而得到的。83 效度的理論定義 從測(cè)量理論角度講,效度可以定義為: 與測(cè)量目標(biāo)有關(guān)的真實(shí)分?jǐn)?shù)方差與總分方差的比率。“有

29、關(guān)的真實(shí)方差”是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)變量所產(chǎn)生的方差。用公式可以表示為: 84 造成測(cè)驗(yàn)分?jǐn)?shù)的變化的原因出自三大來(lái)源: 測(cè)量對(duì)象本身的變化, 量具的精度造成的系統(tǒng)誤差, 量具使用中造成的隨機(jī)誤差。 信度和效度的差別在于所考慮的誤差不同。 信度考慮的是隨機(jī)誤差的影響; 效度的誤差則還包括對(duì)測(cè)驗(yàn)?zāi)康膩?lái)說(shuō)無(wú)關(guān)的變量所引起的系統(tǒng)誤差。 誤差方差低(即信度高)并不保證效度就一定高; 但效度高的話,信度必然會(huì)高。可以這樣說(shuō),信度是效度的必要條件。 85 影響效度的誤差來(lái)源 測(cè)驗(yàn)組成方面 測(cè)驗(yàn)實(shí)施方面 被試反應(yīng) 效度的類型 內(nèi)容效度 構(gòu)想效度 校標(biāo)效度 86 第二節(jié) 內(nèi)容效度一、內(nèi)容效度的性質(zhì) 兩個(gè)條件:

30、定義完好的內(nèi)容范圍 測(cè)驗(yàn)題目是所界定內(nèi)容范圍的代表性取樣87 二、確定內(nèi)容效度的方法 1.專家判斷 由專家根據(jù)測(cè)驗(yàn)題目和假設(shè)的內(nèi)容范圍作系統(tǒng)的比較判斷。 這種方法的主要問(wèn)題是: 缺乏一種數(shù)量化指標(biāo)來(lái)描述內(nèi)容效度的高低; 不同判斷者的判斷可能不一致; 如果測(cè)驗(yàn)內(nèi)容范圍缺乏明確性,會(huì)使效度的判斷過(guò)程發(fā)生困難。 88 2. 統(tǒng)計(jì)分析 克倫巴赫提出,內(nèi)容效度可以由兩個(gè)獨(dú)立的但取自同樣內(nèi)容范圍的測(cè)驗(yàn)得分的相關(guān)(即復(fù)本信度)來(lái)作數(shù)量上的估計(jì)。 3. 經(jīng)驗(yàn)法 例如,對(duì)于管理能力測(cè)驗(yàn),高層管理者的平均成績(jī)應(yīng)該高于普通員工和一般管理者(區(qū)分效度)。 89 三、內(nèi)容效度的特點(diǎn) 特定性 與表面效度混淆 90 四、內(nèi)

31、容效度的應(yīng)用和評(píng)價(jià) 內(nèi)容效度的評(píng)估一般不適用于能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)。 能力傾向和人格測(cè)驗(yàn)不太要求與所取樣的行為領(lǐng)域的相似性,題目的選擇更多受某種假設(shè)的指導(dǎo), 而假設(shè)的正確與否則由其它效度形式來(lái)確定。 能力傾向和人格測(cè)驗(yàn)與成就測(cè)驗(yàn)不同,不是建立在某種教學(xué)課程或工作知識(shí)與技能的基礎(chǔ)上。 在對(duì)相同題目作反應(yīng)時(shí),每個(gè)被試使用的方法和心理過(guò)程是很不相同的,同一測(cè)驗(yàn)對(duì)不同的被試來(lái)說(shuō)測(cè)量的是不同的心理過(guò)程。在這種情況下,不可能從檢查測(cè)量的內(nèi)容來(lái)確定測(cè)量的功能。 91 第三節(jié) 構(gòu)想效度一、構(gòu)想效度定義 構(gòu)想效度(construct validity)是指測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度。 構(gòu)想通常指一些抽

32、象的、假設(shè)性的概念或特質(zhì),如智力、創(chuàng)造力、言語(yǔ)流暢性、焦慮等。這些構(gòu)想往往無(wú)法直接觀察,但都有其心理上的理論基礎(chǔ)和客觀現(xiàn)實(shí)性,都可通過(guò)各種可觀察的材料加以確定。 例如,言語(yǔ)流暢性可以通過(guò)語(yǔ)速、語(yǔ)句間的邏輯性、口誤的數(shù)量等可觀察的指標(biāo)進(jìn)行確定。 92 構(gòu)想效度關(guān)注的問(wèn)題是:測(cè)驗(yàn)是否能正確反映理論構(gòu)想的特性。 比如說(shuō),一項(xiàng)言語(yǔ)流暢性測(cè)驗(yàn)所測(cè)量的是不是真正的言語(yǔ)流暢性,是否對(duì)言語(yǔ)流暢性的理論概念中所包含的所有特點(diǎn)( 如語(yǔ)速、語(yǔ)句間的邏輯性、口誤的數(shù)量等 93 二、確定構(gòu)想效度的方法 測(cè)驗(yàn)內(nèi)方法 測(cè)驗(yàn)間方法:相容效度、區(qū)分效度、因素效度 研究測(cè)驗(yàn)的效標(biāo)效度 考察實(shí)驗(yàn)變量對(duì)測(cè)驗(yàn)分?jǐn)?shù)的影響 搜集某些變異上

33、的證據(jù) 三、對(duì)構(gòu)想效度的評(píng)價(jià)94 第四節(jié) 效標(biāo)效度 一、效標(biāo)效度的定義 反映的是測(cè)驗(yàn)分?jǐn)?shù)與外在標(biāo)準(zhǔn)(效標(biāo))的相關(guān)程度,即測(cè)驗(yàn)分?jǐn)?shù)對(duì)個(gè)體的效標(biāo)行為表現(xiàn)進(jìn)行預(yù)測(cè)的有效性程度。 效標(biāo)是考察測(cè)量效用的外在參照標(biāo)準(zhǔn)。 例如一個(gè)機(jī)械能力傾向測(cè)驗(yàn),其效度的標(biāo)準(zhǔn)(效標(biāo))可以是成為機(jī)械師后的工作表現(xiàn); 一個(gè)管理能力測(cè)驗(yàn),其效標(biāo)可以是將來(lái)管理工作的績(jī)效。 效標(biāo)效度往往用于預(yù)測(cè)性測(cè)量。即根據(jù)測(cè)量分?jǐn)?shù)作出的預(yù) 測(cè),一般用于甄選決策。因此,只有當(dāng)證明測(cè)量分?jǐn)?shù)確實(shí)能夠預(yù)測(cè)所欲研究的行為時(shí),這種決策才可能正確。 95 二、效標(biāo) (一)效標(biāo)與效標(biāo)測(cè)量 效標(biāo)是衡量測(cè)量有效性的參照標(biāo)準(zhǔn),是一種可以直接、獨(dú)立測(cè)量的行為。 要測(cè)量效

34、標(biāo),必須把效標(biāo)行為轉(zhuǎn)化為某種可以操作的測(cè)量指標(biāo),以便進(jìn)行比較。 效標(biāo)的概念涉及觀念效標(biāo)(conceptual criterion,即效標(biāo)的實(shí)質(zhì)概念內(nèi)容)和效標(biāo)測(cè)量(criterion measurement,即效標(biāo)的具體度量方法)。 例如,對(duì)于篩選銷售人員的銷售技巧測(cè)驗(yàn),其觀念效標(biāo)是“銷售工作的成功”,而效標(biāo)測(cè)量往往用“年銷售量”來(lái)表示。 96 (二)效標(biāo)測(cè)量的條件 1. 有效性效標(biāo)測(cè)量要求能真正反映效度 2. 可靠性具有較高的信度,相關(guān)要高 3. 客觀性要避免偏見的影響,防止效標(biāo)污染。 效標(biāo)污染(criterion contamination)是指由于評(píng)定者知道測(cè)量分?jǐn)?shù)而影響個(gè)人的效標(biāo)成績(jī)的

35、情形。 4. 實(shí)用性97 (三)常用的效標(biāo) 1) 學(xué)術(shù)成就 2) 等級(jí)評(píng)定 3) 臨床診斷 4) 特殊訓(xùn)練成績(jī) 5) 實(shí)際工作表現(xiàn) 6) 對(duì)團(tuán)體的區(qū)分 團(tuán)體對(duì)照: 用兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體,比較他們?cè)陬A(yù)測(cè)源分?jǐn)?shù)上的差別。 7) 以前有效的測(cè)量分?jǐn)?shù) (四)效標(biāo)的特性: 多樣性、復(fù)雜性、特殊性、時(shí)間性98 三、確定效標(biāo)效度的方法 相關(guān)法 區(qū)分法 命中率 功利率 四、影響效標(biāo)效度的因素 測(cè)驗(yàn)的長(zhǎng)度、取樣、所用的效標(biāo)和干涉變量99 練習(xí)題 1. 某教師的試卷經(jīng)常超出授課范圍,該試卷的()一定低 A 信度 B 校標(biāo)效度 C 內(nèi)容效度 D 構(gòu)想效度答案:C2. 如果一個(gè)測(cè)驗(yàn)與將來(lái)的實(shí)際業(yè)績(jī)相關(guān)很高,

36、比如機(jī)械傾向測(cè)驗(yàn)與汽車訓(xùn)練課程成績(jī)相關(guān)很高,則這種測(cè)驗(yàn)的()很高。 A 表面效度 B 校標(biāo)效度 C 構(gòu)想效度 D 績(jī)效效度 答案:B100 3. 企業(yè)使用招工測(cè)驗(yàn)的主要目的是預(yù)測(cè)錄用人員未來(lái)工作的績(jī)效,這類測(cè)驗(yàn)非常重視() A 內(nèi)容效度 B 校標(biāo)效度C 構(gòu)想效度 D 會(huì)聚效度答案:B4. 抑郁量表的有效性常用抑郁癥患者的測(cè)驗(yàn)結(jié)果與精 神科醫(yī)生診斷的符合程度來(lái)說(shuō)明,這種方法是() A內(nèi)容效度 B構(gòu)想效度C 效標(biāo)效度 D 評(píng)分者效度答案:C101 5. 命中率所反映的測(cè)驗(yàn)效度屬于()A 內(nèi)容效度 B 校標(biāo)效度C 表面效度 D 結(jié)構(gòu)效度答案:B6. 運(yùn)用測(cè)驗(yàn)所錄取的合格人數(shù)與實(shí)際錄取的總?cè)藬?shù)之比稱作

37、() A 總命中率 B 基礎(chǔ)率 C 正命中率 D 錄取率答案:C102 7 測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度稱為() A.內(nèi)容效度 B. 構(gòu)想效度 C. 校標(biāo)效度 D. 實(shí)證效度答案:B8 衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn)稱為 .A.效度 答案:DB.信度C.常模D.效標(biāo)103 第七章項(xiàng)目分析 項(xiàng)目分析是指根據(jù)試測(cè)結(jié)果對(duì)組成測(cè)驗(yàn)的各個(gè)題目(項(xiàng)目)進(jìn)行分析,從而評(píng)價(jià)題目好壞,對(duì)題目進(jìn)行篩選的程序和方法。 項(xiàng)目分析可以分為定性分析和定量分析 定性分析主要考慮內(nèi)容效度,題目表達(dá)的恰當(dāng)性和有效性等方面; 定量分析主要考察題目難度和鑒別度是否適當(dāng)。 由于測(cè)驗(yàn)的信度、效度最終都依賴于題目的上述性質(zhì),所以通過(guò)項(xiàng)目

38、分析對(duì)測(cè)驗(yàn)題目進(jìn)行選擇和修改 ,可以提高測(cè)驗(yàn)的信度和效度。 104 第一節(jié) 項(xiàng)目難度 難度分析(difficulty analysis),是對(duì)題目的難 度進(jìn)行估計(jì)以確定適宜的難度。 對(duì)于非能力測(cè)驗(yàn)(如人格測(cè)驗(yàn)),難度是指測(cè)驗(yàn)題目的“通俗性”,即測(cè)驗(yàn)題目是否容易被人看懂和回答,往往以取自相同總體的樣本中,能在答案范圍內(nèi)回答該題的人數(shù)指標(biāo)來(lái)表示。 以下主要針對(duì)能力測(cè)驗(yàn)的難度分析.105 一、難度的定義難度(有人也將P值稱為易度)的指標(biāo)通常以通過(guò)率表示,即以答對(duì)或通過(guò)該題的人數(shù)百分比來(lái)表示: 106 二、難度的計(jì)算 當(dāng)被試人數(shù)較多時(shí),可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組:分?jǐn)?shù)最高的27%被試為高分組 (N

39、H),分?jǐn)?shù)最低的27%為低分組(NL),中間46%為中間組。分別計(jì)算高分組和低分組的通過(guò)率,再求試題的難度。 107 三、難度水平的確定 題目難度水平究竟多高合適,依賴于測(cè)驗(yàn)的目的、性質(zhì)和題目形式。 許多測(cè)量都希望能準(zhǔn)確測(cè)量個(gè)體間的差異。如果在某題上,被試全答對(duì)或全答錯(cuò),則該題無(wú)法提供個(gè)別差異的信息,即不能把不同人區(qū)別開來(lái)。 P值越接近于0或接近于1,越無(wú)法區(qū)分被試間能力的差異。相反,P值越接近于.50,區(qū)別力越高。 為使測(cè)驗(yàn)具有更大的區(qū)別力,應(yīng)選擇難度在.50左右的試題比較合適。108 為了考查學(xué)生對(duì)某些方面的知識(shí),技能是否掌握,可保留一些難度偏高的題目。 用于選人時(shí),應(yīng)盡量使難度值接近錄取

40、率。109 四、測(cè)驗(yàn)的難度 整個(gè)測(cè)驗(yàn)的難度取決于組成測(cè)驗(yàn)的各個(gè)試題的難度。 整個(gè)測(cè)驗(yàn)難度水平的確定,需要根據(jù)測(cè)驗(yàn)分?jǐn)?shù)的分布作出。 由于眾人的心理特性多數(shù)基本上是呈正態(tài)分布的,因此如果被試樣本具有代表性,則測(cè)驗(yàn)結(jié)果也應(yīng)符合正態(tài)分布的模型。 110 偏態(tài)分布有“正偏態(tài)分布”和“負(fù)偏態(tài)分布”兩種。 A為正偏態(tài)分布,即大多數(shù)得分集中在低分端,說(shuō)明測(cè)驗(yàn)對(duì)于所研究的樣本團(tuán)體來(lái)說(shuō)偏難。 B為負(fù)偏態(tài)分布,即大多數(shù)得分集中在高分端,說(shuō)明測(cè)驗(yàn)過(guò)易。 111 五、常態(tài)化等級(jí)難度量表 以通過(guò)率作為難度指標(biāo),實(shí)際上是以順序量表來(lái)表示難度,即它僅僅能指出題目難度的順序或相對(duì)難度的高低。通常情況下,需要進(jìn)行等距轉(zhuǎn)換。 如果

41、被試的得分呈正態(tài)分布,可根據(jù)正態(tài)曲線表,將試題難度轉(zhuǎn)換成具有相等單位的等距量表,即分?jǐn)?shù)。 112 試題難度的等距轉(zhuǎn)換 例如有3個(gè)試題通過(guò)的人數(shù)分別為全體被試的60%、40%、20%,可以判定第1題最容易,第3題最難。但雖然它們的相差數(shù)值相同(20%),卻無(wú)法確定題目1與2之間的難度差別是否等于題目2和3之間的難度差別。這就需要計(jì)算等距量表的難度指標(biāo)。 在正態(tài)分布情形下,平均數(shù)之上或之下一個(gè)標(biāo)準(zhǔn)差的距離約占全體人數(shù)的34%。因此,如果某題A通過(guò)率為84%(P=.84),可知該題的難度為-1;如果某題B的通過(guò)人數(shù)只有16%,則這個(gè)題目的難度為+1;如果某題C 剛好有50%的被試通過(guò),那該題的難度為

42、0。 根據(jù)正態(tài)曲線表,可以查出任何通過(guò)率值相對(duì)的值。 113 以分?jǐn)?shù)表示難度,也有不便之處,主要是 有小數(shù)點(diǎn)和正負(fù)符號(hào)。因此通常需要轉(zhuǎn)換成另一種單位的等距量表,其中較為常用的是美國(guó)教育測(cè)驗(yàn)服務(wù)機(jī)構(gòu)采用的難度指標(biāo): =13+4Z為正態(tài)化等距難度值;13為平均數(shù),4為標(biāo)準(zhǔn)差的單位,Z為正態(tài)曲線下從右端計(jì)算的P值(通過(guò)率)所對(duì)應(yīng)的Z值。 114 第二節(jié) 區(qū)分度 區(qū)分度是指測(cè)驗(yàn)項(xiàng)目所測(cè)量的心理特性的區(qū)分程度和鑒別能力,也稱項(xiàng)目的效度。確定區(qū)分度的方法(一)項(xiàng)目特征曲線115 (二)項(xiàng)目與效標(biāo)的相關(guān) 相關(guān)法:項(xiàng)目分?jǐn)?shù)與校標(biāo)分?jǐn)?shù)的相關(guān)。相關(guān)越高,表明項(xiàng)目越具有區(qū)分的功能。 項(xiàng)目效度分析(item vali

43、dity analysis)主要以效標(biāo)為依據(jù),考察 被試在每個(gè)試題上的反應(yīng)與其在效標(biāo)上表現(xiàn)的相關(guān)程度,即每個(gè)試題所測(cè)查的行為是否反映了被試在效標(biāo)上的表現(xiàn)。 例如,如果測(cè)驗(yàn)是預(yù)測(cè)被試在工作中的表現(xiàn),則可以選擇工作表現(xiàn)指標(biāo)(例如上級(jí)和同事的評(píng)價(jià)等)作為效標(biāo)。 題目效度系數(shù)越高,對(duì)預(yù)測(cè)效標(biāo)越有用。 效度系數(shù)高于.20的題目一般可以保留; 效度系數(shù)接近于零或負(fù)數(shù),則應(yīng)該作重大修改或刪除。116 二列相關(guān) 點(diǎn)二列相關(guān) 四分相關(guān) 相關(guān) 項(xiàng)目與總分相關(guān)重疊的校正 有時(shí)在進(jìn)行項(xiàng)目分析時(shí),難以找到合適的效標(biāo),這時(shí)可以采用測(cè)驗(yàn)的總分代替效標(biāo),考察每個(gè)試題和總分的一致性,即做項(xiàng)目總分分析(item-total co

44、rrelation analysis)。 117 (三)鑒別指數(shù)(discrimination index) 效標(biāo)得分高、低兩組被試在項(xiàng)目通過(guò)率上的差值。 當(dāng)效標(biāo)成績(jī)是連續(xù)變量時(shí),可從分?jǐn)?shù)分布的兩端各選擇27%(33%)的被試組成高、低分組,再分別計(jì)算兩組每道題目上各自的通過(guò)率,二者之差就是各題目的鑒別指數(shù)D。 118 高低分組的劃分 當(dāng)分?jǐn)?shù)分布較正態(tài)分布平坦時(shí),高低分組各占比率應(yīng)該有所調(diào)整,應(yīng)該高于27%,大約33%較為合適。 一般高低分組各占比率在25%33%之間都可以。 如果比率太小,則所選出來(lái)的兩組過(guò)于,更容易有明顯區(qū)別,故可能是人為夸大了題目的區(qū)分力。 當(dāng)樣本團(tuán)體過(guò)小時(shí),劃分的比例可

45、以適當(dāng)提高,甚至用50%的標(biāo)準(zhǔn),即把上下兩半被試作為高分組和低分組都是可以的。 119 一般情況下,D值很難等于1.00,而且也沒(méi) 有必要甚至不能追求等于1.00,因?yàn)檫@種情況往往只是題目分?jǐn)?shù)呈現(xiàn)絕對(duì)的雙峰分布時(shí)才會(huì)出現(xiàn)。這時(shí),各題目的同質(zhì)性也會(huì)過(guò)高。 一般情況下,只要所得D值大于.30時(shí),題目就可以接受了。 120 試題鑒別度指數(shù)與質(zhì)量評(píng)價(jià))在實(shí)際操作中,項(xiàng)目鑒別度在0.3-0.5之間比較理想。鑒別度指數(shù)過(guò)大,意味著高低兩組樣本的差異過(guò)大,分?jǐn)?shù)出現(xiàn)明顯雙峰分布,同樣不利于精細(xì)鑒別不同個(gè)體。 121 項(xiàng)目鑒別度的實(shí)際應(yīng)用第1題雖然鑒別度為35,但兩個(gè)組別的通過(guò)率都在50%以下,說(shuō)明題目偏難。第

46、2題雖然鑒別度在33,但兩個(gè)組別的通過(guò)率都在50%以上,說(shuō)明題目偏易。 第3題的通過(guò)率和鑒別度比較理想。 第4題兩組差距太大,出現(xiàn)明顯的雙峰分布,不利于精細(xì)辨別個(gè)體差異。 項(xiàng)目鑒別度并非越大越好,要具體分析情況。122 區(qū)分度的相對(duì)性 采用不同計(jì)算方法區(qū)分度的值不同 用相關(guān)法計(jì)算的區(qū)分度值受樣本大小影響 用兩個(gè)組通過(guò)率的差異,受分組標(biāo)準(zhǔn)影響 與樣本同質(zhì)性有關(guān) 區(qū)分度與難度的關(guān)系123 第三節(jié) 項(xiàng)目分析的特殊問(wèn)題備選答案的反應(yīng)模式 速度測(cè)驗(yàn)的項(xiàng)目分析 標(biāo)準(zhǔn)參考測(cè)驗(yàn)的項(xiàng)目分析項(xiàng)目團(tuán)體的相互作用 有效性與可靠性的矛盾 124 速度測(cè)驗(yàn)的項(xiàng)目分析 有些測(cè)驗(yàn)考察的是被試解決問(wèn)題的速度。這樣的測(cè)驗(yàn)叫速度測(cè)

47、驗(yàn)(speed-based test)。 速度測(cè)驗(yàn)往往有很多題目,一般很少有被試能夠在限定時(shí)間內(nèi)完成所有的題目。 大多數(shù)能力測(cè)驗(yàn)都限定了完成時(shí)間,雖然這些測(cè)驗(yàn)不是速度測(cè)驗(yàn),但速度也是影響成績(jī)的一個(gè)重要因素。 125 速度測(cè)驗(yàn)的項(xiàng)目分析不能用通過(guò)率作為項(xiàng)目分析的指標(biāo)。 第一種方法是對(duì)于那些不能被所有被試完成的題目,只分析完成該題目的被試的成績(jī)。 這容易低估難度,且不穩(wěn)定。 第二種方法是延長(zhǎng)試測(cè)時(shí)間,使所有被試都能完成所有題目。 這背離了速度概念 126 對(duì)于速度測(cè)驗(yàn)的項(xiàng)目分析尚沒(méi)有完善的解決辦法。 從易到難排列的能力速度測(cè)試 可以適當(dāng)延長(zhǎng)測(cè)試時(shí)間 各題難度差不多的能力速度測(cè)試 打亂題目的順序,每一份卷子的順序都是不一樣的,所以最后的結(jié)果是每一道題目都是有一定的缺失值,但是并不影響總體的難度、鑒別度的分析。 使用拉丁方的方法 127 練習(xí)題 1. 已知某校男、女學(xué)生對(duì)某項(xiàng)教育措施各自持“同意”和“反對(duì)”態(tài)度的人數(shù),若要了解性別與態(tài)度是否有關(guān),則應(yīng)該計(jì)算() A 積差相關(guān) B 等級(jí)相關(guān) C 相關(guān)答案:CD二列相關(guān)2.通過(guò)率衡量項(xiàng)目的() A 難度 B 區(qū)分度 C信度 D 效度答案:A128 3. 能確切地反映預(yù)測(cè)性測(cè)驗(yàn)中個(gè)別項(xiàng)目質(zhì)量的是() A 該項(xiàng)目間隔2個(gè)月后再測(cè)得分的一致性B 該項(xiàng)目與其它項(xiàng)目的相關(guān)系數(shù)的平均值C 項(xiàng)目分?jǐn)?shù)與總分的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論