2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W

上傳人：我*** IP屬地：北京上傳時(shí)間：2020-09-27 格式：DOCX 頁(yè)數(shù)：164 大?。?.52MB 積分：14 舉報(bào) 版權(quán)申訴

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第2頁(yè)

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第3頁(yè)

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第4頁(yè)

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W_第5頁(yè)

已閱讀5頁(yè)，還剩159頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、心理測(cè)量學(xué)1 目錄緒論心理測(cè)驗(yàn)的編制測(cè)驗(yàn)的實(shí)施和計(jì)分測(cè)驗(yàn)結(jié)果的解釋測(cè)驗(yàn)信度測(cè)驗(yàn)效度項(xiàng)目分析學(xué)績(jī)測(cè)驗(yàn)智力測(cè)驗(yàn)人格測(cè)驗(yàn) 2 第一章緒論第一節(jié)心理測(cè)量的歷史一、國(guó)外心理測(cè)量發(fā)展的歷史馮特的實(shí)驗(yàn)心理學(xué)高爾頓的遺傳理論測(cè)量卡特爾的個(gè)體差異研究比納和比納西蒙智力量表的產(chǎn)生3 高爾頓的遺傳理論測(cè)量高爾頓：Hereditary Genius，1869智力可以量化測(cè)量智力分布為倒鐘形曲線-正態(tài)分布智力可以客觀測(cè)量不同測(cè)驗(yàn)的關(guān)系精度可用“相關(guān)”來(lái)估天才是遺傳的后來(lái)在社會(huì)中的應(yīng)用Sir Francis Galton (1822-1911)4 關(guān)于弗朗西斯高爾頓他是家中9 個(gè)孩子里最小的一個(gè) 出生1

2、2 個(gè)月后，認(rèn)識(shí)所有大寫字母 18 個(gè)月后則能辨別大寫和小寫兩種字母在他咿呀學(xué)語(yǔ)的時(shí)候，能背誦拉丁文到了兩歲半左右，閱讀蛛網(wǎng)捕蠅之類的兒童讀物3 歲他學(xué)會(huì)簽名 4 歲他能寫詩(shī) 5 歲已能背誦并理解蘇格蘭敘事詩(shī)馬米翁 6 歲，已精熟荷馬史詩(shī)中伊利亞特和奧德賽 7 歲能欣賞莎士比亞名著，對(duì)博物學(xué)產(chǎn)生興趣，并按自己的方法對(duì)昆蟲、礦物標(biāo)本進(jìn)行分類 5 心理測(cè)量的發(fā)展歷史趨勢(shì)：由解剖生理特征為依據(jù)轉(zhuǎn)向?qū)π闹腔顒?dòng)的測(cè)量測(cè)量簡(jiǎn)單感知到復(fù)雜的認(rèn)知能力單一量數(shù)評(píng)定個(gè)體間差異，轉(zhuǎn)為多個(gè)量數(shù)兼顧個(gè)別差異與個(gè)體間差異心理測(cè)量與實(shí)驗(yàn)心理學(xué)的分合6 第二節(jié) 心理測(cè)量的性質(zhì)測(cè)量的基本概念測(cè)量：兩個(gè)要素：參照

3、點(diǎn)：絕對(duì)和相對(duì)零點(diǎn) 單位：確定的意義和相等的價(jià)值測(cè)驗(yàn)：心理測(cè)量的工具和手段7 測(cè)量的量表命名量表順序量表等距量表比例量表 8 心理測(cè)量的基本概念心理測(cè)量與測(cè)驗(yàn)的關(guān)系標(biāo)準(zhǔn)化測(cè)驗(yàn)：標(biāo)準(zhǔn)化的三點(diǎn)優(yōu)點(diǎn)心理測(cè)量的性質(zhì) 間接性相對(duì)性客觀性 9 第三節(jié) 心理測(cè)驗(yàn)的分類和作用心理測(cè)驗(yàn)的分類心理測(cè)驗(yàn)的功能（一）實(shí)際工作1. 選材 2. 安置 3. 診斷 4. 評(píng)價(jià) （二）理論研究 1. 搜集資料 2. 建立和檢驗(yàn)假說(shuō)3. 實(shí)驗(yàn)分組 10 練習(xí)題1. 關(guān)于測(cè)量、測(cè)驗(yàn)、評(píng)價(jià)的關(guān)系，下列說(shuō)法中正確的是（） A 測(cè)驗(yàn)與測(cè)量同義 B 測(cè)驗(yàn)是一種測(cè)量的工具 C 測(cè)驗(yàn)是一種評(píng)價(jià)方法 D 評(píng)價(jià)必須利用

4、測(cè)驗(yàn)所得的資料答案：B11 2. 首先提出“測(cè)驗(yàn)”、“心理測(cè)量”術(shù)語(yǔ)的學(xué)者是（） A 馮特B 比納C 卡特爾 D 高爾頓答案：D12 3. 測(cè)量的兩個(gè)要素是（）A. 對(duì)象和工作 B. 單位和參照點(diǎn) C. 目標(biāo)和量表 D. 分?jǐn)?shù)和常模答案：B13 第二章心理測(cè)驗(yàn)的編制第一節(jié) 編制測(cè)驗(yàn)的一般程序確定測(cè)驗(yàn)的目的制定編題計(jì)劃編寫題目項(xiàng)目的預(yù)測(cè)和分析合成測(cè)驗(yàn) 將測(cè)驗(yàn)標(biāo)準(zhǔn)化對(duì)測(cè)驗(yàn)的鑒定編寫測(cè)驗(yàn)說(shuō)明書 14 雙向細(xì)目表15 關(guān)于常模常模(norm)是一組具有代表性的被試樣本的測(cè)驗(yàn)成績(jī)的分布結(jié)構(gòu)，包括它的集中趨勢(shì) （通常用平均數(shù)表明）和離散度（通常用標(biāo)準(zhǔn)差表示）。常模是用以比較不同被測(cè)者測(cè)驗(yàn)分?jǐn)?shù)的標(biāo)

5、準(zhǔn)，它能夠說(shuō)明某一測(cè)驗(yàn)結(jié)果分?jǐn)?shù)相對(duì)于同類被測(cè)者所處的水平。常模是解釋測(cè)量結(jié)果的重要依據(jù)。16 17 18 第二節(jié)測(cè)驗(yàn)題目的編制技術(shù)命題的一般原則測(cè)量善良你喜歡小動(dòng)物嗎？ A、是 B、看情況，看心情 C、否并不是典型的問(wèn)題你是否同意“自見者不明，自是者不彰，自伐者無(wú)功，自矜者不長(zhǎng)”的主張？ A.同意 B.無(wú)所謂 C.不同意古文，太晦澀猜測(cè)的校正不是永遠(yuǎn)不可以使用的。1）是 2）否的，拗口 19 測(cè)題的種類及編制自由應(yīng)答型固定應(yīng)答型（客觀題）填充題簡(jiǎn)答題應(yīng)用題論文題聯(lián)想題操作題多選題是非題匹配題20 練習(xí)題編寫學(xué)績(jī)測(cè)驗(yàn)時(shí)，雙向細(xì)目表中的“雙向”是指（） A 內(nèi)容與題型B 內(nèi)容與技能

6、C 技能與題型D 題型與難度答案：B21 第三章測(cè)驗(yàn)的實(shí)施和計(jì)分第一節(jié) 測(cè)驗(yàn)的實(shí)施測(cè)驗(yàn)實(shí)施的一般程序 1. 標(biāo)準(zhǔn)化指導(dǎo)語(yǔ) 指導(dǎo)語(yǔ)(instruction)是在測(cè)量實(shí)施時(shí)說(shuō)明測(cè)量進(jìn)行方式，以及如何回答問(wèn)題的指導(dǎo)性語(yǔ)言。類型：指示語(yǔ)有針對(duì)被試和針對(duì)主試的兩種。要求：指示語(yǔ)應(yīng)清楚、明確、易懂、有禮貌。樣例：有時(shí)有必要作適當(dāng)?shù)难菔荆ńo出例題和回答說(shuō)明），并且注意觀察被試的反應(yīng)。 22 指導(dǎo)語(yǔ)的內(nèi)容結(jié)構(gòu)一般來(lái)說(shuō)，對(duì)被試的指示語(yǔ)包括：1）如何選擇反應(yīng)形式（畫圈、劃勾、填數(shù)字、口答、書寫等）； 2）如何記錄這些反應(yīng)（題本或答卷紙、錄音、錄相等）； 3）說(shuō)明時(shí)間限制； 4）如果不能確定正確反應(yīng)

7、，該如何去做（是否允許猜測(cè)等），以及計(jì)分的方法。 5）例題。當(dāng)題目形式比較生疏時(shí)，應(yīng)該給出附有正確答案的例題； 6）某些情況下，可能告知被試測(cè)驗(yàn)?zāi)康摹?23 2. 標(biāo)準(zhǔn)時(shí)限大多數(shù)典型作業(yè)測(cè)驗(yàn)是不受時(shí)間限制的。但在最高作業(yè)測(cè)驗(yàn)中，速度是需要考慮的重要因素之一。大多數(shù)測(cè)驗(yàn)既要考慮反應(yīng)的速度，也要考察解決有較大難度題目的能力。通常，能力和成就測(cè)驗(yàn)的時(shí)限，以大約90%的被試能在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn)為標(biāo)準(zhǔn)。題目從易到難排列，力求使大多數(shù)被試能在規(guī)定時(shí)間內(nèi)完成會(huì)答的題目。確定測(cè)驗(yàn)的標(biāo)準(zhǔn)時(shí)限一般采取嘗試法，即通過(guò)預(yù)測(cè)試來(lái)確定。24 3. 測(cè)驗(yàn)的環(huán)境條件 1）輕松，舒適。 2）安靜、寬敞，照明，

8、通風(fēng)，適宜的溫度和濕度等。3）防止各種干擾。噪音，閑雜無(wú)關(guān)人員，地點(diǎn)便利性環(huán)境條件的要求并不是可有可無(wú)的。不同的環(huán)境條件可能導(dǎo)致不同的結(jié)果，導(dǎo)致測(cè)驗(yàn)分?jǐn)?shù)難以解釋。要在施測(cè)過(guò)程中記錄下任何意外的環(huán)境因素，以便在解釋測(cè)驗(yàn)結(jié)果時(shí)加以考慮。 4.計(jì)算機(jī)輔助的測(cè)驗(yàn)實(shí)施25 1.2.3.主試的職責(zé)施測(cè)前施測(cè)中施測(cè)后主試的影響主試的責(zé)任十分重要，能否按照要求操作，對(duì)測(cè)量結(jié)果有很大影響：主試不熟悉測(cè)量的要求和細(xì)節(jié)，在實(shí)施中會(huì)手忙腳亂，或做出錯(cuò)誤的操作或指示。主試的情緒如緊張，因不熟悉測(cè)量而出現(xiàn)的猶豫、困惑，會(huì)影響被試的應(yīng)試行為。主試的態(tài)度，如對(duì)測(cè)量的嚴(yán)肅性，對(duì)被試的友善，是保證測(cè)量有效性的重

9、要因素。主試指導(dǎo)語(yǔ)的語(yǔ)速會(huì)影響被試應(yīng)答的速度。主試操作不當(dāng)可能產(chǎn)生的后果包括：使能力類測(cè)驗(yàn)分?jǐn)?shù)明顯降低；使人格類測(cè)驗(yàn)分?jǐn)?shù)明顯偏差。 26 第二節(jié) 測(cè)驗(yàn)的計(jì)分和分?jǐn)?shù)的合成計(jì)分的一般程序計(jì)分的基本步驟和要求論文題計(jì)分客觀題計(jì)分猜測(cè)修正公式:S=R-W/(n-1)S是正確分?jǐn)?shù)，R為被試答對(duì)的題目數(shù)，W為被試答錯(cuò)的題目數(shù)，n為選項(xiàng)數(shù)目。 27 關(guān)于猜測(cè)修正公式反對(duì) 贊成修正公式可避免減低測(cè)驗(yàn)的信度。因?yàn)槿绻麖?qiáng)調(diào)倒扣分，被試就不敢盲目猜測(cè)。修正公式可反映被試真正的能力和水平。使用修正公式對(duì)那些不能答完全部試題的被試來(lái)說(shuō)比較公平。公式假設(shè)不成立，因?yàn)楸辉嚧疱e(cuò)，并非完全瞎猜。多數(shù)情況下是先舍

10、棄部分誘答，再就剩下的幾個(gè)選項(xiàng)來(lái)猜測(cè)。有時(shí)答錯(cuò)試題，是因?yàn)橛^念模糊、記憶不清或者粗心大意，并非亂猜。只要所有被試能答完全部題目，或者略去未答的題目數(shù)相同，則猜測(cè)修正無(wú)實(shí)質(zhì)作用。此種情形下其相對(duì)分?jǐn)?shù)（如z分?jǐn)?shù) 、T分?jǐn)?shù)或百分等級(jí)）完全相同。不采用猜測(cè)修正對(duì)信度并無(wú)重大影響。實(shí)際生活中，常常需要僅憑借部分知識(shí)來(lái)作判斷，因此完全不許猜測(cè)也與實(shí)際生活不符。 28 測(cè)驗(yàn)分?jǐn)?shù)的合成 1. 題目的組合 2. 分測(cè)驗(yàn)或量表的組合3. 測(cè)驗(yàn)的組合 29 第三節(jié) 測(cè)驗(yàn)的誤差誤差的定義和種類隨機(jī)誤差和系統(tǒng)誤差誤差的來(lái)源測(cè)驗(yàn)內(nèi)部引起的誤差由施測(cè)過(guò)程引起的誤差由受測(cè)者本身引起的誤差測(cè)驗(yàn)的經(jīng)驗(yàn)、練習(xí)因素

11、、應(yīng)試動(dòng)機(jī)、測(cè)驗(yàn)焦慮、反應(yīng)定勢(shì)、生理因素 30 練習(xí)題1. 測(cè)量過(guò)程中由不可控制的偶然因素引起的誤差稱為（） A 系統(tǒng)誤差B 恒定誤差C 測(cè)量誤差D 隨機(jī)誤差答案：D31 2. 下述關(guān)于隨機(jī)誤差對(duì)測(cè)驗(yàn)影響的說(shuō)法中正確的是（） A 影響測(cè)驗(yàn)的信度，但不影響效度B 影響測(cè)驗(yàn)的效度，但不影響信度C 影響測(cè)驗(yàn)的信度，也影響其效度D 對(duì)測(cè)驗(yàn)的信度、效度均無(wú)影響答案：C32 3. 系統(tǒng)誤差對(duì)測(cè)驗(yàn)的影響可以表述為（）A 影響信度不影響效度B 影響效度，不影響信度C 既影響信度又影響效度 D 既不影響信度也不影響效度答案：B33 4. 由偶然因素引起的、不易控制的誤差叫作（）A 過(guò)失誤差B 恒定誤差C 隨

12、機(jī)誤差D 系統(tǒng)誤差答案：C34 第四章測(cè)驗(yàn)結(jié)果的解釋原始分?jǐn)?shù)：考試85分，跑步第3名導(dǎo)出分?jǐn)?shù) 原始分?jǐn)?shù)參照體系導(dǎo)出分?jǐn)?shù)參照標(biāo)準(zhǔn)不同：常模參照分?jǐn)?shù)導(dǎo)出分?jǐn)?shù) 內(nèi)容參照分?jǐn)?shù)結(jié)果參照分?jǐn)?shù)35 第一節(jié)參照常模的分?jǐn)?shù)解釋常模：常模團(tuán)體的分?jǐn)?shù)分布常模團(tuán)體的組成群體必須明確代表性樣本樣本大小要適當(dāng)時(shí)間性一般常模與特殊常模結(jié)合36 幾種主要的常模參照分?jǐn)?shù)發(fā)展量表智力年齡：比納西蒙量表年級(jí)當(dāng)量發(fā)展循序量表商數(shù) 比率智商教育商數(shù)百分位百分等級(jí)百分位數(shù)十分位標(biāo)準(zhǔn)分?jǐn)?shù)線性轉(zhuǎn)換的標(biāo)準(zhǔn)分?jǐn)?shù)常態(tài)化的標(biāo)準(zhǔn)分?jǐn)?shù) 其他類型：T分?jǐn)?shù)、標(biāo)準(zhǔn)九分、CEEB分?jǐn)?shù)、離差智商37 標(biāo)準(zhǔn)分?jǐn)?shù) 某次測(cè)驗(yàn)，全校學(xué)生數(shù)學(xué)的平均成

13、績(jī)?yōu)?0分，標(biāo)準(zhǔn)差為10分，語(yǔ)文平均分?jǐn)?shù)為80分，標(biāo)準(zhǔn)差為5。甲學(xué)生數(shù)學(xué)和語(yǔ)文分別為80和60分，乙學(xué)生數(shù)學(xué)和語(yǔ)文分別為50和80分。這兩個(gè)學(xué)生哪個(gè)學(xué)生成績(jī)更好些？ 38 呈現(xiàn)常模資料的方式1.轉(zhuǎn)化表 39 2. 剖析圖40 16PF41 第二節(jié) 參照標(biāo)準(zhǔn)的分?jǐn)?shù)解釋內(nèi)容參照分?jǐn)?shù) 掌握分?jǐn)?shù) 正確百分?jǐn)?shù) 等級(jí)評(píng)定量表結(jié)果參照測(cè)驗(yàn) 兩個(gè)先決條件呈現(xiàn)結(jié)果參照分?jǐn)?shù)的方法42 1. 期望結(jié)果的概率（1）表格法 43 下表是由若干個(gè)工作候選人在職業(yè)選擇測(cè)驗(yàn)中得分的聯(lián) 合頻數(shù)分布構(gòu)成，表中還呈現(xiàn)了其工作領(lǐng)導(dǎo)在雇傭他們6 個(gè)月之后，給這些候選人的等級(jí)評(píng)定。 44 （2）圖示法45 2. 預(yù)期的效標(biāo)分?jǐn)?shù)

14、46 1. 最早采用智力年齡概念的是（）A 比納量表 B 瑞文推理測(cè)驗(yàn) C 韋氏量表 D 斯坦福比納量表答案：A2. 提出“比率智商”概念的心理學(xué)家是（）A比納 B答案：C西蒙 C推孟 D 韋克斯勒47 3. 在斯坦福-比納測(cè)驗(yàn)中，測(cè)得某兒童的智力年齡為8，這個(gè)結(jié)果的含意是（） A 該兒童的智力低下 B 該兒童成績(jī)相當(dāng)于8歲兒童的平均分?jǐn)?shù) C 該兒童的智力超常 D 該兒童IQ是80 答案：B48 4. 以50為平均數(shù)，以10為標(biāo)準(zhǔn)差的常模參照分?jǐn)?shù)是（） A 標(biāo)準(zhǔn)九 B 標(biāo)準(zhǔn)十 C.答案：CT分?jǐn)?shù) D.C分?jǐn)?shù)5. 下列導(dǎo)出分?jǐn)?shù)中屬于內(nèi)容參照分?jǐn)?shù)的是（）A 掌握分?jǐn)?shù) B 比率智商 C 百分等級(jí) D

15、標(biāo)準(zhǔn)九答案：A49 6. 下列分?jǐn)?shù)中屬于常模參照分?jǐn)?shù)的是（）A 掌握分?jǐn)?shù) B 正確百分?jǐn)?shù)C 等級(jí)評(píng)定量表 D 標(biāo)準(zhǔn)九答案：D7. 智商是一種（） A 標(biāo)準(zhǔn)參照分?jǐn)?shù) B 內(nèi)容參照分?jǐn)?shù)C 結(jié)果參照分?jǐn)?shù) D 常模參照分?jǐn)?shù)答案：D50 8. 正確百分?jǐn)?shù)是一種 .A.內(nèi)容參照分?jǐn)?shù)B.常模參照分?jǐn)?shù)C.結(jié)果參照分?jǐn)?shù)D.預(yù)期效標(biāo)分?jǐn)?shù) 答案：A51 9. 如果某同學(xué)在標(biāo)準(zhǔn)化測(cè)驗(yàn)中的分?jǐn)?shù)位于75的百分等級(jí)，這意味著（） A 參加測(cè)驗(yàn)的人中，有75%人的分?jǐn)?shù)高于該同學(xué) B 參加測(cè)驗(yàn)的人中，有25%人的分?jǐn)?shù)低于該同學(xué) C 參加測(cè)驗(yàn)的人中，有75%人的分?jǐn)?shù)低于該同學(xué) D 該同學(xué)正確回答了75%的測(cè)驗(yàn)題答案：C52 第

16、五章測(cè)驗(yàn)信度第一節(jié) 信度的性質(zhì) 一、信度的定義測(cè)量的一致性或可靠性程度。由于接受測(cè)量時(shí)應(yīng)試者的行為可能會(huì)由于各種原因產(chǎn)生變動(dòng)，偏離了其真實(shí)行為，就會(huì)使測(cè)量結(jié)果產(chǎn)生誤差。測(cè)驗(yàn)結(jié)果的可靠性，與測(cè)驗(yàn)結(jié)果受誤差影響的程度密切相關(guān)。誤差大，分?jǐn)?shù)的可靠性就降低。 53 二、信度系數(shù)真正分?jǐn)?shù)與實(shí)得分?jǐn)?shù)之間的決定系數(shù) 即測(cè)量分?jǐn)?shù)的變化中有多少真正反映了被測(cè)者分?jǐn)?shù)的變化。信度系數(shù)的分布是從.00到1.00的正數(shù)范圍。可以接受的信度水準(zhǔn) 一般能力與成就測(cè)驗(yàn)信度系數(shù)在0.90以上；人格、興趣等測(cè)驗(yàn)信度系數(shù)通常在0.80到0.85之間。一般來(lái)說(shuō)，當(dāng)rxx0.70時(shí)，可用于團(tuán)體間比較；rxx0.85時(shí)，

17、可用于鑒別個(gè) 人。可以用已有的同類測(cè)驗(yàn)作為比較的標(biāo)準(zhǔn)。 54 三、信度與測(cè)驗(yàn)分?jǐn)?shù)的解釋解釋個(gè)人分?jǐn)?shù) 兩種測(cè)驗(yàn)分?jǐn)?shù)的比較 55 第二節(jié) 信度的類型及估計(jì)方法重測(cè)信度復(fù)本信度分半信度同質(zhì)性信度評(píng)分者信度56 重測(cè)信度(test-retest reliability)又稱穩(wěn)定性系數(shù)：用同一測(cè)驗(yàn)在不同時(shí)間對(duì)同一群體施測(cè)兩次，這兩次測(cè)驗(yàn)分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。重測(cè)信度所考察的誤差來(lái)源是時(shí)間的變化所帶來(lái)的隨機(jī)影響。例如由氣候、偶然的噪音或其它干擾，以及引起被試本身身心狀態(tài)變化的因素如疾病、疲勞、情緒波動(dòng)、焦慮等原因造成的對(duì)測(cè)驗(yàn)結(jié)果的影響。 57 前提：當(dāng)測(cè)量的行為或特質(zhì)較為穩(wěn)定時(shí)，重測(cè)信度的

18、解釋才有效。必須注意重測(cè)間隔時(shí)間：間隔太短，被試對(duì)測(cè)試題記憶猶新，造成假性高相關(guān)；間隔太長(zhǎng)，被試身心特質(zhì)可能改變，使相關(guān)系數(shù)降低。重測(cè)間隔多在2周到6個(gè)月之間 58 重測(cè)信度的前提假設(shè)是：每個(gè)應(yīng)試者對(duì)前一次測(cè)驗(yàn)的遺忘程度相同，而且在重測(cè)間隔期間沒(méi)有學(xué)過(guò)與該測(cè)驗(yàn)有關(guān)的其它材料，或者說(shuō)每人所學(xué)習(xí)的程度相同。有些解決問(wèn)題型測(cè)驗(yàn)不宜采用重測(cè)信度，因?yàn)閼?yīng)試者一旦知道答案就不容易忘記，從而造成假性高相關(guān)。苛勒的黑猩猩的頓悟?qū)W習(xí) 一些推理和創(chuàng)造力測(cè)驗(yàn)、認(rèn)知風(fēng)格測(cè)驗(yàn)，第一次測(cè)驗(yàn)被試就很容易掌握規(guī)則 59 復(fù)本信度(alternative-form reliability) 又稱等值性系數(shù)，它是以

19、兩個(gè)測(cè)驗(yàn)復(fù)本（功能等值但題目?jī)?nèi)容不同）同時(shí)測(cè)量同一群體，然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。還可在不同的時(shí)間施測(cè)兩個(gè)等值的測(cè)驗(yàn)，這時(shí)所求得的是重測(cè)復(fù)本信度，或稱穩(wěn)定和等值系數(shù)。 60 復(fù)本信度的主要優(yōu)點(diǎn)在于：能夠避免重測(cè)信度的一些問(wèn)題，如記憶效果、練習(xí)效應(yīng)等；適用于在進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響；減少了輔導(dǎo)或作弊的可能性。 61 復(fù)本信度的主要局限性在于：如果測(cè)量的行為易受練習(xí)的影響，則復(fù)本信度只能減少而不能消除這種影響；有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變，例如某些問(wèn)題解決型的測(cè)

20、驗(yàn)，如果掌握了解題原則，就有可能產(chǎn)生遷移，尤其當(dāng)復(fù)本只是在題目具體內(nèi)容上有改變時(shí)，這種正遷移的作用會(huì)很強(qiáng)；有些測(cè)驗(yàn)很難找到合適的復(fù)本。 62 分半信度分半信度(split-half reliability)系數(shù)是通過(guò)將測(cè)驗(yàn)分成兩半，計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)，代表了兩半測(cè)驗(yàn)內(nèi)容取樣的一致性程度，因而也稱為內(nèi)部一致性信度系數(shù)。在其它條件相等的情況下，測(cè)驗(yàn)越長(zhǎng)，信度系數(shù)越高。因此，分半須進(jìn)行修正。低估信度，必問(wèn)題是：如何將測(cè)驗(yàn)分成可比較的兩部分 63 大部分測(cè)驗(yàn)的前半部分和后半部分是不可比較的，因?yàn)椋?難度水平可能不同，準(zhǔn)備狀態(tài)、練習(xí)、疲勞、厭倦等有所不同。奇偶分半的

21、方法，即將測(cè)驗(yàn)按奇數(shù)題和偶數(shù)題分成兩半。前后有牽連的題目，如一組題目都與某段材料或某個(gè)圖畫有關(guān)，那么整個(gè)這組題目應(yīng)該分在同一半；否則有可能高估測(cè)驗(yàn)的信度。64 同質(zhì)性信度同質(zhì)性指所有測(cè)驗(yàn)題目測(cè)量的只是單一特質(zhì)或內(nèi)容，表現(xiàn)為所有測(cè)驗(yàn)題目得分的一致性。如果同質(zhì)性差，則測(cè)驗(yàn)可能混淆了不同的內(nèi)容，其結(jié)果就無(wú)從判斷究竟反映了被測(cè)者的哪些特征。所有測(cè)驗(yàn)項(xiàng)目都應(yīng)該保證只測(cè)量一種特質(zhì)或內(nèi)容如果需要在一個(gè)測(cè)驗(yàn)中測(cè)量不同的內(nèi)容，應(yīng)該將測(cè)驗(yàn)設(shè)計(jì)為幾個(gè)分測(cè)驗(yàn)，每個(gè)分測(cè)驗(yàn)測(cè)量一種內(nèi)容。例如：16PF的16個(gè)維度 65 同質(zhì)性的測(cè)量1. 庫(kù)德理查遜公式2. 克倫巴赫系數(shù) 3. 荷伊特信度 4. 因素分析 6

22、6 1. 下列各項(xiàng)方法中，不能用來(lái)計(jì)算項(xiàng)目間一致性的方法是（） A 因素分析B 復(fù)本信度C 克倫巴赫a系數(shù)答案：BD 荷依特信度2. 克倫巴赫a系數(shù)計(jì)算的信度屬于（）A 重測(cè)信度 B 分半信度 C 同質(zhì)性信度 D 評(píng)分者信度答案：C67 評(píng)分者信度在有些測(cè)量情形中，評(píng)分者的評(píng)判也是誤差的來(lái)源之一。例如投射測(cè)驗(yàn)、創(chuàng)造力測(cè)驗(yàn) 、無(wú)領(lǐng)導(dǎo)小組討論、管理者情景模擬測(cè)驗(yàn)等，都依賴于評(píng)分者的主觀性判斷。最簡(jiǎn)單的估計(jì)不同評(píng)分者間評(píng)分一致性的方法，是隨機(jī)抽取若干份答卷，由兩個(gè)甚至更多的獨(dú)立的評(píng)分者打分，再求這些答卷評(píng)判分?jǐn)?shù)間的相關(guān)系數(shù)。 68 一般情況下，間隔施測(cè)的復(fù)本信度（即重測(cè)復(fù)本信度）值最低；修正后的

23、分半信度值最高。 69信度系數(shù)的類型所需復(fù)本施測(cè)次數(shù) 誤差變異的來(lái)源重測(cè)信度 12時(shí)間取樣復(fù)本信度（連續(xù)施測(cè)） 21內(nèi)容取樣復(fù)本信度（間隔施測(cè)） 22時(shí)間與內(nèi)容取樣分半信度 11內(nèi)容取樣同質(zhì)性信度 11內(nèi)容的異質(zhì)性評(píng)分者信度 11評(píng)分者之間的差異 1. 計(jì)算分半信度需要的復(fù)本個(gè)數(shù)和施測(cè)次數(shù)為（） A 1,1答案：AB 2,1C 2,2D 1,22. 用同一個(gè)測(cè)驗(yàn)先后對(duì)受測(cè)者群體施測(cè)兩次，所求得的測(cè)驗(yàn)信度系數(shù)是（） A重測(cè)信度 B復(fù)本信度C分半信度 D 同質(zhì)性信度答案：A70 3. 以時(shí)間取樣為誤差變異來(lái)源的信度類型是（）A 分半信度 B 同質(zhì)性信度C 重測(cè)信度 D 評(píng)分者信度

24、答案：C71 第三節(jié)影響信度的因素一、被試樣本 1.團(tuán)體的異質(zhì)性取樣團(tuán)體的異質(zhì)性越大，信度系數(shù)就相對(duì)越高。如果取樣只是一些高度同質(zhì)性的人，一旦測(cè)驗(yàn)施用于另一些類型的群體對(duì)象，信度就會(huì)降低。 72 例如一項(xiàng)測(cè)驗(yàn)分別施測(cè)于A、B兩組被試。其中A組被試較質(zhì)（如各年級(jí)學(xué)生都有），其分?jǐn)?shù)分布為2090分，而B組被試同質(zhì)程度較高（都為二年級(jí)學(xué)生），其分?jǐn)?shù)分布為8090分。顯然，由于A組被試的分?jǐn)?shù)分布比B組要廣得多，按照上面所提到的分?jǐn)?shù)分布與信度的關(guān)系，可以推知，以A組被試為樣本團(tuán)體得到的信度，要比B組被試得到的信度高。因此，取樣范圍（異質(zhì)性）越大，樣本對(duì)總體的代表性越好，測(cè)量穩(wěn)定性越好。 73 2.

25、團(tuán)體的平均水平測(cè)驗(yàn)所施測(cè)的團(tuán)體的平均能力水平的不同，也會(huì)對(duì) 信度產(chǎn)生影響。例如，在斯坦福比奈量表中，不同年齡組的信度從.83到.98不等。因?yàn)閷?duì)于年幼的團(tuán)體，他們的平均能力水平低，他們的分?jǐn)?shù)更多是憑猜測(cè)獲得的，而靠猜測(cè)的測(cè)驗(yàn)結(jié)果總是不會(huì)很穩(wěn)定的，所以信度值較低。這種情況導(dǎo)致的信度偏差，很難用一般的統(tǒng)計(jì)公式來(lái)校正，只能通過(guò)對(duì)各種年齡及能力水平的檢驗(yàn)來(lái)確定。 74 二、題目的數(shù)量測(cè)驗(yàn)越長(zhǎng)，信度值越高。一方面，測(cè)驗(yàn)越長(zhǎng)，題目取樣或內(nèi)容取樣就越充分，結(jié)果就越容易穩(wěn)定可靠。舉一個(gè)的例子，如果詞匯量的測(cè)驗(yàn)中只包含一個(gè)試題，僅依據(jù)應(yīng)試者對(duì)一個(gè)單詞的記憶，來(lái)確定應(yīng)試者的詞匯量的大小，其結(jié)果必定是非常

26、不可靠的。另一方面，較長(zhǎng)的測(cè)驗(yàn)不容易受到猜測(cè)的影響。 75 三、測(cè)驗(yàn)的難度如果測(cè)驗(yàn)難度太低，測(cè)驗(yàn)分?jǐn)?shù)出現(xiàn)天花板效應(yīng)或地板效應(yīng)，都會(huì)使測(cè)量到的分?jǐn)?shù)分布太窄，導(dǎo)致信度降低。如果只增加測(cè)驗(yàn)長(zhǎng)度，沒(méi)有控制難度，測(cè)驗(yàn)分?jǐn)?shù)不能充分散開，并不能提高信度。只有當(dāng)測(cè)驗(yàn)的難度水平能夠使測(cè)驗(yàn)分?jǐn)?shù)分布范圍最大時(shí)，測(cè)驗(yàn)的信度才會(huì)比較理想。一般來(lái)說(shuō)，當(dāng)所有被試的平均分為測(cè)驗(yàn)總分的一半，并且分?jǐn)?shù)從分布時(shí)，測(cè)量的信度最高。到滿分76 四、間隔時(shí)間以再測(cè)法或復(fù)本法求信度，兩次測(cè)驗(yàn)相隔時(shí)間越短，其信度系數(shù)越大，間隔時(shí)間越久，信度系數(shù)越低 77 第四節(jié)信度的特殊問(wèn)題速度測(cè)驗(yàn)信度標(biāo)準(zhǔn)參考測(cè)驗(yàn)的信度分測(cè)驗(yàn)的信度差異的

27、信度變遷的測(cè)量 78 練習(xí)題1. 如果一個(gè)測(cè)驗(yàn)間隔兩個(gè)月后再施測(cè)于同一群體，兩次結(jié)果高度一致，可以肯定該測(cè)驗(yàn)是（） A 可信的 B 有效的 C 統(tǒng)計(jì)上顯著的 D 可推廣的答案：A79 2.對(duì)一個(gè)測(cè)驗(yàn)中題目一致性的估計(jì)屬于（）A 重測(cè)信度 B 分半信度 C 同質(zhì)性信度 D 評(píng)分者信度答案：C3. 由一個(gè)受測(cè)者樣本在一個(gè)測(cè)驗(yàn)上的得分計(jì) 算得到的奇偶相關(guān)系數(shù)為0.50，則經(jīng)過(guò)校正后得到的分半信度系數(shù)應(yīng)該為（） A 0.60答案：BB 0.67C 0.70D 0.7780 第六章測(cè)驗(yàn)效度第一節(jié) 效度的性質(zhì) 效度的定義測(cè)量的正確性，即用一個(gè)測(cè)驗(yàn)或量具能夠測(cè)量出其所要測(cè)量東西的程度 81 效度是評(píng)

28、價(jià)測(cè)驗(yàn)好壞、選擇測(cè)驗(yàn)的重要標(biāo)準(zhǔn)之一。效度的評(píng)估可以有多種方法，依賴于測(cè)驗(yàn)的具體目的。某種意義上說(shuō)，效度比信度的作用更為重要。如果一個(gè)測(cè)驗(yàn)效度很低，無(wú)論它的信度有多高，這項(xiàng)測(cè)驗(yàn)都沒(méi)有應(yīng)用價(jià)值。 82 效度的性質(zhì) 實(shí)際上效度指的是“測(cè)驗(yàn)結(jié)果的效度”，是測(cè)驗(yàn)結(jié)果的準(zhǔn)確性程度。效度是連續(xù)性的，效度高低只是程度上的差別，不是“全或無(wú)”的變量。因此應(yīng)避免簡(jiǎn)單評(píng)價(jià)某測(cè)驗(yàn)的結(jié)果為“有效”或“無(wú)效”。效度反映了測(cè)驗(yàn)結(jié)果對(duì)測(cè)量目標(biāo)的體現(xiàn)程度。效度不是直接測(cè)量得到的，而是從已有的證據(jù)推理而得到的。83 效度的理論定義從測(cè)量理論角度講，效度可以定義為：與測(cè)量目標(biāo)有關(guān)的真實(shí)分?jǐn)?shù)方差與總分方差的比率。“有

29、關(guān)的真實(shí)方差”是由測(cè)驗(yàn)所要測(cè)量的目標(biāo)變量所產(chǎn)生的方差。用公式可以表示為： 84 造成測(cè)驗(yàn)分?jǐn)?shù)的變化的原因出自三大來(lái)源：測(cè)量對(duì)象本身的變化，量具的精度造成的系統(tǒng)誤差，量具使用中造成的隨機(jī)誤差。信度和效度的差別在于所考慮的誤差不同。信度考慮的是隨機(jī)誤差的影響；效度的誤差則還包括對(duì)測(cè)驗(yàn)?zāi)康膩?lái)說(shuō)無(wú)關(guān)的變量所引起的系統(tǒng)誤差。誤差方差低（即信度高）并不保證效度就一定高；但效度高的話，信度必然會(huì)高。可以這樣說(shuō)，信度是效度的必要條件。 85 影響效度的誤差來(lái)源測(cè)驗(yàn)組成方面測(cè)驗(yàn)實(shí)施方面被試反應(yīng) 效度的類型內(nèi)容效度構(gòu)想效度校標(biāo)效度 86 第二節(jié) 內(nèi)容效度一、內(nèi)容效度的性質(zhì) 兩個(gè)條件：

30、定義完好的內(nèi)容范圍測(cè)驗(yàn)題目是所界定內(nèi)容范圍的代表性取樣87 二、確定內(nèi)容效度的方法 1.專家判斷由專家根據(jù)測(cè)驗(yàn)題目和假設(shè)的內(nèi)容范圍作系統(tǒng)的比較判斷。這種方法的主要問(wèn)題是：缺乏一種數(shù)量化指標(biāo)來(lái)描述內(nèi)容效度的高低；不同判斷者的判斷可能不一致；如果測(cè)驗(yàn)內(nèi)容范圍缺乏明確性，會(huì)使效度的判斷過(guò)程發(fā)生困難。 88 2. 統(tǒng)計(jì)分析克倫巴赫提出，內(nèi)容效度可以由兩個(gè)獨(dú)立的但取自同樣內(nèi)容范圍的測(cè)驗(yàn)得分的相關(guān)（即復(fù)本信度）來(lái)作數(shù)量上的估計(jì)。 3. 經(jīng)驗(yàn)法例如，對(duì)于管理能力測(cè)驗(yàn)，高層管理者的平均成績(jī)應(yīng)該高于普通員工和一般管理者（區(qū)分效度）。 89 三、內(nèi)容效度的特點(diǎn) 特定性與表面效度混淆 90 四、內(nèi)

31、容效度的應(yīng)用和評(píng)價(jià) 內(nèi)容效度的評(píng)估一般不適用于能力傾向測(cè)驗(yàn)和人格測(cè)驗(yàn)。能力傾向和人格測(cè)驗(yàn)不太要求與所取樣的行為領(lǐng)域的相似性，題目的選擇更多受某種假設(shè)的指導(dǎo)，而假設(shè)的正確與否則由其它效度形式來(lái)確定。能力傾向和人格測(cè)驗(yàn)與成就測(cè)驗(yàn)不同，不是建立在某種教學(xué)課程或工作知識(shí)與技能的基礎(chǔ)上。在對(duì)相同題目作反應(yīng)時(shí)，每個(gè)被試使用的方法和心理過(guò)程是很不相同的，同一測(cè)驗(yàn)對(duì)不同的被試來(lái)說(shuō)測(cè)量的是不同的心理過(guò)程。在這種情況下，不可能從檢查測(cè)量的內(nèi)容來(lái)確定測(cè)量的功能。 91 第三節(jié) 構(gòu)想效度一、構(gòu)想效度定義構(gòu)想效度(construct validity)是指測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度。構(gòu)想通常指一些抽

32、象的、假設(shè)性的概念或特質(zhì)，如智力、創(chuàng)造力、言語(yǔ)流暢性、焦慮等。這些構(gòu)想往往無(wú)法直接觀察，但都有其心理上的理論基礎(chǔ)和客觀現(xiàn)實(shí)性，都可通過(guò)各種可觀察的材料加以確定。例如，言語(yǔ)流暢性可以通過(guò)語(yǔ)速、語(yǔ)句間的邏輯性、口誤的數(shù)量等可觀察的指標(biāo)進(jìn)行確定。 92 構(gòu)想效度關(guān)注的問(wèn)題是：測(cè)驗(yàn)是否能正確反映理論構(gòu)想的特性。比如說(shuō)，一項(xiàng)言語(yǔ)流暢性測(cè)驗(yàn)所測(cè)量的是不是真正的言語(yǔ)流暢性，是否對(duì)言語(yǔ)流暢性的理論概念中所包含的所有特點(diǎn)（如語(yǔ)速、語(yǔ)句間的邏輯性、口誤的數(shù)量等 93 二、確定構(gòu)想效度的方法測(cè)驗(yàn)內(nèi)方法測(cè)驗(yàn)間方法：相容效度、區(qū)分效度、因素效度研究測(cè)驗(yàn)的效標(biāo)效度考察實(shí)驗(yàn)變量對(duì)測(cè)驗(yàn)分?jǐn)?shù)的影響搜集某些變異上

33、的證據(jù) 三、對(duì)構(gòu)想效度的評(píng)價(jià)94 第四節(jié) 效標(biāo)效度一、效標(biāo)效度的定義反映的是測(cè)驗(yàn)分?jǐn)?shù)與外在標(biāo)準(zhǔn)（效標(biāo)）的相關(guān)程度，即測(cè)驗(yàn)分?jǐn)?shù)對(duì)個(gè)體的效標(biāo)行為表現(xiàn)進(jìn)行預(yù)測(cè)的有效性程度。效標(biāo)是考察測(cè)量效用的外在參照標(biāo)準(zhǔn)。例如一個(gè)機(jī)械能力傾向測(cè)驗(yàn)，其效度的標(biāo)準(zhǔn)（效標(biāo)）可以是成為機(jī)械師后的工作表現(xiàn)；一個(gè)管理能力測(cè)驗(yàn)，其效標(biāo)可以是將來(lái)管理工作的績(jī)效。效標(biāo)效度往往用于預(yù)測(cè)性測(cè)量。即根據(jù)測(cè)量分?jǐn)?shù)作出的預(yù) 測(cè)，一般用于甄選決策。因此，只有當(dāng)證明測(cè)量分?jǐn)?shù)確實(shí)能夠預(yù)測(cè)所欲研究的行為時(shí)，這種決策才可能正確。 95 二、效標(biāo) （一）效標(biāo)與效標(biāo)測(cè)量效標(biāo)是衡量測(cè)量有效性的參照標(biāo)準(zhǔn)，是一種可以直接、獨(dú)立測(cè)量的行為。要測(cè)量效

34、標(biāo)，必須把效標(biāo)行為轉(zhuǎn)化為某種可以操作的測(cè)量指標(biāo)，以便進(jìn)行比較。效標(biāo)的概念涉及觀念效標(biāo)(conceptual criterion，即效標(biāo)的實(shí)質(zhì)概念內(nèi)容)和效標(biāo)測(cè)量(criterion measurement，即效標(biāo)的具體度量方法)。例如，對(duì)于篩選銷售人員的銷售技巧測(cè)驗(yàn)，其觀念效標(biāo)是“銷售工作的成功”，而效標(biāo)測(cè)量往往用“年銷售量”來(lái)表示。 96 （二）效標(biāo)測(cè)量的條件 1. 有效性效標(biāo)測(cè)量要求能真正反映效度 2. 可靠性具有較高的信度，相關(guān)要高 3. 客觀性要避免偏見的影響，防止效標(biāo)污染。效標(biāo)污染(criterion contamination)是指由于評(píng)定者知道測(cè)量分?jǐn)?shù)而影響個(gè)人的效標(biāo)成績(jī)的

35、情形。 4. 實(shí)用性97 （三）常用的效標(biāo) 1）學(xué)術(shù)成就 2）等級(jí)評(píng)定 3）臨床診斷 4）特殊訓(xùn)練成績(jī) 5）實(shí)際工作表現(xiàn) 6）對(duì)團(tuán)體的區(qū)分團(tuán)體對(duì)照: 用兩個(gè)在效標(biāo)表現(xiàn)上有差別的團(tuán)體，比較他們?cè)陬A(yù)測(cè)源分?jǐn)?shù)上的差別。 7）以前有效的測(cè)量分?jǐn)?shù) （四）效標(biāo)的特性：多樣性、復(fù)雜性、特殊性、時(shí)間性98 三、確定效標(biāo)效度的方法相關(guān)法區(qū)分法命中率功利率四、影響效標(biāo)效度的因素測(cè)驗(yàn)的長(zhǎng)度、取樣、所用的效標(biāo)和干涉變量99 練習(xí)題 1. 某教師的試卷經(jīng)常超出授課范圍，該試卷的（）一定低 A 信度 B 校標(biāo)效度 C 內(nèi)容效度 D 構(gòu)想效度答案：C2. 如果一個(gè)測(cè)驗(yàn)與將來(lái)的實(shí)際業(yè)績(jī)相關(guān)很高，

36、比如機(jī)械傾向測(cè)驗(yàn)與汽車訓(xùn)練課程成績(jī)相關(guān)很高，則這種測(cè)驗(yàn)的（）很高。 A 表面效度 B 校標(biāo)效度 C 構(gòu)想效度 D 績(jī)效效度答案：B100 3. 企業(yè)使用招工測(cè)驗(yàn)的主要目的是預(yù)測(cè)錄用人員未來(lái)工作的績(jī)效，這類測(cè)驗(yàn)非常重視（） A 內(nèi)容效度 B 校標(biāo)效度C 構(gòu)想效度 D 會(huì)聚效度答案：B4. 抑郁量表的有效性常用抑郁癥患者的測(cè)驗(yàn)結(jié)果與精神科醫(yī)生診斷的符合程度來(lái)說(shuō)明，這種方法是（） A內(nèi)容效度 B構(gòu)想效度C 效標(biāo)效度 D 評(píng)分者效度答案：C101 5. 命中率所反映的測(cè)驗(yàn)效度屬于（）A 內(nèi)容效度 B 校標(biāo)效度C 表面效度 D 結(jié)構(gòu)效度答案：B6. 運(yùn)用測(cè)驗(yàn)所錄取的合格人數(shù)與實(shí)際錄取的總?cè)藬?shù)之比稱作

37、（） A 總命中率 B 基礎(chǔ)率 C 正命中率 D 錄取率答案：C102 7 測(cè)驗(yàn)對(duì)某一理論概念或特質(zhì)測(cè)量的程度稱為（） A.內(nèi)容效度 B. 構(gòu)想效度 C. 校標(biāo)效度 D. 實(shí)證效度答案：B8 衡量測(cè)驗(yàn)有效性的參照標(biāo)準(zhǔn)稱為 .A.效度答案：DB.信度C.常模D.效標(biāo)103 第七章項(xiàng)目分析項(xiàng)目分析是指根據(jù)試測(cè)結(jié)果對(duì)組成測(cè)驗(yàn)的各個(gè)題目（項(xiàng)目）進(jìn)行分析，從而評(píng)價(jià)題目好壞，對(duì)題目進(jìn)行篩選的程序和方法。項(xiàng)目分析可以分為定性分析和定量分析定性分析主要考慮內(nèi)容效度，題目表達(dá)的恰當(dāng)性和有效性等方面；定量分析主要考察題目難度和鑒別度是否適當(dāng)。由于測(cè)驗(yàn)的信度、效度最終都依賴于題目的上述性質(zhì)，所以通過(guò)項(xiàng)目

38、分析對(duì)測(cè)驗(yàn)題目進(jìn)行選擇和修改，可以提高測(cè)驗(yàn)的信度和效度。 104 第一節(jié) 項(xiàng)目難度難度分析(difficulty analysis)，是對(duì)題目的難度進(jìn)行估計(jì)以確定適宜的難度。對(duì)于非能力測(cè)驗(yàn)（如人格測(cè)驗(yàn)），難度是指測(cè)驗(yàn)題目的“通俗性”，即測(cè)驗(yàn)題目是否容易被人看懂和回答，往往以取自相同總體的樣本中，能在答案范圍內(nèi)回答該題的人數(shù)指標(biāo)來(lái)表示。以下主要針對(duì)能力測(cè)驗(yàn)的難度分析.105 一、難度的定義難度(有人也將P值稱為易度)的指標(biāo)通常以通過(guò)率表示，即以答對(duì)或通過(guò)該題的人數(shù)百分比來(lái)表示： 106 二、難度的計(jì)算當(dāng)被試人數(shù)較多時(shí)，可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組：分?jǐn)?shù)最高的27%被試為高分組（N

39、H），分?jǐn)?shù)最低的27%為低分組（NL），中間46%為中間組。分別計(jì)算高分組和低分組的通過(guò)率，再求試題的難度。 107 三、難度水平的確定題目難度水平究竟多高合適，依賴于測(cè)驗(yàn)的目的、性質(zhì)和題目形式。許多測(cè)量都希望能準(zhǔn)確測(cè)量個(gè)體間的差異。如果在某題上，被試全答對(duì)或全答錯(cuò)，則該題無(wú)法提供個(gè)別差異的信息，即不能把不同人區(qū)別開來(lái)。 P值越接近于0或接近于1，越無(wú)法區(qū)分被試間能力的差異。相反，P值越接近于.50，區(qū)別力越高。為使測(cè)驗(yàn)具有更大的區(qū)別力，應(yīng)選擇難度在.50左右的試題比較合適。108 為了考查學(xué)生對(duì)某些方面的知識(shí)，技能是否掌握，可保留一些難度偏高的題目。用于選人時(shí)，應(yīng)盡量使難度值接近錄取

40、率。109 四、測(cè)驗(yàn)的難度整個(gè)測(cè)驗(yàn)的難度取決于組成測(cè)驗(yàn)的各個(gè)試題的難度。整個(gè)測(cè)驗(yàn)難度水平的確定，需要根據(jù)測(cè)驗(yàn)分?jǐn)?shù)的分布作出。由于眾人的心理特性多數(shù)基本上是呈正態(tài)分布的，因此如果被試樣本具有代表性，則測(cè)驗(yàn)結(jié)果也應(yīng)符合正態(tài)分布的模型。 110 偏態(tài)分布有“正偏態(tài)分布”和“負(fù)偏態(tài)分布”兩種。 A為正偏態(tài)分布，即大多數(shù)得分集中在低分端，說(shuō)明測(cè)驗(yàn)對(duì)于所研究的樣本團(tuán)體來(lái)說(shuō)偏難。 B為負(fù)偏態(tài)分布，即大多數(shù)得分集中在高分端，說(shuō)明測(cè)驗(yàn)過(guò)易。 111 五、常態(tài)化等級(jí)難度量表以通過(guò)率作為難度指標(biāo)，實(shí)際上是以順序量表來(lái)表示難度，即它僅僅能指出題目難度的順序或相對(duì)難度的高低。通常情況下，需要進(jìn)行等距轉(zhuǎn)換。如果

41、被試的得分呈正態(tài)分布，可根據(jù)正態(tài)曲線表，將試題難度轉(zhuǎn)換成具有相等單位的等距量表，即分?jǐn)?shù)。 112 試題難度的等距轉(zhuǎn)換例如有3個(gè)試題通過(guò)的人數(shù)分別為全體被試的60%、40%、20%，可以判定第1題最容易，第3題最難。但雖然它們的相差數(shù)值相同（20%），卻無(wú)法確定題目1與2之間的難度差別是否等于題目2和3之間的難度差別。這就需要計(jì)算等距量表的難度指標(biāo)。在正態(tài)分布情形下，平均數(shù)之上或之下一個(gè)標(biāo)準(zhǔn)差的距離約占全體人數(shù)的34%。因此，如果某題A通過(guò)率為84%（P=.84），可知該題的難度為-1；如果某題B的通過(guò)人數(shù)只有16%，則這個(gè)題目的難度為+1；如果某題C 剛好有50%的被試通過(guò)，那該題的難度為

42、0。根據(jù)正態(tài)曲線表，可以查出任何通過(guò)率值相對(duì)的值。 113 以分?jǐn)?shù)表示難度，也有不便之處，主要是有小數(shù)點(diǎn)和正負(fù)符號(hào)。因此通常需要轉(zhuǎn)換成另一種單位的等距量表，其中較為常用的是美國(guó)教育測(cè)驗(yàn)服務(wù)機(jī)構(gòu)采用的難度指標(biāo)： =13+4Z為正態(tài)化等距難度值；13為平均數(shù)，4為標(biāo)準(zhǔn)差的單位，Z為正態(tài)曲線下從右端計(jì)算的P值（通過(guò)率）所對(duì)應(yīng)的Z值。 114 第二節(jié) 區(qū)分度區(qū)分度是指測(cè)驗(yàn)項(xiàng)目所測(cè)量的心理特性的區(qū)分程度和鑒別能力，也稱項(xiàng)目的效度。確定區(qū)分度的方法（一）項(xiàng)目特征曲線115 （二）項(xiàng)目與效標(biāo)的相關(guān) 相關(guān)法：項(xiàng)目分?jǐn)?shù)與校標(biāo)分?jǐn)?shù)的相關(guān)。相關(guān)越高，表明項(xiàng)目越具有區(qū)分的功能。項(xiàng)目效度分析(item vali

43、dity analysis)主要以效標(biāo)為依據(jù)，考察被試在每個(gè)試題上的反應(yīng)與其在效標(biāo)上表現(xiàn)的相關(guān)程度，即每個(gè)試題所測(cè)查的行為是否反映了被試在效標(biāo)上的表現(xiàn)。例如，如果測(cè)驗(yàn)是預(yù)測(cè)被試在工作中的表現(xiàn)，則可以選擇工作表現(xiàn)指標(biāo)（例如上級(jí)和同事的評(píng)價(jià)等）作為效標(biāo)。題目效度系數(shù)越高，對(duì)預(yù)測(cè)效標(biāo)越有用。效度系數(shù)高于.20的題目一般可以保留；效度系數(shù)接近于零或負(fù)數(shù)，則應(yīng)該作重大修改或刪除。116 二列相關(guān) 點(diǎn)二列相關(guān) 四分相關(guān) 相關(guān) 項(xiàng)目與總分相關(guān)重疊的校正有時(shí)在進(jìn)行項(xiàng)目分析時(shí)，難以找到合適的效標(biāo)，這時(shí)可以采用測(cè)驗(yàn)的總分代替效標(biāo)，考察每個(gè)試題和總分的一致性，即做項(xiàng)目總分分析(item-total co

44、rrelation analysis)。 117 （三）鑒別指數(shù)(discrimination index) 效標(biāo)得分高、低兩組被試在項(xiàng)目通過(guò)率上的差值。當(dāng)效標(biāo)成績(jī)是連續(xù)變量時(shí)，可從分?jǐn)?shù)分布的兩端各選擇27%(33%)的被試組成高、低分組，再分別計(jì)算兩組每道題目上各自的通過(guò)率，二者之差就是各題目的鑒別指數(shù)D。 118 高低分組的劃分當(dāng)分?jǐn)?shù)分布較正態(tài)分布平坦時(shí)，高低分組各占比率應(yīng)該有所調(diào)整，應(yīng)該高于27%，大約33%較為合適。一般高低分組各占比率在25%33%之間都可以。如果比率太小，則所選出來(lái)的兩組過(guò)于，更容易有明顯區(qū)別，故可能是人為夸大了題目的區(qū)分力。當(dāng)樣本團(tuán)體過(guò)小時(shí)，劃分的比例可

45、以適當(dāng)提高，甚至用50%的標(biāo)準(zhǔn)，即把上下兩半被試作為高分組和低分組都是可以的。 119 一般情況下，D值很難等于1.00，而且也沒(méi) 有必要甚至不能追求等于1.00，因?yàn)檫@種情況往往只是題目分?jǐn)?shù)呈現(xiàn)絕對(duì)的雙峰分布時(shí)才會(huì)出現(xiàn)。這時(shí)，各題目的同質(zhì)性也會(huì)過(guò)高。一般情況下，只要所得D值大于.30時(shí)，題目就可以接受了。 120 試題鑒別度指數(shù)與質(zhì)量評(píng)價(jià)）在實(shí)際操作中，項(xiàng)目鑒別度在0.3-0.5之間比較理想。鑒別度指數(shù)過(guò)大，意味著高低兩組樣本的差異過(guò)大，分?jǐn)?shù)出現(xiàn)明顯雙峰分布，同樣不利于精細(xì)鑒別不同個(gè)體。 121 項(xiàng)目鑒別度的實(shí)際應(yīng)用第1題雖然鑒別度為35，但兩個(gè)組別的通過(guò)率都在50%以下，說(shuō)明題目偏難。第

46、2題雖然鑒別度在33，但兩個(gè)組別的通過(guò)率都在50%以上，說(shuō)明題目偏易。第3題的通過(guò)率和鑒別度比較理想。第4題兩組差距太大，出現(xiàn)明顯的雙峰分布，不利于精細(xì)辨別個(gè)體差異。項(xiàng)目鑒別度并非越大越好，要具體分析情況。122 區(qū)分度的相對(duì)性采用不同計(jì)算方法區(qū)分度的值不同用相關(guān)法計(jì)算的區(qū)分度值受樣本大小影響用兩個(gè)組通過(guò)率的差異，受分組標(biāo)準(zhǔn)影響與樣本同質(zhì)性有關(guān) 區(qū)分度與難度的關(guān)系123 第三節(jié) 項(xiàng)目分析的特殊問(wèn)題備選答案的反應(yīng)模式速度測(cè)驗(yàn)的項(xiàng)目分析標(biāo)準(zhǔn)參考測(cè)驗(yàn)的項(xiàng)目分析項(xiàng)目團(tuán)體的相互作用有效性與可靠性的矛盾 124 速度測(cè)驗(yàn)的項(xiàng)目分析有些測(cè)驗(yàn)考察的是被試解決問(wèn)題的速度。這樣的測(cè)驗(yàn)叫速度測(cè)

47、驗(yàn)(speed-based test)。速度測(cè)驗(yàn)往往有很多題目，一般很少有被試能夠在限定時(shí)間內(nèi)完成所有的題目。大多數(shù)能力測(cè)驗(yàn)都限定了完成時(shí)間，雖然這些測(cè)驗(yàn)不是速度測(cè)驗(yàn)，但速度也是影響成績(jī)的一個(gè)重要因素。 125 速度測(cè)驗(yàn)的項(xiàng)目分析不能用通過(guò)率作為項(xiàng)目分析的指標(biāo)。第一種方法是對(duì)于那些不能被所有被試完成的題目，只分析完成該題目的被試的成績(jī)。這容易低估難度，且不穩(wěn)定。第二種方法是延長(zhǎng)試測(cè)時(shí)間，使所有被試都能完成所有題目。這背離了速度概念 126 對(duì)于速度測(cè)驗(yàn)的項(xiàng)目分析尚沒(méi)有完善的解決辦法。從易到難排列的能力速度測(cè)試可以適當(dāng)延長(zhǎng)測(cè)試時(shí)間各題難度差不多的能力速度測(cè)試打亂題目的順序，每一份卷子的順序都是不一樣的，所以最后的結(jié)果是每一道題目都是有一定的缺失值，但是并不影響總體的難度、鑒別度的分析。使用拉丁方的方法 127 練習(xí)題 1. 已知某校男、女學(xué)生對(duì)某項(xiàng)教育措施各自持“同意”和“反對(duì)”態(tài)度的人數(shù)，若要了解性別與態(tài)度是否有關(guān)，則應(yīng)該計(jì)算（） A 積差相關(guān) B 等級(jí)相關(guān) C 相關(guān)答案：CD二列相關(guān)2.通過(guò)率衡量項(xiàng)目的（） A 難度 B 區(qū)分度 C信度 D 效度答案：A128 3. 能確切地反映預(yù)測(cè)性測(cè)驗(yàn)中個(gè)別項(xiàng)目質(zhì)量的是（） A 該項(xiàng)目間隔2個(gè)月后再測(cè)得分的一致性B 該項(xiàng)目與其它項(xiàng)目的相關(guān)系數(shù)的平均值C 項(xiàng)目分?jǐn)?shù)與總分的

人人文庫(kù)> 全部分類> 應(yīng)用文書

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

2018同等學(xué)力心理學(xué)綜合精講班--心理測(cè)量學(xué)講義_W

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔