項(xiàng)目分析第七章_第1頁(yè)
項(xiàng)目分析第七章_第2頁(yè)
項(xiàng)目分析第七章_第3頁(yè)
項(xiàng)目分析第七章_第4頁(yè)
項(xiàng)目分析第七章_第5頁(yè)
已閱讀5頁(yè),還剩32頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

項(xiàng)目分析第七章導(dǎo)學(xué)

項(xiàng)目分析是在組成測(cè)驗(yàn)之前,通過(guò)預(yù)測(cè)被試對(duì)組成測(cè)驗(yàn)的各個(gè)題目(項(xiàng)目)的反應(yīng)進(jìn)行的分析。它是編制和修訂測(cè)驗(yàn)的重要環(huán)節(jié)。通過(guò)本章的學(xué)習(xí)可解決三個(gè)問(wèn)題:一、掌握什么是測(cè)驗(yàn)的難度,如何計(jì)算測(cè)驗(yàn)的難度;(重點(diǎn))二、掌握什么是測(cè)驗(yàn)的區(qū)分度,如何計(jì)算測(cè)驗(yàn)的區(qū)分度,難度和區(qū)分度的關(guān)系怎樣;(重點(diǎn))三、掌握項(xiàng)目分析的其他特殊形式。項(xiàng)目分析概述項(xiàng)目分析就是對(duì)組成測(cè)驗(yàn)的每個(gè)測(cè)題進(jìn)行分析。質(zhì)的分析量的分析應(yīng)用:測(cè)題選擇和編制(經(jīng)典測(cè)量理論);測(cè)驗(yàn)等值、試題庫(kù)、計(jì)算機(jī)自適應(yīng)考試(現(xiàn)代測(cè)量理論)。第一節(jié)項(xiàng)目難度一、項(xiàng)目的難度1、定義難度,是指項(xiàng)目的難易程度。在能力測(cè)驗(yàn)中通常需要一個(gè)反映難度水平的指標(biāo),在非能力測(cè)驗(yàn)中,類(lèi)似的指標(biāo)是“通俗性”或者稱(chēng)為“流行性”,即取自相同總體的樣本中,能在答案上回答該題的人數(shù)。2、估計(jì)項(xiàng)目難度的方法(1)以答對(duì)的百分比(或比率)來(lái)估計(jì)難度①二值記分(即只有答對(duì)和答錯(cuò)兩種情況,記為1或0)的測(cè)題。

P:試題的難度;R:答對(duì)題的人數(shù);N:總?cè)藬?shù)。P值越大,則難度越小。估計(jì)難度的方法②當(dāng)測(cè)題不是二值記分時(shí),計(jì)算難度的公式:全體考生在該題上的平均分;:該題的滿分。③分組法重要前提:將被試按總分高低排列。一般標(biāo)準(zhǔn)為27%。計(jì)算公式:當(dāng)被試人數(shù)較多時(shí),則可根據(jù)測(cè)驗(yàn)總成績(jī)將被試分成三組:分?jǐn)?shù)最高的27%被試者為高分組(NH),分?jǐn)?shù)最低的27%被試者為低分組(NL),中間46%的被試者為中間組。分別計(jì)算高分組和低分組的通過(guò)率,以兩組通過(guò)率的平均值作為每一題的難度。其公式為:式中P代表難度,PH和PL分別代表高分組和低分組通過(guò)率。

估計(jì)難度的方法(2)項(xiàng)目難度受機(jī)遇影響的矯正由于選擇題允許猜測(cè),所以通過(guò)率可能因機(jī)遇作用而變大。備選答案的數(shù)目越少,機(jī)遇的作用越大,越不能反映測(cè)驗(yàn)的難度。為了平衡機(jī)遇對(duì)難度的影響,吉爾福特提出了一個(gè)難度的校正公式:

CP:矯正后的難度;P:未矯的難度;K:選項(xiàng)的數(shù)目(3)項(xiàng)目難度的等距量表以通過(guò)率作為難度指標(biāo),實(shí)際上是以順序量表來(lái)表示難度,它僅僅能指出題目難度的順序或相對(duì)難度高低。

因此美國(guó)教育測(cè)驗(yàn)服務(wù)社建議用轉(zhuǎn)換過(guò)的分?jǐn)?shù)來(lái)表示試題難度值。其轉(zhuǎn)換公式為Δ=13+4Z,(Δ為難度指標(biāo),Z為標(biāo)準(zhǔn)分?jǐn)?shù),13為轉(zhuǎn)換公式的平均值,4為轉(zhuǎn)換公式的標(biāo)準(zhǔn)差)由于Z分?jǐn)?shù)通常只取±3之間的數(shù)值,因此可知:

P=0.9987時(shí),Z=-3,故Δ=13+4(-3)=1P=0.9772時(shí),Z=-2,故Δ=13+4(-2)=5P=0.8413時(shí),Z=-1,故Δ=13+4(-1)=9P=0.5000時(shí),Z=0,故Δ=13+4(0)=13P=0.1587時(shí),Z=+1,故Δ=13+4(+1)=17P=0.0228時(shí),Z=+2,故Δ=13+4(+2)=21P=0.0013時(shí),Z=+3,故Δ=13+4(+3)=25由此可見(jiàn),常用的Δ值域介于1~25之間,Δ值越大,試題越難;Δ值越小,試題越容易。二.項(xiàng)目的平均數(shù)與方差(變差)項(xiàng)目的平均數(shù)項(xiàng)目的方差和標(biāo)準(zhǔn)差二值計(jì)分的非二值分級(jí)分的總分方差項(xiàng)目的方差與難度的關(guān)系P=0.5時(shí),S2有極大值。三.難度與測(cè)驗(yàn)分?jǐn)?shù)的分布測(cè)驗(yàn)的難度直接依賴(lài)于組成測(cè)驗(yàn)的項(xiàng)目的難度。通過(guò)考察測(cè)驗(yàn)分?jǐn)?shù)的分布,可以對(duì)測(cè)驗(yàn)的難度做出直觀檢驗(yàn)。由于人的心理基本上是呈常態(tài)分布的,而我們目前所采用的統(tǒng)計(jì)方法大都以正態(tài)分布為前提,因此大多數(shù)測(cè)驗(yàn)在設(shè)計(jì)時(shí)希望分?jǐn)?shù)呈現(xiàn)常態(tài)分布的模型。如果被試樣本具有代表性,對(duì)于中等難度的測(cè)驗(yàn),其測(cè)驗(yàn)總分應(yīng)接近常態(tài)分配。如果所獲得的分?jǐn)?shù)不是常態(tài)的,而是如圖所示的a或b的情形,得分偏高或偏低,則為偏態(tài)分布。

a為正偏態(tài)分布,即大多數(shù)得分集中在低端,說(shuō)明編制的測(cè)驗(yàn)對(duì)于所要研究的樣本團(tuán)體來(lái)說(shuō)偏難,因此必須增加足夠數(shù)量的較容易的項(xiàng)目。b為負(fù)偏態(tài)分布,即大多數(shù)得分集中在高分端,說(shuō)明測(cè)驗(yàn)過(guò)易,必須增加足夠數(shù)量的有較高難度的項(xiàng)目。四、項(xiàng)目難度范圍對(duì)信度系數(shù)的影響項(xiàng)目的組間相關(guān)大,則測(cè)驗(yàn)的信度高。而項(xiàng)目組間相關(guān)高,那么它們的難度也越接近。第二節(jié)項(xiàng)目的鑒別力一、定義項(xiàng)目的鑒別力又稱(chēng)區(qū)分度,是指測(cè)驗(yàn)項(xiàng)目對(duì)所測(cè)量的心理特性的區(qū)分程度或鑒別能力。若區(qū)分度高,則水平高者得分高,水平低者得分低。若區(qū)分度低,則無(wú)鑒別力。二、估計(jì)方法

1.項(xiàng)目鑒別指數(shù)區(qū)分度分析的一種簡(jiǎn)便方法是比較測(cè)驗(yàn)總分高和總分低的兩組被試在項(xiàng)目通過(guò)率上的差別:

D=PH-PL式中PH為高分組在某項(xiàng)目上的通過(guò)率,PL為低分組在某項(xiàng)目上的通過(guò)率。二者通過(guò)率之差為鑒別指數(shù)D。D值越大,項(xiàng)目的區(qū)分度越高,即項(xiàng)目越有效。1965年,美國(guó)測(cè)驗(yàn)專(zhuān)家伊貝爾根據(jù)長(zhǎng)期的經(jīng)驗(yàn)提出用鑒別指數(shù)評(píng)價(jià)項(xiàng)目性能的標(biāo)準(zhǔn),如下表所示:鑒別指數(shù)(D)項(xiàng)目評(píng)價(jià)0.40以上0.30-0.390.20-0.290.19及以下很好良好,修改后會(huì)更佳尚可,但需修改差,必須淘汰估計(jì)方法2.方差法(測(cè)題的方差)方差越大,試題的鑒別力越大3.項(xiàng)目與總分相關(guān)說(shuō)明項(xiàng)目與總分有一致性點(diǎn)二列相關(guān);二列相關(guān);皮爾遜積差相關(guān)。4.項(xiàng)目的組間相關(guān)四項(xiàng)(格)相關(guān);Φ相關(guān);皮爾遜積差相關(guān)。5.項(xiàng)目與外部準(zhǔn)則的相關(guān):項(xiàng)目效度分析6.區(qū)分度的相對(duì)性

區(qū)分度的值亦具有相對(duì)性,這表現(xiàn)在以下四個(gè)方面:(1)采用不同的計(jì)算方法區(qū)分度的值不同(2)用相關(guān)法計(jì)算的區(qū)分度值受樣本大小影響(3)用兩個(gè)極端組通過(guò)率的差異作為區(qū)分度的指標(biāo),其值受分組標(biāo)準(zhǔn)的影響。(4)區(qū)分度的大小與樣本的同質(zhì)性有關(guān)。三、區(qū)分度與難度的關(guān)系

區(qū)分度與難度有密切關(guān)系。例如,某項(xiàng)目的通過(guò)率為1.00或0,則說(shuō)明高分組與低分組在通過(guò)率上不存在差異,因此鑒別指數(shù)D為0。假如,項(xiàng)目的通過(guò)率為0.50,則可能是高分組的所有人都通過(guò)了,而低分組卻無(wú)人通過(guò),這樣D的最大值為1.00。從上面的分析中可以看出,難度越接近0.50,項(xiàng)目的潛在區(qū)分度越大,難度越接近1.00或0時(shí),項(xiàng)目的潛在區(qū)分度越小。如下圖與下表:00.20.40.60.81.0P1.00.60.40.20.8D項(xiàng)目通過(guò)率

D的最大值

1.000.900.800.700.600.500.400.300.200.10000.200.400.600.801.000.800.600.400.200D的最大值與項(xiàng)目難度的關(guān)系但是在實(shí)際編制測(cè)驗(yàn)中,不能要求所有項(xiàng)目的難度均為0.50。事實(shí)上,如果測(cè)驗(yàn)的所有項(xiàng)目都是中等難度,只有項(xiàng)目的內(nèi)在相關(guān)為零時(shí),整個(gè)測(cè)驗(yàn)才能產(chǎn)生正態(tài)分布??紤]到一般測(cè)驗(yàn)項(xiàng)目之間都有某種相關(guān),難度的分布廣一些,梯度多一些,是合乎需要的。難度與區(qū)分度都是相對(duì)的,是針對(duì)一定團(tuán)體而言的。一般來(lái)說(shuō),較難的項(xiàng)目對(duì)高水平被試區(qū)分度高,較易的項(xiàng)目對(duì)低水平被試區(qū)分度高,中等難度的項(xiàng)目對(duì)中等水平的被試區(qū)分度高。由于人的多數(shù)心理特征呈正態(tài)分布,所以當(dāng)需要人作最大程度的區(qū)分時(shí),項(xiàng)目難度的分布也以正態(tài)為好,即特別難與特別容易的項(xiàng)目較少,越接近中等難度的項(xiàng)目越多,而所有項(xiàng)目的平均難度為0.50。項(xiàng)目難度、鑒別力、組間相關(guān)與測(cè)驗(yàn)信度、預(yù)測(cè)效度的關(guān)系組間相關(guān)、信度和效度的矛盾項(xiàng)目難度、組間相關(guān)對(duì)測(cè)驗(yàn)總分分布的影響結(jié)論:這幾者之間的關(guān)系十分復(fù)雜,甚至相互矛盾妥協(xié)的方法:組間相關(guān)在0.10~0.60之間;項(xiàng)目與測(cè)驗(yàn)總分相關(guān)為0.3~0.8。第三節(jié)項(xiàng)目反應(yīng)的實(shí)例操作步驟分析步驟選擇樣本組進(jìn)行測(cè)量按測(cè)驗(yàn)總分排序,取高分組和低分組計(jì)算高分組和低分組的通過(guò)比率分別求出難度和鑒別力指數(shù)比較高分組和低分組在測(cè)題不同答案上的反應(yīng)根據(jù)測(cè)題統(tǒng)計(jì)分析的結(jié)果,修改或選擇合適的測(cè)題實(shí)例鑒別力:0.30以上的項(xiàng)目是比較好的。難度:一般在0.35--0.65之間,對(duì)整個(gè)測(cè)驗(yàn)來(lái)說(shuō),0.50的難度題應(yīng)該居多。選項(xiàng):選項(xiàng)分析的異常情況。正確答案無(wú)人選擇或少于其它選項(xiàng)的選擇;錯(cuò)誤選項(xiàng)上低分組的人數(shù)少于高分組;選項(xiàng)無(wú)人選擇;未答人數(shù)較多。找出原因,對(duì)各題進(jìn)行修改。題號(hào)滿分ABCDEFGHIJK1333033030033255055005550031088591037101057412101278559876752015101217151015171815106504530204235253838444023合計(jì)1008663498468437778846950第四節(jié)項(xiàng)目反應(yīng)理論理論及應(yīng)用經(jīng)典測(cè)量理論的局限性抽樣變動(dòng)大能力難比較復(fù)本難實(shí)施缺乏預(yù)測(cè)力等測(cè)量標(biāo)準(zhǔn)誤差I(lǐng)RT的特點(diǎn)基本思想:潛在特質(zhì)基本思路確定被試的心理特質(zhì)值和他們對(duì)于項(xiàng)目的反應(yīng)之間的關(guān)系,這種關(guān)系的數(shù)學(xué)形式就是“項(xiàng)目反應(yīng)模型”。IRT的核心就是數(shù)學(xué)模型的建立以及對(duì)模型中各個(gè)參數(shù)的估計(jì)。IRT的基本假設(shè)潛在特質(zhì)空間的單維性假設(shè)大多數(shù)項(xiàng)目反應(yīng)模型都假設(shè)完全潛在空間是單維的。局部獨(dú)立性假設(shè)被試對(duì)一個(gè)測(cè)驗(yàn)項(xiàng)目的反應(yīng)不受他們對(duì)其他

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論