人才測(cè)評(píng)的信度與效度

上傳人：春*** IP屬地：廣東上傳時(shí)間：2023-07-29 格式：PPT 頁(yè)數(shù)：28 大?。?.53MB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩23頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人才測(cè)評(píng)的信度與效度第1頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月人才測(cè)評(píng)的核心價(jià)值在于預(yù)測(cè)的有效性預(yù)測(cè)好預(yù)測(cè)不好實(shí)際好實(shí)際不好正確接受錯(cuò)誤接受正確拒絕錯(cuò)誤拒絕第2頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月在進(jìn)行測(cè)量時(shí)，誤差是難免的，這就使得真實(shí)值和測(cè)量值之間是不可能完全一致。我們可以這樣來(lái)表示真實(shí)值和測(cè)量值之間的關(guān)系。X=T+B+ET表示真實(shí)值，B表示偏差即系統(tǒng)誤差，E表示測(cè)量誤差即隨機(jī)誤差。第3頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月一、信度測(cè)試信度(testreliability)也叫測(cè)試的可靠性，指測(cè)驗(yàn)結(jié)果的一致性、穩(wěn)定性及可靠性，一般多以內(nèi)部一致性來(lái)加以表示該測(cè)驗(yàn)信度的高低。信度系數(shù)愈高即表示該測(cè)驗(yàn)的結(jié)果愈一致、穩(wěn)定與可靠。系統(tǒng)誤差對(duì)信度沒(méi)什么影響，因?yàn)橄到y(tǒng)誤差總是以相同的方式影響測(cè)量值的，因此不會(huì)造成不一致性。反之，隨機(jī)誤差可能導(dǎo)致不致性，從而降低信度。信度可以定義為隨機(jī)誤差R影響測(cè)量值的程度。如果R=0，就認(rèn)為測(cè)量是完全可信的，信度最高。第4頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月信度評(píng)估的方法（一）重測(cè)信度，又稱為穩(wěn)定性系數(shù)，它的計(jì)量方法是采用重測(cè)法：用同一測(cè)驗(yàn)，在不同時(shí)間對(duì)同一群體施測(cè)兩次，這兩次測(cè)量分?jǐn)?shù)的相關(guān)系數(shù)即為重測(cè)系數(shù)。重測(cè)信度所考察的誤差來(lái)源是時(shí)間的變化所帶來(lái)的隨機(jī)影響。在評(píng)估重測(cè)信度時(shí)，必須注意重測(cè)間隔的時(shí)間。對(duì)于人格測(cè)驗(yàn)，重測(cè)間隔在兩周到6個(gè)月之間比較合適。在進(jìn)行重測(cè)信度的評(píng)估時(shí)，還應(yīng)注意以下兩個(gè)重要問(wèn)題：⑴重測(cè)信度一般只反映由隨機(jī)因素導(dǎo)致的變化，而不反映被試行為的長(zhǎng)久變化。⑵不同的行為受隨機(jī)誤差影響不同。

第5頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（二）復(fù)本信度，是以兩個(gè)測(cè)驗(yàn)復(fù)本來(lái)測(cè)量同一群體，然后求得應(yīng)試者在這兩個(gè)測(cè)驗(yàn)上得分的相關(guān)系數(shù)。復(fù)本信度的高低反映了這兩個(gè)測(cè)驗(yàn)復(fù)本在內(nèi)容上的等值性程度。兩個(gè)等值的測(cè)驗(yàn)互為復(fù)本。計(jì)算復(fù)本信度的主要目的在于考察兩個(gè)測(cè)驗(yàn)復(fù)本的題目取樣或內(nèi)容取樣是否等值。復(fù)本信度也考慮兩個(gè)復(fù)本實(shí)施的時(shí)間間隔。復(fù)本信度的主要優(yōu)點(diǎn)在于：⑴能夠避免重測(cè)信度的一些問(wèn)題，如記憶效果、練習(xí)效應(yīng)等；⑵適用于進(jìn)行長(zhǎng)期追蹤研究或調(diào)查某些干涉變量對(duì)測(cè)驗(yàn)成績(jī)影響；⑶減少了輔導(dǎo)或作弊的可能性?！顝?fù)本信度的局限性在于：⑴如果測(cè)量的行為易受練習(xí)的影響，則復(fù)本信度只能減少而不能消除這種影響；⑵有些測(cè)驗(yàn)的性質(zhì)會(huì)由于重復(fù)而發(fā)生改變；⑶有些測(cè)驗(yàn)很難找到合適的復(fù)本。

第6頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（三）內(nèi)部一致性信度，主要反映的是測(cè)驗(yàn)內(nèi)部題目之間的關(guān)系，考察測(cè)驗(yàn)的各個(gè)題目是否測(cè)量了相同的內(nèi)容或特質(zhì)。內(nèi)部一致性信度又分為分半信度和同質(zhì)性信度。分半信度系數(shù)是通過(guò)將測(cè)驗(yàn)分成兩半，計(jì)算這兩半測(cè)驗(yàn)之間的相關(guān)性而獲得的信度系數(shù)。測(cè)驗(yàn)愈長(zhǎng)，信度系數(shù)愈高。同質(zhì)性信度是指測(cè)驗(yàn)內(nèi)部的各題目在多大程度上考察了同一內(nèi)容。同質(zhì)性信度低時(shí)，即使各個(gè)測(cè)試題看起來(lái)似乎是測(cè)量同一特質(zhì)，但測(cè)驗(yàn)實(shí)際上是異質(zhì)的，即測(cè)驗(yàn)測(cè)量了不止一種特質(zhì)。同質(zhì)性分析與項(xiàng)目分析中的內(nèi)部一致性分析相類似。

第7頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（四）評(píng)分者信度，是指不同評(píng)分者對(duì)同樣對(duì)象進(jìn)行評(píng)定時(shí)的一致性。最簡(jiǎn)單的估計(jì)方法就是隨機(jī)抽取若干份答卷，由兩個(gè)獨(dú)立的評(píng)分者打分，再求每份答卷兩個(gè)評(píng)判分?jǐn)?shù)的相關(guān)系數(shù)。這種相關(guān)系數(shù)的計(jì)算可以用積差相關(guān)方法，也可以采用斯皮爾曼等級(jí)相關(guān)方法。

第8頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月提高測(cè)驗(yàn)信度的方法影響測(cè)驗(yàn)信度的誤差歸納起來(lái)主要有:

(1)抽樣誤差:簡(jiǎn)單說(shuō),這是在抽樣過(guò)程中由于被試間的差異所造成的誤差。被試間的差異可以用全距和方差大小來(lái)表示。全距是指某一心理量最大值與最小值之差。全距大說(shuō)明被試間差異大,全距小說(shuō)明被試間差異小。被試間在某一心理量上參差不齊,差別懸殊,則該心理量的方差大;反之,方差小。對(duì)于方差小的樣本,被試間在某一心理特征上相差較小,則前后兩次測(cè)驗(yàn)結(jié)果的一致性較低,即降低了信度。因?yàn)楸辉囍g的差別越小其同質(zhì)性越高,被試的分?jǐn)?shù)只要發(fā)生小的變化,其名次就可能改變,從而降低信度。

(2)隨機(jī)誤差:由于各種偶然因素的影響而產(chǎn)生的誤差,表現(xiàn)為用同一方法多次測(cè)量同一對(duì)象時(shí)結(jié)果上不一致。隨機(jī)誤差是由許多因素造成的,如量標(biāo)的質(zhì)量,測(cè)量的程序,被試的身心狀態(tài),測(cè)量的環(huán)境等。

第9頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月根據(jù)影響測(cè)驗(yàn)信度的因素,可從以下幾方面來(lái)提高測(cè)驗(yàn)的信度:一是從測(cè)驗(yàn)本身考慮,如測(cè)驗(yàn)的長(zhǎng)度、難度、區(qū)分度、速度、程序、環(huán)境條件與計(jì)分方法等;一是從被試自身考慮,如被試在被測(cè)心理特征上的差異大小,參加測(cè)驗(yàn)的動(dòng)機(jī)水平,對(duì)測(cè)驗(yàn)的態(tài)度和積極性等。在此主要介紹如下幾種提高測(cè)驗(yàn)信度的方法:

（1）適當(dāng)延長(zhǎng)測(cè)驗(yàn)的長(zhǎng)度:

測(cè)驗(yàn)的長(zhǎng)度主要指量表所包含的題目多少。對(duì)一個(gè)測(cè)驗(yàn)來(lái)說(shuō),測(cè)驗(yàn)的題目越少,得分越容易受偶然因素的影響,故測(cè)驗(yàn)的信度越低。反之如果測(cè)驗(yàn)題目較多,即測(cè)驗(yàn)長(zhǎng)度延長(zhǎng),擴(kuò)大了被試得分范圍,可在一定程度上排除偶然因素的影響,從而提高測(cè)驗(yàn)信度。但是測(cè)驗(yàn)信度的增加并不是等比例提高信度系數(shù)。當(dāng)信度系數(shù)較小時(shí),延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度信度系數(shù)增加較大;當(dāng)信度系數(shù)已經(jīng)較大時(shí),延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度對(duì)信度系數(shù)的影響就較小了。而且,在延長(zhǎng)測(cè)驗(yàn)長(zhǎng)度時(shí),還需考慮其他因素的影響,如被試在回答問(wèn)題時(shí)是否疲倦或產(chǎn)生厭煩情緒,是否節(jié)省時(shí)間、物力和財(cái)力,測(cè)題是否附合測(cè)驗(yàn)?zāi)康牡取?/p>

第10頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（2）測(cè)驗(yàn)的難度要適中:難度即測(cè)驗(yàn)的難易程度,當(dāng)測(cè)驗(yàn)難度太大時(shí),被試得分普遍太低,呈負(fù)偏態(tài)分布;當(dāng)測(cè)驗(yàn)難度太小時(shí),被試得分普遍較高,呈正偏態(tài)分布。太難太易的測(cè)驗(yàn)都使被試得分差異減小,使實(shí)得分?jǐn)?shù)方差減小,從而降低測(cè)驗(yàn)信度。第11頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（3）測(cè)驗(yàn)的內(nèi)容盡量同質(zhì):性質(zhì)相同的測(cè)驗(yàn)內(nèi)容,對(duì)被試也要求相同的能力、知識(shí)和技能;而內(nèi)容不同質(zhì)的測(cè)驗(yàn),則要求被試不同的能力、知識(shí)和技能。因而為了提高測(cè)驗(yàn)信度,測(cè)驗(yàn)內(nèi)容應(yīng)盡量同質(zhì)。

（4）測(cè)驗(yàn)的時(shí)間要充分:對(duì)某一測(cè)驗(yàn)而言,應(yīng)保證絕大多數(shù)被試在規(guī)定時(shí)間內(nèi)完成測(cè)驗(yàn);否則,如果被試不能從容回答所有問(wèn)題,就不能反映被試的真實(shí)水平。

第12頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月（5）測(cè)驗(yàn)的程序要統(tǒng)一:包括測(cè)驗(yàn)的題目統(tǒng)一,指導(dǎo)語(yǔ)、回答問(wèn)題的方式、分收試卷的方法、測(cè)驗(yàn)時(shí)間等都要統(tǒng)一。

（6）評(píng)分要客觀:評(píng)分是否客觀對(duì)測(cè)驗(yàn)信度有直接的影響。對(duì)于客觀性題目,評(píng)分標(biāo)準(zhǔn)明確,評(píng)分容易做到客觀;但對(duì)于主觀性題目,受評(píng)分者影響較大,不易做到客觀。為了盡可能客觀評(píng)分,應(yīng)制定明確而易掌握的評(píng)分標(biāo)準(zhǔn),盡量做到一卷多評(píng),或一人只評(píng)一題等。

第13頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月二、效度效度（Validity）即有效性，它是指測(cè)量工具或手段能夠準(zhǔn)確測(cè)出所需測(cè)量的事物的程度。效度是指所測(cè)量到的結(jié)果反映所想要考察內(nèi)容的程度，測(cè)量結(jié)果與要考察的內(nèi)容越吻合，則效度越高；反之，則效度越低。效度分為三種類型：內(nèi)容效度、準(zhǔn)則效度和結(jié)構(gòu)效度。第14頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月從內(nèi)容效度﹐到準(zhǔn)則效度﹐再到構(gòu)念效度﹐可視為一種累進(jìn)﹐即構(gòu)念效度需要比準(zhǔn)則效度更多的信息﹐準(zhǔn)則效度需要比內(nèi)容效度更多的信息。效度比信度有更高的要求﹐信度是效度的必要條件﹐沒(méi)有信度的測(cè)量工具就談不上具有效度﹐但信度高的測(cè)量工具未必具有高的效度。第15頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月測(cè)試維度

1）表面效度（facevalidity）。指測(cè)試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn)，即一套測(cè)試題從表面看來(lái)是否是合適的。例如，若一次閱讀理解力的測(cè)試包括許多受試者沒(méi)有學(xué)過(guò)的方言詞匯，則可認(rèn)為這次測(cè)試缺乏表面效度。表面效度是測(cè)試出受試者正常水平的一種保證因素。

第16頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月

2）內(nèi)容效度（contentvalidity）。指一套測(cè)試題是否測(cè)試了應(yīng)該測(cè)試的內(nèi)容或者說(shuō)所測(cè)試的內(nèi)容是否反映了測(cè)試的要求，即測(cè)試的代表性和覆蓋面的程度。例如，如果某一套發(fā)音技能測(cè)試題僅僅考查發(fā)音所必須具備的某些技能，如只考單一音素的發(fā)音，而不考查重讀、語(yǔ)調(diào)或音素在詞語(yǔ)中的發(fā)音，那么，該測(cè)試的內(nèi)容效度就很低。

第17頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月

3）編制效度（constructvalidity）。指一套測(cè)試題的諸項(xiàng)目對(duì)編制該測(cè)試所依據(jù)的理論的各個(gè)基本方面的反映程度。例如，以結(jié)構(gòu)主義語(yǔ)言理論為基礎(chǔ)，認(rèn)為系統(tǒng)的語(yǔ)言習(xí)慣是通過(guò)句型而獲得的，那么，強(qiáng)調(diào)詞匯和語(yǔ)法環(huán)境的測(cè)試題目就失去了編制效度。

第18頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月

4）經(jīng)驗(yàn)效度（empiricalvalidity）。經(jīng)驗(yàn)效度是一種衡量測(cè)試有效性的量度，通過(guò)把一次測(cè)試與一個(gè)或多個(gè)標(biāo)準(zhǔn)尺度相對(duì)照而得出。經(jīng)驗(yàn)效度可分為兩種：一是共時(shí)效度（concurrentvalidity），即將一次測(cè)試的結(jié)果同另一次時(shí)間相近的有效測(cè)試的結(jié)果相比較，或同教師的鑒定相比較而得出的系數(shù)；二是預(yù)測(cè)效度（predictivevalidity），即將一次測(cè)試的結(jié)果同后來(lái)的語(yǔ)言能力相比較，或是同教師后來(lái)對(duì)學(xué)生的鑒定相比較而得出的系數(shù)。

第19頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月提高測(cè)驗(yàn)效度的方法（1）控制系統(tǒng)誤差:系統(tǒng)誤差是影響測(cè)驗(yàn)效度的主要因素。它主要包括儀器不準(zhǔn),題目和指導(dǎo)語(yǔ)有暗示性,答案按排不當(dāng)(被試可以猜測(cè))等,控制這些因素可以降低系統(tǒng)誤差,提高效度。

第20頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月(2)精心編制測(cè)題和測(cè)驗(yàn)量表:首先測(cè)題內(nèi)容要適合測(cè)驗(yàn)?zāi)康?如知識(shí)性測(cè)題就不能全面反映被試的智力水平,它主要測(cè)量其知識(shí)水平。其次,測(cè)題要清楚明了,用語(yǔ)要讓被試?yán)斫?排列由易到難。第三,測(cè)題的難度和區(qū)分度要合適。

第21頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月(3)嚴(yán)格按照測(cè)驗(yàn)程序進(jìn)行測(cè)量,防止測(cè)量誤差:要嚴(yán)格按照測(cè)驗(yàn)手冊(cè)進(jìn)行測(cè)量,不能作過(guò)多的解釋,按標(biāo)準(zhǔn)評(píng)分,兩次測(cè)驗(yàn)間隔要適當(dāng)。

第22頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月(4)樣本容量要適當(dāng):當(dāng)樣本容量增大時(shí),樣本對(duì)總體的代表性提高,樣本大,被試的內(nèi)部差異增大,擴(kuò)大了真分?jǐn)?shù)的方差,使效度提高。樣本容量一般不應(yīng)低于30。另外,抽樣方法也很重要,一般用隨機(jī)抽樣,當(dāng)群體很大時(shí),可分層抽樣,樣本容量擴(kuò)大時(shí),其代表性才隨之增大。

第23頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月(5)正確處理好信度與效度的關(guān)系:信度是效度的必要條件,但信度高的測(cè)驗(yàn),效度不一定高;而效度高的測(cè)驗(yàn),信度卻比較高。但是,既要有高效度,又要有高信度是不容易做到的?！白畲罂煽慷龋ㄐ哦龋┮鬁y(cè)驗(yàn)項(xiàng)目之間有高度的組間相關(guān)；最大預(yù)測(cè)有效度卻要求低度的組間相關(guān)。最大可靠度（信度）要求項(xiàng)目等同的難度；最大預(yù)測(cè)有效度卻要求項(xiàng)目的難度有所區(qū)別。中等程度的組間相關(guān)（0.10─0.60),通?？僧a(chǎn)生良好的效度(0.30─0.80),并且產(chǎn)生滿意的信度(0.90)。”第24頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月(6)適當(dāng)增加測(cè)驗(yàn)的長(zhǎng)度:增加測(cè)驗(yàn)的長(zhǎng)度可提高測(cè)驗(yàn)的信度,也可以提高效度,但增加測(cè)驗(yàn)的長(zhǎng)度對(duì)信度的影響大于對(duì)效度的影響。第25頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月三、測(cè)評(píng)手段有效度切忌以點(diǎn)代面，比如：韓復(fù)榘的選任方法過(guò)分依賴一個(gè)情景也會(huì)降低面試效度比如：某商場(chǎng)老總招聘員工的方法第26頁(yè)，課件共28頁(yè)，創(chuàng)作于2023年2月第27頁(yè)

人人文庫(kù)> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

人才測(cè)評(píng)的信度與效度

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

人才測(cè)評(píng)的信度與效度

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔