版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、心理測量學(xué),心理學(xué)的重要研究方法之一,第一節(jié)概述,一、測量的基本概念 (一)測量的定義 測量:依據(jù)一定的法則,使用量具對事物的特征進(jìn)行定量描述的過程。,一定的法則 事物的特征 量具 定量描述,(二)測量的基本要素,1、 參照點(diǎn) 絕對參照點(diǎn)(絕對零點(diǎn)) 相對參照點(diǎn) 2 、單位 好的單位須符合兩個條件: 意義明確:同一單位對所有人來說意義相同。 等價:第一單位與第二單位之間的距離第二單位與第三單位之間的距離。,(三)測量的量表,量表(scale):使事物的特征數(shù)量化的數(shù)字的連續(xù)體。 Stevens:將量表從低到高分為4個等級。 1 、命名量表(Nominal Scale) 2 、 順序量表(Ord
2、er Scale) 3 、等距量表(Interval Scale) 4 、比率量表(Ratio Scale),1 、命名量表(Nominal Scale) 用數(shù)字來代表事物或?qū)κ挛镞M(jìn)行分類。 代號類別 數(shù)字只是一種名稱的替代物。不同的個體用不同的數(shù)字標(biāo)志。如球員的號碼,各種分類標(biāo)志(男或女;正?;虍惓?,等),2 、 順序量表(Order Scale) 給個體賦值,使數(shù)值的大小次序與個體在所測量的心理特性上的多少、大小、高低等的次序相符合。 順序量表在心理和教育中十分常見(如競賽成績排名等)。,3 、等距量表(Interval Scale) 給個體賦值,使數(shù)值間的差不僅能夠反映出對應(yīng)個體在所測量
3、心理特性上的排序,而且能夠反映出對應(yīng)個體在該特性上的差異程度。(如溫度計(jì),偏愛程度等) 但建構(gòu)間距量表不是容易的事,常常只能做到順序量表。,4 、比率量表(Ratio Scale) 給個體賦值,使數(shù)值間的比率能夠反映對應(yīng)個體在測量心理特性上比率。(如身高、體重、速度等)。 但在心理學(xué)中是極少見的。 心理測量通常都是順序量表,為方便比較,通常把順序量表轉(zhuǎn)換為等距量表。,二、 心理測驗(yàn)的基本概念,(一)定義 心理測驗(yàn):依據(jù)心理學(xué)理論,使用一定的操作程序,通過觀察人的少數(shù)有代表性的行為,對于貫穿在人的全部行為活動中的心理特點(diǎn)作出推論和數(shù)量化分析的一種科學(xué)手段。,1、心理心理測驗(yàn)測量的是人的行為 2、
4、行為樣本:從總體行為中抽取出來的、能夠反映個人特定心理特質(zhì)的一組行為,作為直接的測量對象。 3、測驗(yàn)條件對所有被試必須是相同的。 4、原始分?jǐn)?shù)的解釋只有與其他人的分?jǐn)?shù)或常模比較才有意義。,(二)心理測量的性質(zhì),1 心理測驗(yàn)的間接性 通過測量外顯行為來推斷內(nèi)隱的心理特質(zhì) 2 心理測驗(yàn)的相對性 沒有絕對的標(biāo)準(zhǔn) 3 心理測驗(yàn)的客觀性 測驗(yàn)的客觀性實(shí)際上就是測驗(yàn)的標(biāo)準(zhǔn)化問題,三 心理測驗(yàn)的種類,一、心理測驗(yàn)的種類 (一)按測驗(yàn)的功能分類 1能力測驗(yàn) 智力測驗(yàn)、特殊能力測驗(yàn)、能力傾向測驗(yàn) 2學(xué)績測驗(yàn) 已獲得的學(xué)業(yè)成就 3人格測驗(yàn) 興趣、態(tài)度、動機(jī)、氣質(zhì)、性格,(二)按測驗(yàn)的方式分類 1個別測驗(yàn) 優(yōu)點(diǎn):獲
5、得的信息多;容易建立融洽的合作關(guān)系;特殊被試(幼兒、盲人) 缺點(diǎn):費(fèi)時、復(fù)雜、對主試要求高。 2團(tuán)體測驗(yàn) 優(yōu)點(diǎn): 缺點(diǎn):,(三)按測驗(yàn)材料性質(zhì)分類 1文字(紙筆)測驗(yàn) 2非文字(操作)測驗(yàn) 文化公平測驗(yàn) (四)按測驗(yàn)材料的嚴(yán)謹(jǐn)程度分類 1構(gòu)造性測驗(yàn) 2投射性測驗(yàn),(五)按測驗(yàn)的要求分類 1最高行為測驗(yàn) 2典型行為測驗(yàn),四、對心理測驗(yàn)的科學(xué)態(tài)度,(一)錯誤觀念 1、萬能論 2、無用論 3、心理測驗(yàn)就是智力測驗(yàn)(心理測驗(yàn) = 智力測驗(yàn) = 智商 = 遺傳決定論),(二)對待測驗(yàn)的正確態(tài)度 1、 心理測驗(yàn)是研究心理學(xué)的重要方法之一,是決策的輔助工具; 2、心理測驗(yàn)作為研究方法和測量工具尚不完善; 3
6、、防止亂編和濫用心理測驗(yàn)。,第二節(jié)測驗(yàn)的常模,一、常模團(tuán)體 (一)常模團(tuán)體的性質(zhì) 由具有共同特征的人所組成的一組群體,或是該群體的一個樣本。 任何一個測驗(yàn),都有許多可能的常模團(tuán)體。 在制定常模時,首先要確定常模團(tuán)體。 在對常模參照分?jǐn)?shù)做解釋時,也必須首先考慮常模團(tuán)體的組成。,二、確定常模團(tuán)體的注意事項(xiàng),常模團(tuán)體的四個條件: 1、 群體構(gòu)成的界限必須明確 對每個常模團(tuán)體的性質(zhì)和特征的簡短且明確的描述。 2、 常模團(tuán)體必須是所測群體的代表性樣本 克服取樣偏差,采用正確的取樣方法:隨機(jī)取樣,系統(tǒng)抽樣,分層取樣。,3、樣本大小要適當(dāng) 從統(tǒng)計(jì)學(xué)原理上說,樣本是越大越好,但考慮到經(jīng)濟(jì)、實(shí)用,樣本數(shù)量也不能
7、無限擴(kuò)大。 樣本大小可以根據(jù)以下幾方面來確定: 常??傮w的數(shù)目??傮w數(shù)目小,則樣本數(shù)目也??;總體數(shù)目大,樣本數(shù)目也應(yīng)大。一般來說,樣本最好應(yīng)有30100人;如果是全國性常模,一般應(yīng)有20003000人為宜。 總體性質(zhì)??傮w性質(zhì)越復(fù)雜,樣本容量就越大。 測驗(yàn)結(jié)果的精確度。精確度要求越高,樣本量就越大。,4 、常模團(tuán)體必須是近時的。,三、取樣的方法,取樣:從目標(biāo)人群中選擇有代表性的樣本上。 統(tǒng)計(jì)學(xué)分類:隨機(jī)抽樣、非隨機(jī)抽樣 隨機(jī)原則:從總體中取樣時,每個個案被抽取的機(jī)會是均等的。,1、簡單隨機(jī)抽樣 按隨機(jī)表順序抽樣。 每個人或抽樣單位有相同的機(jī)會成為常模中的一部分。,2、系統(tǒng)抽樣 是介于隨機(jī)抽樣和
8、和非隨機(jī)抽樣之間的一種抽樣方法。其第一種樣本可以依立意抽樣法抽?。灰嗫捎秒S機(jī)方式抽取。 具體抽樣流程為: 抽樣前,須將母體的每一個單位編號,先計(jì)算樣本區(qū)間(即N/n,N表示母體的數(shù)目,n表示樣本的大小),如果樣本區(qū)間為分?jǐn)?shù),可四舍五入化為整數(shù)。然后從1到N/n號中隨機(jī)抽出一個號碼作為第一個樣本單位,將第一個樣本單位的號碼加下樣本區(qū)間即得第二個樣本單位,依此類推,直到樣本數(shù)抽夠?yàn)橹埂?3、分組抽樣 先將總體依照一種或幾種特征分為幾個子總體(類群),每一個子總體稱為一層,然后從每一層中隨機(jī)抽取一個子樣本,將它們合在一起,即為總體的樣本,稱為分層樣本 比如某中學(xué)有1000名學(xué)生裝,其中男600人,女
9、有400人,欲采用分層抽樣從中抽取100人的一個樣本,則其中男應(yīng)有60人,女應(yīng)有40人 樣本的精確度還與分層數(shù)目及樣本大小密切相關(guān),分層越細(xì),樣本越大,則樣本的代表性越好。,4、分層抽樣 是將總體按照某種標(biāo)準(zhǔn)(年齡、文化程度)劃分為一些子群體。每一個子群為一個抽樣單位,用隨機(jī)的方法從中抽若干子群,將抽出的子群中所有個體合起來作為總體的樣本。,四、常模分?jǐn)?shù)與常模,1、常模分?jǐn)?shù):對常模樣本施測后,將被試的原始分?jǐn)?shù)按一定規(guī)則轉(zhuǎn)換出來的導(dǎo)出分?jǐn)?shù)。 2、常模 常模分?jǐn)?shù)構(gòu)成的分布是。它是解釋心理測驗(yàn)分?jǐn)?shù)的基礎(chǔ)。 種類:一般常模、特殊常模 常模分?jǐn)?shù)和常模均會隨時間的變化而改變,因此常模必須經(jīng)常修訂。,五、常
10、模的類型,類型: 1、發(fā)展量表 2、商數(shù) 3、百分位 4、標(biāo)準(zhǔn)分?jǐn)?shù),(一)發(fā)展量表,1心理年齡(mental age)(智力年齡) 指被試智力發(fā)展水平的年齡。單位是年(或歲)和12個等距的月。 年齡量表最基本的假設(shè)是,隨年齡的增長,所測量的特質(zhì)有系統(tǒng)的改變。因此,不適用于成人。,年齡量表的基本要素: (1)題目:可區(qū)分不同年齡組; (2)常模團(tuán)體:由各個年齡被試組成的有代表性樣本; (3)常模表,2年級當(dāng)量(grade equivalents),即年級常模,用年級代替年齡,指把學(xué)生的測驗(yàn)成績與各年級學(xué)生的平均成績比較,看他相當(dāng)于幾年級的水平。 年級常模的單位通常為10個月間隔。如5年級的分布為
11、5-0到5-9。 年級當(dāng)量只適用于一般課程,不適合只學(xué)12年的課程。 年級當(dāng)量只適用于解釋本學(xué)年的水平,不適用于跨學(xué)年的。如一個五年級學(xué)生的年級當(dāng)量為8,并不能說他已經(jīng)掌握了8年級的課程。,3. 發(fā)展順序量表(ordinal scales),格塞爾發(fā)展順序量表 格塞爾認(rèn)為,嬰幼兒的行為系統(tǒng)的建立是一個有次序的過程,反映了神經(jīng)系統(tǒng)的不斷成長和功能的分化,因而可以把每個成熟階段的行為模式作為智能診斷的依據(jù)。,皮亞杰量表 用特定的任務(wù)來揭示兒童發(fā)展處于哪個階段。 5歲:質(zhì)量守恒 6歲:重量守恒 7歲:容量守恒,(二)商數(shù)(quotient),1比率智商 IQ=100(MA/CA) 缺點(diǎn): 實(shí)齡是等距
12、的,而智齡不等距(智力發(fā)展不是直線的) 計(jì)算成人智商時,以多大實(shí)齡作為除數(shù)?智力生長何時達(dá)到頂點(diǎn)? 不同年齡組,比率智商分?jǐn)?shù)具有不同的標(biāo)準(zhǔn)差,因而相同的比率智商對于不同年齡具有不同的意義。 2、離差智商:IQ100+15Z,(三)百分位,1、 百分等級(percentile rank) 概念:某個分?jǐn)?shù)的百分等級就是得分低于這個分?jǐn)?shù)的人數(shù)的百分比。 百分等級指示個體在常模團(tuán)體中的相對位置。 百分等級越低,個體所處的地位越低。,2 百分點(diǎn) 相對于某一百分等級的分?jǐn)?shù)點(diǎn)叫百分點(diǎn)或百分位數(shù)。 3 十分位 百分點(diǎn)將分?jǐn)?shù)分布分成100個等份。 十分位是將分?jǐn)?shù)分成10個等份。十分位提供一個10級的等級量表,每
13、一級包括10%的分?jǐn)?shù)。,百分位的評價 優(yōu)點(diǎn):(1)容易計(jì)算,容易解釋。(2)對于各種被試和各種測驗(yàn)普遍適用。 缺點(diǎn):(1)缺少相等單位,屬于順序量表,不能做加減乘除運(yùn)算。(2)分布與分?jǐn)?shù)分布不一致,(四)標(biāo)準(zhǔn)分?jǐn)?shù)(standard score) 1 Z分?jǐn)?shù)。 X - X Z= S 不僅具有可比性,還具有可加性。 Z = 0 SZ = 1,-3 +3 約占總體的99.73%。,除了Z分?jǐn)?shù)外,還可以把Z分?jǐn)?shù)轉(zhuǎn)換成T分?jǐn)?shù)、標(biāo)準(zhǔn)九、離差智商等。 轉(zhuǎn)換方法: 線性轉(zhuǎn)換:從正態(tài)到正態(tài) 非線性轉(zhuǎn)換:從偏態(tài)到正態(tài)(通過百分等級),2 T分?jǐn)?shù)(非線性轉(zhuǎn)換,常態(tài)化) 紀(jì)念Terman和Thorndike。 T=1
14、0Z+50 平均數(shù)為50,標(biāo)準(zhǔn)差為10,3 標(biāo)準(zhǔn)九(stanine) 標(biāo)準(zhǔn)化九級分制 標(biāo)準(zhǔn)九=5+2Z,即平均數(shù)為5,標(biāo)準(zhǔn)差為2,4 離差智商(deviation IQ) IQ = 100 + 15Z,六、常模分?jǐn)?shù)的表示方法,(一)轉(zhuǎn)化表 轉(zhuǎn)化表的3個基本要素:原始分、導(dǎo)出分、常模團(tuán)體的特征描述。 1簡單轉(zhuǎn)化表 2復(fù)雜轉(zhuǎn)化表,(二)剖析圖,第三節(jié)測驗(yàn)的信度,測量誤差及其來源 一、測量誤差的含義: 測量值與實(shí)際值的差異 二、測量誤差的種類 系統(tǒng)誤差:測量工具本身引起的誤差(穩(wěn)定); 隨機(jī)誤差:由不穩(wěn)定因素引起的誤差(不穩(wěn)定)。,真分?jǐn)?shù)及其有關(guān)的假設(shè),真分?jǐn)?shù)(True Score):一個測量工具在
15、沒有測量誤差時,所得到的純正值。 操作定義:無數(shù)次測量結(jié)果的平均值。 觀察分?jǐn)?shù)(Observed Score):測驗(yàn)分?jǐn)?shù),真分?jǐn)?shù)的數(shù)學(xué)模型及其假設(shè) X = T + E X:測驗(yàn)分?jǐn)?shù) T:真分?jǐn)?shù) E:誤差 測量誤差的假設(shè): (X)= T 或 (E)= 0,SX2 = ST2 + SE2 實(shí)得分?jǐn)?shù)的變異數(shù)真分?jǐn)?shù)的變異數(shù)誤差變異數(shù)(隨機(jī)誤差) ST2 = SV2 + SI2 真變異數(shù)與測量目的有關(guān)的變異數(shù)與測量目的無關(guān)的穩(wěn)定的變異數(shù)(系統(tǒng)誤差) SX2 = SV2 + SI2 + SE2,SX2,ST2,一信度概述,(一)什么是信度? 信度(reliability)是指測量結(jié)果的穩(wěn)定性程度,也叫測量
16、的可靠性。 操作定義:一組測量分?jǐn)?shù)的真變異數(shù)與總變異數(shù)(實(shí)得變異數(shù))的比率。 rxx=ST2 / Sx2 rxx:信度系數(shù),注意: (1)信度指的是一組測驗(yàn)分?jǐn)?shù)或一系列測量的特性,而不是個人分?jǐn)?shù)的特性; (2)真分?jǐn)?shù)的變異數(shù)是不能直接測量的,因此信度是一個理論上構(gòu)想的概念,只能根據(jù)一組實(shí)得分?jǐn)?shù)作出估計(jì)。,(二)信度的作用 1評價測驗(yàn):信度是測量過程中所存在的隨機(jī)誤差大小的反映 2解釋個人測驗(yàn)分?jǐn)?shù)的意義 SE=SX1 - Rxx SE:標(biāo)準(zhǔn)誤Sx:所得分?jǐn)?shù)的標(biāo)準(zhǔn)差 rxx:測驗(yàn)的信度 真分?jǐn)?shù)的置信區(qū)間(95%)=X1.96SE 3不同測驗(yàn)分?jǐn)?shù)的比較,二信度的估計(jì)方法,(一)重測信度 1含義和計(jì)算
17、 重測信度(test-retest reliability):用同一量表對同一組被試施測兩次所得結(jié)果的一致性程度。,rxx=,X1X2/N-X1X2,S1S2,2使用的前提條件 所測量的心理特質(zhì)必須是穩(wěn)定的; 練習(xí)和遺忘的效果基本上相互抵消; 在兩次施測的間隔時期內(nèi),被試在所要測查的心理特質(zhì)方面沒有獲得更多的學(xué)習(xí)和訓(xùn)練。,(二)復(fù)本信度,1含義和計(jì)算 復(fù)本信度(Alternate-form reliability)是指兩個平行(等值)的測驗(yàn)測量同一批被試所得結(jié)果的一致性程度。計(jì)算方法與重測法相同。,施測的安排: 等值性系數(shù):兩個復(fù)本測驗(yàn)是同時連續(xù)施測的 穩(wěn)定等值系數(shù)(重測復(fù)本信度):兩個復(fù)本測
18、驗(yàn)是相距一段時間分兩次施測的。,2使用的前提條件 兩測驗(yàn)真正平行:項(xiàng)目的內(nèi)容、形式、數(shù)量、難易、時限、指導(dǎo)語等 被試要有條件接受兩個測驗(yàn)。注意:時間間隔要適當(dāng)。,3、局限 只能減少而不能排除練習(xí)和記憶的影響。 許多測驗(yàn)建立復(fù)本相當(dāng)困難。,(三)分半信度,1含義和計(jì)算 分半信度(split-half reliability)是指將一個測驗(yàn)分成對等的兩半后,所有被試在這兩半上所得分?jǐn)?shù)的一致性程度。 假設(shè):兩半測驗(yàn)等值。,常見的分半方法是按測題序號奇偶分半: l 測驗(yàn)題目按某種順序(如難度)排列; l如果是隨機(jī)排列的題目,則必須是所有題目是平等的(要么難度相等,要么性質(zhì)一致,是測同一個心理特質(zhì)的);
19、 l如果測驗(yàn)有多個分量表,應(yīng)在分量表內(nèi)部排好順序,再把各分量表的兩半組合起來求相關(guān)。,奇偶分半法作用注意事項(xiàng),如果有相互有牽連的項(xiàng)目或一組解決同一問題的項(xiàng)目時,這些項(xiàng)目要放在同一半中。 如果試卷中存在任選題或試卷為速度測驗(yàn)時,不宜使用分辦信度。,分半法是按正常的程序?qū)嵤y驗(yàn),然后將全部項(xiàng)目分成相等的兩半,根據(jù)各人在這兩半測驗(yàn)的分?jǐn)?shù)計(jì)算其相關(guān)。然后進(jìn)行修正(?) 校正公式:斯皮爾曼-布郎公式 rxx= 2 rhh /(1+ rhh) rhh是兩半測驗(yàn)分?jǐn)?shù)之間的相關(guān)系數(shù)。,當(dāng)假定“兩半測驗(yàn)等值(具有相同的平均數(shù)和標(biāo)準(zhǔn)差”)不成立時,用弗朗那根公式或盧侖公式來估計(jì)信度。 弗朗那根公式: rxx =
20、2 1 -(Sa2 + Sb2)/ Sx2 Sa2 、 Sb2是兩半測驗(yàn)分?jǐn)?shù)的變異數(shù), Sx2是測驗(yàn)總分的變異數(shù),盧侖公式: rxx = 1 - Sd2 / Sx2 Sd2 :兩半測驗(yàn)分?jǐn)?shù)之差的變異數(shù) Sx2:測驗(yàn)總分的變異數(shù),(四)同質(zhì)性信度 1含義 同質(zhì)性信度(homogeneity reliability),也叫內(nèi)部一致性系數(shù),是指測驗(yàn)內(nèi)部所有題目間的一致性程度。可彌補(bǔ)分半法的不足。 2計(jì)算及適用范圍 基本公式:rkk = K rij / 1 +(K - 1)rij K為測驗(yàn)項(xiàng)目數(shù) r ij是項(xiàng)目間相關(guān)系數(shù)的平均數(shù)。,庫德理查遜公式 KR20公式: rxx = K /(K - 1) 1-
21、(piqi)/ Sx2 pi為答對第i題的人數(shù)的比例;qi為答錯第i題的人數(shù)的比例;K為題目數(shù), Sx2為測驗(yàn)總分的變異。 適用于:已知各項(xiàng)目的難度,(五)評分者信度 1含義和計(jì)算 評分者信度(scorer reliability)是指多個評分者給同一批人的答卷進(jìn)行評分的一致性程度。 2人時:相關(guān)系數(shù)(積差相關(guān)).90 多人時:肯德爾和諧系數(shù) W=12 R i2 -(R i)2 / N / K2(N3 -N) (K=3 20;N=3 7時,查W表檢驗(yàn)) R I為第i個被試被評的水平等級之和,七、影響測量信度的主要因素,(一)被試方面 被試團(tuán)體同質(zhì)性越高(個體差異越?。孟嚓P(guān)系數(shù)(信度)就越
22、低。 被試團(tuán)體異質(zhì)性越高(個體差異越大),所得相關(guān)系數(shù)(信度)就越高。 (二)主試方面 指導(dǎo)語、態(tài)度、期望等 (三)施測情境,(四)測量工具 測驗(yàn)長度:測驗(yàn)越長,信度越高。 測驗(yàn)難度:過難或過易都會使個體間得分差異減小,降低信度。 測驗(yàn)內(nèi)容:試題取樣不當(dāng),內(nèi)部一致性低,題意模糊,信度則低。 (五)兩次施測的間隔時間 間隔時間越短,信度越高; 間隔時間越長,信度越低。,第四節(jié)測驗(yàn)的效度,一效度的概念 1、什么是效度 效度(validity)是指一個測驗(yàn)或量表實(shí)際能測出其所要測的心理特質(zhì)的程度。 (1)效度是一個相對的概念:每個測量工具都有自己的目的;內(nèi)隱特質(zhì)是通過外顯行為間接測得的。 (2)效度
23、是測量的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。 (3)判斷一個測量是否有效要從多方面收集證據(jù),操作定義: 效度=SV2/SX2=rXY2,SX2,ST2,實(shí)得分?jǐn)?shù)的變異數(shù)真分?jǐn)?shù)的變異數(shù)誤差變異數(shù)(隨機(jī)誤差) 真變異數(shù)與測量目的有關(guān)的變異數(shù)與測量目的無關(guān)的穩(wěn)定的變異數(shù)(系統(tǒng)誤差),2、效度與信度的關(guān)系 (1)信度高是效度高的必要而非充分條件 一個測驗(yàn)效度高,其信度也必然高; 但一個測驗(yàn)信度高,其效度不一定高。 (2)測驗(yàn)的效度受它的信度制約 rXYrXX 一個測驗(yàn)的信度必然比效度高,至少相等。,二、 效度的估計(jì),1、內(nèi)容效度 內(nèi)容效度(content validity)是指測驗(yàn)題目對有關(guān)內(nèi)容或行為取樣的
24、適當(dāng)程度,即一個測驗(yàn)實(shí)際測到的內(nèi)容與所要測量的內(nèi)容之間的吻合程度。 一個測驗(yàn)要有內(nèi)容效度必須具備兩個條件: (1)要有定義完好的內(nèi)容范圍 (2)測驗(yàn)題目應(yīng)是所界定的內(nèi)容范圍的代表性取樣。,應(yīng)用范圍:主要應(yīng)用于成就測驗(yàn),也適合于某些用于選拔和分類的職業(yè)測驗(yàn)。不適用于能力傾向測驗(yàn)和人格測驗(yàn)。 表面效度(surface validity):外行人對某個測驗(yàn)從表面上看好像是測某種心理特質(zhì)的程度。并不是一種真正的效度。 人格測驗(yàn)要求表面效度不宜過高。,2內(nèi)容效度的確定方法,(1)邏輯分析法:專家根據(jù)自己的知識經(jīng)驗(yàn)對量表的有效性(邏輯性)作出判斷,也稱邏輯效度。 為使內(nèi)容效度的判斷過程更客觀,一般采用下列
25、步驟: 確定測驗(yàn)內(nèi)容的總體范圍; 編制雙向細(xì)目表; 編制評定量表,從測驗(yàn)內(nèi)容所測的技能、題目對所定義的范圍的覆蓋率、各種題目數(shù)量和分?jǐn)?shù)的比例以及題目形式的適當(dāng)性等方面,對測驗(yàn)作出總的評價。,(2)統(tǒng)計(jì)方法:用兩個測驗(yàn)復(fù)本來測同一批被試,若相關(guān)高,則內(nèi)容效度可能高,但若相關(guān)低,則說明必有一個測驗(yàn)缺乏內(nèi)容效度。 (3)經(jīng)驗(yàn)推測法 通過實(shí)踐來檢驗(yàn)效度,2、結(jié)構(gòu)效度,structure validity是指一個測驗(yàn)實(shí)際測到所要測量的理論結(jié)構(gòu)或特質(zhì)的程度,或者說測驗(yàn)分?jǐn)?shù)能夠說明心理學(xué)理論的某種結(jié)構(gòu)或特質(zhì)的程度。 特點(diǎn): (1)具有不同理論構(gòu)思的測驗(yàn),其結(jié)構(gòu)效度無法進(jìn)行比較; (2)結(jié)構(gòu)效度有時很難獲得;
26、 (3)結(jié)構(gòu)效度沒有單一的指標(biāo),是由各方面的證據(jù)累積起來進(jìn)行評價的。,結(jié)構(gòu)效度的確定方法,結(jié)構(gòu)效度確立的一般步驟: (1)提出理論框架; (2)依據(jù)理論框架推演出有關(guān)測驗(yàn)成績的假設(shè); (3)用邏輯或?qū)嵶C的方法來證明假設(shè)。,結(jié)構(gòu)效度的確定方法,結(jié)構(gòu)效度確立的一般步驟: (1)提出理論框架; (2)依據(jù)理論框架推演出有關(guān)測驗(yàn)成績的假設(shè); (3)用邏輯或?qū)嵶C的方法來證明假設(shè)。,具體方法: (1)測驗(yàn)內(nèi)部尋找證據(jù)法 分析測驗(yàn)的內(nèi)容效度:若內(nèi)容效度高,說明其結(jié)構(gòu)效度也高。 分析被試對題目反應(yīng)的特點(diǎn):有無社會稱許性的題目,如“當(dāng)事情不順我意時,我時常動怒?!睂υ擃}的回答,也許反映不了要測的性格。 計(jì)算測驗(yàn)
27、的同質(zhì)性信度:分半信度、系數(shù)、KR20、KR21,(2)測驗(yàn)之間尋找證據(jù)法 相容效度:新老測驗(yàn)之間的相關(guān)(兩測驗(yàn)測的是同一心理特質(zhì))。若相關(guān)高,則說明新測驗(yàn)可能有較高的效度。 區(qū)分效度:新老測驗(yàn)之間的相關(guān)(兩測驗(yàn)測的不是同一心理特質(zhì)),若相關(guān)低,則說明新測驗(yàn)可能有較高的效度。 因素分析法:得出的因素符合理論的構(gòu)思,說明效度高。,(3)考察測驗(yàn)的實(shí)證效度法 根據(jù)效標(biāo)把被試分組,考察其得分差異。 根據(jù)測驗(yàn)得分差異把被試分組,考察其所測特質(zhì)(行為表現(xiàn))的差異。 (4)實(shí)驗(yàn)法和觀察法證實(shí) 實(shí)驗(yàn)前訓(xùn)練實(shí)驗(yàn)后,3、實(shí)證效度,含義、種類及作用 實(shí)證效度是指一個測驗(yàn)對處于特定情境中的個體的行為進(jìn)行估計(jì)的有效性
28、。 效標(biāo)(criterion) :被估計(jì)的行為是檢驗(yàn)測驗(yàn)效度的標(biāo)準(zhǔn)。衡量一個測驗(yàn)是否有效的外在標(biāo)準(zhǔn)。 實(shí)證效度又稱效標(biāo)關(guān)聯(lián)效度(criterion-related validity)。,常用的效標(biāo): 學(xué)業(yè)成就 臨床診斷 實(shí)際工作表現(xiàn) 特殊訓(xùn)練成績 不同團(tuán)體的總體表現(xiàn) 先前有效的測驗(yàn) 等級評定。,效標(biāo)測量的條件,a.有效性:效標(biāo)測量能真正反映觀念效標(biāo)。 b.可靠性:有較高的信度 c.客觀性: 效標(biāo)測量必須能真正反映觀念效標(biāo),防止效標(biāo)污染。 效標(biāo)污染(criterion contamination)是指評定者知道被試的測驗(yàn)分?jǐn)?shù),因而影響到對效標(biāo)的客觀評定。 d.實(shí)用性: 經(jīng)濟(jì)實(shí)用,實(shí)證效度的確定方
29、法,(1)相關(guān)法 測驗(yàn)分?jǐn)?shù)與效標(biāo)測量之間的相關(guān)系數(shù)。 優(yōu)點(diǎn): 數(shù)量化; 可用回歸方程進(jìn)行個人效標(biāo)預(yù)測 缺點(diǎn): 要求預(yù)測源與效標(biāo)呈線性關(guān)系; 無法提供關(guān)于取舍正確性的指標(biāo),(2)區(qū)分法 檢驗(yàn)測驗(yàn)分?jǐn)?shù)能否有效地區(qū)分由效標(biāo)所定義的團(tuán)體。 T檢驗(yàn): 重疊量計(jì)算:,(3)命中率法 應(yīng)用范圍:預(yù)測源和效標(biāo)都是二分的。,強(qiáng)調(diào)社會公平時使用,總命中率=(B+C)/(A+B+C+D) 當(dāng)測驗(yàn)用于提高工作或?qū)W習(xí)效率時使用,正命中率= B/(A+B),效度的功能,一、預(yù)測誤差 二預(yù)測效標(biāo)分?jǐn)?shù) 三預(yù)測效率指數(shù),四、影響測量效度的因素,A測驗(yàn)的構(gòu)成 項(xiàng)目的質(zhì)量(題型、區(qū)分度、難易順序) 項(xiàng)目數(shù)量 測驗(yàn)長度與效度的關(guān)系:
30、 r(nx)y =nrxy /n(1- rxx +nrxx) n測驗(yàn)增長倍數(shù),B測驗(yàn)的實(shí)施過程 C接受測驗(yàn)的被試 常模團(tuán)體的同質(zhì)性影響到對被試測驗(yàn)得分的解釋,進(jìn)而影響到測驗(yàn)的效度。 測驗(yàn)偏倚(test bias)是指用不適用于被試的標(biāo)準(zhǔn)來解釋被試的測驗(yàn)得分,因而造成解釋的偏差。,D效標(biāo) 測量行為與所選效標(biāo)的相似性越高,效度越高。 測驗(yàn)分?jǐn)?shù)與效標(biāo)行為之間是否是線性關(guān)系,如果不是線性關(guān)系,求皮爾遜相關(guān)就會低估效度。 效標(biāo)本身的測量越可靠,效度就可能越高。 E測量的信度,第五節(jié)項(xiàng)目分析,項(xiàng)目分析:對項(xiàng)目進(jìn)行篩選和修訂,可以提高測驗(yàn)的信度和效度。 定性分析:內(nèi)容效度、題目編寫的恰當(dāng)性和有效性等的分析。
31、 定量分析:主要是指題目難度和區(qū)分度的分析。,第一單元、 測驗(yàn)的難度,一、難度(difficulty)的含義 難度:指項(xiàng)目的難易程度。 在“最高”作為測驗(yàn)(如:)中,稱為“難度”,而在“典型”作為測驗(yàn)(如:)中,則指“通俗性”。 兩者都是指在總體中,能夠正確或確切回答某項(xiàng)目的人數(shù)。,二難度的計(jì)算,1、二分法記分項(xiàng)目(是非題、選擇題)的難度用通過率來表示。 通過率(易度): P=R/N R:通過人數(shù);N全體被試人數(shù) P越大,難度越小,用極端分組法(上下27%): 被試較多時,測驗(yàn)總分從高到低排列。分別計(jì)算高分組和低分組在某一項(xiàng)目上的通過率,合并: P=(PH+PL)/2 選擇題難度的校正:CP(
32、KP-1)/(K-1) CP:校正后通過率,P:實(shí)得通過率,K:備選答案數(shù)目,2、論述題等非二分法記分項(xiàng)目的難度 P=X / Xmax X:所有被試在該項(xiàng)目上的平均得分, Xmax:該項(xiàng)目的滿分。,三、難度水平的確定,(一)項(xiàng)目難度:取決于測驗(yàn)的目的、性質(zhì)和項(xiàng)目形式 1、測驗(yàn)?zāi)康模鸿b別差異 防止被試得滿分,滿分的意義是不明確的。難度為0.50時最理想,項(xiàng)目具有最大的鑒別力。 一般只需使項(xiàng)目的平均難度接近0.50,各個項(xiàng)目的難度在0.50 0.20之間變化。 2、項(xiàng)目形式 選擇題的難度一般應(yīng)大于猜測概率。 是非題:0.75最合適;四選一:0.63 3、測驗(yàn)性質(zhì): 效標(biāo)參照測驗(yàn)、掌握測驗(yàn):不考慮難
33、度 選拔測驗(yàn):難度=錄取率,(二)測驗(yàn)難度,取決于:測驗(yàn)各項(xiàng)目難度 考察測驗(yàn)分?jǐn)?shù)的分布形態(tài)檢驗(yàn)測驗(yàn)難度。 正偏態(tài),難度大 常態(tài)分布,難度適中 負(fù)偏態(tài),難度低,標(biāo)準(zhǔn)參照測驗(yàn)、掌握測驗(yàn):不考慮難度 允許分?jǐn)?shù)分布是偏態(tài)的,第二單元項(xiàng)目的區(qū)分度,一、區(qū)分度的含義 區(qū)分度(鑒別力):指測驗(yàn)項(xiàng)目對被試心理特性的區(qū)分能力。 項(xiàng)目的區(qū)分度是評價項(xiàng)目質(zhì)量和篩選項(xiàng)目的主要指標(biāo)。影響測驗(yàn)效度的重要因素。 高區(qū)分度項(xiàng)目能將不同水平的被試區(qū)分開來。 取值范圍:-1+1,二、區(qū)分度的計(jì)算 項(xiàng)目得分高低、實(shí)際水平高低二者的相關(guān)。 1、鑒別指數(shù) 比較測驗(yàn)高分組和低分組的兩組被試在項(xiàng)目通過率上的差別。 D = PH - PL
34、D值越大,區(qū)分度越高,項(xiàng)目越有效,伊貝爾(1965)鑒別指數(shù)評價標(biāo)準(zhǔn),(二)相關(guān)法,相關(guān)法(項(xiàng)目-總分相關(guān)):以某一項(xiàng)目分?jǐn)?shù)與效標(biāo)分?jǐn)?shù)或測驗(yàn)總分的相關(guān)作為該項(xiàng)目區(qū)分度的指標(biāo)。 相關(guān)越高,區(qū)分度?,計(jì)算方法,1、點(diǎn)二列相關(guān): 適用于:一類變量是二分稱名變量,另一類變量是連續(xù)變量 例如: 連續(xù)變量數(shù)據(jù),如體重、身高以及許多測驗(yàn)與考試的分?jǐn)?shù); 二分稱名變量數(shù)據(jù),如性別(分男與女)、態(tài)度(分贊成和不贊成)、學(xué)習(xí)經(jīng)歷(分有與無)、考試結(jié)果(分合格與不合格)、題目解答(分答對與答錯)等數(shù)據(jù)。,2、二列相關(guān) 適用于:兩個連續(xù)變量,其中一個變量被人為分成兩類。如: 一個測驗(yàn)的題目分?jǐn)?shù)是連續(xù)的,而效標(biāo)分?jǐn)?shù)或測驗(yàn)
35、總分被分成及格、不及格。 3、相關(guān)法 適用于:兩個變量均為二分稱名變量。,三、區(qū)分度與難度的關(guān)系,項(xiàng)目難度以常態(tài)分布為好,平均難度0.50,第六節(jié)測驗(yàn)編制的一般程序,一、測驗(yàn)的目標(biāo)分析:對象、用途、目標(biāo) 二、測題的編寫 三、測驗(yàn)的編排和組織,第一單元測驗(yàn)的目標(biāo)分析,一、測量的對象:測驗(yàn)適用的團(tuán)體 年齡、性別、職業(yè)、受教育程度、經(jīng)濟(jì)狀況、民族、文化背景等。 二、明確測量用途 用于顯示,或用于預(yù)測? (一)顯示性測驗(yàn):測驗(yàn)題目和所要測量的心理特征相似的測驗(yàn)。 (二)預(yù)測性測驗(yàn):預(yù)測一些沒被測量的行為的測驗(yàn)。,三、測量目標(biāo) (一)工作分析:預(yù)測性測驗(yàn)中要對所預(yù)測的行為活動作具體分析。 確定哪些心理特
36、征和行為可以使要預(yù)測的活動達(dá)到成功。 建立效標(biāo)。成功的標(biāo)準(zhǔn) (二)對特定概念下定義(操作定義):具體。 (三)確定測驗(yàn)具體內(nèi)容:雙向細(xì)目表,例:小學(xué)自然常識測驗(yàn)編題計(jì)劃,第二單元測題的編寫,一、收集測驗(yàn)資料設(shè)計(jì)項(xiàng)目的依據(jù) 題目來源 已有標(biāo)準(zhǔn)測驗(yàn) 理論和專家的經(jīng)驗(yàn) 臨床觀察和記錄 二、命題的一般原則 內(nèi)容:符合目的;代表性;相互獨(dú)立 文字:準(zhǔn)確;簡要;意義明確 理解:確切答案;普遍性 社會敏感性方面:社會負(fù)評價的內(nèi)容,三、編制要領(lǐng),種類: 提供型題目(論文題、簡答題、填充題) 選擇型題目(選擇題、是非題、匹配題),(一)選擇題,構(gòu)成:題干 + 選項(xiàng)(正確選項(xiàng)與誘答選項(xiàng)) 原則: 題干所提的問題必
37、須明確 選項(xiàng)要簡短,必要的敘述或相同的修飾語應(yīng)放在題干中; 每題只給一個正確答案; 各選項(xiàng)長度應(yīng)相等; 避免題干用詞與選項(xiàng)用詞一致; 選項(xiàng)最好用同一形式,(二)是非題,注意事項(xiàng): 內(nèi)容以有意義的概念、事實(shí)或基本原則為基礎(chǔ)。 每題只包含一個概念,避免兩個以上的概念在同一題中出現(xiàn),造成題目似是而非,或半對半錯。 盡量采用正面肯定的敘述,避免反面陳述或雙重否定的句子。如“生物沒有不是由細(xì)胞組成的。” 表達(dá)意見的題目,最好說明意見的來源和根據(jù)。 “是”與“非”的題數(shù)應(yīng)大致相等,且隨機(jī)排列。,(三)簡答題,形式:填充題、簡答題 原則: 用問句形式 填充題空格不宜過多 每題只有一個正確答案,(四)操作題,
38、原則: 明確測量目標(biāo),將其操作化 盡量選擇高真實(shí)性的項(xiàng)目 指導(dǎo)語要簡明扼要 制定評分標(biāo)準(zhǔn),第三單元測驗(yàn)的編排和組織,(一)合成測驗(yàn) (二)預(yù)測與項(xiàng)目分析 (三)信度和效度考察 (四)常模制訂 (五)編寫指導(dǎo)手冊,一、合成測驗(yàn),(一)選擇與審定試題 選擇試題形式:取決于測驗(yàn)的目的、材料性質(zhì)、測驗(yàn)對象、各種實(shí)際因素。 審定題目: 題目范圍:要與雙向細(xì)目表一致; 題目數(shù)量:要比最終所需要的數(shù)量多,以便篩選或編制復(fù)本; 題目的難度:測驗(yàn)?zāi)康?;?yīng)有一定的分布范圍; 項(xiàng)目說明: 用詞力求清楚明白。,(二)測題的編排 原則 逐步由易變難 同類型題目放在一起 根據(jù)各類型測題本身特點(diǎn)排列 排列方式 并列直進(jìn)式:韋克斯勒量表 混合螺旋式:比西量表,二、試測與項(xiàng)目分析,(一)試測 對象取樣 施測過程與施測情景 時限可稍寬一些 記錄被試的各種反應(yīng)。 (二)項(xiàng)目分析,三
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 道路危險貨物運(yùn)輸安全標(biāo)準(zhǔn)化制度匯編
- 湖南省長沙2025年八年級上學(xué)期期末物理試題附答案
- 河北省滄州市2025-2026學(xué)年高二上學(xué)期期末語文試題(含答案)
- 中國冶金地質(zhì)總局礦產(chǎn)資源研究院2026年高校畢業(yè)生招聘備考題庫含答案詳解
- 會議服務(wù)與后勤保障制度
- 2026年輔警防詐騙宣傳面試能力試題及解析
- 2026年宗教學(xué)基本概念與研究方法測試題庫含答案
- 2026年快遞網(wǎng)絡(luò)規(guī)劃總監(jiān)面試含答案
- 2026年電商運(yùn)營經(jīng)理評估問答含答案
- 2026年健康管理師流行病學(xué)考試題含答案
- 2026廣東廣州開發(fā)區(qū)統(tǒng)計(jì)局(廣州市黃埔區(qū)統(tǒng)計(jì)局)招聘市商業(yè)調(diào)查隊(duì)隊(duì)員1人考試備考試題及答案解析
- 惠州市惠陽區(qū)(2025年)社工崗位考試題目及答案
- 2026年遼寧現(xiàn)代服務(wù)職業(yè)技術(shù)學(xué)院單招職業(yè)技能筆試參考題庫帶答案解析
- 雨課堂在線學(xué)堂《項(xiàng)目管理概論》作業(yè)單元考核答案
- 排水管網(wǎng)清淤疏通方案(技術(shù)方案)
- 慢性支氣管炎和COPD(內(nèi)科護(hù)理學(xué)第七版)
- 關(guān)于提高護(hù)士輸液時PDA的掃描率的品管圈PPT
- GB/T 30564-2023無損檢測無損檢測人員培訓(xùn)機(jī)構(gòu)
- 中華人民共和國汽車行業(yè)標(biāo)準(zhǔn)汽車油漆涂層QC-T484-1999
- GB/T 96.2-2002大墊圈C級
- 第九章-第一節(jié)-美洲概述
評論
0/150
提交評論