心理測量串講及試卷

上傳人：浪*** IP屬地：河北上傳時間：2023-05-16 格式：PDF 頁數(shù)：101 大?。?2.46MB 積分：12 舉報 版權申訴

已閱讀5頁，還剩96頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權，請進行舉報或認領

文檔簡介

北大心理測量串講筆記

第1章概論

1、中國古代心理測量簡述：

(1)公元六世紀初，南朝人劉勰的著作《新論?專學》中提到了類似現(xiàn)代“分心測驗”的思想。

(2)在中國古代，“七巧板”是很常見的一種兒童玩具，其實它可以作為創(chuàng)造力測量的工具。

(3)中國古代心理測量的思想中包含著典型的東方文化特點：定性描述及帶有道德判斷色彩。

2、中國近代心理測量的出現(xiàn)：

(1)1916年，樊炳清先生首先介紹了比內(nèi)-西蒙智力量表。

(2)1920年，北京高等師范學校和南京師范學校建立了我國最早的兩個心理學實驗室，廖世承和陳鶴琴先生在南

京高等師范學校開設心理測驗課。1921年，他倆正式出版《心理測驗法》一書。

(3)1922年夏天，中華教育改進社聘請美國教育心理測驗專家麥考爾來華講學。

(4)1924年，陸志韋先生發(fā)表了《訂正比內(nèi)西蒙智力測驗說明書》，30年代又與吳天敏再次做了修訂。

(5)1931年由艾偉、陸志韋、陳鶴琴、蕭孝噪等倡議，組織并成立了中國測驗學會。

(6)1932年《測驗》雜志創(chuàng)刊。

(7)至抗戰(zhàn)前夕，由我國心理學工作者制定或編制出的合乎標準的智力測驗和人格測驗約20種，教育測驗50多種」

3、中國現(xiàn)代心理測量的發(fā)展：

(1)1936年，蘇聯(lián)在批判“兒童學”時擴大化，心理測驗也被一概禁止。

(2)從1978年北京大學首建心理系開始，心理測驗才重新得到恢復。

(3)1979年，林傳鼎、張厚等以國外資料為參考，編制了少年兒童學習能力測驗。

(4)1980年初，北師大心理系開設了心理測量課。1984年，在北京召開的第五屆全國心理學年會上，成立了心理測

驗工作委員會，加強了測驗工作的指導和監(jiān)督。

4、科學心理測驗的產(chǎn)生：心理測驗的產(chǎn)生，是出于實際需要。最初，人們用測驗，是因為要治療智力落后者和精

神病病人。

(1)法國的醫(yī)生艾斯奎羅第一個把智力落后與精神病分開。他認為，精神病以情緒障礙為標志，不一定伴隨智力落

后，而智力落后則是以出生時或嬰兒期表現(xiàn)出來的智力缺陷為主要標志。

(2)50多年后，法國的心理學家比內(nèi)提出應該從正常學校學習的兒童中篩選出不適應的兒童，安排在特殊的班級

里學習和教育。此舉動導致了心理測驗史上重大事件的發(fā)生一第一個智力測驗的誕生。

(3)實驗心理學的誕生是心理測驗產(chǎn)生的另一個重要原因。實驗心理學的誕生和發(fā)展，還給心理測量帶來了另一個

副產(chǎn)品：嚴格的標準化程序。標準化是現(xiàn)代心理測驗的重要評價指標。

5、西方早期的心理測驗嘗試：

(1)弗蘭西斯?高爾頓是第?個倡導心理測驗的人。他于1884年在倫敦國際博覽會上專門設立了一個“人類測量

實驗室”。他的這一舉動是心理測驗史上第一個大規(guī)模系統(tǒng)地測量個體差異的嘗試。

(2)高爾頓還是使用評定量表和問卷法的先驅(qū)。并且他發(fā)展了分析個體差異資料的統(tǒng)計方法，不僅擴充了古特列特

的百分位法，而且創(chuàng)造了粗淺的相關計算法。

(3)美國心理學家卡特爾1980年發(fā)表《心理測驗與測量》一文于《心理》雜志上，這是在心理學文獻中首次出現(xiàn)

“心理測驗”一詞。

6、比內(nèi)-西蒙量表的誕生及心理測驗的發(fā)展：

(1)1904年比內(nèi)為了鑒別弱智兒童，他與西蒙合作編制成了世界上第一個科學的智力測驗一比內(nèi)-西蒙量表。1905

年，他在《心理學年報》上發(fā)表了文章《診斷異常兒童的新方法》，介紹了該量表，歷史上稱為“1905量表”。從

此，比內(nèi)-西蒙量表宣告誕生。

(2)比內(nèi)-西蒙量表自1905年發(fā)表后，比內(nèi)和西蒙親自主持過兩次修訂，一次在1908年，一次在1911年，此時比

內(nèi)已不幸去世。

(3)1905年量表主要強調(diào)的是判斷、理解和推理能力，也就是比內(nèi)認為的智力的基本組成成分。1908年版的量表刪

掉了1905年版中不合適的題目，增加了新題目，題目總數(shù)大59個。所有測驗題目按年齡分組，從3~13歲。測驗

的結(jié)果用“智力水平”來表示。人們常叫它為“智力年齡”o它表示一個兒童能完成何種年齡水平的兒童所能完成

的測驗。

(4)最有名的是1918年出版的美國斯坦福大學的推孟教授修訂的“斯坦福-比內(nèi)量表”這?量表首次使用了“智力

商數(shù)”的概念，簡稱為IQ,是心理年齡和實際年齡的比值。

(5)比較有名的幾個測驗。

1智力測驗：推孟的研究生歐提斯編制的團體智力測驗，2后在次基礎上發(fā)展出美國陸軍用甲、乙兩種測驗。有基于

因素分析理論編制的測量多項能力的韋克斯勒的兒童智力量表。還有桑代克編制的標準化教育測驗。

2人格測驗：1917年武德沃斯設計的“個人資料調(diào)查表”。1912年問世的羅夏克墨跡圖測驗(RIT)和于1943年首

次出版，由哈撒韋和麥金利編制的目前影響最大的MMPI-明尼蘇達多相人格調(diào)查表。

7、測量是：就是根據(jù)一定的法則用數(shù)字對事物加以確定。測量就是確定一個事物的屬性的量多少。因此，我們所指

的測量，就是根據(jù)一定的法則，采用一?定的操作程序，給事物確定出?種數(shù)量化的價值。

8、測量的要素是：參照點和單位。

參照點：它可以分為兩種，一是絕對的零點；二是相對參照點。最理想的參照點是絕對零。心理測量中所用的參照點

都是人為的，因而測量的結(jié)果常常不能以“倍數(shù)”來解釋。如IQ=100的人IQ=50的人的智力的兩倍。

9、量表是：就是有參照點和單位的連續(xù)體。

10、量表的種類有：量表是由人來制訂的，依單位和參照點的不同，量表的種類也不一樣。根據(jù)測量精度高低，斯

蒂文斯將量表分為四個水平，山低到高分別為：命名量表、順序量表、等距量表和等比量表。

種類定義特點備注

命名量表只是用數(shù)字來代表事物或?qū)κ挛镞M行分類。命名量表中的數(shù)字沒有任何數(shù)值意義，不能作量化分析。無大

小意義，只表明類別。無參照點和單位。無法比較大小或進行任何數(shù)學方法運算。

順序量表表明類別的大小或某種屬性的多少。主要用于分等論級和分類。數(shù)字僅表示等級并不表示某種屬性的真正

量或絕對值。無參照點(沒有絕對零度)和單位。無法進行數(shù)學方法運算。

等距量表存在大小關系。無絕對零度，但存在相對零點?？梢赃M行數(shù)學運算，有相等單位。

等比量表是最精確的測量。大多是物理量表。而心理量表只能達到等距量表水平?？梢灾朗挛镏g的某種特點上

相差多少及它們之間的倍數(shù)關系。有相等單位和絕對零點?？梢赃M行數(shù)學運算。

11、心理測量是：就是通過觀察人的少數(shù)有代表性的行為，對反映在人的行為活動中的心理特征，依確定的原則進

行推論和量化分析的一種科學手段。

12、著名的心理測驗學家安娜斯泰西認為：心理測驗實質(zhì)上是行為樣本的客觀和標準化的測量”。

這一定義包含有至少三個基本要素：行為樣本、客觀測量和標準化。心理測驗要測量的是心理特征，但它要通過測量

人的行為來實現(xiàn)，從行為測量中來推知心理特征。這就要找有代表性的少數(shù)行為作為全部行為的樣本。

13、關于心理測量中的標準化：心理測量要做到客觀必須在測驗編制、實施、評分、解釋過程中減少主試和被試的

隨意性程度。標準化的測量是測量客觀性的根本保證。

14、心理測驗的性質(zhì)：間接性、相對性、客觀性。

15、心理測驗的種類：

(1)按測驗的內(nèi)容分：能力測驗(智力測驗、反應能力測驗)；學績測驗，如成套的成就測驗；人格測驗如EPQ、

MMPI等。

(2)按測驗的對象特點分：個別測驗和團體測驗。

(3)按測驗表現(xiàn)形式分：文字測驗(紙筆測驗)和非文字測驗。

(4)按測驗的目的分：描述性測驗、診斷性測驗、預測性測驗。

(5)按測驗的時間分：速度測驗和難度測驗。

(6)按測驗要求分：有最高作為測驗和典型行為測驗。前者要求被試盡可能作出最好的回答，而且有正確的答案。

能力測驗、學績測驗均屬此類。后者要求被試按照日常習慣回答，無正確答案，所有人格測驗均可稱為典型行為測驗。

16、心理測驗的功能：

(1)從實際應用角度看：選拔人才、崗位安置、診斷、評價、輔助咨詢。

(2)從理論研究角度看：搜集資料、提出和驗證假設、實驗分組。

17、正確的測驗觀：

(1)測驗是重要的心理學研究方法之一，是決策的輔助工具。

(2)心理測驗作為研究方法和測量工具尚不完善。心理測驗的最大問題是理論基礎不夠堅實。

(3)科學地看待測驗，防止亂編濫用。

18、錯誤的測驗觀：測驗萬能論、測驗無用論、文化公平測驗(只有相對的文化公平，沒有絕對的文化公平)、心理

測驗即智力測驗。

第2章心理測驗的編制

1、心理測驗的目的是指：我們編測驗干什么用。

2、測驗目的種類：

(1)顯示性測驗是指：測驗題目和要測量的特征相似的測驗，比如成就測驗。

(2)預測性測驗是：為了預測一些沒被測量的行為的測驗。

3、心理測驗的目標是指：編制的測驗是測什么的，即測什么樣的心理特征或人格特點。

4、目標分析依測驗不同可分為：

(D工作分析：對于預測或選拔用的測驗，主要任務就是對所預測行為活動做具體分析，即任務分析或工作分析。

(2)對特定概念下定義：

(3)確定測驗的具體內(nèi)容。

5、命題的基本原則：

(1)試題要符合測驗的目的。

(2)內(nèi)容取樣要有代表性。

(3)題目格式要不被人誤解。

(4)語句要簡明扼要。既排除與答題無關的因素，乂不能遺漏答題所依據(jù)的必要條件。避免使用生僻的字句或詞匯。

(5)答案確定，不應引起爭議。(創(chuàng)造力測驗和人格測驗除外)。

(6)題目間內(nèi)容相互獨立、互不牽連，對不同題目的回答不致相互影響。

(7)題目不能含有答題傾向的線索。

(8)題目內(nèi)容不超出受測團體的知識水平和理解能力。

(9)比開社會敏感性問題，如涉及社會禁忌或個人隱私的題目不應使用。

(10)便于施測，評分筒捷。

6、如測驗涉及社會敏感性問題時的策略：

(1)命題時假定被試具有某種行為，使他不得不在確實沒有該行為時才否定，可避免否定答案過多的傾向。

(2)假定規(guī)范不一致。

(3)指出該行為是常見的，雖然是違規(guī)的。

7,測驗題目的來源：已出版的標準測驗、理論和專家的經(jīng)驗、臨床觀察和記錄。

8、心理測驗題目的類型：根據(jù)對被試的要求不同來分，可有兩大類：提供型和選擇型的題目。前者求被試給出答案

內(nèi)容，如論文題、簡答題、填充題；選擇型題目要求被試在幾個有限的答案中選擇正確的答案，如是非題、匹配題(選

擇題，由題干和選項構(gòu)成)、填充題等。

9、測驗題目在編排時所遵循的普遍原則是：測試同一因素的題目放在一起、同類型的測試題盡可能組合在?起、題

目的難度排列宜逐步上升。

10、測題的常見編排方式：并列-直進式、混合螺旋式。

第3章測驗的實施、計分和誤差

1、標準化是：測驗編制中遵循科學的理論和技術，測驗實施中要統(tǒng)一步驟和標準，結(jié)果解釋時也要統(tǒng)?標準。換句

話說，不僅編制測驗時要嚴格選題、預試取樣、施測、建立常模、確定記分標準和解釋系統(tǒng)、有信度和效度驗證，而

且測驗在實施測量時也要統(tǒng)一準和步驟，以控制無關因素對測驗目的和結(jié)果的影響。

2、心理測驗的實施程序：預告測驗、準備測驗環(huán)境、準備測驗材料、熟悉測驗的具體步驟、熟悉測驗的指導語、具

體實施。

3、實施心理測驗的過程中的要素：主試（包括助手）、被試、測試工具、環(huán)境。

4、主試誤差是：由于主試實施測驗必然伴隨的影響因素造成的誤差。

5、主試誤差包括：主試者的生理物理因素、主試在施測時偏離規(guī)定程序。

6、有幾種情況主試能發(fā)生較大影響：

（1）測驗步驟復雜，指導語冗長、繁瑣。

（2）測驗題目本身模糊不定，形式多變。

（3）安排的測驗條件寬裕，有較多靈活機動的余地。

（4）被試屬幼兒或有情緒捆擾者。

7、控制誤差的方法：

（1）嚴格遵從指導語，不帶任何暗示，被試提問時，盡量按中性方式回答。

（2）測驗前不講太多無關的話，以免引起被試的煩躁情緒和反感。

（3）對特殊問題有心理準備。

8、被試誤差可分為：應試技巧與練習、動機和焦慮、反應定勢。

（1）應試技巧與練習：速度測驗比難度測驗更易受練習因素的影響。

（2）動機和焦慮：對智力測驗、成就測驗和能力傾向測驗來說，被試動機強才能有好成績。

?般來說，適度的測驗焦慮會使人提高興奮水平，促進注意力增強，反應速度加快，有利于智力測驗、成就測驗和能

力傾向類測驗的成績。但是焦慮水平過高或過低都不利于測驗。

（3）反應定勢：也叫反應風格。是被試的一種反應傾向，與測驗內(nèi)容無關。簡言之即被試的答題習慣。

定勢的種類：求“快”定勢、求“精確”定勢、喜好正面敘述的定勢、位置定勢、長選項定勢、猜測定勢。

9、主試的心理因素：主試的態(tài)度對智力測驗的成績有影響。主試的動機也會影響測驗。主試的期望對測驗結(jié)果的影

響最典型的范例是“羅森塔兒效應”。

10、被試對主試的五種需要：現(xiàn)實需要、受人尊重的需要、自我表現(xiàn)的需要、對主試權威性的需要、特殊需要。

11、如何控制主、被試交互作用引起的誤差：可建立良好的主、被試協(xié)調(diào)關系。

協(xié)調(diào)關系是指：主、被試之間產(chǎn)生的一種友好、合作、能促使被試最大限度地作好測驗的關系。

12、計分標準化的含義：

（1）對測驗編制者而言，在編制測驗時就要根據(jù)測驗的目的、性質(zhì)及題型確定一個適當?shù)挠嫹殖绦颉?/p>

（2）對施測者而言，在測驗完成以后要按測驗操作手冊上的規(guī)定要嚴格進行計分。

13、計分的一般程序：記錄被試反應、參考標準答案、計算最后得分。

14、常見的猜測修正方法：S=R—32、W/n—33、1S是真正分數(shù)、R是被試答對的題目數(shù)，W是被試答錯的題目數(shù)，

n為選擇項數(shù)目。

第4章測驗的常模和分數(shù)的解釋

1、導出分數(shù)：原始分數(shù)的意義需有參照意義標2、準才能體現(xiàn)出來，在心理測驗中，這種標準是由原始分數(shù)構(gòu)成

的分布轉(zhuǎn)換而來的分數(shù)，就叫導出分數(shù)。導出分數(shù)具有一定的參照點和單位。

2、常見的導出分數(shù)分：常模參照分數(shù)、內(nèi)容參照分數(shù)、結(jié)果參照分數(shù)。

3、常模團體：做心理測驗，得到的測驗分數(shù)需要做出有意義的解釋，因而參考標準不可缺少。導出分數(shù)是由原始分

數(shù)轉(zhuǎn)換而來，而原始分數(shù)由被試完成測驗后得到，因此，許多被試構(gòu)成的人群就是構(gòu)成參照標準的被試團體，也叫參

照團體，或叫常模團體。

常模團體是由具有某些共同特征的人所組成的一個群體，或者是該群體的一個樣本。

4、常模樣本：找一個有代表性的樣本來代表目標總體，也代表常?？傮w。這個用來代表常模總體的樣本，就是常模

樣本。常模樣本必須具備常?？傮w的基本特征。

5、常模樣本的容量：總體的數(shù)目。一般情況，最小樣本為30~100個。要是全國性的常模，一般地要求有2000~

3000人為宜。

6、取樣就是：從目標總體中選擇有代表性的樣本。一般地有兩類取樣方法：隨機抽樣和非隨機抽樣。具體說有：簡

單隨機抽樣、系統(tǒng)抽樣、分組抽樣、分層抽樣。

7、常模分數(shù)：就是施測常模樣本被試后，將被試的原始分數(shù)按一定規(guī)則轉(zhuǎn)換出來的導出分數(shù)。

8、常模分數(shù)構(gòu)成的分布是：通常所說的常模。它是解釋心理測驗分數(shù)的基礎。

人們常常會忽略常模的時間性。常模分數(shù)和常模均會隨時間的變化而改變，因此常模必須經(jīng)常修訂。

9、常模的表示方法：表格法和圖示法。

（1）表格法就是轉(zhuǎn)換表法。這種表示常模分數(shù)分布的方法是最常見的。它有三個要素：原始分數(shù)、導出分數(shù)、常模

樣本的特征描述。

（2）圖示法就是剖面圖法。

10、參照常模的解釋分數(shù)是：將被試的分數(shù)直接或間接地以常模樣本中的相對等級或相對位置來表示。另一種常見

法是以常模性質(zhì)分，可分為：發(fā)展常模（反映心理發(fā)展程）、百分位常模和標準分常模。

11、發(fā)展常模：按發(fā)展常模來解釋測驗分數(shù)，某測驗分數(shù)就表示個人在以正常途徑發(fā)展的心理特征方面處于一個

什么樣的發(fā)展水平。這些平均表現(xiàn)構(gòu)成的量表就是發(fā)展常模，象智力年齡、年級當量、發(fā)展順序量表等均為發(fā)展常模。

（1）發(fā)展順序量表：是直觀的發(fā)展常模，因為它告訴人們多大的兒童具備什么能力或行為就表明其發(fā)育正常。

(2)智力年齡：在比內(nèi)-西蒙智力量表中首先使用了智力年齡的概念。智力年齡實際上是一種年齡量表。也是用年

齡來表示測驗分數(shù)。

以智力年齡為典型代表的年齡常模在做解釋時確實非常簡捷明了，但是智力年齡并不是單位恒定相等的，而是隨年齡

的增長而增大。另外，智力年齡的概念顯然不適用于成人，成人到一定階段后智力發(fā)展相對穩(wěn)定，表現(xiàn)不出?年與?

年之間的差別。

(3)年級當量：它實際上就是年級量表，測驗結(jié)果說明屬哪一年級的水平，在教育成就測驗中最常用。

12、百分位常模是：把?個量表分成一百個位置，對不同的得分給予相應的等級評價，依據(jù)不同的等級對結(jié)果作出

解釋。

13、百分位常?？煞謨深悾喊俜值燃壓桶俜贮c。

(1)百分等級：一個測驗分數(shù)的百分等級式是指在常模樣本中低于該分數(shù)人數(shù)的百分比。百分等級是應用最廣的測

驗分數(shù)表示方法。

(2)百分點：又叫百分位數(shù)，百分點或百分位數(shù)于百分等級的計算方法正好相反。百分等級是計算低于某測驗分數(shù)

的人數(shù)百分化，而百分位數(shù)是計算處于某一百分比例的人對應的測驗分數(shù)是多少。

(3)還有兩種常見的變式：四分位數(shù)和十分位數(shù)。兩者含義相似。

14、百分位常模的優(yōu)點與缺點：易于計算、解釋、實用；不受原始得分的分數(shù)分布形態(tài)的影響。缺點是：單位不相

等，特別是分數(shù)的兩端；百分位無法說明被試間差異的原始分數(shù)量大小。

15、標準分常模：標準分數(shù)最常見的是z分數(shù)。標準分數(shù)是等距量表，它可以做加、減、乘、除運算。

常見的標準分常模：z分數(shù)、Z分數(shù)、T分數(shù)、標準九分數(shù)、離差智商(IQ)等。

標準分由原始分轉(zhuǎn)換而來，這種轉(zhuǎn)換乂可分成：線性轉(zhuǎn)換、非線性轉(zhuǎn)換。

16、線性轉(zhuǎn)換的標準分-z分數(shù)(最典型的線性轉(zhuǎn)換的標準分)。

(1)公式：z=X-(2)X/SD

X為原始分，X為樣本平均數(shù)，SD為樣本標準差。從公式看，z的含義是：它表示某一分數(shù)與平均數(shù)之差是標準差的

兒倍。

(3)z的性質(zhì)：

1平均數(shù)為0,標準差為1。

2z分數(shù)有正、負，其絕對值表示原始分與平均數(shù)間的距離正值表示原始分大于平均數(shù)，負值則相反。

3z分數(shù)的分布形態(tài)與原始分分布--致。

17、非線性轉(zhuǎn)換的標準分：

(1)T分數(shù)是：平均數(shù)為50,標準差為10的分數(shù)。即

這一詞最早由麥柯爾于1939年提出，是為了紀念推孟和桑代克對智力測驗，尤其是提出智商這一概念所作出的巨大

貢獻。

（2）標準九：是標準化九分制的簡稱。它是以5為平均數(shù)，以2為標準差的一個分數(shù)量表，最早時被廣泛應用于美

國空軍的心理測驗中。

標準九分數(shù)也是一種標準分，它將原始分劃分為9部分，最高是9分，最低1分。除1和9的范圍略大以外，其余均

是以5為中心向兩邊各包含0.5個標準差的分數(shù)段。

18、標準分常模小結(jié)：

（1）標準分常模分數(shù)均是等距分數(shù)，雖然不同類型的常模其平均數(shù)和標準差不同，但均可用離均值來表示。

（2）標準分常模的局限性：標準化常模表示的是存在狀態(tài)之間的橫向比較，離開原常模樣本，不同常模樣本之間的

比較就沒有意義。

名稱z分數(shù)和z'分數(shù)T分數(shù)標準九標準十標準二十

平均數(shù)0505510

標準差11021.53

19、離差智商及其意義（傳統(tǒng)比率智商的缺點）：

（1）心理年齡與生理年齡呈線性關系。用傳統(tǒng)的比率智商，不同年齡組的標準差不相等，從10~20都有，因此智

齡與年齡的發(fā)展并不是呈線性關系。

（2）智力增長到何時達終點仍在爭論。

1離差智商：通過與同2年齡的代表性樣本的平均數(shù)相比較來確定智商的高低。

離差智商是一種常態(tài)化標準分數(shù)，因而其計算方法與其他標準分數(shù)一樣，公式為：IQ=100+15z'。由于離差智商

的提出，過去使用比率智商的測驗都改用離差智商，其公式為：IQ=100+16z'。兩者唯一的區(qū)別是標準差：一個

是15,一個是16。

2由于標準差不同，離差智商間就不能直接比較，因為單位不等，相同的IQ值表示的智力水平也不一樣。

3常態(tài)化使得IQ的評定對智力較低者打分偏高，對智力較高者打分又偏低，而對中等智力者打分最準確。

20、效標參照測驗是：格拉塞于1963年首先提出的。它是直接向人們報告被試完成什么測驗題，能拼多少單詞，能

做什么樣的邏輯推理題等。

21、效標參照測驗的優(yōu)點：

（1）效標參照測驗巧妙地避開了對得分、名次的過細糾纏，使個人都能有自己大致的奮斗目標和希望。

（2）效標參照測驗能發(fā)現(xiàn)個人特有的長處，也會找到問題癥結(jié)所在。

（3）常模參照測驗的得分不能告訴我們評價被試的外在效標是什么，而指標參照測驗的結(jié)果本身可能就是效標。

22、對效標參照測驗的解釋的方法：內(nèi)容參照分數(shù)、結(jié)果參照分數(shù)。

23、內(nèi)容參照分數(shù)與常模參照分數(shù)的本質(zhì)區(qū)別：用內(nèi)容參照分數(shù)來解釋測驗結(jié)果，很象我們平時所說的課程考查，

只有“通過”與“不通過”，或“及格”與“不及格”之分，沒有100分與60分之分。就是說，它依據(jù)被試對某個

確定的材料或技能的掌握程度和熟悉程度來表示測驗的結(jié)果。所以它比較的對象是測驗的內(nèi)容，而非完成測驗的其他

人。

24、對內(nèi)容參照測驗的解釋有兩種內(nèi)容參照分數(shù)可供選擇：掌握分數(shù)和正確百分數(shù)。

(1)掌握分數(shù)：按效標參照的思想，最簡便的做法就是確定一個評判標準，一判斷被試是否通過或達到掌握的水平。

(2)正確百分數(shù)是指被試在測驗中答對題目的百分比例。

第5章信度

1、信度是指：測量結(jié)果的可靠性和一致性。因為心理測驗通常測量人的行為，行為會由于各種各樣的原因，因時、

因事、因地而產(chǎn)生變動，這些因素有些是偶然的，有些是固有的，人在完成心理測驗時的行為也會受上述因素的影響，

從而使測驗結(jié)果與真實結(jié)果不完全一致，所以我們要用信度來衡量測驗的可靠性和一致性。

2、信度的操作化定義：

(1)誤差理論認為：一個人的測驗分數(shù)X是由真實分數(shù)(T)和誤差(E)兩部分構(gòu)成的，公式是X=T+Eo

(2)因此信度就被定義為：?組測量分數(shù)的真實方差與實得方差的比，或者是指真實方差占總方差的百分比。公式

為：rxx=1-SE2/SX2

(3)根據(jù)統(tǒng)計學理論，真實方差與實得方差的比是一個相關系數(shù)的平方，所以我們把這種相關系數(shù)的平方叫做信度

系數(shù)。

(4)計算公式為:rxx=ST2/SX2

3、由于誤差的來源信度的可分為：這種分類是基于信度的傳統(tǒng)定義-真分數(shù)理論。

(1)重測信度：考慮的誤差來源是時間取樣。

(2)復本信度：考慮的誤差來源是內(nèi)容取樣。

(3)分半信度：它考慮的誤差來源也是內(nèi)容取樣，它與復本信度的差別是：分半信度考查一個測驗內(nèi)容的兩半題目

測量的是否是同一個心理特點行為。

(4)同質(zhì)性信度(內(nèi)部一致性系數(shù))：考慮的是測驗內(nèi)容是否異質(zhì)。

(5)評分者信度：考慮的誤差來源是評分者間的差別。

4、信度的表示方法：

(1)信度系數(shù)和信度指數(shù)：

1信度系數(shù)：rxx=rx2T=S2T/S2

2信度指數(shù)：rXT=ST/SX

(2)測量標準誤：SE=SX1-rxx

5、信度的意義：

(1)信度系數(shù)可以解釋為樣本測驗分數(shù)的總方差中有多少比例是真分數(shù)方差，也就是測驗的總變異中真分數(shù)造成的

變異占百分之兒。它直接告訴我們測量的誤差有多大。

(2)測量的標準誤可以告訴我們有多大可能性真實分數(shù)在某?吩數(shù)范圍內(nèi)，并且可以預測實得分數(shù)再測時可能的變

化情況。

6、信度的作用：

(1)解釋預測個人分數(shù)的意義。

(2)解釋真實分數(shù)與實得分數(shù)間的關系，明確告訴我們測驗誤差大小。

(3)新編的測驗信度應高于原有的同類測驗或相似測驗。

(4)下結(jié)論說某測驗比較可靠，必須是依據(jù)情境的，經(jīng)多次證實的。

(5)它是確定測驗好壞的一個指標。一般的原則是：

1當rxx<0.70時，測驗不能用于對個人作出評價或預測，而且不能做團體間比較。

2當0.70WrxxV0.85時，可用于團體比較。

3當rxx>0.85時，才可以用來鑒別或預測個人成績或作用

7、重測信度：有時也叫穩(wěn)定性，主要針對時間變量。

(1)重測信度采集數(shù)據(jù)得方法是：對同一組被試間隔一定的時間重復測試一次。

(4)重測信度的計算方法是積差相關法，因而rxx就是皮爾遜的積差相關系數(shù)。

(7)重測信度的時間間隔選擇依測驗性質(zhì)和目的而定，如果測驗是用于長期預測，則測量間隔長一些。對兒童的智

力測驗一般是兩周到四周為宜。對成年人，間隔可到半年，很少超過6個月。

(13)使用重測信度應注意：不是所有測驗都可以計算重測信度。并且重測信度只是反映了隨機誤差的影響，而不是

反映被試心理特點的長期變化。

8、復本信度：又叫等值性系數(shù)。

(1)數(shù)據(jù)采集方法是：給被試施測兩個內(nèi)容等值但題目不同的測驗，求兩組數(shù)值的相關。計算方法常見的也是積差

相關法。

(2)復本信度的高低反映了兩個互為復本的測驗等價的程度，而不是反映一個測驗本身受隨機誤差影響的大小。復

本信度的高低關鍵取決于復本測驗的選擇，因而施題目取樣問題，或者說是測驗的內(nèi)容取樣問題。

(3)復本信度優(yōu)于重測信度的地方是：避免了重測帶來的記憶效應和練習效應；可用于長期追蹤研究前后測量；減

少了作弊的可能性。

(4)復本信度的缺點：有些測驗的復本很難找到；有些測驗因正遷移效應使測驗性質(zhì)改變；如測量的內(nèi)容很容易受

練習的影響，復本信度也無法清除這種練習效應。

(5)重測復本信度，即再不同的時間里施測兩個等值的測驗(復本)，得到的相關就是重測復本信度，也叫穩(wěn)定等

值系數(shù)。它比單一的重測信度或復本信度都要嚴格、全面一-些。

9、斯皮爾曼-布朗公式：rnn=nrtt/1+(n—13、1)rtt,14>rnn是校正以后的相關系數(shù)，15、rtt是實得

的相關系數(shù)，16、n為rnn對應的測驗長度與rtt對應的測驗長度之比。分半時，17、n=N/(N/2)=2(N為

測驗全長)，18、所以分半法信度的校正公式是：rxx=2rnn/1+rhh其中rhh為兩半測驗的相關系數(shù)。

(1)盧倫公式：rxx=1-Sd2/Sx2其中Sd2是兩半測驗分數(shù)之差的方差，Sx2為總方差。

(2)從理論上分析，分半信度反映的實際上是兩半測驗能夠測量相同內(nèi)容或心理特點的程度。

10、內(nèi)部一致性信度（同質(zhì)性信度）：同質(zhì)性是指測驗的所有題目間性質(zhì)的一致性，即測的是同一種心理特質(zhì)或行

為。同質(zhì)性是測量單一特質(zhì)的必要條件。這里講的同質(zhì)性是指測驗題目得分反映的心理特質(zhì)一致，同質(zhì)性的判別標準

是：題目間呈高正相關，如果相關很低或是呈負相關，則題目為異質(zhì)。

（1）庫德和里查德森提出的K-R20公式只適合預測題目是二分法計分的?？藗惏秃誥系數(shù)適合于非二分法計分的測

驗的內(nèi)部一致性信度估計法。

（2）從同質(zhì)性信度的含義我們不難看出，分半信度是求測驗兩半之間的一致性或同質(zhì)性，而同質(zhì)性是求所有題目間

的?致性。因此分半信度實際上是同質(zhì)性信度的一種，可以作為測驗同質(zhì)性評價的粗略估計指標。因為可以根據(jù)測驗

得分來推論或驗證某種概念或理論構(gòu)思，因此同質(zhì)性信度也是?種構(gòu)思效度，或叫結(jié)構(gòu)效度，它實際上介于信度與效

度之間。

11、評分者信度：有些心理測驗的得分不是根據(jù)客觀的計分系統(tǒng)計分的，是由評分者來給被試打分，因此，這樣的

測驗的可靠性如何取決于評分者評分的一致性和穩(wěn)定性如何。

評分者信度因評分者人數(shù)不同而估計方法不一樣。如果是兩個評分者，獨立對被試的反應評分，則可以用積差相關來

計算，或用斯皮爾曼等級相關法計算。如果評分者在三人以上，而且是等級評分，則可以用“肯德爾和諧系數(shù)”（W）

來求評分者信度。

12、以測量標準誤表示信度的好處是：

（1）信度的單位與測驗分數(shù)的單位相同，因此解釋個人分數(shù)時非常直接，能直接指出允許測驗分數(shù)變化的范圍。

（2）測驗同質(zhì)與否并不影響測量標準誤的大小。測量標準誤的不足之處時：無法比較不同測驗間的信度高低。比較

不同測驗的信度用信度系數(shù)（rxx）解釋個人分數(shù)時用測量標準誤（SE）。

13、常見的影響信度的因素有：樣本特征、測驗的長度、測驗的難度、測量的時間間隔等。

14、我們做信度考驗時，常常選取一個與常模樣本性質(zhì)相同的樣本施測，根據(jù)被試得分求出信度系數(shù)。

（1）樣本團體得分分布的影響：求信度的樣本團體得分分布如果比較窄小的話信度就低。

（2）樣本團體異質(zhì)性的影響：樣本團體異質(zhì)的話，測驗分數(shù)的分布就比同質(zhì)樣本的要廣，分數(shù)的離差就大，樣本的

方差就大，信度就高。實際匕高信度可能是假性高信度，是由樣本團體的異質(zhì)造成的。但如果常模總體要求各種各

樣的人，則異質(zhì)的信度樣本求得的信度就是真信度。這時，相反的情況就需要校正信度。

（3）樣本團體平均能力水平的影響。由于信度也會因樣本間團體平均能力水平的不同而不同，因此在求信度時，一

定要注意信度樣本與常模總體間是否一致。

15、測驗的長度：在其他條件均等的情況下，測驗越長，信度越高。原因在于：

（1）測驗越長，即題目越多，測驗的內(nèi)容取樣就越有可能有代表性。

（2）測驗越長，被試的猜測因素影響就越小。

16、測驗的難度：難度對信度的影響之存在于某些測驗中，如智力測驗、成就測驗、能力傾向測驗、教育測驗等。

測驗的難度對信度有間接影響，因為如果測驗過難，被試的得分會集中在低分區(qū)。過于容易，分數(shù)則集中在高分區(qū)。

兩種情況都使信度樣本的得分范圍變窄，變異量降低，從而低估測驗信度。

17、測驗的時間間隔：這一因素之對重測信度和不同時測量時的復本信度有影響，對其余的信度來說不存在時間間

隔問題。

第6章效度

1、效度是指：測驗能測量到所要測量的對象的程度。這一定義包含著兩層含義：測驗測量什么？測驗對測量目標的

測量精確度和真實性是多少？

2、效度的公式為：rxy=SV2/SX2它是與測量目標有關的真實分數(shù)方差與總方差的比率。其中rxy是常用的效度

表示法；SV2是“有關的真實方差”，也就是由測驗所要測量的心理變量引起的方差，也叫有效方差；SX2是總方差。

3、信度和效度的差別是：兩者所涉及的誤差不同：信度僅考慮偶然的隨機誤差占測驗總變異的比例，效度則還包括

與測驗無關的但穩(wěn)定的測量誤差。

（1）信度是效度的必要而非充分條件。

（2）效度是受信度制約的。

4、效度的性質(zhì)：效度的真實含義是指測驗結(jié)果的效度，也就是測驗結(jié)果的準確程度。

（1）效度具有相對性。

（2）效度具有連續(xù)性。測驗的有效性只有程度上的差別。

（3）效度也不是直接就可以測量到的，它是從已有的證據(jù)推理而來的。

5、效度的種類：內(nèi)容效度、構(gòu)思效度和效標關聯(lián)效度。

6、效標關聯(lián)效度是指：測驗總分數(shù)與外在標20、準（效標）之間的相關程度，反映的是用測驗預測個體在某種情

境下行為的表現(xiàn)如何的有效性程度。由于外在標準成了考察測驗有效性的參照標準，因此簡稱為效標。

7、阿斯丁把效標分為兩個層次：?是理論描述水平的“觀念效標”，二是操作定義水平的“效標測量”。

（1）觀念效標是效標的理論定義，效標測量是效標的操作定義，效標測量必須能真正反映觀念效標。

（2）效標測量的一個重要特征是客觀性。為此因做到：

1避免偏見影響效標測量，特別是以等級評定為效標4測量時，評分者的主觀偏見會有很大影響。

2防止效標污染，即指個人的效標因評定者知道個體的測驗分數(shù)（也叫預測源分數(shù)）而受到影響。

8、常用的效標：學業(yè)成就、臨床診斷、實際工作表現(xiàn)、特殊訓練成績、效標團體比較、先前有效的測驗、等級評定。

9、同時效度：它的效標資料是和測驗分數(shù)差不多同時搜集的.一般情況下，它可以代替預測效度。

10、預測效度的效標是經(jīng)過?段時間以后才獲得的，預測效度反映的是從測驗分數(shù)預測任何效標情境或?段時間后

被試的行為表現(xiàn)的程度。

11、構(gòu)思效度就是：心理測驗對某一理論概念或特質(zhì)測量的程度。因此，研究構(gòu)思效度就是要搞清楚：測驗測量的

是什么構(gòu)思（概念或特質(zhì)）？測驗分數(shù)的變異中有多少來自于測驗的理論構(gòu)思？構(gòu)思效度是沒有單指標的，它是由

各方面證據(jù)累積起來作出評價的。

12、確定構(gòu)思效度的基本步驟：建立理論框架、根據(jù)理論框架推演出有關測驗成績的假設、用邏輯或?qū)嵶C的方法來

證明假設。

13、確定構(gòu)思效度的方法：測驗內(nèi)部的方法、測驗間的方法、效標效度的研究、實驗和觀察法驗證。

(1)測驗內(nèi)方法：這類方法是通過研究測驗內(nèi)部結(jié)構(gòu)來界定理論構(gòu)思，從而為構(gòu)思效度提供證據(jù)。

(2)確定方法是：分析測驗的內(nèi)容效度和測驗的內(nèi)部一致性分析。測驗的內(nèi)部一致性可以由分半信度、a系數(shù)、KR20

或KR21等指標來衡量，它們考察的是測驗題目是否同質(zhì)，分測驗與總測驗是否一致或同質(zhì)，這些都可以證明測驗所

測量的構(gòu)思是否合理，因而構(gòu)成了證實構(gòu)思效度高低的證據(jù)。

(3)有時分析被試對題目的反應特點也可以作為構(gòu)思效度的證據(jù)。

(4)測驗間的方法：通過分析幾個測驗間的相關關系，找出其共同之處，進行推斷這些測驗測量的特質(zhì)是什么，也

可以確定這些測驗構(gòu)思效度如何。最簡單的方法是計算兩種測驗之間得分的相關。區(qū)分效度是構(gòu)思效度的又一個證據(jù)。

因素分析法也是建立構(gòu)思效度的常用方法。

(5)實驗法和觀察法證實：觀察實驗前和實驗后分數(shù)的差異也是驗證構(gòu)思效度的方法之一。

14、內(nèi)容效度是指：測驗題目對有關內(nèi)容或行為總體取樣的適當性程度。因為這種效度主要是考察測驗的內(nèi)容，因

此叫內(nèi)容效度。

(1)要想使測驗的內(nèi)容效度高，必須又兩個條件：內(nèi)容的范圍或行為總體必須界定名確；測驗題目應該是所界定的

內(nèi)容范圍的代表性樣本。

(2)內(nèi)容效度的確定方法：專家判斷、經(jīng)驗判斷、統(tǒng)計分析法。

15、表面效度是指：一個測驗看起來好象是測量所要測的東西的程度。換句話說，當那些未經(jīng)過訓練的被試或測驗

應用者認為某測驗是有效的測驗時，該測驗就有表面效度。

16、效度的指標是指：效標關聯(lián)效度和構(gòu)思效度的的指標。效度指標一般有：效度系數(shù)、統(tǒng)計推斷參數(shù)、預期表等。

17、效度系數(shù)：它是最常用的效度指標，尤其是效標關聯(lián)效度。它是以皮爾遜積差相關系數(shù)來表示的。效度系數(shù)的

實際意義常以決定性系數(shù)來表示，表達式是rx2y,效度系數(shù)的平方就是決定性系數(shù)，測驗正確預測或解釋的效標的

方差占總方差的比例。

18、效度的其他指標：一些描述不同團體的差異的統(tǒng)計指標(參數(shù))也可以作為效度的指標，比如：t考驗、F考驗、

重疊百分比等。

19、效度的影響因素：測驗本身的因素、測驗施測的樣本的性質(zhì)、效標的性質(zhì)等。

(1)對于測驗本身因素又可分為：測驗題目的質(zhì)量、測驗的長度、測驗實施中的干擾、被試的因素等。

(2)樣本的性質(zhì)：

1影響之一是：不同的團體對同一測驗的反應可能會不一樣，因被試的背景不同，對測驗的題目可能采取完全不同的

方法來回答。

2、響之二是：同一個測驗，效度團體的性質(zhì)不同，效度也會有很大差別。效度團體的性質(zhì)包括年齡、性別、教育程

度、智力水平、動機、職業(yè)等有關的特點，1這些性質(zhì)特點使測驗對不同的團體具有不同的預測能力。故稱為干涉變

量。

3影響之三是：樣本團體的異質(zhì)性。其他條件相同的時候，樣本同質(zhì)性越高，效度越低。

第7章項目分析

1、項目分析是指：?組分析被試對測驗項目的反應的統(tǒng)計方法，而廣義的項目分析則還包括內(nèi)容效度分析和項目

編寫的分析。

2最簡便的難度指標通過率：所謂通過率就是在回答某個項目的樣本中，正確回答該項目的人數(shù)的百分比。

3項目難度與測驗難度的確定：

（1）對題目難度來說，如果項目過難或過易，就會造成被試基本上都答錯或基本上都答對了，也就是P值接近0

或1,這樣也就不能區(qū)分被試能力的差異。大體而言，項目難度為.50時最理想，此時項目具有最大鑒別力。

（2）在實際操作時，一般只需使項目的平均難度接近.50而各個項目的難度在.50±.20之間變化。如果測驗是用于

選拔或診斷，則最好多選一些難度與錄取線接近的項目。在項目選擇上還有一個要注意的問題是：當項目形式是選擇

題時，要考慮到讓P值大于概率水平，否則項目是無效的。

4鑒別力分析的設想基礎：如果單個項目與測驗測的是同11、一特性，那么我們可以預期在測驗上得高分的人正確

回答這一問題的概率大，而在測驗上得低分的人正確回答這一問題的概率低。鑒別力分析就是在這一設想的基礎上進

行的。項目的鑒別力就是其對于所測量的心理特性的區(qū)分能力。

5、鑒別力分析的一般方法：鑒別力指數(shù)、項目-總分相關、項目間相關。

6鑒別力指數(shù)是：運用極端組計算項目鑒別力的一種簡單方法。公式為：D=PH-PL是高分組在項目上的通過率，

而是低分組在項目上的通過率。

當D<.19是，項目差，必須淘汰；但D在.20~.29之間時，項目尚可，但必須修改；當D在.30~.39之間時;項

目良好，但還是最好稍做修改；而當D.>40時，項目完全可以被接受，但一般測驗，D>.30項目就可以接受了。

7項目總分相關是：被試在項目上的得分與其總測驗分的簡單相關。

8難度水平與鑒別力：難度水平直接限制了一個項目的鑒別力。如果當P值接近.50,項目最可能具有高的鑒別力。

但是，P值接近.50并不能保證項目有高的鑒別力，只能說在統(tǒng)計上已經(jīng)沒有限制了。

9項目特征曲線：運用圖象直觀地顯示了隨著測驗者某種心理特征水平的變化，正確回答某個項目的概率是如何變化

的。項目特征曲線是現(xiàn)代心理測量學最有影響的理論之一-項目反應理論或稱潛特征理論的基礎。ICC歸納了項目分

析的信息，顯示了心理能力水平與項目反應之間的關系。

當項目-總體相關為正時，ICC的斜率也是正的；當相關接近0時，ICC斜率也接近于0；當相關為負時，ICC斜率為

負。

10、剪裁測驗：如果能使測驗適合于每個測驗者的水平，那么就不用對每個人施測長長的每個能力水平上均有項目的

測驗。這種測驗就稱為剪裁測驗，又稱計算機化的適應測驗。

第8章智力測驗

1、關于智力的定義：

(1)斯皮爾曼(Spearman)認為：智力是一種普遍的能力，它主要涉及聯(lián)系的引出和相關的引出。

(2比內(nèi)和西蒙(Binet&Simon)認為：智力是正確地進行理解、判斷和推理的能力。

(3韋克斯勒(Wechsler)認為：智力是個體有目的地行動，理性地思考以及有效地應付環(huán)境的總體能力。

2、智力是：通過經(jīng)驗進行學習的能力；適應環(huán)境的能力。

3、智力的理論-Spearman和g因素：

(1)在對各種智力和感覺能力的相關模式進行廣泛研究之后，提出智力由兩種因素組成：?個一般因素g、若干個

特殊因素S。

(2它認為g因子是整個大腦皮層共有的能力或能量，而S因子只是代表了大腦中某些神經(jīng)元的生理功能。

4、智力的理論-Thurstone與基本心理能力：Thrustone總結(jié)出了七種基本心理能力：語詞理解、數(shù)字、空間、知覺

速度、語詞流暢性、聯(lián)想記憶、歸納推理。

5、智力的理論-Cattell與流體智力-晶體智力：Cattell確定了兩大因素：流體智力、晶體智力。

(1)流體智力：基本上是非語言、相對不受文化因素影響的心理功能。它與個體通過遺傳獲得的學習利解決問題的

能力有聯(lián)系。

(2晶體智力高度依賴于文化，是個體完成那些需要習得性或習慣性反應任務的能力。晶體智力是流體智力運用在不

同文化環(huán)境中的產(chǎn)物。

6、智力的理論-Piaget的認知發(fā)展理論：主要觀點：

(1)兒童的思維與成人的思維存在質(zhì)的差別。守恒是指：在物體表面看來發(fā)生變化時，能意識到物體的實質(zhì)沒有變

化。

(2認知發(fā)展可分為四個階段：感覺運動階段、前運算階段、具體運算階段、形式運算階段。

(3圖式是知識獲得的基礎。圖式是經(jīng)過組織的行為模式或定義明確的心理結(jié)構(gòu)。

7,Guilford與智力結(jié)構(gòu)模型：Guilford在1967年提出了一個智力結(jié)構(gòu)模型。這一模型為三維立方體，每一維代表

一個變量。它包括：

(1)自變量：代表思維的內(nèi)容。

(2)中間變量：代表思維的操作。

(3)因變量：代表思維的產(chǎn)物。

8Sternberg與智力的三主理論：該理論包括三方面：成分智力、經(jīng)驗智力、情境智力。

9韋克斯勒智力測驗：

(1)韋克斯勒是從1932年開始他的測驗編制的.目的是為了設計一個適合于測量精神病人的智力測驗。第一個韋氏

測驗出版在1938年。他將量表分為言語、操作兩大部分。這一區(qū)分使我們可以比較測驗者使用詞語和符號的能力和

操作實物、感知視覺模式的能力。

(2)韋氏驗的一般特點：

1幾個重要的韋氏測驗：1939年韋克斯勒-貝利弗測驗；1949年韋克斯勒兒童智力量表(WISC)；1974年韋克斯勒

兒童智力量表修訂版(WISC-R)；1991年韋克斯勒兒童智力量表第三版(WISC-11I)?

2各個韋氏測驗的特點：

A.10~12個分測驗：多個分測驗使我們不B.僅得到總IQ,C.而D.且可以分析個體智力上的強點和弱點。

E.言語量表和操作量表各由5~6各分測驗組成。這體現(xiàn)了左右腦功能的整合。

F.共同G.的IQ計分系統(tǒng)。這使我們可以比較被試的分測驗分數(shù)，H.了解其相對強弱。

I.不J.同K.年齡組由相同L.的分測驗有助于測驗間的相互比較。

3韋克斯勒測驗的分測驗：常識、數(shù)字廣度、詞匯、算術、領悟、相似性、填圖、圖片排列、積木圖案、物體拼湊、

譯碼或數(shù)字符號、迷津、句子、幾何圖形、動物房。

A.常識是：一般知識性知識問題，B.要求被試用兒句話或兒個數(shù)字回答，C.問題從易到難排列。缺點是容易受到

文化背景和被試熟悉程度的影響。

D.數(shù)字廣度：由順背和倒背兩部分組成。

(4)韋氏成人智力量表修訂版：WAIS-R共有11個分測驗，其中包括六個言語量表：常識、數(shù)字廣度、詞匯、算術、

領悟、相似性；五個操作量表：填圖、圖片排列、積木圖案、物體拼湊、數(shù)字符號。所有11個分測驗分數(shù)合并成全

量表分數(shù)，并可以分別求得三個智力商數(shù)：言語智商(VIQ)、操作智商(PIQ)、總智商(FIQ)。

WAIS-R的標準化，被試年齡從16~74歲。

(5)韋氏兒童智力測驗修訂版(WISC-R)適用于6~16歲兒童。它由五個言語分測驗和五個操作分測驗組成。此外

還有2個補充分測驗。

(6)韋氏學前和小學兒童智力測驗修訂版(WPPSI-R)該測驗與WPPSI極為相似，只是年齡范圍從原來的4~6.5

歲兒童擴展到3~7歲3個月兒童。

(7)韋氏智力量表中國修訂版：從1979年起中國韋氏測驗的修訂工作由湖南醫(yī)學院龔耀先教授主持進行，于1982

年出版了WAIS的中國修訂版,WAIS-RC?

10個體智力測驗：

(1)斯坦福-比內(nèi)智力量表：

11916年量表：首先采用了智商這一概念。

21937年量表：年齡范圍從1916年量表的3~13歲擴展為2~18歲，并且編制了測驗復本，分別為L型和M型。

31960年量表：該量表采用離差智商。

4斯坦福-比內(nèi)第四版(SB：FE)：該版的最大改變在于采用智力層次模型來劃分和構(gòu)建分測驗。

SB：FE的智力模型：SB：FE的編制者用一個三層次的認知能力結(jié)構(gòu)模型作為編制量表的框架。這一模型的最高層是

一般智力g因子：第二層分成晶體智力和流體智力，此外乂增加了短時記憶能力。短時記憶能力包括珠子記憶、句子

記憶、數(shù)字記憶和物體記憶四個分測驗。

(2)考夫曼兒童成套評估測驗(K-ABC)是智力和成就的綜合測量。K-ABC是以神經(jīng)心理學和認知心理學研究為基

礎，以“個體問題解決和信息加工模式”定義智力。

K-ABC提供四個方面的分數(shù)：系列加工、同時加工、綜合心理加工、成就測驗。

(3)能力區(qū)分量表(DAS)：適用于2歲6個月到17歲11個月的兒童。

11團體測驗于個體測驗的差異：

團體測驗采用多項選擇，而個體測驗多采用開放式問題。

團體測驗多采用客觀的計算機評分，而個體測驗?般為施測者評分。

團體測驗為團體施測，個體測驗為個體施測。

團體測驗多用于篩選，而個體測驗多用于診斷及彌補工作。

團體測驗標準化樣本極大，而個體測驗一般只用幾千名精心挑選的被試。

12團體智力測驗:

(1)文化公平智力測驗(CFIT)是：一個非言語流體智力測量，最早由R.B.Cattell發(fā)表在《教育心理學》期刊上,

它的目標是測量流體智力，避免文化因素的干擾。

(2)瑞文漸進測驗(RPM)：該測驗既可以個體施測，但更多作為團體施測。

該測驗實際上是三個不同的測驗：瑞文兒童彩色漸進測驗、瑞文標準漸進測驗、瑞文高級漸進測驗。

我國由北京師范大學張厚桀教授主持，從1985年起對瑞文測驗進行修訂。

13圖書群體測驗的類型：非言語測驗(古德依納芙-哈里斯繪人測驗)、非閱讀性測驗、嬰兒智力測驗、發(fā)展程序表。

14非閱讀和非動作蒯驗-皮波迪圖畫詞匯測驗修訂本(PPVT-R)是:由LM.Dunn編制，1981年修訂的測驗。測驗由

175張圖片組成，每張圖片上有4個圖形。PPVT-R適用于2歲半到成人，測驗需用時10~20分鐘。由于不需要語言

反應，所以常用于言語障礙、大腦麻痹、閱讀困難和智力落后的被試及孤僻、注意不集中的兒童。

15、嬰兒智力量表：

(1)葛塞爾發(fā)展程序表：該量表是最早編制于1925年的第一個嬰兒智力量表。測量包括五個領域：大運動、精細

運動、語言發(fā)展、適應行為、個體-社會行為。這?量表主要用于臨床篩查和診斷。

(2)丹佛發(fā)展篩查測驗(DDST)：主要用于篩查智力發(fā)展的大致范圍，它評定了四個行為領域：個人-社會行為、

精細動作適應行為、語言、大運動。

16、遺傳和環(huán)境對智力的影響：遺傳對智力的影響在研究中一般用遺傳指數(shù)來表示。遺傳指數(shù)為0意味著遺傳在某種

特質(zhì)上不起作用；遺傳指數(shù)為1意味著遺傳完全決定了特質(zhì)。當然，遺傳對大多數(shù)特質(zhì)的影響介于0、1之間。

第9章能力傾向測驗

1、能力傾向測驗一般指：測量從事某種職業(yè)或活動的潛在能力的評估工具。

2、能力傾向測驗可分成：一般能力傾向測驗、特殊能力傾向測驗和多因素能力傾向測驗。其中?般能力傾向測驗現(xiàn)

在就是指4、智力測驗。而5、狹義的能力傾向測驗專指6、后兩者。

3、能力傾向測驗與智力測驗的關系：

（1）智力測驗一般得到的是對個體總智能的評估分數(shù)，而能力傾向測驗則測量的是某種特定的或多因素的組合。

（2）智力測驗與能力傾向測驗的另一個區(qū)別就是：克倫巴赫提出的帶寬和精確度。帶寬是指測驗可預測的效標全距,

測驗能預測的效標總數(shù)越大，則這個測驗的帶寬越大，智力測驗比能力傾向測驗的帶寬普遍要大。精確度是指測驗可

在多大程度上預測效標，一般而言能力傾向測驗的精確讀為更大一些。

4、能力傾向測驗發(fā)展主要的原因：

（1）智力測驗的局限：早期智力測驗的編制者，希望通過廣泛地測量心理功能，從而估計個體的總體智力水平。但

是所謂的智力測驗只是涉及到智力的某些方面而已。

（2）體能力傾向的差異：個體在某一測驗的各部分上的作業(yè)，常常表現(xiàn)出顯著的差異。這種個體內(nèi)變異在智力測驗

上表現(xiàn)為分測驗得分的差異。智力測驗往往不足以作出這種個體能力傾向差異的分析。

（3）素分析技術的發(fā)展：因素分析使我們能夠編制多重能力傾向測驗，從而為個體各種能力傾向的強弱提供比較。

來自實際的需要。

5、能力傾向測驗的特點：能力傾向測驗預測失敗比預測成功更為正確；必須審慎解釋各種特殊能力分數(shù)間的差異；

能力傾向測驗在訓練計劃中應審慎運用。

6、多因素能力傾向測驗：該測驗被用來測量個體在不同領域內(nèi)的技能和知識，從而為職業(yè)咨詢、分類和人員安置提

供最有效的信息。這種測驗的結(jié)果不是一個總分或IQ,而是一組不同能力傾向的分數(shù)，它們提供了一種智能剖面圖，

顯示出個體的強點和弱點。

7、多因素能力傾向測驗發(fā)展的原因：對個體內(nèi)在差異的認識、對一般智力測驗特征性的認識、職業(yè)咨詢和分類的需

要。統(tǒng)計學發(fā)展的影響。

8、工業(yè)能力傾向成套測驗：多用于工商業(yè)的人員選擇與安置。它包含了測驗有一般智力測驗及數(shù)學、知覺、機械和

心理運動能力測驗。它還建立了一組職業(yè)能力模式。

9、一般能力傾向測驗（GATB）：由美國就業(yè)服務社編制。研究者們在工作分析和對59各測驗因素分析的基礎上，

設計了GATB,主要用于職業(yè)咨詢。它共有12個分測驗，8個紙筆測驗和4個儀器測驗。適用于高中至成人。

第10章成就測驗

1、成就測驗的歷史發(fā)展：

（1）最遲在漢朝，中國便已經(jīng)有了非正式的考試制度。公元1370年（明朝初期）筆試成為科舉取士的一部分，這

可視為成就測驗的正式開始。

（2）今天在世界各地廣泛應用的標準化成就測驗發(fā)源于美國，始創(chuàng)者是賴斯。另外一個早期的奠基人是桑代克。并

且桑代克被公認為是教育測驗的鼻祖。

2、成就測驗和智力測驗、能力傾向測驗的區(qū)別：成就測驗和智力測驗、能力傾向測驗的測量對象都是認知性特質(zhì)。

這三種測驗都是測量個體從與環(huán)境的相互作用經(jīng)驗中發(fā)展出來的能力。所以在本質(zhì)上，它們有相同之處。能力傾向、

智力測驗所測量的也可以看作一種“成就”。不過，如果從測驗的目的、性質(zhì)及所含蓋的經(jīng)驗范圍來看，這三種測驗

仍有某些不同之處，不能相互取代。

就測驗的對象而言，三者本質(zhì)上有重疊之處，無法加以截然區(qū)分。大多學者認為成就測驗測量的是一些特定的、限定

于某一范圍的能力和知識，而另兩者所測驗的則為一般性的、較為廣泛的能力。

從功能上看，成就測驗也不同于智力、能力傾向測驗。后兩者的主要功能是預測一個人在未來的教育、訓練或工作經(jīng)

驗中可能的表現(xiàn)，它們的使用是在教育或訓練程序以前，用以反映被試是否有接受某種課程或?qū)I(yè)技能訓練的能力。

成就測驗則是評估被試在接受一些教育或訓練程序后所獲得的學習成果，它的實施發(fā)生在教育、訓練過程后。在測驗

的技術品質(zhì)上，成就測驗要注重內(nèi)容效度，而能力傾向、智力測驗則必須有較高的預測效度，否則就失去其基本價值。

3成就測驗的功能：考查和報告學習成就、篩選和安置、診斷、評估教育計劃或教育質(zhì)量。成就測驗可以用于評估某

種教學法和教學程序的功效，以作為改進教材和教法的參考。

4、成就測驗的分類：成就測驗可從其內(nèi)容、用途、編制方法和原理等四個方面進行分類，具體可分為：單科測驗與

成套測驗、評估性測驗和診斷性測驗、標準化測驗和教師自編測驗、常模參照測驗和效標參照測驗。

5低成就與學習障礙的評估：

（1）低成就是指：學生在學業(yè)上的成就低于其所具有的學習能力。

（2）學習障礙可視為低成就中的一類。有關學習障礙的定義，使用最廣的是美國聯(lián)邦法的規(guī)定：”學習障礙是指和

口頭或書面語言的理解和應用有關的一種或多種基本心理過程有障礙，這種障礙可表現(xiàn)在聽、想、說、讀、寫或數(shù)學

運算的能力不足。”

（3）學習障礙的特點：

1學習成就和?般智力之間不一致。

2習障礙的絕大多數(shù)定義包含了排除標準。

3障礙是異質(zhì)性的。

4習障礙是一類發(fā)展現(xiàn)象。

5習障礙個體經(jīng)常會因?qū)W業(yè)成就差而8遇到社會交往和情緒適應上的困難。

6學習障礙的評估：

（1）在學習障礙的評估中，最基本的工具是：信度、效度可靠的成就和智力測驗。大多數(shù)學習障礙組合測驗包括這

兩個領域的主要測量工具，如斯坦福-比內(nèi)智力測驗、韋克斯勒兒童智力測驗及皮波迪個人成就測驗、考夫曼教育成

就測驗等。

（2）為了保證兒童能從學業(yè)方面的補救措施中受益，測驗者有必要了解是否有社會交往和情緒適應問題。在這方面

常用的測驗工具有：兒童人格問卷（PIC）和考納斯教師評定量表（CTRS）。

7兒童多動癥的評估：兒童多動癥或稱注意缺陷多動癥（ADHD）是--種行為綜合癥。癥狀為注意缺陷、多動，21、患

者有輕微的腦功能障礙。考納斯編制了一系列辨別兒童多動及其他行為問題的評定量表。其中，22、考納斯教師評

定量表有兩種版式，23、一個包含28個項目（CTRS-28）,24、一個包含39個項目（CTBS-39）。另外考納斯父母

評定量表（CPRS）也有兩個版式：一個包含48個項目（CPRS-48）,25、另一個包含93個項目（CPRS-93）。

第11章人格測驗

1、心理測驗依據(jù)所測量的心理特質(zhì)或行為，2、分為：認知性和非認知性兩大類。非認知性測驗所測的特質(zhì)或行為

是情感性的。按照知、情、意的傳統(tǒng)三分法，前者是對知的方面，后者則是對情和意的方面的測驗。

2、認知性測驗和非認知性測驗的區(qū)別：

（1）認知性測驗和非認知性測驗在對被試的要求上，有一個很大的不同。認知性測驗基本上是最佳表現(xiàn)測驗，其目

的是測得被試的最高能力或水平，被試應該盡最大努力做正確回答。而非認知性測驗是典型表現(xiàn)測驗，其目的是對被

試的II常一般行為做代表性的取樣，而不是測量其是否有行為能力。非認知性測驗的答案并無“對”、“錯”之分。

測驗者關心的是被試的反應能否確切地代表他或她的典型行為。

（2）非認知性性質(zhì)的測量中，人格測驗都占有中心的地位。廣義的人格是指：個體所具有的能力、能力傾向、需要、

動機、情緒、性格、興趣、態(tài)度及其它心理和行為的差異的總和，既包括認知性變量，又包括情感性變量。

3、自陳量表：又稱自陳問卷，是由被試本人對自己的人格特質(zhì)，按照自己的意見進

人人文庫> 全部分類> 教育資料 > 輔導培訓

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

心理測量串講及試卷

文檔簡介

溫馨提示

最新文檔

評論

心理測量串講及試卷

文檔簡介

溫馨提示

最新文檔

評論

相關文檔