教育督導、評價與監(jiān)測——自學考試蘇君陽(第14-18章)_第1頁
教育督導、評價與監(jiān)測——自學考試蘇君陽(第14-18章)_第2頁
教育督導、評價與監(jiān)測——自學考試蘇君陽(第14-18章)_第3頁
教育督導、評價與監(jiān)測——自學考試蘇君陽(第14-18章)_第4頁
教育督導、評價與監(jiān)測——自學考試蘇君陽(第14-18章)_第5頁
已閱讀5頁,還剩112頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、教育督導、評價與監(jiān)測,第十四章 教育質(zhì)量監(jiān)測概述,第一節(jié) 教育質(zhì)量監(jiān)測的內(nèi)涵和特征一、教育質(zhì)量的內(nèi)涵1、含義:教育質(zhì)量,即以學生的全面發(fā)展為核心,學生在完成各學段教育時,具備的與進步開學,進入社會或今后發(fā)展有關(guān)的基本能力和關(guān)鍵素養(yǎng)。2、內(nèi)涵:第一,系統(tǒng)化的教育質(zhì)量觀。教育質(zhì)量的內(nèi)涵是多方位、全過程、多層次的,具有系統(tǒng)性。第二,教育質(zhì)量的衡量是以學生發(fā)展為核心的。第三,學生的發(fā)展是全面的、多元的。,二、教育質(zhì)量監(jiān)測的內(nèi)涵與特征1、含義:教育質(zhì)量監(jiān)測,也稱教育質(zhì)量監(jiān)控,是指通過對本國關(guān)鍵年齡階段學生學習的若干主要課程在一定時間間隔內(nèi)進行的抽樣測試,及時發(fā)現(xiàn)可能存在的質(zhì)量問題,以便教育決策部門調(diào)解教

2、育政策、控制教育行為,從而保障教育質(zhì)量不斷提升的過程。,2、特點第一,教育質(zhì)量監(jiān)測受到各國重視,在全世界范圍內(nèi)廣泛開展。第二,評價內(nèi)容全面化,反映教育現(xiàn)代化的要求。第三,評價理論和技術(shù)不斷突破,提高了教育質(zhì)量檢測的準確性。第四,評價主體的多元化,提高了評價的民主性和科學性。,第二節(jié) 教育質(zhì)量監(jiān)測的功能和理論基礎(chǔ),一、教育質(zhì)量監(jiān)測的目的與意義1、目的:義務(wù)教育質(zhì)量監(jiān)測的目的,是客觀反映學生學業(yè)質(zhì)量、身心健康及變化情況,深入分析影響義務(wù)教育質(zhì)量的主要原因,為轉(zhuǎn)變教育管理方式和改進學校教育教學提供參考,引導社會樹立正確的教育質(zhì)量觀,糾正以升學率作為評價學校和學生的唯一標準的做法,推動義務(wù)教育質(zhì)量和學

3、生健康水平不斷提升。,2、意義:實施國家義務(wù)教育質(zhì)量監(jiān)測的意義:首先,教育質(zhì)量監(jiān)測是教育質(zhì)量的重要保障。其次,實施國家基礎(chǔ)教育質(zhì)量監(jiān)測是發(fā)達國家的同行做法,體現(xiàn)了國家對教育的責任。再次,實施國家基礎(chǔ)教育質(zhì)量監(jiān)測是推進課程改革、實施素質(zhì)教育的關(guān)鍵環(huán)節(jié)。最后,教育質(zhì)量監(jiān)測是國民獲得優(yōu)質(zhì)教育和公平的受教育權(quán)利的重要保障。,二、教育質(zhì)量監(jiān)測理論基礎(chǔ)教育質(zhì)量監(jiān)測以教育測量學作為理論基礎(chǔ),教育測量學的三個分支理論:經(jīng)典測量理論、概化理論、項目反映理論,都是教育質(zhì)量監(jiān)測的重要理論基礎(chǔ)。,(一)經(jīng)典測量理論(CTT)由美國學者格里克森在1950年心理測驗理論一書中系統(tǒng)提出,CTT也稱為真分數(shù)理論,是最早實現(xiàn)數(shù)

4、學形式化的測量理論,是以真分數(shù)理論為核心理論假設(shè)的測量理論及其方法體系。真分數(shù)的數(shù)學模型為:X=T+E,其中T為真分數(shù),X為觀察分數(shù)。,(二)概化理論(GT)概化理論由克倫巴赫等在行為測量的可考性:概化理論一書中正式提出。概化理論認為,測量的總方差可以分解為代表目標測量的方差成分和構(gòu)成誤差的種種方差成分。測量工作要加以認識的心理特質(zhì)水平是測量目標,而構(gòu)成測量條件與具體情境關(guān)系的因素,成為測量側(cè)面。,(三)項目反應(yīng)理論(IRT)含義:又稱題目反應(yīng)理論、潛在特質(zhì)理論,是在反對和克服經(jīng)典測驗理論的不足之中發(fā)展起來的一種現(xiàn)代測量理論。IRT的基本思想與心理學中關(guān)于潛在特質(zhì)的一般理論有關(guān)。它假設(shè)被試對測

5、驗的反應(yīng)受到某種心理特質(zhì)支配。IRT可以估計出該被試這種特質(zhì)的分數(shù),并根據(jù)其高低來預測、解釋被試對項目或測驗的反應(yīng)。項目反應(yīng)理論有三條基本假設(shè):一是單維性假設(shè)。二是局部獨立性假設(shè)。三是項目特征曲線假設(shè)。,(四)計算機自適應(yīng)測驗(CAT)計算機自適應(yīng)測驗,是用項目反應(yīng)理論建立題庫,并由計算機模仿聰明主考官的做法,每次都呈現(xiàn)難度與考生能力水平接近的題目,能夠準確的估計考生的潛在特質(zhì)。其目的在于通過被試正確回答題目難度的高低來評價其能力。,第三節(jié) 教育質(zhì)量監(jiān)測的進展與發(fā)展趨勢,一、國際社會教育質(zhì)量監(jiān)測的進展與發(fā)展趨勢(一)測量工具日益精準化。測量工具的研究日益精細化,更加追求同時反映個體和群體真實教

6、育情況的高質(zhì)量測量工具的研發(fā)。這對于更好地挖掘教育本質(zhì)、把握教育規(guī)律,從而促進學生的全面健康發(fā)展提供了更加個性化、人性化的經(jīng)驗。,(二)更加注重對教育均衡測評數(shù)據(jù)的挖掘運用教育資源的再分配,尤其是分配到資源不均勻的地區(qū),應(yīng)考慮如何降低行動的復雜性,采取有效干預策略,消除教育中的不平等現(xiàn)象。(三)更加關(guān)注對特殊群體數(shù)據(jù)的挖掘應(yīng)用教學應(yīng)該為學生提供人道幫助,為他們提供助教,且提供助教的對象不僅包括學習有障礙的學生,也應(yīng)該包括一般學生。,二、我國教育質(zhì)量監(jiān)測的進展與發(fā)展趨勢近年來,國家明確提出了建立國家義務(wù)教育質(zhì)量基本標準和監(jiān)測制度的要求,全面啟動了基礎(chǔ)教育質(zhì)量監(jiān)測體系建設(shè)的工作,出臺了一系列重要舉

7、措,鼓勵和支持一大批試驗性、示范性的探索嘗試,取得了突出的建設(shè)成效。在監(jiān)測實施工作中,形成了以教育督導系統(tǒng)為主,教研、考試、基教等其他系統(tǒng)為輔的監(jiān)測數(shù)據(jù)采集隊伍,并建立了國家規(guī)劃設(shè)計、省級統(tǒng)籌協(xié)調(diào)、縣級操作執(zhí)行的數(shù)據(jù)采集模式。,(一)我國教育質(zhì)量監(jiān)測的主要進展1、國家義務(wù)教育質(zhì)量監(jiān)測工作的持續(xù)開展作為國家義務(wù)教育質(zhì)量監(jiān)測的實施單位,教育部基礎(chǔ)教育質(zhì)量檢測中心研制了義務(wù)教育質(zhì)量監(jiān)測 指標體系,開發(fā)了義務(wù)教育學生學業(yè)質(zhì)量監(jiān)測工具,建設(shè)了規(guī)范的監(jiān)測流程和標準。全國監(jiān)測規(guī)模巨大,經(jīng)過嚴格、科學的命題、標準劃定、問卷編制、PPS抽樣、監(jiān)測實施、數(shù)據(jù)統(tǒng)計、報告撰寫等環(huán)節(jié),積累了大量的數(shù)據(jù),反映了全國義務(wù)教

8、育質(zhì)量及其影響因素狀況。,2、全國基礎(chǔ)教育質(zhì)量監(jiān)測網(wǎng)絡(luò)基本形成截至2016年底,全國有25個升級單位成立基礎(chǔ)教育質(zhì)量監(jiān)測機構(gòu),同時市級監(jiān)測機構(gòu)不斷建立,區(qū)縣級監(jiān)測機構(gòu)也逐步建立,全國已經(jīng)初步成立四級監(jiān)測機構(gòu),基本形成檢測網(wǎng)絡(luò)。,3、地方基礎(chǔ)教育質(zhì)量監(jiān)測模式構(gòu)建初步形成三種模式:一是地方購買國家監(jiān)測服務(wù)的模式。以廣東省、安徽合肥市包河區(qū)為代表。二是地方自主實時監(jiān)測的模式。以重慶市、浙江省臺州市為代表。三是委托第三方實施監(jiān)測的模式。以河南省為代表。(河南省教育評價中心),(二)我國教育質(zhì)量監(jiān)測的發(fā)展趨勢1、完善教育質(zhì)量監(jiān)測體系健康的教育質(zhì)量監(jiān)測體系,就是在教育質(zhì)量國家標準的指導下,形成各級教育質(zhì)量

9、監(jiān)測機構(gòu),各司其職,相互配合,全面掌握教育質(zhì)量和動態(tài)的格局。一是加快建立現(xiàn)代化的教育質(zhì)量國家標準。二是完善教育質(zhì)量監(jiān)測網(wǎng)絡(luò),厘清各級教育監(jiān)測機構(gòu)及其職能。三是委托第三方專業(yè)監(jiān)測評價機構(gòu),促進監(jiān)測體系專業(yè)化建設(shè)。,2、開展以學生發(fā)展為導向的教育監(jiān)測評價方法改革教育監(jiān)測評價方法改革,應(yīng)以第四代教育評價理念和理論為基礎(chǔ),結(jié)合認知診斷理論、多維項目反應(yīng)理論等量化評價的最新理論,并融合檔案袋評價等質(zhì)性評價方法,提高評價的準確性、有效性和可靠性。運用信息和網(wǎng)絡(luò)技術(shù),著眼于學生發(fā)展,從傳統(tǒng)、片面的知識掌握性監(jiān)測向現(xiàn)代、全面的真實性評價轉(zhuǎn)變。第一,改變將紙筆測驗作為唯一的或主要的評價手段的現(xiàn)狀,運用多種評價方

10、法對學生進行評價。第二,突出評價的過程性和真實性。第三,將學生評價與學生的學習和發(fā)展聯(lián)系在一起。,3、加強利用監(jiān)測數(shù)據(jù)的政策研究一方面,監(jiān)測數(shù)據(jù)開放和使用的力度不足,另一方面,我國傳統(tǒng)的政策研究仍存在研究范式單一、量化研究薄弱、實踐導向不強等弊端。教育政策研究要進一步加強監(jiān)測數(shù)據(jù)分析,為政策制訂服務(wù)。,第十五章 教育質(zhì)量監(jiān)測機構(gòu),第一節(jié) 國際組織教育質(zhì)量監(jiān)測機構(gòu)一、國際學生評價項目(PISA)為了滿足獲得關(guān)于學生知識、技能及教育表現(xiàn)的常規(guī)、可靠數(shù)據(jù)資料的愿望,經(jīng)濟合作與發(fā)展組織再1997年正式啟動了國際學生評價項目,2000年國際學生評價項目開始了第一輪測評。此后,每三年進行一次,最近一次測試

11、是在2018年。,(一)組織管理模式參與PISA2018評價的國家已經(jīng)達到80多個。管理工作主要由管理委員會和經(jīng)濟合作與發(fā)展秘書處負責。1、管理委員會:主要承擔項目總體的指導監(jiān)督工作。需要確定每年國際學生評價項目調(diào)查的重點,制訂測評指導原則,從宏觀上把控項目的方向。2、經(jīng)濟合作與發(fā)展秘書處:承擔日常的管理工作。負責具體包括監(jiān)督調(diào)查實施的情況、管理委員會的行政事務(wù)、跨國交流的媒介等。,(二)評價過程1、框架制訂項目的框架制訂主要由國際學生評價項目聯(lián)合處完成,同時各國教育主管部門提供支持和指導??蚣苤朴喌闹饕獌?nèi)容主要包括:執(zhí)行測評指導原則、確定各測評領(lǐng)域的技能和能力范圍、對測評領(lǐng)域進行操作定義、評

12、價各項任務(wù)的組織程序、使用測評題目所需要重視的關(guān)鍵特征操作化、評價變量的有效性以及準備對結(jié)果的解釋方案等。,2、工具編制由管理委員會和聯(lián)合出共同完成,管理委員會挑選專家組成專家組,負責設(shè)計項目的理論框架及問卷制定。聯(lián)合出自行設(shè)計或邀請項目參與國提交測試問題,最后選取無異議的問題進入試題庫。3、學生抽樣4、具體施策施測過程中,各參與國政府任命一位國家項目經(jīng)理負責監(jiān)督各參與國的評價實施情況。以紙筆測試的形式進行,近年基于計算機的測試取代紙筆測試。,5、測試評分P262測試評分,測試得分由各參與國的測試行動組,根據(jù)專家制定的指南手冊記錄,并受到國家項目經(jīng)理的監(jiān)督,測試最終結(jié)果通過國際學生評價項目國際

13、聯(lián)合處,上交到經(jīng)濟合作與發(fā)展組織秘書處。6、評價報告。在測評結(jié)束以后,經(jīng)濟合作與發(fā)展組織秘書處一般會在其官方網(wǎng)站公布測評結(jié)果,并提供一份包括各國平均分排名、影響成績的因素和分數(shù)相關(guān)性等信息的國際評價報告。,(三)影響國際學生評價項目因其廣泛的覆蓋面,科學的研究方法和獨創(chuàng)的素養(yǎng)概念等優(yōu)勢,在國際上產(chǎn)生了深遠影響,許多參與國家根據(jù)測評結(jié)果以及其與其他國家的對比,反思本國教育存在的問題,從而進行教育改革。,二、國際數(shù)學和科學成就趨勢研究TIMSS國際數(shù)學和科學成就趨勢研究,由國際教育成就評價協(xié)會1995年發(fā)起,現(xiàn)在是世界上參與國家最多、影響最廣且最嚴格的國際比較教育研究。,(一)組織管理模式。國際教

14、育成就評估協(xié)會國際研究中心是整個研究工作的領(lǐng)導與協(xié)調(diào)核心,負責策劃國際數(shù)學和科學成就趨勢系列研究的所有活動,組織世界各地的研究機構(gòu)開展研究并制定完善的教育質(zhì)量保證機制。國際教育成就評估協(xié)會秘書處負責國際數(shù)學和科學成就趨勢系列研究的日常管理,具體包括監(jiān)督調(diào)查實施的情況、溝通協(xié)調(diào)各研究機構(gòu)等。在國家層面,協(xié)調(diào)員和監(jiān)察員是評價過程中具體執(zhí)行各國監(jiān)測的負責人,承擔著評價最基層也是最重要的工作。,(二)評價過程。1、框架制定。國際數(shù)學和科學成就趨勢測驗的框架制定工作,由國際教育成就評估協(xié)會國際研究中心牽頭,各國專家協(xié)調(diào)完成。2、工具編制,國際數(shù)學和科學成就趨勢研究的工作編制由國際數(shù)學科學題目委員會負責,

15、該委員會成員來自各參與國的數(shù)學和科學的教育專家。3、學生抽樣。4、具體施策。各國協(xié)調(diào)員負責組織本國的具體施策過程。5、測試評分。測試的結(jié)果首先由各國協(xié)調(diào)員進行匯總,在按照統(tǒng)一標準錄入數(shù)據(jù)以后,統(tǒng)一交給總部在德國漢堡的國際教育協(xié)會數(shù)據(jù)處理中心,負責數(shù)據(jù)的整理和分析。,(三)影響國際數(shù)學和科學成就趨勢研究,以其覆蓋面大、參與人數(shù)最多、評價過程嚴格、關(guān)注課程評價等特點,成為備受世界關(guān)注的國際比較評價,其評價結(jié)果不僅引起了各國教育決策者的高度關(guān)注和思考,更在一些國家掀起了教育改革的浪潮。,三、國際閱讀素養(yǎng)進步研究國際閱讀素養(yǎng)進步研究同以評價數(shù)學科學能力為核心的國際數(shù)學和科學成就趨勢研究項目一樣,都屬于

16、國際教育成就評估協(xié)會的常規(guī)跨國比較項目研究。(一)組織管理。國際閱讀素養(yǎng)進步研究國際研究中心是國際閱讀素養(yǎng)進步研究項目的核心機構(gòu),主要負責項目的設(shè)計發(fā)展和實施,同時國際閱讀素養(yǎng)進步研究咨詢委員會和參與國的代表也會協(xié)助完成上述工作。,(二)評價過程。1、框架制定。國際閱讀素養(yǎng)進步研究國際研究中心負責國際閱讀素養(yǎng)進步研究評估框架的制定,在此過程中征求各國協(xié)調(diào)員以及閱讀評估小組的意見。2、工具編制。有閱讀評估小組起草,各國協(xié)調(diào)員和質(zhì)量控制專員修改,最后由國際閱讀素養(yǎng)進步研究國際研究中心定稿。3、數(shù)據(jù)收集與處理。國際閱讀素養(yǎng)進步研究的數(shù)據(jù)書籍,嚴格按照國際教育成就評估協(xié)會的統(tǒng)一標準執(zhí)行。各參與過統(tǒng)一收

17、集本國的數(shù)據(jù)協(xié)調(diào)員,按照協(xié)調(diào)員手冊要求對數(shù)據(jù)統(tǒng)一管理。,第2節(jié) 其他主要國家教育質(zhì)量監(jiān)測機構(gòu),一、美國教育質(zhì)量監(jiān)測。美國國家教育進步評價NAEP,也被稱為國家成績報告單是美國國內(nèi)唯一長期的且有全國代表性的教育評價體系,在美國教育領(lǐng)域以及世界范圍內(nèi)產(chǎn)生了深遠的影響。,(一)組織管理。美國國家評價管理委員會是由美國國會批準,專門為監(jiān)督國家教育進步評估工作而建立的。管理委員會主要負責以下工作:選擇評價的學科,確定合適的成績,目標設(shè)定,評價目標制定,測試規(guī)范,設(shè)計評價方法制定分析計劃和報告,頒布評價的評價結(jié)果的方針與標準,開發(fā)州與州之間地區(qū)與國家之間成績比較的標準與程序等。美國國家教育統(tǒng)計中心隸屬于教

18、育科學院,是美國教育部下屬的重要機構(gòu),負責國家教育評價的監(jiān)控,國家教育統(tǒng)計中心評價部負責項目的執(zhí)行,主要職責有設(shè)計評價、開發(fā)試題、實施評價、發(fā)布報告、協(xié)調(diào)各州評價與相關(guān)數(shù)據(jù)收集活動等。美國國家教育統(tǒng)計中心挑選專業(yè)教育考試機構(gòu)或考試服務(wù)公司負責項目具體實施的工作。,(二)評價過程。1、框架制定。美國國家教育進步評價的框架制定,有國家評價管理委員會負責框架制定,主要秉持兩大標準:一是綜合考慮各州和各地區(qū)不同的教育狀況,反映出當前教育發(fā)展的需求。二是在教育目標和課程變化方面具有前瞻性和預測性,實現(xiàn)教學實踐與研究成果之間的平衡。2、工具開發(fā)。美國國家教育進步評價工具開發(fā),首先是美國教育考試服務(wù)中心,根

19、據(jù)美國國家教育進步評價工具制定委員會的建議和指導,編寫評價試題和練習試題,直到定稿需要經(jīng)過三次修改。,3、學生抽樣。學生抽樣主要是考慮地理位置、城市化程度、少數(shù)民族學生注冊人數(shù)、中等收入家庭數(shù)量、學校性質(zhì)等因素,先抽取一定數(shù)量的學校,再按照事先確定的比例從指定年級中隨機抽取學生。4、評分過程。美國國家計算機系統(tǒng)負責國家教育進步評價的評分選擇題使用光電閱讀器評分開放式問題,由經(jīng)過培訓的評分者,依據(jù)評分指南和量表進行打分。5、成績報告。美國國家教育進步評價,在每一科目上的結(jié)果,都以量尺分數(shù)和成就水平兩種方式呈現(xiàn)。,二、英國的教育質(zhì)量監(jiān)測。2010年國家課程評價監(jiān)管方面的工作由資格與考試管理局負責,

20、其他非監(jiān)管方面的工作,由資格與課程發(fā)展部負責。,(一)組織管理。1、監(jiān)管機構(gòu)資格與考試管理局。資格與考試管理局是英國的教育監(jiān)管機構(gòu),負責資格認定,考試測驗等工作的監(jiān)督和管理。2、管理與執(zhí)行機構(gòu)資格與課程發(fā)展部。資格與課程發(fā)展部是英國國家課程評價的管理與執(zhí)行機構(gòu),主要負責對所要評價的方面設(shè)定標準,建立監(jiān)控和保障測驗編制,實施質(zhì)量的程序。3、具體實施機構(gòu)專業(yè)機構(gòu)和教師。英國國家課程評價的具體實施工作,委托專業(yè)的運作機構(gòu)負責資格與課程發(fā)展部的工作人員,地方當局以及學校校長教師等也會參與部分環(huán)節(jié)。,(二)評價過程。1、制定標準。課程與發(fā)展部設(shè)定一般的標準和學科標準,每年進行檢查,并且根據(jù)這些標準制定了

21、詳盡的測驗說明。2、工具開發(fā)。工具開發(fā)過程有專業(yè)的測驗開發(fā)機構(gòu),按照測驗說明執(zhí)行,同時受到資格與課程發(fā)展部的監(jiān)督和檢查,測驗一般需要23年的開發(fā)過程,其中包括至少兩次前測。,3、評分及電力水平界限。KS1階段7歲的學生,由教師根據(jù)指導手冊進行評分,并判定等級,教師手冊中公布了,根據(jù)檢測數(shù)據(jù)及試卷細查確定的水平電線。KS2階段11歲學生,評分由經(jīng)過專業(yè)培訓,且通過考核的外部評分者進行,水平界限是資格與課程發(fā)展部及其他部門的有關(guān)人員,根據(jù)檢測數(shù)據(jù)、試卷細查以及國家數(shù)據(jù)樣本等確定的。4、成績報告。為了保護學生隱私,學生個人成績僅向教師學生本人及家長公布,而學校地方和國家學業(yè)成就的總體情況則會向社會公

22、開。,三、日本的教育質(zhì)量監(jiān)測。日本全國學力調(diào)查是通過考察學生對學習指導要領(lǐng)所規(guī)定的內(nèi)容的掌握情況,來審查教育政策的成果和問題的全國性測評。目前日本全國學力調(diào)查由日本文部科學省統(tǒng)籌規(guī)劃國立教育研究所及企業(yè)負責具體實施。,(一)組織管理。日本全國學力調(diào)查主要由文部科學省負責調(diào)查內(nèi)容與難度科目等也有文部科學省確立,主要職責有總體管理安排,出資調(diào)查,抽取學校樣本,招標負責實施的民間企業(yè),向社會公布結(jié)果,根據(jù)調(diào)查結(jié)果調(diào)整、制定有關(guān)教育政策以及制定學習指導要領(lǐng)等。國立教育政策研究所是日本負責教育政策的國家研究機構(gòu),在全國學力調(diào)查中負責開發(fā)試題、準備有關(guān)資料,分析結(jié)果、準備報告等工作。,(二)評價過程。1、

23、建立標準。日本全國學力調(diào)查廣度深度以及對學生最低要求的確定,以學習指導要領(lǐng)為標準,包括試卷的內(nèi)容、結(jié)構(gòu)、難度和評價標準,均依照學習指導要領(lǐng)的要求。2、工具研發(fā)。國立教育政策研究所負責全國學力調(diào)查試題的開發(fā)以及相關(guān)資料的準備。工具需要評價期望學生擁有的學習能力、課程規(guī)定的重要內(nèi)容和有利于學生掌握提高學習的方法以及獨立解決問題的內(nèi)容。,3、施測、評分與統(tǒng)計分析。日本全國學力調(diào)查的施測與評分均由民間企業(yè)完成,統(tǒng)計分析由國立教育政策研究所負責,主要統(tǒng)計平均數(shù)、平均率、中位數(shù)、最高頻數(shù)、標準差等,并以學生成績分布圖的形式,以縣、村、校為單位進行比較,分析結(jié)果,撰寫報告。4、結(jié)果報告。日本文部科學省對于結(jié)

24、果的公布采取了折中的方案,只公開發(fā)表各都道府縣的整體情況結(jié)果,向各地方教育委員會和學校提供該教育委員會所轄學區(qū)和學校的統(tǒng)計成績,對于具體的分數(shù)和排名則不公布。文部科學省規(guī)定各地方教委不得公布各學區(qū)和學校的具體成績和排名,各學校自行決定是否公布本校成績。,(三)影響。首先,從國家層面而言,全國學力調(diào)查的結(jié)果有助于相關(guān)教育部門了解教育現(xiàn)狀,推動教育政策的制定和課程的改革。其次,從地方層面而言,能夠從全國學力調(diào)查的結(jié)果中了解到自身的優(yōu)勢與不足,進而調(diào)整教育方針,改進教學。第三,從學校層面而言,全國學力調(diào)查是難得的了解本校教育水平、教育問題的機會,可以促進學校改善教學。,第3節(jié) 我國義務(wù)教育質(zhì)量監(jiān)測機

25、構(gòu)。,2007年經(jīng)中央機構(gòu)編制委員會辦公室批復,同意教育部委托北京師范大學成立教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心。截至2015年年底,我國共22個省,明確成立省級監(jiān)測機構(gòu),協(xié)助開展國家義務(wù)教育質(zhì)量監(jiān)測工作,依據(jù)中國的行政體制從中央到地方一般分為中央、省、市、縣四級,相應(yīng)地,監(jiān)測工作也建立了4級網(wǎng)絡(luò)。,一、統(tǒng)籌規(guī)劃國務(wù)院教育督導委員會辦公室。國務(wù)院成立國務(wù)院教育督導委員會,國務(wù)院教育督導委員會辦公室負責統(tǒng)籌規(guī)劃,監(jiān)督指導,確定監(jiān)測目標和監(jiān)測方案,發(fā)布監(jiān)測報告。二、國家義務(wù)教育質(zhì)量監(jiān)測日常管理與執(zhí)行教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心。教育部基礎(chǔ)教育質(zhì)量監(jiān)測中心負責國家義務(wù)教育質(zhì)量監(jiān)測工作等日常組織與和管理,具體包

26、括:組織建立專家工作隊伍,制定監(jiān)測工作流程與規(guī)范,組織落實監(jiān)測各環(huán)節(jié)工作,對承擔專項任務(wù)的其他機構(gòu)和部門進行過程管理和質(zhì)量監(jiān)控。,三、具體實施機構(gòu)地方教育質(zhì)量監(jiān)測機構(gòu)。截至2015年底,共有22個省成立了省級監(jiān)測機構(gòu)。省級教育督導部門負責本地區(qū)的測試組織和過程監(jiān)督??h級教育督導部門負責組織現(xiàn)場測試。省級教育質(zhì)量監(jiān)測機構(gòu)對其工作職責有兩方面定位:一類是緊緊圍繞監(jiān)測(如貴州?。A硪活愂峭瑫r加強調(diào)監(jiān)測以及改進(如江蘇?。?。,第16章 教育質(zhì)量監(jiān)測內(nèi)容,第1節(jié) 國際組織教育監(jiān)測的內(nèi)容一、國際學生評價項目PISA國際學生評價項目,是由經(jīng)濟合作與發(fā)展組織開發(fā)的,目前全球最具影響力、涉及范圍最廣的國際學生

27、學習評價項目之一。評價對象聚焦于即將完成義務(wù)教育的15歲學生,對他們是否具備終身學習所需要的知識技能和能力等素養(yǎng)進行評價,并對學生成績與教育背景、學校因素以及情感態(tài)度價值觀之間的關(guān)系進行分析,其評價結(jié)果已對多國的教育改革產(chǎn)生重要影響。,(一)評價對象。在測試開始時,年齡在15歲三個月到16歲兩個月的在校學生,不包括未在教育機構(gòu)就讀或者在國外上學的15歲青少年。(二)評價的核心。提出素養(yǎng)概念,它反映所評價的更廣泛范圍內(nèi)的知識、技能和能力,即學生應(yīng)用所學知識和技能,分析、推理和進行有效溝通,解決和解釋各種不同情境中的問題的能力。素養(yǎng)強調(diào)學習的能力,它不僅可以通過正規(guī)的學校教育去獲得,也可以發(fā)生在同

28、伴、同事等更廣泛的社交圈中。,(三)評價領(lǐng)域。國際學生評價項目主要集中在三個領(lǐng)域:閱讀素養(yǎng)、數(shù)學素養(yǎng)和科學素養(yǎng)。每三次測評為一個周期,分別以閱讀、數(shù)學、科學為核心,測評領(lǐng)域依次循環(huán)。1、閱讀素養(yǎng),是指學生為了達到個人目標、增進知識、發(fā)展?jié)撃芤约皡⑴c社會生活而理解、運用、反思書面材料的能力以及投入閱讀的狀況。2、數(shù)學素養(yǎng),是指學生識別和理解數(shù)學在世界中所起的作用,作出有根據(jù)的數(shù)學判斷的能力,以及作為一個關(guān)心社會、善于思考的公民,為了滿足個人生活需要而使用和從事數(shù)學活動的能力。,3、科學素養(yǎng),是指運用科學知識去識別問題,經(jīng)論證得出結(jié)論,以助于理解人類對于自然界的改造和所做的決策的能力。4、問題解決

29、能力,是指個人通過認知過程來面對和解決現(xiàn)實、跨學科情境下無明顯解決方法的問題的能力。5、金融能力,是指運用金融知識和理解力的技能、動機和信心,以便個人在廣泛的經(jīng)濟背景中做出有效決策,提高個人和社會經(jīng)濟利益,并參與經(jīng)濟生活的能力。,(四)評價模型國際學生評價項目將教育系統(tǒng)分為4個層次:個人參與者、教學背景、教育服務(wù)的提供者、作為整體的教育系統(tǒng)。,二、國際數(shù)學和科學成就趨勢研究TIMSS定義:國際數(shù)學和科學成就趨勢研究,由國際教育成就評價協(xié)會于1995年發(fā)起。目前是全球參與國家最多影響最廣且最嚴格的國際比較教育研究。(一)評價對象。四年級和八年級學生作為測試對象。所有被測試學生均需來自正規(guī)公立學校

30、。(二)評價理念。研究的出發(fā)點和落腳點皆為課程,即在正規(guī)的學校教育中學生被提供了什么樣的課程,而學生又能在多大程度上掌握這些課程。,基于評價課程的理念,該研究首次提出課程評價的三個層次:準備的課程、實施的課程、掌握的課程。(三)評價領(lǐng)域。國際教育成就評價協(xié)會每4年組織一次,國際數(shù)學和科學成就趨勢系列研究測試分為兩部分:數(shù)學和科學成就、影響因素。數(shù)學和科學成就,主要考察四年級和八年級學生對于基本概念的掌握情況和推理應(yīng)用情況。計算能力,是2015年新增的測試項。影響因素,包括學生的學習態(tài)度、興趣、習慣、風格以及對學生學業(yè)成就有影響的相關(guān)因素,對影響因素的分析,用來更好地理解與解釋學生的學習行為。,

31、三、國際閱讀素養(yǎng)進步研究PIRLS含義:國際閱讀素養(yǎng)進步研究,是由國際教育成就評價協(xié)會主持的對四年級學生閱讀素養(yǎng)進行評價的國際性比較研究。每5年進行一次,第1次在2001年舉行,最近一次在2016年舉行。國際閱讀素養(yǎng)進步研究,以四年級學生為評價對象。評價內(nèi)容,包括閱讀成績、閱讀行為和閱讀態(tài)度,其結(jié)果反映的問題引起了許多國家的重視,推動了教育改革的進程。,(一)評價核心。閱讀能力是國際閱讀素養(yǎng)進步研究的評價核心,對于閱讀能力的界定統(tǒng)領(lǐng)和指導整個評價項目,同時也是選擇評價工具,確定評分標準和分析評價結(jié)果的根本依據(jù)。(二)評價框架。國際閱讀素養(yǎng)進步研究,對閱讀能力劃分的三項操作性評價維度分別是:理解

32、的過程、閱讀的目的、閱讀行為和態(tài)度。(三)試卷。每張試卷都有閱讀理解和與之相關(guān)的選擇題、簡答題組成。(四)問卷。國際閱讀素養(yǎng)進步研究,考察了學生的閱讀成績以及影響閱讀成績的因素兩大問題。前者的信息通過學生作答試卷獲得,后者的信息通過由相關(guān)人員填寫的問卷獲得。影響因素的問卷根據(jù)調(diào)查對象的不同分為4類:被試學生問卷、被試學生的家長問卷、教師問卷和校長問卷。,第2節(jié) 其他主要國家教育監(jiān)測的內(nèi)容,一、美國國家教育進步評價NAEP美國國內(nèi)唯一長期且具有全國代表性的教育評價體系,是美國國家教育進步評價,也被稱為國家成績報告單。也因其權(quán)威性和專業(yè)性在世界范圍內(nèi)產(chǎn)生了深遠的影響,成為其他國家建立教育質(zhì)量監(jiān)測體

33、系學習的榜樣。,(一)評價對象。美國國家教育進步評價類型,包括主要評價、長期趨勢評價和專項研究。主要評價分為全國評價和州評價。全國評價的對象:為四年級,八年級和十二年級的學生,每次選取兩個年級參加。州評價的對象:為四年級和八年級學生。長期趨勢評價的對象:是9歲,13歲和17歲的學生。專項研究:根據(jù)研究目的選擇特定的評價對象。,(二)評價類型1、主要評價:評價學生當前水平。要評價分為全國評價和州評價。評價目的在于了解全國及各州學生在核心學科領(lǐng)域達到的水平和具備的能力。2、長期趨勢評價:監(jiān)測學生成就發(fā)展趨勢。評價的目的在于了解學生在核心學科領(lǐng)域的長期發(fā)展變化,長期趨勢評價每4年舉行一次。3、專項研

34、究:輔助性與專題研究。目的在于了解特定主題或特定群體的教育問題。,二、英國國家課程評價英國的國家課程評價監(jiān)管工作,2010年起由資格與考試管理局負責,非監(jiān)管工作由資格與課程開發(fā)部負責。(一)評價對象。1988年英國國會通過的教育改革法,將義務(wù)教育劃分為4個關(guān)鍵階段:KS1,5-7歲;KS2,7-11歲;KS3,11-14歲;KS4,14-16歲;國家課程評價要求公立學校中處于KS1、 KS2、 KS3階段末的學生必須參加國家統(tǒng)一評價。,(二)評價領(lǐng)域及方式。評價領(lǐng)域分為兩類:核心學科和非核心學科。核心學科:包括數(shù)學、英語和科學。非核心學科:包括設(shè)計和技術(shù)、信息與交流技術(shù)、現(xiàn)代外語,體育、地理、

35、公民教育、音樂、歷史、藝術(shù)和設(shè)計。英國國家課程評價的內(nèi)容,包括測驗、任務(wù)和教師評價。,三、日本全國學力調(diào)查。日本全國學力調(diào)查,以小學六年級和初中三年級為調(diào)查對象,主要考察學生對學習指導要領(lǐng)所規(guī)定的內(nèi)容的掌握情況,同時收集學生學習生活等方面的信息。(一)調(diào)查了對象和樣本范圍。對象為小學六年級和初中三年級學生。20072009年全體學生都參加。2010-2012年在全國抽取一定數(shù)量的學校參加。2013年之后又重新回到全體調(diào)查年級學生參加。,(二)調(diào)查的方式及領(lǐng)域。日本全國學力調(diào)查分為和。學力測試是按照學力測試學習狀況問卷調(diào)查學習指導要領(lǐng)中對知識和技能的要求編制的,考察的內(nèi)容主要是日語和數(shù)學。學習狀

36、況問卷調(diào)查,包括學生問卷和學校問卷。,四、各國教育質(zhì)量監(jiān)測特點比較。(一)有的國家對核心學科進行評價。如澳大利亞教育研究委員會從1999年開始,每年評價三、五、七年級孩子的閱讀與數(shù)學能力。(二)有的國家對所有學科進行評價,如美國NAEP評價四、八和十二年級學生的學業(yè)水平,涵蓋多學科。(三)不同年份或年齡測試不同的學科。新西蘭每年都對四年級和八年級學生開展一次全國性的教育質(zhì)量檢查,4年一個循環(huán),涵蓋課程中的大部分內(nèi)容。(四)并非完全基于學科的測試。芬蘭的教育質(zhì)量評價不是基于具體學科進行的,而是將學科能力分解為兩個維度:認知技能和情感控制技能。,第3節(jié) 我國教育質(zhì)量監(jiān)測。,國家中長期教育改革和發(fā)展

37、規(guī)劃綱要2010-2020年頒布后,把公平與質(zhì)量作為教育事業(yè)發(fā)展的重要主體,教育公平不僅體現(xiàn)在受教育機會分配的平等,更重要的是讓更多的人能夠接受更高質(zhì)量的教育。教育質(zhì)量有內(nèi)在質(zhì)量和外在質(zhì)量之分。一、監(jiān)測目的。規(guī)模、質(zhì)量、公平與效率是教育事業(yè)發(fā)展的4種基本價值屬性。當前我國教育質(zhì)量監(jiān)測具有雙重目的:其一是保證公平,其二是提升質(zhì)量。公平且有質(zhì)量,是當前我國開展教育質(zhì)量監(jiān)測工作的主要目的。,(二)監(jiān)測對象。監(jiān)測對象為義務(wù)教育階段四年級和八年級的學生,監(jiān)測年級的確定主要考慮到四年級和八年級學生處于發(fā)展關(guān)鍵期。(三)抽樣方式。采取三階段分層不等概率抽樣方式,抽取有代表性的樣本,具體抽樣方法如下。第1階段

38、:抽取區(qū)縣第2階段:抽取學校第3階段:抽取學生,(四)監(jiān)測學科與內(nèi)容。1、語文:重點測查語文基礎(chǔ)文本閱讀、書面表達、識別與推論、整合與解釋、評價與鑒賞、學習興趣、學習信心和學習習慣等。2、數(shù)學:重點測查數(shù)與代數(shù)、圖形與幾何、統(tǒng)計與概率論等知識的了解、理解和運用,學習興趣、學習信心和學習習慣等。3、科學重點測查生命科學、物質(zhì)科學、地球與宇宙知識的了解、理解和運用,科學問題的探究、解釋、解決,學習興趣、學習信心和學習習慣等。4、體育重點復查身高、體重、視力、肺活量、力量、速度、耐力、興趣與態(tài)度、健康、睡眠和鍛煉習慣等情況。5、藝術(shù)重點調(diào)查,對藝術(shù)作品表現(xiàn)形式、民族藝術(shù)作品特點、中外藝術(shù)作品表達主體

39、和情感的了解、理解,對民族藝術(shù)的興趣、喜愛以及藝術(shù)活動的參與等。6、德育重點測查學生對社會主義核心價值觀以及中華優(yōu)秀傳統(tǒng)文化的理解,日常生活中道德行為規(guī)范的掌握,對于基本國情、地理和歷史常識、安全和法律常識等的了解,以及對與他人與社會與自然關(guān)系的認識。,第17章 教育質(zhì)量監(jiān)測工具開發(fā),第1節(jié) 試題編制。一、編制流程。試題編制包括4個步驟:構(gòu)建測試框架、試卷編制、預試分析以及形成正式測驗。(一)構(gòu)建測試框架。根據(jù)監(jiān)測的目的和內(nèi)容,確定學業(yè)成就測驗的測試框架,即考察什么內(nèi)容,然后編制測驗藍圖。測驗藍圖是一種考察目標和內(nèi)容之間的列聯(lián)表,有測量的內(nèi)容維度和行為技能構(gòu)成。(二)編寫測驗題目。命題者需要根

40、據(jù)雙向新目標中考察內(nèi)容的情況選擇合適的題目。命題結(jié)束后,需要填寫題目屬性表,清楚說明題目涵蓋的內(nèi)容維度、認知維度和具體指標,方便后續(xù)修改等工作。,(三)組卷。學業(yè)成就測驗需要較好的覆蓋課程內(nèi)容,題量較大。因此要把所有符合要求的測試題目,按照一定的測量技術(shù)和方法,選取題目組合成若干個題本,確保覆蓋所有指標。(四)專家審核。為保證試題的科學性、準確性和規(guī)范性,在試題編制、組卷、形成題本后,都需要專家對題目進行審核。審核的內(nèi)容:包括題目是否符合測驗藍圖的設(shè)計;題目的難度是否適宜;題目的材料選取是否合適有效;題目的表述和設(shè)置是否適合學生年齡適合實際情況;題目是否創(chuàng)新,避免常用教材、教輔中出現(xiàn)的題目或情

41、境;題目的語言表述是否通順、準確、簡潔易懂等。,(五)預試分析。試題編制過程中至少需要兩次預試:第1次是對所有試題進行小范圍預試,并對每道試題抽取幾名學生進行訪談,了解其答題的思路,了解評分準則的準確性和有效性,依據(jù)預試結(jié)果進行修改。第2次預試是對修改后的試題進行一定范圍預試,遇事條件盡量與正式施測保持一致。(六)形成正式測驗。根據(jù)預試結(jié)果,對試題質(zhì)量進行分析篩選和修訂試題組成正式的測驗。,二、題目編寫。(一)題型的選擇。測驗中常用的題型是有是非題、多項選擇題、匹配題、填空題、簡答題和論述題。(二)各類題型編寫需注意的事項1、非題的編寫,每道題的題目表述要簡單明了,不能似是而非、模棱兩可。2、

42、選擇題的編寫,每道題目的題干都需要呈現(xiàn)一個明確、具體、單一的問題。3、匹配題的編寫。在每個匹配題內(nèi)各題干之間、各選項之間的性質(zhì)應(yīng)該相同。4、填空題的編寫。每道填空題的空格處,都應(yīng)該有非常明確的正確答案,而且答案的形式簡單。5、簡答題的編寫。簡答題對任務(wù)的要求要清楚具體,避免籠統(tǒng),過于寬泛。6、論述題的編寫。論述題只能用來測查比較復雜的知識與技能。,三、預試與修訂。(一)試題的預試。1、預試題本的設(shè)計。預試測驗題目的題本的設(shè)計與正式測驗是一致的,同時題目數(shù)量應(yīng)是正式測驗題本的2.53倍。2、預試樣本的設(shè)計。預試一般選擇與目標人群相似的學生群體進行,樣本量不應(yīng)少于500人。3、執(zhí)行預試。預試題本在

43、進行施測的時候,注意各個測試環(huán)節(jié)的控制應(yīng)與正式測驗時一致。預試時,主試要詳細記錄學生在施測時所遇到的問題及發(fā)現(xiàn)的疑問,管理人員對主試的記錄進行收集和整理。4、預測評分。評分過程本身也是預試的一部分,一般情況下選擇題答案簡單、清晰、固定,因此可以通過答題卡方式收集,用計算機閱卷的方式進行評分,而對主觀性強的解答題或者論述題,就需要評分人員進行手動評分。,(二)試題的質(zhì)量分析與修訂。根據(jù)預試的結(jié)果分析,測驗題目的質(zhì)量,包括題目層面的分析和測驗層面的分析。1、題目層面的分析。在題目層面需要對題目的回答率、難度、區(qū)分度以及選項進行分析。2、測驗層面的分析。還需要在測驗層面進行質(zhì)量分析,包括測驗的信度、

44、效度等。,第2節(jié) 問卷開發(fā)一、開發(fā)流程。一般來說,問卷的編制需要4個步驟:準備、初步設(shè)計、預試和修訂。教育質(zhì)量監(jiān)測問卷編制的一般流程共有6個步驟:確定問卷編制的目的,確定問卷的框架,編制問卷,制定數(shù)據(jù)分析計劃,實施預試,形成正式問卷。,二、題目編制。首先,問卷研發(fā)的第1步是問卷編制的頂整體設(shè)計,即確定問卷的調(diào)查框架。其次,要明確問卷的一般結(jié)構(gòu)問卷。一般包括卷首語、問題、選擇答案和結(jié)束語部分。問卷的封面呈現(xiàn)的是卷首語,包括標題、前言和整體指導語。最后,正式編制問卷題目。問卷研發(fā)者需要根據(jù)問卷調(diào)查的目的、調(diào)查對象、調(diào)查條件來選擇合適的問卷類型:結(jié)構(gòu)問卷和無結(jié)構(gòu)問卷。,三、預試與修訂當問卷編寫完成后

45、,需要進行預試。問卷的預試包括兩部分:一部分工作是根據(jù)正式問卷調(diào)查的條件、調(diào)查環(huán)境、被調(diào)查者設(shè)計預試,收集數(shù)據(jù)。另一部分工作是向同一領(lǐng)域的專家、與調(diào)查的內(nèi)容相關(guān)的人員征求對問卷的意見,看是否存在不恰當與實際不符合的情況。,第3節(jié) 表現(xiàn)性評價工具開發(fā),一、編制流程。(一)構(gòu)建概念框架。概念框架的設(shè)計是從構(gòu)念定義開始的。確定概念框架時,需要綜合考慮教育質(zhì)量監(jiān)測的目的、監(jiān)測內(nèi)容和監(jiān)測對象。(二)編制評價記目表。評價系目表將表現(xiàn)性任務(wù)與評價目的相聯(lián)系,內(nèi)容包括任務(wù)考察的內(nèi)容維度、認知過程的權(quán)重以及任務(wù)的測量學特征等信息。(三)設(shè)計表現(xiàn)性任務(wù)。表現(xiàn)性任務(wù)的一個突出特征是,這些任務(wù)一般都是對真實生活情境和

46、問題的模擬。,(四)專家審核。專家審核的內(nèi)容包括:任務(wù)內(nèi)容是否基于評價系目表進行設(shè)計是否涵蓋了所有需要考察的指標任務(wù)的要求是否明確表述和措辭是否清晰明確是否對特定學生群體有偏見是否存在敏感性問題,比如宗教信仰話題任務(wù)的一些無關(guān)因素是否會被會影響評價者的表現(xiàn)?,(五)制定評分規(guī)則。評分規(guī)則的制定是表現(xiàn)性評價工具研發(fā)的重點和難點。評分規(guī)則常由一組專家制定,這些專家需要具有豐富的學科知識以及豐富的教學經(jīng)驗。,二、題目編寫。表現(xiàn)性評價工具的初步編制的步驟分別是:制定評價目標、明確評價內(nèi)容、設(shè)計表現(xiàn)性任務(wù)。(一)制定評價目標。所有的評價都屬于一個清晰、適當且有價值的評價目標。最常用于評價傳統(tǒng)紙筆式評價工

47、具不能評價的知識和技能上,包括對任務(wù)的理解和思考過程、復雜的知識技能以及高級思維能力等。,(二)明確評價內(nèi)容。評價內(nèi)容是評價目標的體現(xiàn),也是評價目標實現(xiàn)的基石,評價內(nèi)容的確定與評價目標緊密相連。評價內(nèi)容確定之后,要將評價內(nèi)容轉(zhuǎn)化為具體的評價指標,也就是把評價內(nèi)容分解為具體的可觀察的行為指標。(三)設(shè)計表現(xiàn)性任務(wù)主要包含4個步驟:1、根據(jù)評價目標和評價內(nèi)容選擇合適的任務(wù)形式。2、創(chuàng)作情境,反映評價內(nèi)容。3、編寫任務(wù)指導語。4、建立評分標準。,三、預試與修訂。通過預試可以對工具的質(zhì)量進行分析,還可以發(fā)現(xiàn)實際測試中可能遇到的問題。(一)表現(xiàn)性評價預試實施。首先,環(huán)境檢查。場所是否滿足要求,所用的工具

48、是否齊全等。其次,觀察者準備。觀察者應(yīng)在正式測試前進行準備工作,包括熟悉所提供的書面指導語、熟悉提供關(guān)于表現(xiàn)性評分的樣例以及接受評分訓練。最后,預試的過程要完全遵循正式測驗的流程,以便檢驗表現(xiàn)性任務(wù)實施的各個環(huán)節(jié)是否存在問題,為工具的修改和完善提供依據(jù)。,(二)表現(xiàn)性評價工具的信度和效度。在給學生表現(xiàn)評分時,有三方面的因素可能導致評分結(jié)果不一致:一是評分標準的解釋比較模糊,二是評論者的嚴格程度、對規(guī)則的理解、主觀態(tài)度等自身特征會影響任務(wù)的評分,三是任務(wù)帶來的變異成為表現(xiàn)性,評估主要的測量誤差來源。,第18章 教育質(zhì)量監(jiān)測實施,第一節(jié) 理論基礎(chǔ)。一、經(jīng)典測量理論。(一)概念。經(jīng)典測量理論中有三個

49、重要概念:第1個概念是真分數(shù),它是被試真正的潛在能力。第2個概念是觀察分數(shù),是被試在測驗或者考試中得到的分數(shù)。第3個概念是測量誤差,指一些其他不確定因素,在測量過程中對測量結(jié)果產(chǎn)生的影響。這三個概念之間的關(guān)系是。X=T+E其中,X是觀察分數(shù),T是真分數(shù),E是測量誤差。,(二)優(yōu)勢及局限性。1優(yōu)勢:表現(xiàn)在它基于比較弱的假設(shè)、理論基礎(chǔ)較容易理解,分析時也不要也不要求嚴格的擬合性檢驗,因而適用于絕大多數(shù)心理與教育測驗資料。2、局限性:第一,觀察分數(shù)等權(quán)重線累加的不合理性。第二,測驗對被試的評價依賴于測驗的具體項目組合和項目數(shù)量。第三,測驗及項目的性能指標的估計依賴于具體的費時樣本。第四,被試能力與項

50、目難度兩個指標含義的非統(tǒng)一性。第五,測量誤差估計的不精確性和籠統(tǒng)性。,二、項目反應(yīng)理論。含義:項目反應(yīng)理論,其特點是以概率函數(shù)的形式來描述項目作答反應(yīng)結(jié)果是如何受到被試能力水平和項目特征聯(lián)合作用的影響,具體來說,就是依據(jù)被試在各個項目上的實際作答反應(yīng)結(jié)果,經(jīng)數(shù)學模型的運算,統(tǒng)一估計出被試的能力水平或潛在心理特質(zhì)水平,以及項目的計量學參數(shù)。描述被試能力水平、項目參數(shù)與項目作答結(jié)果之間關(guān)系的數(shù)學模型稱為項目特征函數(shù)。,(二)項目反應(yīng)理論的優(yōu)勢及局限性。項目反應(yīng)理論的優(yōu)勢:1、被試能力參數(shù)與項目參數(shù)具有不變性的特征。2、被視能力參數(shù)與項目難度參數(shù)具有統(tǒng)一的量表。3、可以針對不同被試精確估計每個項目及

51、測驗的測量誤差。局限性:1、對于測試條件要求高,對被試樣本量以及測驗題目數(shù)量要求比較大2、項目反應(yīng)理論的統(tǒng)計模型比較復雜,難于理解,很多基層的專家和教師不能很好的掌握這一理論。3、項目反應(yīng)理論,在測驗的效度問題上并沒有提出獨到的見解。,第2節(jié) 框架結(jié)構(gòu),含義:測驗框架是對評價和分析的理論基礎(chǔ)及內(nèi)容依據(jù)的相關(guān)說明和模型表達,往往要闡明評價與分析的目的主題領(lǐng)域和標準,對象和方式以及提供合同類型的反饋。一、明確監(jiān)測的功能定位明確功能定位是評價框框架結(jié)構(gòu)的前提。從服務(wù)對象來看,可以劃分為國內(nèi)省級層面、國家層面及全球?qū)用?。從服?wù)內(nèi)容來看,基于不同的實施功能與目的,可以劃分為:以PISA、NAEP、NAEQ為代表的指向宏觀教育政策研究類調(diào)查;以TIMSS、PIRLS為代表的幾項終端課程研究類調(diào)查;以NAAA、EQAO、BAEQ為代表的指向微觀學校層面,教育學質(zhì)量研究類調(diào)查。,二、明確監(jiān)測框架的基本構(gòu)成一是起初大規(guī)模學業(yè)成就教材的評價框架,大多僅由學業(yè)成就測驗所指

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論