教育評價與測量課件_第1頁
教育評價與測量課件_第2頁
教育評價與測量課件_第3頁
教育評價與測量課件_第4頁
教育評價與測量課件_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、教育評價與測量教育評價與測量教育評價與測量的發(fā)展歷史一、中國是考試的故鄉(xiāng),是考試制度的發(fā)源地。 現(xiàn)在學(xué)者一般認(rèn)為,考試制度在西周初見端倪,西周選士是我國考試制度的萌芽階段。 “一年視離經(jīng)辨志,三年視敬業(yè)樂群,五年視博習(xí)親師,七年視論學(xué)取友,謂之小成;九年知類通達(dá),強(qiáng)立而不返,謂之大成。”學(xué)記教育評價與測量的發(fā)展歷史一、中國是考試的故鄉(xiāng),是考試制度的發(fā)“古之教育,家有塾,學(xué)有庠,術(shù)有序,國有學(xué)。比年入學(xué),中年考校,” 古代教育制度規(guī)定,20戶人家設(shè)一私塾,500戶的縣設(shè)一學(xué)堂,12500戶的行政區(qū)設(shè)學(xué)校,國都設(shè)大學(xué)。大學(xué)每年招收學(xué)生,每隔一年考查一次,第一年考查學(xué)生分析課文的能力和志趣;第三年考

2、查學(xué)生的專業(yè)思想是否鞏固,同學(xué)之年能否相親相助;第五年考查學(xué)生的知識是否廣博,對教師是否敬愛;第七年考查學(xué)生研究學(xué)問的本領(lǐng)和識別朋友的能力,合格的就叫“小成”。到第九年,學(xué)生對于學(xué)業(yè)已能觸類旁通,他們的見解行動已能堅定不移,這就叫做“大成”?!肮胖逃?,家有塾,學(xué)有庠,術(shù)有序,國有學(xué)。比年入學(xué),中年考二、從教育測量走向教育評價1教育測量學(xué)科的誕生 1904年美國心理學(xué)家桑代克出版了論著精神與社會測量導(dǎo)論,被公認(rèn)是教育統(tǒng)計學(xué)、教育測量學(xué)、教育評價學(xué)等學(xué)科的第一本著作,首次較系統(tǒng)地介紹了教育統(tǒng)計方法及編制測驗的基本原理,標(biāo)志著教育測量理論的誕生。2進(jìn)入教育評價的時代 泰勒在1940年的“八年研究”

3、報告書中,首次提出“教育評價”的概念。他認(rèn)為評價是一種確定行為實際變化程度的過程,并形成了泰勒“行為目標(biāo)評價模式”,他本人因此被稱為當(dāng)代教育評價之父。二、從教育測量走向教育評價三、第四代教育評價理論1測量時代:1900-19302描述時代:1930-19403判斷時代:1950、1960-19894應(yīng)答性模式:1989至今三、第四代教育評價理論教育測量的一般原理一、測量理論1經(jīng)典測驗(Classical Test Theory,CTT)2概化理論(Generalizability Theory, GT)3項目反應(yīng)理論(Item Response Theory,IRT)教育測量的一般原理一、測量

4、理論二、測驗的類型1常模參照測驗2標(biāo)準(zhǔn)參照測驗二、測驗的類型三、測量的數(shù)據(jù)類型1稱名量表和稱名量表數(shù)據(jù)2順序量表和順序量表數(shù)據(jù)3等距量表和等距量表數(shù)據(jù)4比率量表和比率量表數(shù)據(jù)離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)三、測量的數(shù)據(jù)類型四、數(shù)據(jù)的數(shù)字特征1集中量數(shù):眾數(shù)、中位數(shù)、均值2離散量數(shù):全距、四分位差、方差、標(biāo)準(zhǔn)差、差異系數(shù)五、數(shù)據(jù)的正態(tài)分布形態(tài)1正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布,也稱其為常態(tài)分布。2負(fù)偏態(tài)分布也稱為右偏態(tài)分布3正偏態(tài)分布也稱為左偏態(tài)分布四、數(shù)據(jù)的數(shù)字特征六、原始分?jǐn)?shù)轉(zhuǎn)換1百分等級和百分位數(shù)2Z標(biāo)準(zhǔn)分?jǐn)?shù)和T分?jǐn)?shù)六、原始分?jǐn)?shù)轉(zhuǎn)換教育評價的標(biāo)準(zhǔn)一、影響評價標(biāo)準(zhǔn)的因素 教育目標(biāo)、評價對象和條

5、件、科學(xué)理論、評價需要與意圖二、評價指標(biāo)設(shè)計的方法1特爾斐法2關(guān)鍵特征調(diào)查法3層次分析法教育評價的標(biāo)準(zhǔn)一、影響評價標(biāo)準(zhǔn)的因素教育評價信息的處理一、常用數(shù)據(jù)的處理方法1針對類別數(shù)據(jù)的處理方法:計算次數(shù)、眾數(shù)、百分比、卡方檢驗、列聯(lián)相關(guān)2等級數(shù)據(jù)的處理:計算中位數(shù)、百分位數(shù)、肯德爾和諧系數(shù)、等級相關(guān)3等距數(shù)據(jù)的處理:計算平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)、t檢驗、F檢驗教育評價信息的處理一、常用數(shù)據(jù)的處理方法 x2檢驗(Chi-square Test):既可用于推斷某個變量是否服從某種特定分布的擬合度檢驗,也可用于推斷兩個離散型變量是否存在依從關(guān)系的獨立性檢驗或推斷幾次重復(fù)試驗的結(jié)果是否是相同的同質(zhì)性檢驗。

6、例:某位老師調(diào)查了32位學(xué)生最喜歡的媒體類型:報刊、電視、電影、網(wǎng)絡(luò),結(jié)果是依次受歡迎人數(shù)是4、5、8、15。如果理論上每類媒體期望的人數(shù)應(yīng)該都是8。 此類問題中要檢驗的假設(shè)是: H0:四類媒體同樣受歡迎 H1:某類媒體比較受歡迎 x2檢驗(Chi-square Test):既可用于肯德爾和諧系數(shù)(Kendalls W):是一種應(yīng)用平均秩檢驗法的結(jié)果。首先將多個樣本數(shù)據(jù)混合按升序排列,并求出每個觀測值的秩,然后對各個樣本的秩分別求平均值,再計算Kendalls W。 Kendalls W和諧系數(shù)檢驗主要用于分析若干個評判者的評判標(biāo)準(zhǔn)是否一致。例如,在一次普通話比賽中,三名評委A、B、C對40名

7、選手的評分如表所示,試檢驗三名評委的評分標(biāo)準(zhǔn)是否一致??系聽柡椭C系數(shù)(Kendalls W):是一種應(yīng)用平均秩t檢驗是一種參數(shù)檢驗,主要涉及兩個樣本所來自的兩個總體的方差是否相等。 如果是比較兩組測試結(jié)果的均值時,可以用 檢驗。當(dāng)涉及多組樣本的均值比較問題時,還用 檢驗進(jìn)行兩兩比較是不合適的,因為它會大大降低檢驗的可信度,此時應(yīng)當(dāng)用到方差分析。F檢驗,與t檢驗直接比較兩組平均數(shù)的做法不同的是,方差分析把“平均數(shù)之間差異是否顯著”的問題轉(zhuǎn)化為“平均數(shù)組間變異是否顯著”的問題,通過“組間變異”與“組內(nèi)變異”的對比,進(jìn)行F檢驗,從整體上同時比較多組的平均數(shù)之間是否存在顯著差異。由于F分布統(tǒng)計量是一個

8、方差比,故稱這種檢驗方法為方差分析。t檢驗是一種參數(shù)檢驗,主要涉及兩個樣本所來自的兩個總體的方差二、評價信息的統(tǒng)計推斷 統(tǒng)計推斷是運用樣本信息來推斷總體情況的有效方法,它包括參數(shù)估計和假設(shè)檢驗兩個基本部分。(樣本的數(shù)字特征稱為統(tǒng)計量,總體的數(shù)字特征稱為參數(shù)。)1參數(shù)估計 常用的置信區(qū)間: 0.95置信區(qū)間=0.05顯著性水平,其意思是,估計正確的概率為95%,出現(xiàn)錯誤的概率為5%,此時Z值為1.96。 0.99置信區(qū)間=0.01顯著性水平,其意思是,估計正確的概率為99%,出現(xiàn)錯誤的概率為1%,此時Z值為2.58。2參數(shù)假設(shè)檢驗二、評價信息的統(tǒng)計推斷零假設(shè):即假設(shè)兩組數(shù)據(jù)的參數(shù)(如平均數(shù))無本

9、質(zhì)差異,用表達(dá)式表示則為: H0:u1=u2備擇/研究假設(shè):即假設(shè)兩組數(shù)據(jù)的參數(shù)有本質(zhì)差異。用表達(dá)式表示則為: H1:u1 u2注意事項: 當(dāng)樣本數(shù)量N30時,采用Z檢驗,反之采用t檢驗。 如果評價者只關(guān)心兩個平均數(shù)之間是否存在顯著差異,而不關(guān)心差異的方向,可采用雙側(cè)檢驗法。如果評價者可預(yù)測某一平均數(shù)應(yīng)大于或小于另一平均數(shù)時,則可采用單側(cè)檢驗法。如,樣本的平均數(shù)大于總體平均數(shù)時,則采用左側(cè)檢驗;樣本平均數(shù)小于總體平均數(shù)時,可采用右側(cè)檢驗。零假設(shè):即假設(shè)兩組數(shù)據(jù)的參數(shù)(如平均數(shù))無本質(zhì)差異,用表達(dá)式教育評價的質(zhì)量一、信度 測驗的信度是指測驗結(jié)果的可靠性或可靠程度。所謂可靠性是指對同一組對象進(jìn)行兩次相同測量所得結(jié)果的一致性和穩(wěn)定性程度。常用的信度估計方法有:(1)計算測驗內(nèi)部各項目的得分的一致性,得到同質(zhì)性信度;(2)用同一測驗對同一組被試,前后測驗兩次,據(jù)兩次測驗分?jǐn)?shù)計算其相關(guān)系數(shù),得到再測信度;(3)當(dāng)一種測驗只能施行一次且沒有復(fù)本時,可按測驗題目的奇偶

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論