教育評價與測量課件

上傳人：c*** IP屬地：貴州上傳時間：2022-09-25 格式：PPTX 頁數(shù)：19 大小：64.78KB 積分：22 舉報 版權(quán)申訴

已閱讀5頁，還剩14頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、教育評價與測量教育評價與測量教育評價與測量的發(fā)展歷史一、中國是考試的故鄉(xiāng)，是考試制度的發(fā)源地。現(xiàn)在學(xué)者一般認(rèn)為，考試制度在西周初見端倪，西周選士是我國考試制度的萌芽階段。 “一年視離經(jīng)辨志，三年視敬業(yè)樂群，五年視博習(xí)親師，七年視論學(xué)取友，謂之小成；九年知類通達(dá)，強(qiáng)立而不返，謂之大成。”學(xué)記教育評價與測量的發(fā)展歷史一、中國是考試的故鄉(xiāng)，是考試制度的發(fā)“古之教育，家有塾，學(xué)有庠，術(shù)有序，國有學(xué)。比年入學(xué)，中年考校，” 古代教育制度規(guī)定，20戶人家設(shè)一私塾，500戶的縣設(shè)一學(xué)堂，12500戶的行政區(qū)設(shè)學(xué)校，國都設(shè)大學(xué)。大學(xué)每年招收學(xué)生，每隔一年考查一次，第一年考查學(xué)生分析課文的能力和志趣；第三年考

2、查學(xué)生的專業(yè)思想是否鞏固，同學(xué)之年能否相親相助；第五年考查學(xué)生的知識是否廣博，對教師是否敬愛；第七年考查學(xué)生研究學(xué)問的本領(lǐng)和識別朋友的能力，合格的就叫“小成”。到第九年，學(xué)生對于學(xué)業(yè)已能觸類旁通，他們的見解行動已能堅定不移，這就叫做“大成”?！肮胖逃?，家有塾，學(xué)有庠，術(shù)有序，國有學(xué)。比年入學(xué)，中年考二、從教育測量走向教育評價1教育測量學(xué)科的誕生 1904年美國心理學(xué)家桑代克出版了論著精神與社會測量導(dǎo)論，被公認(rèn)是教育統(tǒng)計學(xué)、教育測量學(xué)、教育評價學(xué)等學(xué)科的第一本著作，首次較系統(tǒng)地介紹了教育統(tǒng)計方法及編制測驗的基本原理，標(biāo)志著教育測量理論的誕生。2進(jìn)入教育評價的時代泰勒在1940年的“八年研究”

3、報告書中，首次提出“教育評價”的概念。他認(rèn)為評價是一種確定行為實際變化程度的過程，并形成了泰勒“行為目標(biāo)評價模式”，他本人因此被稱為當(dāng)代教育評價之父。二、從教育測量走向教育評價三、第四代教育評價理論1測量時代：1900-19302描述時代：1930-19403判斷時代：1950、1960-19894應(yīng)答性模式：1989至今三、第四代教育評價理論教育測量的一般原理一、測量理論1經(jīng)典測驗(Classical Test Theory,CTT)2概化理論(Generalizability Theory, GT)3項目反應(yīng)理論(Item Response Theory,IRT)教育測量的一般原理一、測量

4、理論二、測驗的類型1常模參照測驗2標(biāo)準(zhǔn)參照測驗二、測驗的類型三、測量的數(shù)據(jù)類型1稱名量表和稱名量表數(shù)據(jù)2順序量表和順序量表數(shù)據(jù)3等距量表和等距量表數(shù)據(jù)4比率量表和比率量表數(shù)據(jù)離散型數(shù)據(jù)和連續(xù)型數(shù)據(jù)三、測量的數(shù)據(jù)類型四、數(shù)據(jù)的數(shù)字特征1集中量數(shù)：眾數(shù)、中位數(shù)、均值2離散量數(shù)：全距、四分位差、方差、標(biāo)準(zhǔn)差、差異系數(shù)五、數(shù)據(jù)的正態(tài)分布形態(tài)1正態(tài)分布是一種連續(xù)型隨機(jī)變量的概率分布，也稱其為常態(tài)分布。2負(fù)偏態(tài)分布也稱為右偏態(tài)分布3正偏態(tài)分布也稱為左偏態(tài)分布四、數(shù)據(jù)的數(shù)字特征六、原始分?jǐn)?shù)轉(zhuǎn)換1百分等級和百分位數(shù)2Z標(biāo)準(zhǔn)分?jǐn)?shù)和T分?jǐn)?shù)六、原始分?jǐn)?shù)轉(zhuǎn)換教育評價的標(biāo)準(zhǔn)一、影響評價標(biāo)準(zhǔn)的因素教育目標(biāo)、評價對象和條

5、件、科學(xué)理論、評價需要與意圖二、評價指標(biāo)設(shè)計的方法1特爾斐法2關(guān)鍵特征調(diào)查法3層次分析法教育評價的標(biāo)準(zhǔn)一、影響評價標(biāo)準(zhǔn)的因素教育評價信息的處理一、常用數(shù)據(jù)的處理方法1針對類別數(shù)據(jù)的處理方法：計算次數(shù)、眾數(shù)、百分比、卡方檢驗、列聯(lián)相關(guān)2等級數(shù)據(jù)的處理：計算中位數(shù)、百分位數(shù)、肯德爾和諧系數(shù)、等級相關(guān)3等距數(shù)據(jù)的處理：計算平均數(shù)、標(biāo)準(zhǔn)差、積差相關(guān)、t檢驗、F檢驗教育評價信息的處理一、常用數(shù)據(jù)的處理方法 x2檢驗（Chi-square Test）：既可用于推斷某個變量是否服從某種特定分布的擬合度檢驗，也可用于推斷兩個離散型變量是否存在依從關(guān)系的獨立性檢驗或推斷幾次重復(fù)試驗的結(jié)果是否是相同的同質(zhì)性檢驗。

6、例：某位老師調(diào)查了32位學(xué)生最喜歡的媒體類型：報刊、電視、電影、網(wǎng)絡(luò)，結(jié)果是依次受歡迎人數(shù)是4、5、8、15。如果理論上每類媒體期望的人數(shù)應(yīng)該都是8。此類問題中要檢驗的假設(shè)是： H0：四類媒體同樣受歡迎 H1：某類媒體比較受歡迎 x2檢驗（Chi-square Test）：既可用于肯德爾和諧系數(shù)（Kendalls W）：是一種應(yīng)用平均秩檢驗法的結(jié)果。首先將多個樣本數(shù)據(jù)混合按升序排列，并求出每個觀測值的秩，然后對各個樣本的秩分別求平均值，再計算Kendalls W。 Kendalls W和諧系數(shù)檢驗主要用于分析若干個評判者的評判標(biāo)準(zhǔn)是否一致。例如，在一次普通話比賽中，三名評委A、B、C對40名

7、選手的評分如表所示，試檢驗三名評委的評分標(biāo)準(zhǔn)是否一致?？系聽柡椭C系數(shù)（Kendalls W）：是一種應(yīng)用平均秩t檢驗是一種參數(shù)檢驗，主要涉及兩個樣本所來自的兩個總體的方差是否相等。如果是比較兩組測試結(jié)果的均值時，可以用檢驗。當(dāng)涉及多組樣本的均值比較問題時，還用檢驗進(jìn)行兩兩比較是不合適的，因為它會大大降低檢驗的可信度，此時應(yīng)當(dāng)用到方差分析。F檢驗，與t檢驗直接比較兩組平均數(shù)的做法不同的是，方差分析把“平均數(shù)之間差異是否顯著”的問題轉(zhuǎn)化為“平均數(shù)組間變異是否顯著”的問題，通過“組間變異”與“組內(nèi)變異”的對比，進(jìn)行F檢驗，從整體上同時比較多組的平均數(shù)之間是否存在顯著差異。由于F分布統(tǒng)計量是一個

8、方差比，故稱這種檢驗方法為方差分析。t檢驗是一種參數(shù)檢驗，主要涉及兩個樣本所來自的兩個總體的方差二、評價信息的統(tǒng)計推斷統(tǒng)計推斷是運用樣本信息來推斷總體情況的有效方法，它包括參數(shù)估計和假設(shè)檢驗兩個基本部分。（樣本的數(shù)字特征稱為統(tǒng)計量，總體的數(shù)字特征稱為參數(shù)。）1參數(shù)估計常用的置信區(qū)間： 0.95置信區(qū)間=0.05顯著性水平，其意思是，估計正確的概率為95%，出現(xiàn)錯誤的概率為5%，此時Z值為1.96。 0.99置信區(qū)間=0.01顯著性水平，其意思是，估計正確的概率為99%，出現(xiàn)錯誤的概率為1%，此時Z值為2.58。2參數(shù)假設(shè)檢驗二、評價信息的統(tǒng)計推斷零假設(shè)：即假設(shè)兩組數(shù)據(jù)的參數(shù)（如平均數(shù)）無本

9、質(zhì)差異，用表達(dá)式表示則為： H0：u1=u2備擇/研究假設(shè)：即假設(shè)兩組數(shù)據(jù)的參數(shù)有本質(zhì)差異。用表達(dá)式表示則為： H1：u1 u2注意事項：當(dāng)樣本數(shù)量N30時，采用Z檢驗，反之采用t檢驗。如果評價者只關(guān)心兩個平均數(shù)之間是否存在顯著差異，而不關(guān)心差異的方向，可采用雙側(cè)檢驗法。如果評價者可預(yù)測某一平均數(shù)應(yīng)大于或小于另一平均數(shù)時，則可采用單側(cè)檢驗法。如，樣本的平均數(shù)大于總體平均數(shù)時，則采用左側(cè)檢驗；樣本平均數(shù)小于總體平均數(shù)時，可采用右側(cè)檢驗。零假設(shè)：即假設(shè)兩組數(shù)據(jù)的參數(shù)（如平均數(shù)）無本質(zhì)差異，用表達(dá)式教育評價的質(zhì)量一、信度測驗的信度是指測驗結(jié)果的可靠性或可靠程度。所謂可靠性是指對同一組對象進(jìn)行兩次相同測量所得結(jié)果的一致性和穩(wěn)定性程度。常用的信度估計方法有：（1）計算測驗內(nèi)部各項目的得分的一致性，得到同質(zhì)性信度；（2）用同一測驗對同一組被試，前后測驗兩次，據(jù)兩次測驗分?jǐn)?shù)計算其相關(guān)系數(shù)，得到再測信度；（3）當(dāng)一種測驗只能施行一次且沒有復(fù)本時，可按測驗題目的奇偶

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

教育評價與測量課件

文檔簡介

溫馨提示

最新文檔

評論

教育評價與測量課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔