數學學習中常用的量化評價方法課件_第1頁
數學學習中常用的量化評價方法課件_第2頁
數學學習中常用的量化評價方法課件_第3頁
數學學習中常用的量化評價方法課件_第4頁
數學學習中常用的量化評價方法課件_第5頁
已閱讀5頁,還剩143頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、數學學習評價中常用的量化評價方式童莉重慶師范大學數學學院基于TIMSS和PISA的視角數學教育研究的范疇:為什么教和學數學?教和學什么樣的數學?怎樣教和怎樣學數學?教和學數學的效果怎么樣?(即:數學教育評價)教學評價(單向線性結構)教學評價(循環(huán)往復結構)過去:現在:時代背景:2001年基礎教育課程改革綱要指出,課程改革中應:建立促進學生全面發(fā)展的評價體系。評價不僅要關注學生的學業(yè)成績,而且要發(fā)現和發(fā)展學生多方面的潛能,了解學生發(fā)展中的需求,幫助學生認識自我,建立自信。發(fā)揮評價的教育功能,促進學生在原有水平上的發(fā)展。建立促進教師不斷提高的評價體系。強調教師對自己教學行為的分析與反思,建立以教師

2、自評為主,校長、教師、學生、家長共同參與的評價制度,使教師從多種渠道獲得信息,不斷提高教學水平。建立促進課程不斷發(fā)展的評價體系。周期性地對學校課程執(zhí)行的情況、課程實施中的問題進行分析評估,調整課程內容、改進教學管理,形成課程不斷革新的機制。 2003年普通高中數學課程標準(實驗)在“課程的基本理念”中指出:建立合理、科學的評價體系。現代社會對人的發(fā)展的要求引起評價體系的深刻變化,高中數學課程應建立合理、科學的評價體系,包括評價理念、評價內容、評價形式和評價體制等方面。評價既要關注學生數學學習的結果,也要關注他們數學學習的過程;既要關注學生數學學習的水平,也要關注他們在數學活動中所表現出來的情感

3、態(tài)度的變化。在數學教育中,評價應建立多元化的目標,關注學生個性與潛能的發(fā)展。例如,過程性評價應關注對學生理解數學概念、數學思想等過程的評價,關注對學生數學地提出、分析、解決問題等過程的評價,以及在過程中表現出來的與人合作的態(tài)度、表達與交流的意識和探索的精神。對于數學探究、數學建模等學習活動,要建立相應的過程評價內容和方法。2010年全日制義務教育數學課程標準(修改稿)在“課程基本理念”中指出:學習評價的主要目的是為了全面了解學生數學學習的過程和結果,激勵學生學習和改進教師教學。應建立目標多元、方法多樣的評價體系。評價既要關注學生學習的結果,也要重視學習的過程;既要關注學生數學學習的水平,也要重

4、視學生在數學活動中所表現出來的情感與態(tài)度,幫助學生認識自我、建立信心。 2010年國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年) 的“發(fā)展任務”中指出:義務教育階段發(fā)展任務之一:提高義務教育質量。建立國家義務教育質量基本標準和監(jiān)測制度。 高中教育階段發(fā)展任務之一:建立科學的教育質量評價體系,全面實施高中學業(yè)水平考試和綜合素質評價。 關注評價研究評價實施有效科學的評價“問題驅動”:問題一:什么叫數學學習評價?問題二:數學學習評價的常見類型有哪些?問題三:一個科學合理的評價體系應用包括哪些方面?問題四:常見的數學學習量化評價的誤區(qū)?問題五:如何保障數學學習量化評價的科學性?問題六:一個好

5、的測量應具有哪些特征?教育評價的含義及發(fā)展評價即考試.(自19世紀中葉本世紀30年代)教育評價的第一個時期-“心理測驗時期”。教育測量的研究取得了一系列的成果,在考試的定量化、客觀化與標準化方面,取得了重要的進展。強調以量化的方法對學生學習狀況進行測量。然而,當時的考試與測驗只要求學生記誦教材的知識內容,較為片面。無法真正反映學生的學習過程。拉爾夫.泰勒對評價的認識。(本世紀30年代-50年代)教育評價的第二個時期-“目標中心時期”,泰勒(Tyler, R) 提出了以教育目標為核心的教育評價原理,即教育評價的泰勒原理,并明確提出了“教育評價”(education evaluation)的概念,

6、從而把教育評價與教育測量區(qū)分開來,教育評價學就是在泰勒原理的基礎上誕生與發(fā)展起來的。在西方,一般人們都把泰勒稱為“教育評價之父”。問題一:什么叫數學學習評價?經常聽到老師這樣說:在此次數學期末考試中,張三同學考了90分,李四同學考了80分,這是對學生數學學習的評價嗎?考試是評價嗎?數學學習評價是全面搜集和處理學生數學學習過程中的信息,從而做出價值判斷、改進教育決策的過程。師:在此次數學期末考試中,張三同學通過平時的努力,取得了優(yōu)異的成績,李四同學與上次考試相比,獲得了明顯的進步。辨別:評價(Evaluation)與測量(measurement)、評估(Appraise)、評定(Assessme

7、nt)的區(qū)別問題二:數學學習評價的常見類型有哪些?診斷性評價、形成性評價、終結性評價相對性評價、絕對性評價、個體內差異評價目標取向評價、過程取向評價、個體取向評價問題三:一個科學合理的評價體系應用包括哪些方面?比如:國際數學學習評價TIMSS和PISA評價體系:評價目標(為什么評)評價對象(評誰)評價內容(評什么)評價方法(怎么評)問題四:常見的數學學習量化評價的誤區(qū)?(憑經驗)如何確定班級中等級評定人數?(錯誤比較)某生數學期中考試80分,期末考試78分,判斷說該生的數學成績退步了。 或兩個考生的總分相同,判斷說兩學生的成績相當。(簡單化比較)計算每次考試的平均分或及格率.(缺乏過程性比較)

8、就某次考試作分析,缺乏長期的對每個學生的跟蹤分析(缺乏成績背后影響因素的分析)科目原始分數甲乙語文7572數學8596外語9082合計250250考試種類 原始分數 期中考試80期末考試78崔允漷等.,2008.(3)總體抽樣樣本(所要考察對象的全體) 個體:總體中的每一個考察對象 樣本:從總體中抽取的一部分個體叫做這個總體的一個樣本 樣本容量:樣本中個體的數目 抽樣方法非隨機抽樣方便抽樣:如訪問過路行人。配額抽樣:分層非隨機抽樣。如市場調查,家庭每月消費調查。判斷抽樣:設計者基于對總體特征的了解,判斷選擇樣本,如物價指數調查。雪球抽樣:從起始受查者提供的資訊取得其他受查者,如同性戀調查。隨機

9、抽樣單純隨機抽象;機械抽樣;分層抽樣;整群抽樣問題:對本班同學對看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進行調查方案:將全班同學按學號編號,制作相應的卡片號簽,放入同一個箱子里均勻攪拌,從中抽出15個號簽,就相應的15名學生對看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進行調查抽簽法抽簽法的一般步驟:(1)將總體中所有個體編號(對已經有編號的個體, 可以省略編號的過程);(2)制作與個體編號相同的號簽;(3)將號簽放在一個箱子中攪勻;(4)按要求隨機抽取號簽,并記錄;(5)將編號與號簽一致的個體抽出抽簽法的適用范圍: 抽簽法簡單易行,適用于總體中個體數不多的

10、情形 抽簽法的制簽比較麻煩,如何簡化制簽過程?隨機數表法 制作一個表,其中每個數都是用隨機方法產生的,這樣的表稱為隨機數表如何用隨機數表來抽取樣本?16 22 77 94 39 49 54 43 54 82 17 37 93 23 78 87 35 20 96 43 84 26 34 91 64 84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 79 33

11、 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54 57 60 86 32 44 09 47 27 96 54 49 17 46 09 62 90 52 84 77 27 08 02 73 43 28例如選取第8行第9列開始.問題:為了檢驗某種產品的質量,決定從40件產品中抽取10件進行檢查,如何抽樣?6行:7行:8行:9行:10行:16191012073938332134機械抽樣(等距抽樣): 將總體分成均衡的幾個部分,然后按照預先定出的規(guī)則,從每一部分抽取一個個體,得到所需要的樣本,這種抽樣叫做系

12、統(tǒng)抽樣(也稱為等距抽樣) 問題:為了了解參加某種知識競賽的1000名學生的成績,應采用什么樣的抽樣方法恰當?(50個樣本)解:抽樣過程如下:(1)隨機將這1000名學生編號為1,2,3,1000(比如可以利用準考證號);(2)將總體按編號順序平均分成50部分,每部分包含20個個體(3)在第一部分的個體編號1,2,20中,利用簡單隨機抽樣抽取一個號碼,比如是18;(4)以18為起始號,每間隔20抽取一個號碼,這樣就得到一個容量為50的樣本:18,38,58,978,998 如果上述問題中,學生人數是1003,如何進行系統(tǒng)抽樣?解:(1)隨機將這1003個個體進行編號1,2,3,1003; (2)

13、利用簡單隨機抽樣,先從總體中剔除3個個體(可以隨機數表法),將剩下的個體重新編號然后按系統(tǒng)抽樣的方法進行系統(tǒng)抽樣的步驟:(1)采用隨機的方式將總體中的個體編號。為簡便起見,有時可直接采用個體所帶有的號碼,如考生的準考證號、街道上各戶的門牌號,等等;(2)整個的編號分段(即分成幾個部分),要確定分段的間隔k.當N/n(N為總體中的個體的個數,n為樣本容量)是整數時,k=N/n;當N/n不是整數時,通過從總體中剔除一些個體使剩下的總體中個體的個數N能被n整除,這時k=N/n;(3)在第一段用簡單隨機抽樣確定起始的個體編號;(4)按照事先確定的規(guī)則抽取樣本(通常是將l加上間隔k,得到第2個編號l+k

14、,第3個編號l+2k,這樣繼續(xù)下去,直到獲取整個樣本).(1)系統(tǒng)抽樣稱為等距抽樣;(2)注意當N/n不是整數時,要去掉一些個體,可以再用隨機數表的方法抽出剔除的個體;(3)系統(tǒng)抽樣適用于總體容量較大的情況;(4)系統(tǒng)抽樣是等可能抽樣注意以下4點: 分層抽樣(PPS):將總體按某種性質劃分成數個子總體(層),每一層分別按在總體中的相應比例應用簡單隨機抽樣法進行抽樣。TIMSS和PISA采用二級或三級PPS抽樣方法 (學樣抽樣、班級抽樣、學生抽樣)如:重慶市10000名初中畢業(yè)生,其中重點中學占20%,普通中學占50%,農村中學占30%。為了解數學成績,抽取100名進行成績分析,則應怎樣抽樣?整

15、群抽樣將總體按某種性質劃分成數個子總體(群),應用單純隨機抽樣法抽選樣本群,每一樣本群內全查。優(yōu)點:1.不需完整的個體名冊。2.執(zhí)行方便,成本較低。 分層隨機抽樣與群集抽樣比較分層抽樣群集抽樣層數較少,層內個體較多群數較多,群內個體較少層間個體差異較大,層內個體差異較小群間個體差異較小,群內個體差異較大所有層中至少都有一單位被選入樣本中只有部分群集被選為樣本分層抽樣只在每層中,選部分個體作為樣本群集抽樣則在被抽選之群集中進行普查或進行再次抽樣目的在減少抽樣誤差,提高樣本估計值之可靠度目的在減低抽樣成本或配合母體底冊成績分析之Z分數: 以“正態(tài)分布理論”為基礎正態(tài)分布:正態(tài)曲線正態(tài)分布在測驗中的

16、應用(1)將原始分數轉換成標準分數(2)確定錄取分數線(3)確定等級評定人數(4)品質評定數量化 某生數學期中考試80分,期末考試78分,是否可以說該生的數學成績退步了?兩個考生的總分相同,怎樣進行比較?Z分數: 優(yōu)點:具有可加性;具有可比性;可作 為舍棄異常數據的依據。T分數:T=KZ+C 返回某生數學期中、期末考試對照表考試種類 原始分數 全班平均值 標準差 標準分Z 標準分T期中考試80826.2-0.3218期末考試78756.50.4696成績分析表科目原始分數全體考生平均分標準差標準分T=10Z+50甲乙甲乙語文757270856.2552.50數學85968565068.33外語

17、908295742.8631.43合計250250149.1152.26問:誰的品質好一些?數學老師A班主任B張三甲丙李四乙乙成績分析之圖表分析: 以直觀性較強的統(tǒng)計表與統(tǒng)計圖來反映數據資料的特征。1、統(tǒng)計表簡單表分組表復合表頻數分布表 (1)累積百分比的作用更能說明成績水平 (2)百分等級分數:累積百分比 * 100;表示比該考生成績差的考生占考生總數的百分比;(TIMSS與PISA中的應用)思考:名次與百分等級分數(30人的小班中的第十名和120人的大班中的第十名是不是等值的。)20/30=66.7%110/120=91.7%成績組中值頻數累積頻數累積百分比50-52.5220.0455-

18、57.58100.2060-62.56160.3265-67.512280.5670-72.57350.7075-77.56410.8280-82.54450.9085-87.53480.9690-92.51490.9895-97.51501.00總和 502、統(tǒng)計圖直條圖圓形圖(扇形圖或餅圖)直方圖線形圖多邊圖累積多邊圖成績分析之集中情況分析: 集中量(描述單組數據典型水平或集中趨勢的量)集中量:平均數(算術平均數、加權平均數、幾何平均數、調和平均數)中位數 原始數據法: 5,7,9,13,15,21,70 (實在數)數據分布過偏(平均數:20) 3,5,7,9,13,15,16,19 (假

19、想數) 頻數分布表法:眾數以上幾種集中量的比較:平均數集中代表性較好,其次是中位數,然后是眾數。加權平均數舉例:某生平時數學成績?yōu)?0分,期中考試成績?yōu)?0分,期末考試成績?yōu)?5分.按學校規(guī)定學期成績中平時成績占有20%,期中考試成績占30%,期末考試成績占50%.問該生學期總評成績應為多少分?調和平均數舉例:設甲、乙、丙3個學生的解題速度如下:甲生每小時8題、乙生第小時7題、丙生每小時10題。求3 人的平均解題速度。成績分析之分散情況分析: 差異量(描述單組數據的離散程度的特征量)一組:1,3,5,7,14,60(平均數為15);二組:12,13,14,16,17,18(平均數為15)差異量

20、全距平均差方差標準差差異系數差異系數舉例:某市區(qū)入學男童(7歲組)體重的平均值為20.37kg,標準差為2.16kg;身高的平均值為113.64cm,標準差為4.04cm。問身高與體重哪個差異大?返回學生甲在初中一學年9次數學考試成績對照表考試次數123456789原始分868495989289948697百分等級分數604079897783892894平均分83.6 86.289.4888578.18689.284.9標準差9.48.56.98.29.38.26.355.47.8標準分0.25-0.260.811.220.750.961.26-0.591.55某班一學期幾次考試的成績分析表:

21、考試次數平均數標準差5%分數10%分數25%分數50%分數75%分數90%分數95%分數12成績的集中情況與分散情況的分析可利用SPSS軟件進行分析處理SPSS軟件簡介:早期名稱:Statistical Package for Social Science。社會科學統(tǒng)計軟件包現在名稱:Statistical Products and Services Solutions。統(tǒng)計產品與服務解決方案歷史沿革:1970年代即進入市場,早期僅能在主機電腦上執(zhí)行,1985年推出DOS版,1990年推出Widows版,2002年推出SPSS11.5 for Windows。SPSS的基本作用方式窗口式數據編

22、輯窗口(data editor):對SPSS的數據進行定義、錄入、修改、管理等基本操作的窗口 。輸出窗口(Viewer):SPSS統(tǒng)計分析報表及圖形的輸出窗口 利用SPSS做數據分析的一般步驟: 建立SPSS數據文件(定義數據文件結構、錄入修改和編輯待分析的數據)分析數據(統(tǒng)計分析之前的數據預處理、統(tǒng)計分析和建模)結果的說明和解釋數據和分析結果的保存SPSS菜單和工具欄SPSS的基本對話框:分析案例:成績分析之相關情況分析: 相關量(描述兩組數據的相關程度的特征量)相關量相關系數r(-1r 1)r0,正相關r30公式:舉例: 求某班50個學生的某次測驗的數學與物理成績的相關程度.等級相關:條件

23、: 變量以等級次序排列公式:舉例:序號數學分數X物理分數YX等級Y等級D1949311002909222.5-0.50.25386923.52.511486703.57-3.512.255728254116707665.50.50.257686579-248667685.52.56.25964689811106160101000N=10 =2610個學生數學分數與物理分數表點二列相關:條件:兩變量中有一個是二分變量公式:舉例:在某班中隨機抽取15名學生的數學期末考試成績如下.問該次考試成績與性別的相關程度.性別男 男 男 男 女 男 男 女 女 女 男 女 女 男 男成績86 91 90 66

24、 58 99 74 88 72 89 62 65 78 67 85 相關條件: 二列變量都是二分變量公式:另一類數據合計錄取未錄取一類數據男aba+b女cdc+d合計a+cb+da+b+c+d=N運用SPSS作相關分析成績分析之差異情況分析: 問:兩個班的數學成績是否有顯著性差異?假設檢驗任務:判斷差異的原因方法:(反證法)步驟:1、提出原假設(零假設) 2、選擇和計算教育統(tǒng)計量; 3、對給定的顯著性水平確定臨界值 4、將統(tǒng)計量計算的結果與臨界值比較,從而決定拒絕還是接受原假設。常用的統(tǒng)計檢驗方法:假設檢驗:z檢驗(兩平均數的差異檢驗)T檢驗 (兩平均數的差異檢驗)F檢驗( 兩個獨立樣本的方差

25、齊性檢驗 ) 檢驗(對樣本的頻數分布所來自的總體分布是否服從某種理論分布或某種假設分布所作的假設檢驗. )Z檢驗:條件:總體標準差已知或N30類型:單總體Z檢驗:雙總體Z檢驗:T檢驗:條件:總體標準未知,且N30類型:單總體T檢驗:雙總體T檢驗:(無關小樣本)(相關樣本)其中,例:某校歷屆畢業(yè)生數學測驗平均分數為66分,標準差為11.7?,F以同樣的試題測驗應屆畢業(yè)生,并從中隨機抽18份試卷,算得平均分為69分。問該校應屆與歷屆畢業(yè)生數學測驗成績是否一樣?假設檢驗:1、原假設:假設該校應屆與歷屆畢業(yè)生數學成績無顯著性差異,即 u66分;2、計算統(tǒng)計量:3、確定臨界值:0.05,臨界值1.964、

26、判斷:因為1.092.093,有顯著性進步)例:在初三年級的學生中隨機抽取10名學生,在學期初和學期末進行了兩次推理能力測驗,成績分別為79.5分和71分,標準差分別為9.124,9.940,相關系數為0.704.問兩次測驗成績是否有顯著的差異?( 2.262,有顯 著性差異 )例:一次數學考試后,從兩個學校分別隨機抽取試卷n1=10份和n2=9份,算得的樣本修正方差即總體方差估計值為 =236.8, =63.36.問兩校這次考試離散程度是否有顯著差異?( 3.04,有顯著差異)例:從某校高中應屆畢業(yè)生中抽54人進行體檢,健康狀況屬于良好的有15人,中等的有23人,差的有16人.問該校高中應屆

27、畢業(yè)生的健康狀況好中差的人數比率是否是1:2:1?( 1.70,接受原假設。 )方差分析t檢驗法適用于樣本平均數與總體平均數及兩樣本平均數間的差異顯著性檢驗;實際研究中往往需要對三個或三個以上樣本的均值進行差異顯著性檢驗.方差分析的目的:通過分析實驗數據中不同來源的變異對總體變異貢獻的大小,從而確定自變量的不同水平是否對因變量產生了顯著的影響.使用條件:正態(tài)分布變異的同質性各個觀測值之間是獨立的.案例:某研究要比較1、3、5年級小學生識記生字量的年級差異。從小學1、3、5年級分別隨機抽取30名被試,先讓他們識記15個生字,然后對他們識記過的生字進行回憶測驗,并對測驗所得分數進行收集。(運用SP

28、SS軟件)問題六:一個好的測量應具有哪些特征?經典測量理論(良好測驗的特征)信度: 含義:穩(wěn)定性、可靠性、一致性(無目標) 判斷方法 效度: 有效性(實現目標的程度) 判斷方法難度: 測驗項目的難易程度 判斷方法區(qū)分度:測驗對考生實際水平的區(qū)分程度 判斷方法信度的判斷方法再測信度:測驗A1 測驗A2(適用于速度測驗,而不適用于難度測驗的信度計算)復本信度:以兩個等值但具體內容不同的量表,在最短時距內,對相同被試先后施測兩次 測驗A1 測驗B1內部一致性系數:同一測驗的兩個部分(例如分為奇數題和偶數題,或測驗的前一半和后一半)得分的相關系數。信度介于0到1之間,低于0.35屬于低信度,應拒絕使用

29、;在0.5以上,可認為考試可靠;在0.8以上,可認為考試的信度比較好.適當時距最短時距效度的判斷方法:效標關聯效度(是指測驗分數與作為效標的另一獨立測驗結果之間的一致性程度。)內容效度(是指測驗內容與預定要測的內容之間的一致性程度。邏輯分析法;克龍巴赫法、評分一致性考查法、前后測比較法)構想效度(是指測驗成績能夠解釋心理學理論上的某種結構或特質的程度。步驟:建立理論結構提出有關測驗成績的假設驗證假設)難度的判斷方法客觀題的方法主觀題的方法難度P在0-1之間最易容易適中較難難很難P0.950.850.700.500.300.10章節(jié)考試20%40%30%10%高考30%30%20%20%競賽20

30、%30%30%20%區(qū)分度的判斷方法得分率求差法:D=PH-PL得分求差法:區(qū)分度對題目性能的評價標準: 0. 40 很好。 試卷各題得分分析(平均分、標準差)(七年級某題)在計算機上,為了讓使用者清楚、直觀的看出磁盤“已用空間”和“可用空間”占“整個磁盤空間”的百分比,那么比較適合的統(tǒng)計圖是( ) A、扇形統(tǒng)計圖 B、條形統(tǒng)計圖 C、折線統(tǒng)計圖 D、以上都可以估計難度:0.9(難度:*,區(qū)分度:*)考察的核心內容與能力:統(tǒng)計數據的活動,知道事實要考查的子技能: 了解“磁盤空間”常識,回答簡單的實際問題涉及的知識要素:統(tǒng)計圖題干特征: 給出“磁盤空間”的百分比,用比較適合的統(tǒng)計圖表示選擇支特征

31、:(1)設四個選項,其中有一個是正確的A;(2)三個錯誤的選項,B、C、 D 是沒有理解“比較適合”的含義。 (七年級某題)某商店一次賣給顧客兩臺彩電,賣出價都是1500元,其中一臺盈利20%,另有一臺虧了20%。在這次交易中,這家商店的盈虧情況是() A、虧了125元B、不虧不盈C、盈利125克D、盈虧不能確定。估計難度:難;估計難度:0.4 (難度:*,區(qū)分度:*)考察的核心內容與能力:數與代數,非常規(guī)問題解決要考查的子技能:能夠根據非常規(guī)問題中的數量關系,列出方程,求出未知數的值,從而解決實際問題。涉及的知識要素:例一元一次方程、解一元一次方程題干特征:聯系實際生活選擇支特征:(1)設四

32、個選項,其中有一個是正確的A;(2)三個錯誤的選項,B、錯在將虧了20%和盈利的20%相加減;C屬于計算錯誤;D不能對問題進行具體分析。期待著您的共同討論、共同研究!謝謝大家!項目反應理論經典測量理論的局限性真實分數=實測分數+誤差問題:(1)測量次數夠多時,誤差才會相互抵消(2)考生得分相同,是否其真實能力也一樣?(3)對考試題目的評價(難度、區(qū)分度、猜測度等),嚴重依賴于被測對象。IRT項目反應理論(item response theory)也稱潛在特質理論或潛在特質模型,是一種現代心理測量理論,其意義在于可以指導項目篩選和測驗編制。項目反應理論假設被試有一種“潛在特質”,潛在特質是在觀察

33、分析測驗反應基礎上提出的一種統(tǒng)計構想,在測驗中,潛在特質一般是指潛在的能力,并經常用測驗總分作為這種潛力的估算。項目反應理論認為被試在測驗項目的反應和成績與他們的潛在特質有特殊的關系。通過項目反應理論建立的項目參數具有恒久性的特點,意味著不同測量量表的分數可以統(tǒng)一。項目反應理論通過項目反應曲線綜合各種項目分析的資料,使我們綜合直觀地看出項目難度、鑒別度等項目分析的特征,從而起到指導項目篩選和編制測驗比較分數等作用。目的:選取難度適中,區(qū)分度高、猜測度低和信息量豐富的試題組成一份考卷或測驗卷,考查學生的真實能力。題目特征曲線和信息曲線D=1.702(常數), 表示考生能力水平,a表示題目區(qū)分度,

34、b表示題目的難度系數,c表示題目的猜測系數. 表示能力為 的考生答對此題的概率,即正確反應概率.特征曲線拐點處的斜率,即斜率的最大值。表示題目的區(qū)分度,它的值越大說明題目對受測者的區(qū)分程度越高。 特征曲線上最陡的那一點所對應的值,表示題目的難度。 特征曲線的截距,表示題目的猜測參數,它的值越大,說明不論受測者能力高低,都容易猜對本道題目。 數學學習評價的目的與功能(為什么評價)目的:提供教與學狀況的準確信息,促進教與學的改進。(為學生提供信息、為教師提供信息、為家長提供信息、為教育系統(tǒng)提供信息)功能:甄別、選拔 反饋、 診斷、激勵、 導向、決策基礎教育課程改革綱要指出:改變課程評價過分強調甄別

35、與選拔的功能,發(fā)揮評價促進學生發(fā)展、教師提高和改進教學實踐的功能。 XX同學此次考試成績優(yōu)異或有明顯的進步!某某同學基礎知識和基本技能掌握不牢或解題時經常粗心大意!王小明同學,本學期我們學習了收集、整理和表達數據。你通過自己的努力,能收集、記錄數據,知道如何求平均數,了解統(tǒng)計圖的特點,制作的統(tǒng)計圖很出色,在這個方面是全班最好的。但你在使用語言解釋統(tǒng)計結果方面有一定困難。繼續(xù)努力,小明! 評定等級:B。數學學習評價的內容(評價什么)學生數學學習評價 數學基礎知識與基本技能(“了解、理解、掌握、應用” 與“經歷、體驗、探索 ”的結合 )數學學習的過程與方法(包括解決問題、數學推理和交流能力等)數學

36、學習情感、態(tài)度與價值觀(參與數學活動的情況、思考問題、合作交流等)數學學習評價的方法(如何評價)量化的評價方法(是一種力圖把復雜的教育現象簡化為數量,進而從數量的分析與比較中推斷某一評價對象的成效的評價方式)如:測驗法、問卷調查法質性評價方法(是以研究者本人作為研究工具,在自然情境下采用多種資料收集方法對現象進行整體性探究,全面充分揭示和描述評價對象的各種特質,以彰顯其中的意義,促進理解的一種評價方式)如:觀察法、訪談法 教育測量:根據教育目標的要求,按照一定的規(guī)則對教育活動的效果加以數量化測定的過程。教育測量與評價關系:、測量為評價提供依據,是評價信息的主要來源,如無測量提供的資料,評價將失

37、去作價值判斷的依據;、測量的結果只有通過評價才能獲得實際意義,成為決策者有參考價值的信息。 泰勒原理介紹:(1) what educational purposes should the school seek to attain? “確定教育目標”(2) What educational experiences can be provided that are likely to attain these purposes? “選擇教育經驗”(3) How can these educational experiences be effectively organized? “組織教育經驗”

38、(4) How can we determine whether these purposes are being attained? “評價教育計劃”返回布盧姆的教育目標分類系統(tǒng)介紹(1)認知領域(6級):識記、領會、運用、分析、綜合、評價(2)情感領域(5級):接受、反應、價值化、組織、價值與價值體系的性格化(3)動作技能領域(6級):反射動作、基礎性的基本動作、知覺能力、生理能力、技能動作、有意活動返回 國際數學學習評價簡介TIMSS與PISA TIMSS簡介PISA簡介TIMSS與PISA的區(qū)別與聯系TIMSS簡介TIMSS的含義:是由國際教育成就評價協(xié)會(簡寫為IEA)組織的,原為T

39、hird International Mathematics and Science Study,每四年進行一次,現為Trends in International Mathematics and Science Study的縮寫。 TIMSS的特點:是當今世界最大、最廣且最嚴格的國際性評價研究。TIMSS的評價體系測評題與問卷樣例 思考:運用TIMSS所收集的數據可進行哪些方面的評價研究?(國家或地區(qū)間成績比較、國家成績的發(fā)展趨勢、成績的性別差異比較、測成績的影響因素(語言、父母受教育程度、電腦、對數學的態(tài)度、到校情況、學校資源、學校氛圍)、數學課程與教學的比較(課程標準、教材使用、教學指導

40、方式、家庭作業(yè)、數學測驗情況)TIMSS的評價體系:評價目的:了解學生對數學和科學課程的掌握情況,對各國數學教育和科學教育的情況進行比較研究 。評價對象:各個國家和地區(qū)4年級(不低于9.5歲)和8年級(不低于13.5歲)的在校學生 。評價內容評價方式TIMSS的評價內容:內容領域(content domain)Grade 4: Number(數), Geometric Shapes and Measures(幾何圖形與測量), Data Display(數據表示) Grade 8: Number(數), Algebra(代數), Geometry(幾何), Data and Chance(數據

41、和概率)。 認知領域(cognitive domain) Knowing(理解), Applying(應用)and Reasoning(推理) TIMSS的評價方式:三層次課程模型: 預期課程(Intended Curriculum) ; 實施課程(Implemented Curriculum) ; 達到課程(Attained Curriculum) 評價的方法 “紙筆測試”+“背景問卷”(學生問卷、教師問卷、學校問卷、課程問題) 評價模型: 課程問卷預期課程實施課程達到課程校長、教師問卷測試題、學生問卷PISA簡介PISA的含義:PISA(The Programme for Internat

42、ional Student Assessment)是世界經濟合作與發(fā)展組織(The Organization for Economic Co-operation and Development,以下簡稱OECD)的一項國際學生評價項目。 PISA的特點:每三年進行一次,每次重點關注點不同。2000年以閱讀素養(yǎng)為主,2003年以數學素養(yǎng)為主,2006年以科學素養(yǎng)為主。每三次為一個循環(huán)。PISA的評價體系測試題與問卷樣例思考一:運用PISA所收集的數據可進行哪些方面的評價研究?思考二:上海2009年參加PISA的結果?PISA的評價體系評價目的:評價學生現實生活和終生學習所必需的知識技能等基本素養(yǎng)

43、的掌握狀況,以判斷學生是否具備未來生活所需的知識、技能和終身學習的能力 。評價對象:各國和地區(qū)15歲的初中畢業(yè)生(15歲3個月到16歲2個月年齡段之間完成義務教育的學生) 評價內容評價方式PISA的評價內容:打破了學校課程的限制,按照數學素養(yǎng)的定義,以數量、空間和圖形、變化和關系、不確定性為主要內容領域;以再現、聯系、反思把解決數學問題的能力分為三組 。再現組:標準化的呈現和定義;常規(guī)計算;常規(guī)問題解決聯系組:模式化;標準問題解決轉化和解釋;多種明確的方法 反思組:復雜問題解決和呈現;反思和洞察;新穎的數學方法;多種復雜的方法;推廣 評價方式:PISA建立在“終身學習”(Lifelong le

44、arning)的動態(tài)模型基礎之上,認為:終身學習就是一個人在他的一生中不斷通過學習獲得為成功地適應不斷變化的世界所必需的新知識和技能。 評價方法:“紙筆測試”+“背景問卷”(學生問卷、學校問卷、家長問卷、ICT問卷) 上海2009年PISAPISA2009有65個國家和地區(qū)參加測評,其中,中國上海152所學校的5115名15歲在校生首次參測,奪行閱讀、數學、科學三冠。引起了國際的關注。美國紐約時報2010年12月一則消息(中國在)國家學生水平評測的前茅成績令(美國)教育家驚詫,曾在里根政府期間教育部任職的切斯特E 費恩甚至說“我感到有點震驚,這讓我想到史普尼克”;日本共同社指出,“上海的教育模

45、式引起了全球矚目”。巴黎法新社指出,“上海青少年有全世界最好的教育”。各國家和地區(qū)對中國學生的印象大為改觀,不僅認可中國上海教育質量的提升,還紛紛挖掘上海教育經驗,充分肯定了上海教育均衡發(fā)展政策和新課改的成效。冷思考:(1)上海的成績能代表中國的成績嗎? (2)成績背后學生的付出? (3)中國日報2010年11月的一篇報道“中國學生想象力倒數第一,創(chuàng)造力倒數第五”(“錢學森之問”和“諾貝爾獎情結”)平均分和標準差表次數123456789平均分數83.6 86.289.4888578.18689.284.9班級標準差9.48.56.98.29.38.26.355.47.8學生甲在初中一學年9次數

46、學考試成績對照表考試次數123456789原始分868495989289948697標準分0.25-0.260.811.220.750.961.26-0.591.55TIMSS系列研究是當今世界最大、最廣且最嚴格的國際評價研究,具體體現在以下幾個方面:參與國家多。參與TIMSS1995,1999,2003,2007測評的國家和地區(qū)數依次為45,38,49,59。較IEA在1980 -1982年組織的第二次國際數學研究的20個國家來說,其數目增加了約一倍.參加測試的學生人數多.如在TIMSS1995,參加測試的學生有50多萬,來自15, 000多所學校.涵蓋的數學測試內容廣。內容領域和認知領域調查的對象范圍廣.TIMSS系列

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論