教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt_第1頁
教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt_第2頁
教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt_第3頁
教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt_第4頁
教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt_第5頁
已閱讀5頁,還剩71頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、教育統(tǒng)計與測量的基礎(chǔ)知識,第一節(jié) 教育統(tǒng)計基礎(chǔ)知識,一、教育統(tǒng)計與測量概述,1. 什么是統(tǒng)計學(xué) 統(tǒng)計學(xué)是研究統(tǒng)計原理和方法的科學(xué)。具體地說,它是如何搜集、整理、分析反映事物總體信息的數(shù)字資料,并以此為依據(jù),對總體特征進行推斷的原理和方法。,(1) 數(shù)理統(tǒng)計:以概率論為基礎(chǔ),對統(tǒng)計數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋,對統(tǒng)計原理和方法給予數(shù)學(xué)的證明。 (2) 應(yīng)用統(tǒng)計:統(tǒng)計原理在某個行業(yè)的具體應(yīng)用。如工業(yè)統(tǒng)計學(xué)、教育統(tǒng)計學(xué)等。,2.統(tǒng)計學(xué)分類,3. 教育統(tǒng)計,教育統(tǒng)計是運用數(shù)理統(tǒng)計原理和方法,研究教育問題的一門應(yīng)用科學(xué)。主要包括: 描述統(tǒng)計; 推斷統(tǒng)計; 實驗設(shè)計。,. 教育統(tǒng)計中幾個名詞,頻數(shù):隨機事件

2、在n次試驗中出現(xiàn)的次數(shù),稱這個隨機事件的頻數(shù)。 頻數(shù)分布:各種隨機事件在n次試驗中出現(xiàn)的次數(shù)分布,稱為頻數(shù)分布。 離差:個體量和某一群體的平均量之差。,教育統(tǒng)計中幾個名詞,正態(tài)分布:是一種連續(xù)型隨機變量的概率分布。 二項式分布中當 p=q時,且n很大時,二項式分布接近于正態(tài)分布,二、統(tǒng)計表,構(gòu)成:統(tǒng)計表一般由標題、表號、標目、表注等構(gòu)成。 編制基本原則:結(jié)構(gòu)簡明,一目了然。,統(tǒng)計表基本格式,表的標題 ? ? ?,注腳:說明資料來源等 X X X,表1 初三(1)班男女生數(shù)學(xué)成績分布統(tǒng)計表,三. 統(tǒng)計圖統(tǒng)計圖由標題、圖號標目、圖注等項構(gòu)成。,1. 直條圖,2. 圓形圖,3. 線條圖,4. 頻數(shù)頒

3、布直方圖 圖.4中考化學(xué)統(tǒng)計成績直方圖,5. 累積頻數(shù)圖圖.5 2004年中考化學(xué)抽樣得分情況累積頻數(shù)圖,10 20 30 40 50 60 70 80 90 100,圖2.6:高一語文,四、集中量,1. 算術(shù)平均數(shù)( ) 所有觀察值總和除以總頻數(shù)之和所得商。,四、集中量,2. 加權(quán)平均數(shù)( ) 是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù) 或. N表示各組的頻數(shù);X 表示各組的平均數(shù)。,例1:一個學(xué)生某門課期中考試成績?yōu)?2分,期末考試成績?yōu)?6分,而期考試占總成績的40%,期末占60%,這個學(xué)生的學(xué)期總分是多少?,例2 :某校初一共有3個班,某次語文測驗中,一班50人均分為68,二班45人均分為75

4、,三班40人均分為80,問全校初一語文的平均成績? 不能用:(68+75+80)/3=74.33,正態(tài)分布圖,偏正態(tài)分布,五、差異量,1. 全距(R) 一組數(shù)據(jù)中最大值和最小值之差表示,又稱極差。 2. 標準差(或S) 標準差概念:標準差是指離差平方和后平均的方根。,問題1:,某班甲乙兩組在一次測驗中的成績分別為65,68,71,72,74(均分為70分)和 30,50,86,90,94(均分為70分)。如何評價兩組的學(xué)習(xí)情況?,方法一:根據(jù)定義式計算 方法二:根據(jù)原始數(shù)據(jù)計算 方法三:利用計算器計算 方法四:利用計算機計算,3.差異系數(shù)(變異系數(shù)),兩個群體測量單位不同,或雖測量單位相同,平

5、均數(shù)相差很大時,不能用標準差比較他們離散程度,可利用差異系數(shù)。,問題2:某校期末考試語文平均成績?yōu)?9.3分,標準差為11.2分;英語平均成績?yōu)?4.8,標準差為13.8分。問哪一學(xué)科離散程度大?,問題3:設(shè)某考區(qū)已錄取高中學(xué)生語文平均分為69分,標準差為12.5分,而未錄取高中的學(xué)生語文平均分為40分,標準差為12.5分。比較他們語文成績的離散程度。 CV1=12.5/69 *100%=18.12%; CV2=12.5/40 *100%=31.25%。 未錄取學(xué)生的離散程度大。,問題4:下表中是某班甲乙兩同學(xué)的期末考試成績,問:(1)甲同學(xué)的語文和數(shù)學(xué)哪科相對較好? (2)甲同學(xué)和乙同學(xué)相比

6、,哪一個學(xué)業(yè)成績較好?,六、標準分,(1)概念:標準分是將原始分數(shù)(測驗分數(shù))與平均分數(shù)相減,再除以標準差所得的商。 甲同學(xué): z(語文)=(73-48.3)/ 3.9=1.8 z(數(shù)學(xué))=(79-66.9) / 18.5=0.7,(2)標準分特點,標準分是以標準差為單位的,故稱為標準分。它是一種相對地位分。 標準分有正負之分,一般在-3,3中(幾率為99.74%) ,平均值為零。 標準分可比性根據(jù)在于標準正態(tài)分布。 T分數(shù):T=100Z+500 (一般200T800),(3)標準分應(yīng)用,比較各個學(xué)生成績在班級中地位; 比較某個學(xué)生兩科或多科測驗中所得分的優(yōu)劣,精確地計算學(xué)生的總成績。 確定等

7、級評定的人數(shù)。,七、相關(guān)系數(shù),相關(guān):是指兩個或兩個以上變量之間存在相互依存關(guān)系。如數(shù)學(xué)課成績與數(shù)學(xué)競賽成績、數(shù)學(xué)與物理成績等。 正相關(guān) 負相關(guān) 零相關(guān),相關(guān)系數(shù):用來描述兩個變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。最常用的是積差相關(guān)系數(shù)。,數(shù)學(xué)與物理、物理與英語相關(guān)性比較,相關(guān)系數(shù)與相關(guān)程度表一覽表表,八、差異顯著性檢驗假設(shè)檢驗的基本原理,1.假設(shè) 虛無假設(shè)(零假設(shè)):是關(guān)于當前樣本所屬的總體(指參數(shù))與假設(shè)總體(指參數(shù))無區(qū)別的假設(shè),一般H0表示。 備擇假設(shè)(研究假設(shè)):是關(guān)于當前樣本所屬的總體(指參數(shù))與假設(shè)總體(指參數(shù))相反的假設(shè),一般用H1表示。 由于直接檢驗備擇假設(shè)的

8、真實性困難,假設(shè)檢驗一般都是從虛無假設(shè)出發(fā),通過虛無假設(shè)的不真實性來證明備假設(shè)的真實性。,八、差異顯著性檢驗,2. 小概率事 在隨機事件中,概率很小的事件被稱為小概率事件,習(xí)慣上約定在0.05以下,即當P(A) 5%時,則稱A為小概率事件。在統(tǒng)計推斷中認為,小概率事件在一次試驗或觀察中是不可能發(fā)生的。,八、差異顯著性檢驗,3.顯著性水平 兩種水平 (1)=0.05,顯著性水平為0.05,即統(tǒng)計推斷時可能犯錯誤的概率5%,也就是在95%的可靠程度上進行檢驗; (2) =0.01,顯著性水平為0.01,即統(tǒng)計推斷時可能犯錯誤的概率1%,也就是在99%的可靠程度上進行檢驗。,八、差異顯著性檢驗,4.

9、雙樣本Z檢驗 雙樣本均為大樣本,N1、N2都大于30,并標準差相差不很大。(小于30要用t檢驗),八、差異顯著性檢驗,例3:某校高一進行數(shù)學(xué)教改實驗,若實驗前兩班的化學(xué)成績無顯著性差異,實驗一段時間后的數(shù)學(xué)測驗成績,實驗班51名為均分為62.37,標準差為13.65,對照班45名學(xué)生的均分為56.16,標準差為16.37,試進行差異性檢驗。,(1)提出假設(shè) 虛無假設(shè)H0:1=2(實驗班和對照班樣本來自同一個總體)。 備擇假設(shè)H1:12 (實驗班和對照班樣本不是來自同一個總體)。 (2)選擇統(tǒng)計量,計算其值 (3)確定顯著水平=0.05。 (4)統(tǒng)計決斷 |.0 1.96,則0.05,拒絕零假設(shè)

10、。實驗班和對照的化學(xué)成績存在顯著差異,雙側(cè)檢驗統(tǒng)計決斷規(guī)則,第二節(jié) 教育測量的質(zhì)量特性,一個高質(zhì)量的測驗,它的結(jié)果是可靠而且是有效的; 可靠性(信度)和有效性(效度)是評價測驗質(zhì)量的兩個重要指標。,一、教育測量的信度和效度,當一個測驗多次測量的結(jié)果一致時,它就被認為是可靠的; 估計測量一致性程度的指標被稱為信度。,如果在大體相同的條件下,幾次測驗都得到了大體相同的分數(shù),那么這個測驗的信度是較高的,反之,信度就低; 即如果被試的實得分數(shù)與真實分數(shù)差距小,則測驗的分數(shù)越可靠,信度越高。 通常用信度系數(shù)衡量測驗好壞: 一般能力與學(xué)籍測驗的信度系數(shù)常在0.9以上; 性格、興趣、態(tài)度等人格測驗常在0.8

11、-0.85之間,有的認為0.7以上。,估計信度的方法,再測信度 復(fù)本信度 分半信度 內(nèi)部一致性信度,試卷的信度,2i:每一道試題的方差; 2:全卷的方差; k試卷中試題的數(shù)目。,教育測量的效度,效度是測量的有效性,即一個測驗對它所要測量的特性準確測量的程度。 效度不僅受隨機誤差的影響,還受系統(tǒng)誤差的影響。,效度的類型,內(nèi)容效度 構(gòu)想效度 內(nèi)部效度 統(tǒng)計結(jié)論效度 外部效度,內(nèi)容效度,題目對欲測的內(nèi)容或行為范圍取樣的適當程度,即是否充分代表了該范圍內(nèi)的基本知識和基本能力。 要具備好的內(nèi)容效度要滿足兩個條件: 確定好內(nèi)容范圍; 測試題目具有該范圍的代表性。,確定內(nèi)容效度的方法,專家判斷法 再測法,內(nèi)

12、容效度較適合評價教育成就測驗和職業(yè)選拔測驗; 缺乏可靠的數(shù)量指標,妨礙各測驗間的相互比較。,構(gòu)想效度,測驗對理論上的構(gòu)想或特質(zhì)的測量程度; 即測驗所提供的數(shù)據(jù)同理論假設(shè)的符合程度。,要獲得較高的構(gòu)想效度:,理論構(gòu)思必須結(jié)構(gòu)嚴謹,符合邏輯,層次分明,形成某種“構(gòu)思網(wǎng)絡(luò)”; 對研究的各種變量作出明確、嚴格的說明; 給變量下明確的操作定義,并制定相應(yīng)的、客觀的測量指標; 消除或控制影響構(gòu)思效度的因素。,影響構(gòu)思效度的因素,對構(gòu)思缺乏明確的說明,概念解釋模糊,邏輯關(guān)系不清; 單一方法和操作引起的偏差; 構(gòu)思水平之間的混亂; 研究過程中主試的期望、被試因猜測而發(fā)生的心理與行為的改變,不同實驗處理的相互作

13、用等。,內(nèi)部效度,自變量與因變量之間存在一定關(guān)系的明確程度; 即所研究的兩個或多個變量之間是否存在一定的關(guān)系?是否確實是自變量的變化引起了因變量的變化?,影響內(nèi)部效度的因素:,成熟因素; 歷史因素; 被試選擇上的差異; 被試缺失產(chǎn)生的效應(yīng); 前測的影響; 實驗程序不一致等,統(tǒng)計結(jié)論效度,檢驗研究結(jié)果的數(shù)據(jù)分析程序與方法的有效性的指標。 主要受數(shù)據(jù)的質(zhì)量,統(tǒng)計的假設(shè)等因素影響。,研究的外部效度,研究結(jié)果能夠一般化和普遍化到樣本來自的總體和其他變量條件、時間和背景中去的程度,即研究結(jié)果的普遍性和代表性。,再測信度,用同一個測驗,對同一組被試前后兩次施測,兩次測驗分數(shù)的相關(guān)系數(shù)即得信度系數(shù)。 滿足的

14、條件: 所測量的特性必須是穩(wěn)定的; 遺忘與練習(xí)的效果相同; 兩次施測期間被試的學(xué)習(xí)效果沒有差別。,缺點 易受練習(xí)和記憶的影響; 優(yōu)點 能提供測驗結(jié)果是否隨時間變化的資料,作為預(yù)測被試將來行為的依據(jù); 適用于速度測驗,不用用于難度測驗。,復(fù)本信度,根據(jù)一組被試在兩個等值測驗上的得分計算的相關(guān)系數(shù)即為復(fù)本信度系數(shù)(肯德爾和諧系數(shù))。 優(yōu)點 可以在一定程度上避免再測法的缺點; 缺點 需要編制等值的兩份問卷,比較困難。,分半信度,按照正常的程序?qū)嵤y驗,然后將全部試題分成相等的兩半,被試組在這兩半測驗上的分數(shù)之間的相關(guān)系數(shù)即為信度系數(shù)。 通常采用奇偶分半法,得到半個測驗的信度,求整個測驗的信度,需要校

15、正。,當兩半測驗分數(shù)具有相同的平均數(shù)與標準差,用斯皮爾曼-布朗校正公式; 當兩半測驗分數(shù)具有不同的平均數(shù)與標準差,用盧倫校正公式;,優(yōu)點 減少學(xué)生的疲勞、厭煩等因素的干擾 缺點 只能表示兩半試題的等值程度,不能提供時間穩(wěn)定性的信息。,內(nèi)部一致性信度,即測驗內(nèi)部所有題目間的一致性,如果在一個測驗中各道題得分有較大的正相關(guān)時,則測驗是同質(zhì)的; 也就是說該測驗中所有的項目都測量相同的特質(zhì)或程度略同的特質(zhì)。 在李克特態(tài)度量表中常用的信度檢驗方法為Cronbach系數(shù)。,如果一個測驗或量表,包含了數(shù)個小測驗或構(gòu)想層面,則每個小量表或構(gòu)想層面的信度也要檢驗。 多數(shù)子測驗或構(gòu)想層面間的信度系數(shù)值會低于總測驗

16、或總量表的信度系數(shù)值。,難度,難度指測題的難易程度。在教學(xué)測量中,通常用答對或通過測驗的人數(shù)比例作為難度值。 P值越大,難度越低,P值越小,難度越高。一般來說,難度值平均在0.5最佳,難度值過高或過低,都會降低測驗的信度。,在實際的評價過程中,測驗的難度水平多高才合適,也還要取決于測驗的目的。如果教師要對學(xué)生的知識準備狀況進行一次診斷性測驗,為了真實、準確地了解學(xué)生的知識掌握情況,測驗難度大一點也是正常的。,難度() 試題的難易程度。P值越大,試題越容易。,0、1計分 ()P=R/N;(R:答對人數(shù),N:被試總?cè)藬?shù)。) ()當被試較多時,將分數(shù)由高到低排序,可從高分和低分各取27%,形成高分組和低分組,然后以高分組的答對率和低分組的答對率(和)的平均數(shù)作為該題的難度。,(2)0、1計分多重選擇題難度校正,k:每個測題可供選擇的答案; P:未校正測題的難度; CP:校正測題難度。,3.非0、1計分(解答題),0.3,0.5,0.7,區(qū)分度,區(qū)分度有時也稱鑒別力,它主要指測驗對于不同水平的被試加以區(qū)分的能力。 題目對學(xué)業(yè)水平不同考生的鑒別程度。 它反映著測驗與被試實際水平的相符合程度,如果在某道題上得分高就意味著學(xué)生的實際水平高,得分低就意味著實際水平低

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論