教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt

上傳人：q*** IP屬地：江蘇上傳時間：2020-09-23 格式：PPT 頁數(shù)：76 大小：431KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩71頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1、教育統(tǒng)計與測量的基礎(chǔ)知識,第一節(jié) 教育統(tǒng)計基礎(chǔ)知識,一、教育統(tǒng)計與測量概述,1. 什么是統(tǒng)計學(xué) 統(tǒng)計學(xué)是研究統(tǒng)計原理和方法的科學(xué)。具體地說，它是如何搜集、整理、分析反映事物總體信息的數(shù)字資料，并以此為依據(jù)，對總體特征進行推斷的原理和方法。,(1) 數(shù)理統(tǒng)計：以概率論為基礎(chǔ)，對統(tǒng)計數(shù)據(jù)數(shù)量關(guān)系的模式加以解釋，對統(tǒng)計原理和方法給予數(shù)學(xué)的證明。 (2) 應(yīng)用統(tǒng)計：統(tǒng)計原理在某個行業(yè)的具體應(yīng)用。如工業(yè)統(tǒng)計學(xué)、教育統(tǒng)計學(xué)等。,2.統(tǒng)計學(xué)分類,3. 教育統(tǒng)計,教育統(tǒng)計是運用數(shù)理統(tǒng)計原理和方法,研究教育問題的一門應(yīng)用科學(xué)。主要包括：描述統(tǒng)計；推斷統(tǒng)計；實驗設(shè)計。,. 教育統(tǒng)計中幾個名詞,頻數(shù)：隨機事件

2、在n次試驗中出現(xiàn)的次數(shù)，稱這個隨機事件的頻數(shù)。頻數(shù)分布：各種隨機事件在n次試驗中出現(xiàn)的次數(shù)分布，稱為頻數(shù)分布。離差：個體量和某一群體的平均量之差。,教育統(tǒng)計中幾個名詞,正態(tài)分布：是一種連續(xù)型隨機變量的概率分布。二項式分布中當 p=q時，且n很大時，二項式分布接近于正態(tài)分布,二、統(tǒng)計表,構(gòu)成：統(tǒng)計表一般由標題、表號、標目、表注等構(gòu)成。編制基本原則：結(jié)構(gòu)簡明，一目了然。,統(tǒng)計表基本格式,表的標題 ? ? ?,注腳:說明資料來源等 X X X,表1 初三(1)班男女生數(shù)學(xué)成績分布統(tǒng)計表,三. 統(tǒng)計圖統(tǒng)計圖由標題、圖號標目、圖注等項構(gòu)成。,1. 直條圖,2. 圓形圖,3. 線條圖,4. 頻數(shù)頒

3、布直方圖圖.4中考化學(xué)統(tǒng)計成績直方圖,5. 累積頻數(shù)圖圖.5 2004年中考化學(xué)抽樣得分情況累積頻數(shù)圖,10 20 30 40 50 60 70 80 90 100,圖2.6:高一語文,四、集中量,1. 算術(shù)平均數(shù)( ) 所有觀察值總和除以總頻數(shù)之和所得商。,四、集中量,2. 加權(quán)平均數(shù)( ) 是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù) 或. N表示各組的頻數(shù)；X 表示各組的平均數(shù)。,例1：一個學(xué)生某門課期中考試成績?yōu)?2分，期末考試成績?yōu)?6分，而期考試占總成績的40%，期末占60%，這個學(xué)生的學(xué)期總分是多少？,例2 ：某校初一共有3個班，某次語文測驗中，一班50人均分為68，二班45人均分為75

4、，三班40人均分為80，問全校初一語文的平均成績？不能用：（68+75+80）/3=74.33,正態(tài)分布圖,偏正態(tài)分布,五、差異量,1. 全距（R）一組數(shù)據(jù)中最大值和最小值之差表示，又稱極差。 2. 標準差（或S）標準差概念：標準差是指離差平方和后平均的方根。,問題1：,某班甲乙兩組在一次測驗中的成績分別為65，68，71，72，74（均分為70分）和 30，50，86，90，94（均分為70分）。如何評價兩組的學(xué)習(xí)情況？,方法一：根據(jù)定義式計算方法二：根據(jù)原始數(shù)據(jù)計算方法三：利用計算器計算方法四：利用計算機計算,3.差異系數(shù)（變異系數(shù)）,兩個群體測量單位不同，或雖測量單位相同，平

5、均數(shù)相差很大時，不能用標準差比較他們離散程度，可利用差異系數(shù)。,問題2：某校期末考試語文平均成績?yōu)?9.3分，標準差為11.2分；英語平均成績?yōu)?4.8，標準差為13.8分。問哪一學(xué)科離散程度大？,問題3：設(shè)某考區(qū)已錄取高中學(xué)生語文平均分為69分，標準差為12.5分，而未錄取高中的學(xué)生語文平均分為40分，標準差為12.5分。比較他們語文成績的離散程度。 CV1=12.5/69 *100%=18.12%； CV2=12.5/40 *100%=31.25%。未錄取學(xué)生的離散程度大。,問題4：下表中是某班甲乙兩同學(xué)的期末考試成績，問：（1）甲同學(xué)的語文和數(shù)學(xué)哪科相對較好？（2）甲同學(xué)和乙同學(xué)相比

6、，哪一個學(xué)業(yè)成績較好？,六、標準分,（1）概念：標準分是將原始分數(shù)（測驗分數(shù)）與平均分數(shù)相減，再除以標準差所得的商。甲同學(xué)： z（語文）=（73-48.3）/ 3.9=1.8 z（數(shù)學(xué)）=（79-66.9) / 18.5=0.7,（2）標準分特點,標準分是以標準差為單位的，故稱為標準分。它是一種相對地位分。標準分有正負之分，一般在-3，3中（幾率為99.74%) ，平均值為零。標準分可比性根據(jù)在于標準正態(tài)分布。 T分數(shù)：T=100Z+500 (一般200T800）,（3）標準分應(yīng)用,比較各個學(xué)生成績在班級中地位；比較某個學(xué)生兩科或多科測驗中所得分的優(yōu)劣，精確地計算學(xué)生的總成績。確定等

7、級評定的人數(shù)。,七、相關(guān)系數(shù),相關(guān)：是指兩個或兩個以上變量之間存在相互依存關(guān)系。如數(shù)學(xué)課成績與數(shù)學(xué)競賽成績、數(shù)學(xué)與物理成績等。正相關(guān) 負相關(guān) 零相關(guān),相關(guān)系數(shù)：用來描述兩個變量相互之間變化方向及密切程度的數(shù)字特征量稱為相關(guān)系數(shù)。最常用的是積差相關(guān)系數(shù)。,數(shù)學(xué)與物理、物理與英語相關(guān)性比較,相關(guān)系數(shù)與相關(guān)程度表一覽表表,八、差異顯著性檢驗假設(shè)檢驗的基本原理,1.假設(shè) 虛無假設(shè)（零假設(shè)）：是關(guān)于當前樣本所屬的總體（指參數(shù)）與假設(shè)總體（指參數(shù)）無區(qū)別的假設(shè)，一般H0表示。備擇假設(shè)（研究假設(shè)）：是關(guān)于當前樣本所屬的總體（指參數(shù)）與假設(shè)總體（指參數(shù)）相反的假設(shè)，一般用H1表示。由于直接檢驗備擇假設(shè)的

8、真實性困難，假設(shè)檢驗一般都是從虛無假設(shè)出發(fā)，通過虛無假設(shè)的不真實性來證明備假設(shè)的真實性。,八、差異顯著性檢驗,2. 小概率事在隨機事件中，概率很小的事件被稱為小概率事件，習(xí)慣上約定在0.05以下，即當P（A） 5%時，則稱A為小概率事件。在統(tǒng)計推斷中認為，小概率事件在一次試驗或觀察中是不可能發(fā)生的。,八、差異顯著性檢驗,3.顯著性水平兩種水平（1）=0.05，顯著性水平為0.05，即統(tǒng)計推斷時可能犯錯誤的概率5%，也就是在95%的可靠程度上進行檢驗；（2） =0.01，顯著性水平為0.01，即統(tǒng)計推斷時可能犯錯誤的概率1%，也就是在99%的可靠程度上進行檢驗。,八、差異顯著性檢驗,4.

9、雙樣本Z檢驗雙樣本均為大樣本，N1、N2都大于30，并標準差相差不很大。（小于30要用t檢驗）,八、差異顯著性檢驗,例3：某校高一進行數(shù)學(xué)教改實驗，若實驗前兩班的化學(xué)成績無顯著性差異，實驗一段時間后的數(shù)學(xué)測驗成績，實驗班51名為均分為62.37，標準差為13.65，對照班45名學(xué)生的均分為56.16，標準差為16.37，試進行差異性檢驗。,（1）提出假設(shè) 虛無假設(shè)H0：1=2（實驗班和對照班樣本來自同一個總體）。備擇假設(shè)H1：12 （實驗班和對照班樣本不是來自同一個總體）。（2）選擇統(tǒng)計量，計算其值（3）確定顯著水平=0.05。（4）統(tǒng)計決斷 |.0 1.96，則0.05，拒絕零假設(shè)

10、。實驗班和對照的化學(xué)成績存在顯著差異,雙側(cè)檢驗統(tǒng)計決斷規(guī)則,第二節(jié) 教育測量的質(zhì)量特性,一個高質(zhì)量的測驗，它的結(jié)果是可靠而且是有效的；可靠性（信度）和有效性（效度）是評價測驗質(zhì)量的兩個重要指標。,一、教育測量的信度和效度,當一個測驗多次測量的結(jié)果一致時，它就被認為是可靠的；估計測量一致性程度的指標被稱為信度。,如果在大體相同的條件下，幾次測驗都得到了大體相同的分數(shù)，那么這個測驗的信度是較高的，反之，信度就低；即如果被試的實得分數(shù)與真實分數(shù)差距小，則測驗的分數(shù)越可靠，信度越高。通常用信度系數(shù)衡量測驗好壞：一般能力與學(xué)籍測驗的信度系數(shù)常在0.9以上；性格、興趣、態(tài)度等人格測驗常在0.8

11、-0.85之間,有的認為0.7以上。,估計信度的方法,再測信度復(fù)本信度分半信度內(nèi)部一致性信度,試卷的信度,2i：每一道試題的方差； 2：全卷的方差； k試卷中試題的數(shù)目。,教育測量的效度,效度是測量的有效性，即一個測驗對它所要測量的特性準確測量的程度。效度不僅受隨機誤差的影響，還受系統(tǒng)誤差的影響。,效度的類型,內(nèi)容效度構(gòu)想效度內(nèi)部效度統(tǒng)計結(jié)論效度外部效度,內(nèi)容效度,題目對欲測的內(nèi)容或行為范圍取樣的適當程度，即是否充分代表了該范圍內(nèi)的基本知識和基本能力。要具備好的內(nèi)容效度要滿足兩個條件：確定好內(nèi)容范圍；測試題目具有該范圍的代表性。,確定內(nèi)容效度的方法,專家判斷法再測法,內(nèi)

12、容效度較適合評價教育成就測驗和職業(yè)選拔測驗；缺乏可靠的數(shù)量指標，妨礙各測驗間的相互比較。,構(gòu)想效度,測驗對理論上的構(gòu)想或特質(zhì)的測量程度；即測驗所提供的數(shù)據(jù)同理論假設(shè)的符合程度。,要獲得較高的構(gòu)想效度：,理論構(gòu)思必須結(jié)構(gòu)嚴謹，符合邏輯，層次分明，形成某種“構(gòu)思網(wǎng)絡(luò)”；對研究的各種變量作出明確、嚴格的說明；給變量下明確的操作定義，并制定相應(yīng)的、客觀的測量指標；消除或控制影響構(gòu)思效度的因素。,影響構(gòu)思效度的因素,對構(gòu)思缺乏明確的說明，概念解釋模糊，邏輯關(guān)系不清；單一方法和操作引起的偏差；構(gòu)思水平之間的混亂；研究過程中主試的期望、被試因猜測而發(fā)生的心理與行為的改變，不同實驗處理的相互作

13、用等。,內(nèi)部效度,自變量與因變量之間存在一定關(guān)系的明確程度；即所研究的兩個或多個變量之間是否存在一定的關(guān)系？是否確實是自變量的變化引起了因變量的變化？,影響內(nèi)部效度的因素：,成熟因素；歷史因素；被試選擇上的差異；被試缺失產(chǎn)生的效應(yīng)；前測的影響；實驗程序不一致等,統(tǒng)計結(jié)論效度,檢驗研究結(jié)果的數(shù)據(jù)分析程序與方法的有效性的指標。主要受數(shù)據(jù)的質(zhì)量，統(tǒng)計的假設(shè)等因素影響。,研究的外部效度,研究結(jié)果能夠一般化和普遍化到樣本來自的總體和其他變量條件、時間和背景中去的程度，即研究結(jié)果的普遍性和代表性。,再測信度,用同一個測驗，對同一組被試前后兩次施測，兩次測驗分數(shù)的相關(guān)系數(shù)即得信度系數(shù)。滿足的

14、條件：所測量的特性必須是穩(wěn)定的；遺忘與練習(xí)的效果相同；兩次施測期間被試的學(xué)習(xí)效果沒有差別。,缺點易受練習(xí)和記憶的影響；優(yōu)點能提供測驗結(jié)果是否隨時間變化的資料，作為預(yù)測被試將來行為的依據(jù)；適用于速度測驗，不用用于難度測驗。,復(fù)本信度,根據(jù)一組被試在兩個等值測驗上的得分計算的相關(guān)系數(shù)即為復(fù)本信度系數(shù)（肯德爾和諧系數(shù)）。優(yōu)點可以在一定程度上避免再測法的缺點；缺點需要編制等值的兩份問卷，比較困難。,分半信度,按照正常的程序?qū)嵤y驗，然后將全部試題分成相等的兩半，被試組在這兩半測驗上的分數(shù)之間的相關(guān)系數(shù)即為信度系數(shù)。通常采用奇偶分半法，得到半個測驗的信度，求整個測驗的信度，需要校

15、正。,當兩半測驗分數(shù)具有相同的平均數(shù)與標準差，用斯皮爾曼-布朗校正公式；當兩半測驗分數(shù)具有不同的平均數(shù)與標準差，用盧倫校正公式；,優(yōu)點減少學(xué)生的疲勞、厭煩等因素的干擾缺點只能表示兩半試題的等值程度，不能提供時間穩(wěn)定性的信息。,內(nèi)部一致性信度,即測驗內(nèi)部所有題目間的一致性，如果在一個測驗中各道題得分有較大的正相關(guān)時，則測驗是同質(zhì)的；也就是說該測驗中所有的項目都測量相同的特質(zhì)或程度略同的特質(zhì)。在李克特態(tài)度量表中常用的信度檢驗方法為Cronbach系數(shù)。,如果一個測驗或量表，包含了數(shù)個小測驗或構(gòu)想層面，則每個小量表或構(gòu)想層面的信度也要檢驗。多數(shù)子測驗或構(gòu)想層面間的信度系數(shù)值會低于總測驗

16、或總量表的信度系數(shù)值。,難度,難度指測題的難易程度。在教學(xué)測量中，通常用答對或通過測驗的人數(shù)比例作為難度值。 P值越大，難度越低，P值越小，難度越高。一般來說，難度值平均在0.5最佳，難度值過高或過低，都會降低測驗的信度。,在實際的評價過程中，測驗的難度水平多高才合適，也還要取決于測驗的目的。如果教師要對學(xué)生的知識準備狀況進行一次診斷性測驗，為了真實、準確地了解學(xué)生的知識掌握情況，測驗難度大一點也是正常的。,難度（）試題的難易程度。P值越大，試題越容易。,0、1計分（）P=R/N；（R：答對人數(shù)，N：被試總?cè)藬?shù)。）（）當被試較多時，將分數(shù)由高到低排序，可從高分和低分各取27%，形成高分組和低分組，然后以高分組的答對率和低分組的答對率（和）的平均數(shù)作為該題的難度。,（2）0、1計分多重選擇題難度校正,k：每個測題可供選擇的答案； P：未校正測題的難度； CP：校正測題難度。,3.非0、1計分（解答題）,0.3,0.5,0.7,區(qū)分度,區(qū)分度有時也稱鑒別力，它主要指測驗對于不同水平的被試加以區(qū)分的能力。題目對學(xué)業(yè)水平不同考生的鑒別程度。它反映著測驗與被試實際水平的相符合程度，如果在某道題上得分高就意味著學(xué)生的實際水平高，得分低就意味著實際水平低

人人文庫> 全部分類> 應(yīng)用文書 > 項目管理

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt

文檔簡介

溫馨提示

最新文檔

評論

教育數(shù)據(jù)類別與測量質(zhì)量指標.ppt

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔