教育統(tǒng)計與測量學原理(共78張PPT)_第1頁
教育統(tǒng)計與測量學原理(共78張PPT)_第2頁
教育統(tǒng)計與測量學原理(共78張PPT)_第3頁
教育統(tǒng)計與測量學原理(共78張PPT)_第4頁
教育統(tǒng)計與測量學原理(共78張PPT)_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

教育統(tǒng)計與測量學原理第一頁,共78頁。教育統(tǒng)計與測量學原理學習教育統(tǒng)計與教育測量的重要意義1、教育統(tǒng)計和測量是認識教育本質的有力武器;2、是分析處理教育工作中各種數據資料、進行教育督導與評價的有效工具;3、對教育管理科學化具有重要意義;4、是教育科學研究中,發(fā)現探索教育教學規(guī)律、指導教育教學實踐、為教育行政部門決策提供依據的重要思想方法;5、是黨和政府制定教育方針、政策以及認清教育事業(yè)和整個國民經濟開展關系的重要工具。第二頁,共78頁。第一局部:教育統(tǒng)計學一、概述

1、什么是教育統(tǒng)計學

2、教育統(tǒng)計學的歷史

3、教育統(tǒng)計學的內容二、描述統(tǒng)計

1、常用的統(tǒng)計表、圖與統(tǒng)計量

2、相關分析

3、正態(tài)分布三、推斷統(tǒng)計

1、相關概念

2、總體平均數估計

3、平均數差異的顯著性檢驗四、實驗設計簡介第三頁,共78頁。一、概述教育統(tǒng)計學概念、開展歷史、內容1、概念:教育統(tǒng)計學就是運用數理統(tǒng)計的原理和方法研究教育問題的一門應用科學。它是研究如何收集、整理、分析和解釋教育方面的數據,從而說明教育上某些現象的特征及規(guī)律的一門科學,它是處理教育實際工作和進行教育研究以及提高管理質量的科學水平、提高教育質量的重要工具。教育統(tǒng)計學的主要任務:對教育現象進行調查和實驗,在占有充分數據資料的根底上,經過對數據的整理計算、統(tǒng)計分析和統(tǒng)計檢驗等方法,對研究結果予以科學說明。即從數量方面的研究,來探索教育和心理現象的開展變化的特征和規(guī)律,或根據研究結果的數據處理、統(tǒng)計推斷,做出正確決策。第四頁,共78頁。教育統(tǒng)計學概念、開展歷史、內容2、教育統(tǒng)計學開展史:教育統(tǒng)計學產生于上個世紀初,開展于五、六十年代,廣泛應用于八十年代以后?!?〕國外:20世紀初統(tǒng)計學傳入美國,桑代克〔〕為了到達“竭力以心理學與統(tǒng)計學為工具研究教育學,使教育科學化〞的目的,1904年出版世界上第一本有關教育統(tǒng)計學的專著?心理與社會測量導論??!?〕國內:我國的教育統(tǒng)計學是在辛亥革命以后,隨著西方科學技術成就一起被引入。當時的大學教育系和中等師范學校,都把教育統(tǒng)計學作為必修課程,很多學者撰寫專著,如薛鴻志?教育統(tǒng)計方法?〔1925〕、王書林?教育測驗與統(tǒng)計?〔1935〕等。1979年隨著全國教育科學規(guī)劃會議的召開,教育統(tǒng)計學恢復了新生,各師范大學又都開設了教育統(tǒng)計學課程。教育部組織葉佩華、萬梅亭、郝德元、陳一百等教授編寫?教育統(tǒng)計學?作為全國通用教材。經過100多年的開展,各種教育統(tǒng)計方法已相當豐富。但每一種方法的運用在我國還處于推廣和適用階段,因此不少人對它的作用缺乏足夠的認識,特別是對復雜的教育問題,由于統(tǒng)計方法本身的限制,還有十分重要的實驗設計和統(tǒng)計推斷的問題不能在理論上得到有力解決,還有待于教育學家親自動手來推進統(tǒng)計理論和改進統(tǒng)計工具。第五頁,共78頁。教育統(tǒng)計學概念、開展歷史、內容3、教育統(tǒng)計學的內容:教育統(tǒng)計學按應用分為描述統(tǒng)計、推斷統(tǒng)計、實驗設計〔多元統(tǒng)計〕三局部內容?!?〕描述統(tǒng)計的主要作用就在于就所關心的教育現象進行全面調查和觀測,然后將所得的大量數據加以整理、簡縮、制成圖表;或就這些數據的分布特征〔如集中趨勢、離散趨勢、相關度等等〕計算出具有概括性的數字作為標志。借助這些概括性的數字,我們就可以從雜亂無章的數據中取得有意義的信息?!?〕推斷統(tǒng)計也叫抽樣統(tǒng)計,它是在描述統(tǒng)計的根底上開展起來的。是用抽樣的方法,根據局部數據來推斷一般情況,即通過局部對全局的情況加以推斷的一種方法。它可以幫我們透過現象看到本質,對客觀現象作出本質性的判斷,它是從樣本的研究中得出統(tǒng)計量。來推斷總體的有關特征,以便作出具體的措施和決策。常用的方法有:u檢驗、t檢驗、卡方檢驗和非參數檢驗,還有多元分析中的主成份分析和因素分析等?!?〕實驗設計通常指實驗程序的方案和安排。而實驗程序的方案和安排離不開統(tǒng)計和檢驗。第六頁,共78頁。二、描述統(tǒng)計

第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量〔一〕常用統(tǒng)計表1、統(tǒng)計表的結構:由標題、工程〔標目〕、數據、線條、表注〔數據來源〕組成1983年我國普通中學教師學歷統(tǒng)計表學歷人數百分比〔%〕

大學本科以上30088711.6大專畢業(yè)56686321.8中專畢業(yè)以下172975066.6

合計2596900100.0注:引自?中國教育成就統(tǒng)計資料?,1984年人民教育出版社標題工程線條

數據表注第七頁,共78頁。二、描述統(tǒng)計

第一章常用統(tǒng)計表、圖及統(tǒng)計量數2、制表的一般要求A、統(tǒng)計表的內容要簡要,最好一個表說明一個中心內容。標題的措詞要簡明扼要,正確說明內容,使人一望便知。B、分項要準確,以能說明問題為主,分項的好壞是決定統(tǒng)計表質量的關鍵,切忌分項太細。C、數據是統(tǒng)計表的語言,說明內容,要求準確,書寫整齊,一律用阿拉伯數字,單位要統(tǒng)一,位數對齊,有效數字要一致,表格內不能有空白。D、線條不要太多,表的上下端有頂線與底線,左右兩邊不要用線封死,縱工程用細線格開,橫工程一律不畫線條,合計工程用粗線條或雙線與其它工程分開。第八頁,共78頁?!捕吵S媒y(tǒng)計圖1、統(tǒng)計圖結構:圖題、圖目、圖尺、圖例、圖形、圖注人數706050403020101980年1985年1991年某校近十年教師人數及性別變化圖示男女年份圖例圖形第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量圖目圖尺(制圖的尺度線。點、單位的總稱)圖題第九頁,共78頁。2、統(tǒng)計圖的類型及繪制要求繪制統(tǒng)計圖的要求A、根據數據和目的選擇適宜的圖形B、圖形所表示的面積或距離要比例適當C、表示不同的事物要用不同的顏色與線條類型:1直條圖2圓形圖3曲線圖4直方圖講師42.9%助教28.8%

教授0.4%某大學教師職稱圖副教授21.9%某市7至18歲男女生身高比較圖1.751.701.651.601.551.501.451.40歲789101112131415161718米某校某班50名學生家庭背景情況比較2015105人數其他農工商企業(yè)職員公務與科教人員14161552015105人數其他農工商企業(yè)職員公務與科教人員1416155〔二〕常用統(tǒng)計圖第十頁,共78頁。

3、次數分布表與直方圖

對一批數據按一定次序排列并加以分組、編成反映這群數據在各組上出現次數的統(tǒng)計表和圖,就是次數分布表和直方圖。例:一次考試之后,某班48名學生的成績如下:

86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68

將該組數據整理成次數分布表與直方圖〔二〕常用統(tǒng)計圖*第十一頁,共78頁。1求全距:R=max{xi}-min{xi}用該組數據最大數減最小數2定組數和組距:數據劃分組數、每組上下限之間距離〔全距除以組數〕3列組限:從最高分至最低分以組距為單位依次分組4歸組劃記:計算數據出現次數,并計算累積次數及相對次數步驟:例:一次考試之后,某班48名學生的成績如下:86,77,63,78,92,72,66,87,75,83,74,47,83,81,76,82,97,69,82,88,71,67,65,75,70,82,77,86,60,93,71,80,76,78,57,95,78,64,79,82,68,74,73,84,76,79,86,68

組限組中值劃記次數f累積次數∑f相對次數Rf累積相對次數∑Rf95908580757065605550459994898479746964595449225912763101

2491830374346474748

0.040.040.100.190.250.150.130.060.0200.020.040.080.180.370.620.770.900.960.980.981.00正正正正正正合計48481.00次數分布表9792878277726762575247K=1.87(n-1)2/5第十二頁,共78頁。14121086424550556065707580859095100次數分數

直方圖第十三頁,共78頁。它可以理解為測驗實際上測量了準備測量的結構特征所到達的程度。從總體中隨機抽出容量為n的一切可能樣本的平均數的平均數等于總體的平均數。不能脫離教育目的和教材的要求,隨意地制定測驗量表,任意地進行測量。借助這些概括性的數字,我們就可以從雜亂無章的數據中取得有意義的信息。②測驗的難度要適中,同一測驗中的試題難度水平接近?!捕巢牧希簲祵W試卷一份,馬表。E分數:E=20Z+90(一般30≤E≤150〕主要用于考察被試對根本知識的記憶和理解能力;標準分有正負之分,一般在[-3,3]中〔幾率為99.如果是按同一組樣本不同情況的測試所得的平均值1和296X10+75=94.2主試僅向甲組被試著重指出:你們在運算時必須注意試題A、統(tǒng)計表的內容要簡要,最好一個表說明一個中心內容。R小說明離散程度小,比較整齊。測驗的結果有效和可靠〔即效度、信度高〕即從數量方面的研究,來探索教育和心理現象的開展變化的特征和規(guī)律,或根據研究結果的數據處理、統(tǒng)計推斷,做出正確決策。〔三〕常用統(tǒng)計量-集中量數1、集中量數:代表一組數據的集中趨勢和典型特征常用的有:平均數中數眾數第一章常用統(tǒng)計表、統(tǒng)計圖及統(tǒng)計量

(1)

平均數(算數平均數)X1、X=(X1+X2+---+Xn)/n=(1/n)∑Xi

(原始數據公式)2、X=∑fxc/n(分組數據公式)xc:組中值f:次數3、X=(n1x1+n2x2+---+nkxk)/(n1+n2+---nk)(加權平均數公式)第十四頁,共78頁。(2)中數〔中位數):用Md表示,是在一組按大小順序排列的數據中位置居中的那個數。數據是奇數個時,正好是中間位置的數,即第〔N+1)/2個那個數;數據是偶數個時,求中間位置兩個數的平均數。如:13679Md=6;36792021Md=〔7+9〕/2=8(3)眾數:用M0表示,是一組數據中次數出現最多的那個數。在眾數不明顯的情況下,一般可看眾數段,即哪個分數段的次數多,就以該段中點值作眾數。一般用觀察法求得。

眾中平

眾中平

平中眾

正態(tài)分布正偏態(tài)分布負偏態(tài)分布平均數、中數、眾數在數據常態(tài)分布中的相對位置第十五頁,共78頁。2、差異量數:全距平均差標準差差異量數是描述次數分布中“離中趨勢〞這一特征的統(tǒng)計量,簡稱“差異量〞。一組數據,假設離中趨勢小,那么集中量的代表性就大;反之,假設離中趨勢大,那么集中量的代表性就小。但是,僅考慮集中量數是不夠的。要了解兩組學生成績分布的全貌,還必須研究兩個組的差異量數。最常用的差異量有全距、平均差和標準差。(1)全距(符號為“R〞),指一組數據中由最大量數到最小量數的距離。R小說明離散程度小,比較整齊。(2)平均差,指一組數據內的每個數與均數差的絕對值的算術平均數,通常用AD表示。平均差的計算公式為:常用統(tǒng)計量-差異量數AD=(1/n)∑Xi-X或AD=(1/n)∑Xi-Md第十六頁,共78頁。差異量數-方差與標準差

(3)、標準差:指一組數據中每一個數值與它們的平均數之差的平方的算術平均數的平方根,其符號為S(樣本標準差)、總體標準差用σ表示。S的計算公式為:S越大說明離散程度越大,數據不均勻,集中量的代表性小。

方差與標準差除具有平均差的優(yōu)點之外,還具有受抽樣影響小和適于代數運算等優(yōu)點,是最優(yōu)良的差異量數。()()()()nxxxxxxxxSn2232221-++-+-+-=…

XX1X22S2σ表示樣本方差表示總體方差第十七頁,共78頁。標準差的應用:變異系數、標準分數標準差的應用-變異系數變異系數計算公式:主要用于:①同一團體不同觀測值離散程度的比較;②對于水平相差較大,但進行的是同一種觀測的各種團體離散程度的比較。例:某小學一年級學生的平均體重為25千克,標準差是3.7千克,平均身高110厘米,標準差為6.2厘米,問體重與身高的離散程度那個大?解:CV體重=3.7/25=14.8%CV身高=6.2/110=5.64%答:通過比較差異系數可知,體重的分散程度比身高的分散程度大〔14.8>5.64)。變異系數是一種相對差異量,常用cv表示第十八頁,共78頁。標準差的應用-標準分標準分數(又稱Z分數)。它是一種以平均數為參照點,以標準差為單位的,表示一個分數在團體分數中所處位置的量數,其計算方法為:由原始分數與平均分數的差除以標準差所得的量數,其符號為“Z〞,計算公式是:標準分是以標準差為單位的,故稱為標準分。它是一種相對地位分。標準分有正負之分,一般在[-3,3]中〔幾率為99.74%),平均值為零。標準分可比性根據在于標準正態(tài)分布。T分數:T=10Z+50(一般20≤T≤80〕E分數:E=20Z+90(一般30≤E≤150〕第十九頁,共78頁。例:有某生三次數學考試的成績分別為70、57、45,三次考試的班平均分為70、55、42,標準差分別為8、4、5。如何看待該生的三次考試成績?答:如果僅從原始分數看,肯定認為第一次最好,其實不然,要計算出各次的標準分數,才能說明問題。根據公式得出:Z1=(70-70)/8=0Z2=〔57-55〕/4=0.5Z3=〔45-42〕/5=0.6這說明,原始分數為70,其位置正在平均線上,而原始分數為57的,其位置在平均線上0.5處,而原始分數為45的,其位置在平均線上0.6處。很顯然第三次成績最好,第一次最差。標準差的應用-標準分第二十頁,共78頁。標準分數:運用標準分比較不同教育測驗成績總分的優(yōu)劣,更為合理。例:甲乙兩學生五科考試成績如下,試分析哪名學生成績好些?語文數學地理歷史政治合計70.014.080850.711.0785.03.590881.430.8655.04.057510.50-1.0042.05.045400.60-0.4070.08.0709002.503423543.243.03兩考生總成績標準分數計算表

甲生乙生甲生乙生

科目XSXZ如果按原始分數乙生總分是354分優(yōu)于甲生的342分總分,但按標準分數那么甲生的3.24分優(yōu)于乙生的3.03分。標準差的應用-標準分第二十一頁,共78頁。二、描述統(tǒng)計相關分析:研究兩自變量之間的關系緊密程度的過程,統(tǒng)計學上稱為相關分析。事物的變化總是伴隨著一定的量的變化,有些是單變量,有些是雙變量或多變量,也有些是復變量。集中量數和差異量數反映的是單變量數據特征,相關分析主要研究雙變量數據特征。我們都知道事物現象間的相互關系,如果從數量關系的角度考察,可分為函數關系和相關關系兩種類型。相關關系可分為正相關、負相關、直線相關、曲線相關、完全相關〔函數關系〕、高度相關、低相關和零相關。如:教育經費的投入與教育事業(yè)開展規(guī)模和速度之間的關系是正相關;復習次數與遺忘量之間的關系是負相關。相關分析的方法有二:一是圖示法,一為計算法。第二章相關分析圖示法:將兩組觀測值標在坐標系中●●●●●●●●●●●●●●●●曲線相關●●●●●●●●●●●直線相關第二十二頁,共78頁。二、描述統(tǒng)計

相關系數:是描述兩組數據之間相關程度的量數種類有:積差相關系數、等級相關、點二列相關和φ相關積差相關系數〔皮爾遜系數〕:是描述來自正態(tài)總體兩個連續(xù)變量之間線性相關程度的一種相關量數r=[n∑xy-(∑x)(∑y)]/√[n∑X2-(∑X)2][n∑y2-(∑y)2]

相關系數的范圍:-1≤r≤1

當r是正值時為正相關;當r是負值時為負相關;r=0為零相關。通常1r≥0.70為高度相關;0.70r≥0.40為較顯著相關

0.40≥r0為低相關。當然在下結論時還要進行顯著性檢驗第二章相關分析對相關系數的解釋注意以下問題:A在小樣本中要做顯著性檢驗;B相關系數大小差異不是絕對的;C相關系數不是等距的不能進行大小比較;D相關關系不一定是因果關系第二十三頁,共78頁。第二章相關分析數學物理英語物理70757675606360638275657544605660525570559097859780894889r=0.91r=0.26例:數學與物理、物理與英語相關性比較第二十四頁,共78頁。

第三章正態(tài)分布

在社會、教育現象中大多數隨機變量都呈現是或近似正態(tài)分布的情形。正態(tài)分布是統(tǒng)計理論與統(tǒng)計應用中最重要應用最廣泛的一種分布。正態(tài)曲線的特點11.52.534.56X

Y0.80.60.40.20σ=0.8,μ=1.5、2.5、4.5二、描述統(tǒng)計

一個正態(tài)分布是由總體的平均數和總體的方差所決定的。1、正態(tài)曲線及其特點正態(tài)分布x~(μ,σ)的密度函數曲線2①正態(tài)曲線位于x軸上方,以x=μ

為對稱軸,以x軸為漸近線②曲線的位置和形狀取決于μ

值和σ值

,μ決定位置,σ決定形狀。σ越大曲線越矮胖,σ越小曲線越陡峭

③x=μ時曲線處于最高點,即當x=μ時f(μ)=1/

√2σ為最大值

,曲線呈中間高兩邊低的形態(tài)。p正態(tài)曲線方程:f(x)=【1/(√2

●σ)】e-(x-μ)/2σ22其中:是園周率;e是自然對數的底;x為隨機變量的取值;μ為正態(tài)分布的均值;

σ為正態(tài)分布的方差。2pp第二十五頁,共78頁。第三章正態(tài)分布2、正態(tài)分布曲線的重要性質:-3σ-2σ-σ0σ2σ3σ

68.26%95.46%99.73%

從概率的角度而言:觀測數據落在(μ+1σ)內的概率為68.26%;落在(μ+2σ)內的概率為95.46%;落在(μ+3σ)內的概率為99.73%。z=(x-μ)/σ標準正態(tài)分布x~(0,1)z、P的意義如:z=1時P=0.3413

z=2時P=0.4772

z=2.5時P=0.4938

z=3時P=0.4987第二十六頁,共78頁。3、正態(tài)曲線理論的應用〔1〕推求學生成績中某些分數的人數例:假定500個學生某科成績近似正態(tài)分布,其X=70,σ=10,試問〔1〕75分以下有多少人〔2〕85分以上有多少人〔3〕75-85分之間有多少人。解:〔1〕z=(75-70)/10=0.5,查正態(tài)分布表中值為0.6915,因此75分以下的學生占69.15%,75分以下的人數是500X69.15%=346〔人〕(2)z=(85-70)/10=1.5,查正態(tài)分布表中值為0.93319,85分以下的學生占93.319%,因此85分以上的學生占100%-93.319%=6.681%,所以85分以上的人數是500X6.681%=33〔人〕〔3〕75分至85分之間,實際上是75分以上至85分以下的范圍,因此85分的百分率減去75分以下的百分率即為所求93.319%-69.15%=24.169%500x24.169%=121〔人〕-3σ-2σ-σ0σ2σ3σ

第二十七頁,共78頁。正態(tài)曲線理論的應用〔2〕推求某一特定百分率的成績界限例:某縣對初一年級學生1000名學生進行能力測驗,其結果為X=75,σ=10,現擬根據此次結果選取25名學生作為“尖子班〞培養(yǎng),假定測驗成績近似正態(tài)分布,問多少分以上才能被選到“尖子班〞學習。97.5%2.5%X1.96σ7594.6在正態(tài)分布表中查表中值0.975所對應的標準分數,z=1.96,既是說1000名學生中有97.5%的人數在標準分數1.96以下,因此有2.5%的人數在標準分1.96以上,再將標準分數1.96化為原始分數得:1.96X10+75=94.6〔分〕答:分數在94.6分以上才能進“尖子班〞。分析:“尖子班〞的人數占全年級的百分比為:25/1000=2.5%用標準分計算更容易理解:σxxZ-=Z=1.96=(x-75)/10X=1.96X10+75=94.6(分)第二十八頁,共78頁。正態(tài)曲線理論的應用〔3〕分析測驗試題的難度例:某校學生在一次測驗中,第一題的答對率為15%,第二題的答對率為25%,第三題的答對率為35%,假設這三題所測量的能力近似正態(tài)分布,問1、2、3題的難度值各為多少?各題之間的難度差異怎樣?解:試題難度值比較表題號答對率答錯率難度值難度差異

115%85%1.04225%75%0.670.37335%65%0.390.28在正態(tài)分布中,通常是根據答錯率找出所對應的標準分數界限值,此值即為該題的難度比值。由左表可知雖然三題的答對率都相差10%,但第二題與第三題的難度差異卻比第一題與第二題的難度差異要小。x00.650.750.85

0.390.671.04第二十九頁,共78頁。三、推斷統(tǒng)計

教育現象和一切客觀物質世界中的現象一樣,不僅存在質的方面,同時也存在量的方面,而且這兩方面是辯證統(tǒng)一的。教育統(tǒng)計學就是在教育現象的質與量中,專門研究其數量方面特征的重要工具。在建立了以概率論和抽樣方法為主要依據后,教育統(tǒng)計學便具有了以局部推知全體,以樣本資料推知總體性質的科學推斷功能。根據樣本信息對總體參數狀況的推斷有兩種不同形式,既總體參數估計和假設檢驗,二者既有區(qū)別也有聯(lián)系。第三十頁,共78頁。三、推斷統(tǒng)計

1、總體和樣本所要研究對象的全體叫做總體。其中每一個研究對象叫做個體。從總體中抽取的一局部叫做總體的一個樣本,樣本中個體的數目叫做樣本容量。例1:對家用電器質量抽查,確定次品率。不能采用全部檢測的方法。例2:全市要檢查初中學生體育鍛煉達標情況,對每名學生一一測試工作量很大,不僅消耗人力、物力和時間,而且沒有必要。有沒有一種科學的方法只抽測一少局部學生,然后根據這局部學生的測試成績去推知全市中學生的體育達標情況?

2、參數與統(tǒng)計量

總體參數是指一切由觀察測定總體的全部個體而得到的統(tǒng)計量數(μ,σ);樣本統(tǒng)計量是指為估計總體參數從樣本所得的統(tǒng)計(,s)。第一章相關概念第三十一頁,共78頁。推斷統(tǒng)計4、抽樣方法3、隨機誤差樣本統(tǒng)計量與總體參數之間的差距。從某市參加高考的1200名學生中抽取200名試卷組成一個樣本,計算這200份試卷的平均分和標準差,這200份試卷的平均分和標準差與1200名考生的平均分和標準差是有差距的,不同的抽取帶來不同的差距,這種差距稱之為隨機誤差。A、隨機抽樣〔抽簽法、隨機數字法〕B、機械抽樣C、分層抽樣D、整群抽樣抽取樣本應遵循的原那么。第一總體中每一個個體被抽中的時機均等,即抽中與抽不中純屬偶然;第二任一個體與其它個體在抽取時無聯(lián)帶關系,即抽中的個體與抽不中的個體無關;第三在條件允許的情況下,盡量使樣本容量大一些。5.小概率事在隨機事件中,概率很小的事件被稱為小概率事件,習慣上約定在0.05以下,即當P〔A〕<5%時,那么稱A為小概率事件。在統(tǒng)計推斷中認為,小概率事件在一次試驗或觀察中是不可能發(fā)生的。第三十二頁,共78頁。第二章總體平均數的區(qū)間估計〔總體平均數的置信區(qū)間〕推斷統(tǒng)計的根本理論之一就是抽樣理論,而推斷統(tǒng)計的任務那么是根據樣本資料來推斷總體的特征,從而揭示總體的本質和規(guī)律。抽樣分布的幾個重要定理〔統(tǒng)計推斷的理論依據〕1.從總體中隨機抽出容量為n的一切可能樣本的平均數的平均數等于總體的平均數。E(x)=μ2.容量為n的平均數在抽樣分布上的標準差,等于總體標準差除以n的方根。

σx=σn√3、從正態(tài)總體中,隨機抽取的容量為n的一切可能的樣本平均數的分布也呈正態(tài)分布。

4、雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數的抽樣分布,也接近于正態(tài)分布。多個樣本平均數呈正態(tài)分布~N(μ,)xσn√第三十三頁,共78頁。第二章總體平均數的區(qū)間估計〔總體平均數的置信區(qū)間〕〔一〕、原總體的方差樣本平均數的總體分布,在樣本容量很大時其分布近似于正態(tài)分布,樣本平均數分布的標準差為σ/√n,根據正態(tài)分布的性質U=〔X-μ〕/σX服從正態(tài)分布。對于給定的α值〔0<α<1〕,那么稱〔1-α〕為置信度,可求出滿足P〔U>Uα〕=1-α。一般取α=0.01或α=0.05,對應的U0.05=1.96U0.01=2.58。置信區(qū)間:α=0.05(x-1.96σ/√n,x+1.96σ/√n)為總體平均數95%的置信區(qū)間α=0.01(x-2.58σ/√n,x+2.58σ/√n)為總體平均數99%的置信區(qū)間根據樣本平均數估計總體平均數的所在區(qū)間,稱為總體平均數的區(qū)間估計。根本原理:按一定概率要求,根據樣本平均數估計總體平均數的所在區(qū)間。01-αα/2

α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n

x+1.96σ/√n

01-αα/2

α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n

01-αα/2

α/2區(qū)間估計示意圖x-1.96σ/√nx+1.96σ/√n

第三十四頁,共78頁?!捕场⒃傮w的方差未知對于總體方差未知且容量n﹥30,那么用S代σ相應的有置信區(qū)間為:α=0.05(x-1.96S/√n,x+1.96S/√n)為總體平均數95%的置信區(qū)間α=0.01(x-2.58S/√n,x+2.58S/√n)為總體平均數99%的置信區(qū)間例:從某地區(qū)高考初試的數學試卷中,隨機抽取40份,分析后得到如下數據,平均成績?yōu)?1.2,標準差為3.8,問這一地區(qū)初試數學平均成績在怎樣的范圍內?答:X=51.2S=3.8n=40,此題屬于總體方差未知且大樣本n>30,因此:置信區(qū)間的下限√40=50置信區(qū)間的上限√40=52這一地區(qū)初試數學平均成績有95%的可能性在〔50,52〕范圍內。同理也可以計算出有99%的可能性在〔49.6,52.7〕范圍內。第三十五頁,共78頁。

三、推斷統(tǒng)計第三章顯著性檢驗平均數差異的顯著性檢驗(Z檢驗與t檢驗〕一、顯著性檢驗的根本思想顯著性檢驗是統(tǒng)計推斷的一種方法,它是確定一個具有統(tǒng)計量的樣本是不是從對應參數的總體中抽出來的或是兩樣本的統(tǒng)計量是來自同一總體還是來自不同的總體?;驈牧硗獾慕嵌日f,樣本統(tǒng)計量與總體參數的差異或兩個樣本統(tǒng)計量的差異究竟是由于抽樣所引起的隨機誤差,還是本質上的誤差,這需要檢驗才能加以確定。判斷這種差異是否顯著,要用概率來答復。如果差異是由于抽樣誤差而引起的可能性大,那末兩者的差異就不顯著,反之兩者的差異就顯著。抽樣誤差的概率大小是由顯著性水平來衡量的。通常采用的顯著性水平為0.05或0.01,如果P>0.05為差異不顯著;如果0.05≥P>0.01差異顯著;如果P<0.01那么特別顯著。需要注意的是,顯著性檢驗是以隨機樣本為前提的,以概率論原理為根底的,所以進行檢驗時應注意樣本的隨機性,以及樣本的可比性,觀測指標的所有條件應盡可能相同或根本相同。00.0250.025接受假設區(qū)域

0.95拒絕假設區(qū)域拒絕假設區(qū)域第三十六頁,共78頁。二、顯著性檢驗的一般方法一般來說,統(tǒng)計檢驗先對總體的分布規(guī)律作出某種假說,然后,根據樣本提供的信息,對假說作出肯定或否認的決策。具體步驟為:①提出假設。如“假設兩個群體平均數沒有差異〞,其數學符號為:“H0:μ1=μ2〞,這種對群體所作的“無差異〞的假設,稱為“零假設〞或稱虛無假設,用符號“H0〞表示。與此同時實際上存在第二種假設,“兩個總體平均數有差異〞,其符號為:“H1:μ1≠μ2〞,稱為備擇假設。顯然,“零假設〞與“備擇假設〞是兩個對立的假設,肯定是此否認彼。②根據不同條件和樣本提供的信息即數據,從零假設出發(fā),代入相應的公式,計算出零假設的概率。③作出統(tǒng)計決斷,根據“小概率事件實際上不可能性〞原理,研究H0成立的概率。如果H0的概率P>0.05,表示零假設不是一個小概率事件,那么H0成立,便否認被擇假設H1從而確定“μ1=μ2〞。如果H0的概率p≤0.05,說明是個小概率事件H0不成立,就肯定備擇假設H1的成立,從而確定“μ1≠μ2〞。④結論:當P>0.05時差異不顯著;當0.01≤p≤0.05時差異顯著;當P≤0.01時差異特別顯著。

三、推斷統(tǒng)計第三章顯著性檢驗第三十七頁,共78頁。推斷統(tǒng)計〔顯著性檢驗〕三、顯著性檢驗的一般步驟:1、建立檢驗假設〔H0:=μ或μ1=μ2〕2、選擇和計算統(tǒng)計量〔z值或t值〕3、確定P值4、判斷結果:當P>0.05為差異不顯著接受檢驗假設當0.05≥P>0.01差異顯著拒絕檢驗假設當P≤0.01差異特別顯著拒絕檢驗假設第三十八頁,共78頁。平均數差異的顯著性檢驗〔Z檢驗〕1、兩個獨立大樣本平均數差異的顯著性檢驗Z檢驗是一般用于大樣本(即樣本容量大于30)平均值差異性檢驗的方法。它是用標準正態(tài)分布的理論來推斷差異發(fā)生的概率,從而比較兩個平均數的差異是否顯著。Z檢驗公式:例1987年上海市初中三年級語文教學調查中,對男女生語文測試成績作如下統(tǒng)計,試檢驗男女生語文成績是否存在顯著差異,性別人數總分閱讀寫作平均分標準差平均分標準差平均分標準差男167113.7420.9571.6415.1142.129.73女159118.5219.0974.8714.0144.438.83差值|Z|2.152.002.27抽取的兩個樣本均大于30,屬兩個獨立大樣本平均數差異的顯著性檢驗,用Z檢驗。差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗pz第三十九頁,共78頁。平均數差異的顯著性檢驗〔Z檢驗〕檢驗步驟:

①提出零假設z:H0:μ1=μ2即假定男女寫作、閱讀及讀寫總分均無顯著差異,現在的差異是抽樣誤差所致。

②計算統(tǒng)計量,代人Z值公式00.0250.025接受假設區(qū)域

0.95拒絕假設區(qū)域拒絕假設區(qū)域差異異常顯著p≤0.01Z≥2.58差異顯著0.05>p>0.011.96≤Z<2.58差異不顯著P>0.05Z<1.96檢驗pz第四十頁,共78頁。平均數差異的顯著性檢驗〔Z檢驗〕③計算出的Z值與下表進行對照,作出判斷:|Z|P差異顯著性>1.96<0.05差異顯著>1.96<0.05差異顯著>1.96<0.05差異顯著因為|Z寫|=2.27,顯然,|Z寫|>1.96,說明概率P≤0.05,男女生寫作成績差異顯著。因為|Z讀|=2.00,顯然,|Z讀|>1.96,說明概率P≤0.05,男女生閱讀成績差異顯著。因為|Z總|=2.15,顯然,|Z總|>1.96,說明概率P≤0.05,男女生語文成績差異顯著。④結論:當P≤0.05時,拒斥H0,肯定H1,1987年調查說明上海市初三語文成績男女生存在顯著差異,女生高于男生。00.0250.025接受假設區(qū)域

0.95拒絕假設區(qū)域拒絕假設區(qū)域-1.961.96第四十一頁,共78頁。平均數差異的顯著性檢驗〔t檢驗〕2、小樣本與總體均數的差異檢驗t檢驗是用于小樣本(樣本容量小于30)時的平均值差異程度檢驗方法。它是用t分布理論來推斷差異發(fā)生的概率,從而比較兩個平均數的差異是否顯著。例某校初一年級抽出一組20人,對數學自學輔導教材進行試驗,期末全年級測試平均成績?yōu)?0分,而這20人的平均分為=77.7,標準差為15,試檢驗實驗效果。本例隨機抽樣樣本容量為20人,屬小樣本,因此適用t檢驗。所謂檢驗實驗效果,就是以樣本(20人)的平均數與某總體平均數μ之間的差異程度的顯著性檢驗,既檢驗樣本所取自(所代表)的總體的平均數μ與μ0,是否有差異。t檢驗公式:第四十二頁,共78頁。平均數差異的顯著性檢驗〔t檢驗〕檢驗步驟:①提出零假設:H0:μ=μ0,即假定樣本所代表的總體平均數與平均數無顯著差異,如有差異僅是抽樣誤差所致。此題μ0=70分②計算檢驗統(tǒng)計量t值。用如下公式式中,=樣本平均數77.7;μ0=總體平均數70;

s=樣本標準差15;n=樣本容量20,代人公式得第四十三頁,共78頁。平均數差異的顯著性檢驗〔t檢驗〕③作出判斷。與正態(tài)分布曲線不同,t分布的曲線形式隨自由度大小而不同?!白杂啥权曈涀鳌癲f〞。作總體平均數的假設檢驗時,統(tǒng)計量t的自由度df=n-1。據此,此題的df=20-1=19。查t值表,得出理論t值為:t(19)0.05=2.093再與計算所得t值比較可得:t=2.24>t(19)0.05=2.093依據?t值與差異顯著性關系?表,推斷H0發(fā)生的概率,作出結論。t值與差異顯著性關系tP差異顯著性<t(df)0.05>0.05差異不顯著≥t(df)0.05≤0.05差異顯著≥t(df)0.01≤0.01差異十分顯著因為t=2.31>t(df)0.05,從上表可知,概率P≤0.05時,μ和μ0之間的差異顯著。因此可下結論為:拒斥H0:μ=μ0,而肯定H1:μ≠μ0,又因μ>μ0,故結論說明新教材實驗有成效。第四十四頁,共78頁。平均數差異的顯著性檢驗〔t檢驗〕

3、其它檢驗公式

如果是按同一組樣本不同情況的測試所得的平均值1和2來檢驗平均值的差異程度,其計算公式為:式中,D為兩次測試中每對分數之差即D=X2-X1。對于兩個獨立的正態(tài)總體,如果兩總體方差相等但未知總體方差具體數值,從中各抽取一隨機樣本,兩樣本平均數之差將服從自由度為

的t分布。其檢驗統(tǒng)計量的計算公式

第四十五頁,共78頁。實驗設計簡述實驗設計:實驗者為了揭示實驗中的自變量與因變量的關系,在實驗之前所作的實驗方案,通常指實驗程序的方案和安排。而實驗程序的方案和安排離不開統(tǒng)計、檢驗。實驗設計的內容:包括怎樣選擇被試〔實驗對象〕,控制那些因素,指出什么假設,觀察那些內容,如何安排實驗步驟,采取何種統(tǒng)計方法來處理和分析實驗結果等等。第四十六頁,共78頁。例:控制變量指示語〔一〕目的:通過把指示語作為自變量,觀察被試對反響變量的不同影響,從而了解到不是以指示語為自變量的實驗中控制指示語的重要性?!捕巢牧希簲祵W試卷一份,馬表?!踩吵绦颍?按全班被試的數學程度,分為數學能力相同的甲、乙兩組。2主試僅向甲組被試著重指出:你們在運算時必須注意試題中數字之間的關系,余內容兩者相同。3主試說明實驗要求,發(fā)給各被試試題一張,覆置桌上。主試發(fā)“預備〞口令時,被試把題紙翻轉正面,寫好姓名等項,主試發(fā)“開始〞口令時,同時開動馬表,被試答題。4被試做完題目,立即停筆并問得答題時間,記錄在試題紙上。5全組做完,主試宣布答案,被試加以核對,并記錄成績,以便整理全組結果?!菜摹辰Y果:1統(tǒng)計甲乙兩組的平均成績〔做對題數和做題的時間〕2檢驗兩組時間〔或成績〕差異的顯著性〔五〕討論:1在本實驗中,你是怎樣發(fā)現題目的規(guī)律的2指導語在解題中所起作用如何第四十七頁,共78頁。實驗設計簡述附:數學試題如下姓名——組別——時間——在以下各數列后的橫線上,填寫你認為應該填寫的數字〔1〕26101418————〔2〕31248192768————〔3〕8421————〔4〕31/4833/4————〔5〕455667————〔6〕38131823————〔7〕134679————〔8〕72503-2————〔9〕1346101222————〔10〕1222428————第四十八頁,共78頁。第二局部教育測量學原理簡介第一章教育測量概述一教育測量的含義與特點二教育測量開展的歷史三教育測量的要素和種類四教育測量的功能及對教育測量應持的態(tài)度第二章測驗的信度、效度、難度與區(qū)分度一、測驗的信度二、測驗的效度三、測驗的難度四、測驗的區(qū)分度第三章測驗的編制與實施一、確定測驗目的二、教育目標分類三、編制測驗雙向細目表四、試題的編制五、試題評分六、試卷的編輯與測驗實施七、試卷分析第四章題型編制的一般原理與方法第四十九頁,共78頁。

第一章教育測量概述

一、教育測量的含義與特點

1、教育測量的含義測量(Measurement):通常指人們對客觀事物進行某種數量化的測定。測量是以數量來表述結果的,沒有數量來表述的結果不能稱為測量。

教育測量(EducationalMcasufement):就是對學生的學習能力、學業(yè)成績、興趣愛好、思想品德以及教育措施上許多問題的數量化測定。

教育測量主要對學生精神特性的測定。凡物之存在必有其數量,凡有數量的東西都可以測量,測不準原理。第五十頁,共78頁。一、教育測量的含義與特點測量、測驗、考試、評價的聯(lián)系與區(qū)別

測量與測驗:測驗(Test)是引起某種行為的工具,通常是指運用某些儀器、試題來引起人們的某種行為,從而測定人們的某種特性。它是進行數量化分析和科學推斷的前提和手段。測量比測驗的含義要廣泛,測量不僅包括著運用儀器、試題來進行測定事物的質量與特性,而且還包括著運用調查、觀察等方法來測量事物的質量與特性,測量既包括對事物的測驗,又包含對事物進行數量化的分析,并對測驗結果進行一定的解釋和評價。

測驗與考試(Examination)也不盡相同。我們平時所說的考試,通常只憑教師自己的經驗去出試題和評分,帶有主觀隨意性。測驗是經過較細致的科學分析才編制出測驗的題目,在測驗的程序和評分方面也有較嚴格的要求??荚囈话阌糜诳己藢W生的學業(yè)成績,測驗不僅用于考核學生的學業(yè)成績,還用于心理特性的測量。測量與評價(Evalution)既有聯(lián)系,也有區(qū)別。測量強調的是數量化,評價那么是突出價值觀,充分重視對問題的分析與評斷。第五十一頁,共78頁。一、教育測量的含義與特點2、教育測量的特點〔1〕教育測量一般是間接測量我們只能通過學生對測驗題目的反響和一些行為表現運用推理、判斷的方法,來間接的測量出他們的知識水平、智力上下和品德好壞?!?〕教育測量的度量單位是相對的學生的學業(yè)成績好壞、智力上下和能力大小等,都是就其在所在團體的整個分數序列、行為序列中的地位來說的,其測量的分數單位,并非絕對的?!?〕教育測量是為實現教育目的效勞的是為改進教育工作,提高教育質量,更好地實現教育目的效勞的。不能脫離教育目的和教材的要求,隨意地制定測驗量表,任意地進行測量。對各種教育測量結果的評價,也都應依據教育目的的要求來進行。第五十二頁,共78頁。第一章教育測量概述

二、教育測量開展的歷史主觀經驗性考試階段(1864年以前)教育測量起源于我國的科舉考試制度??陀^標準化測驗階段(1864一1940年)法國的比納、西蒙,美國的推孟、桑戴克、麥柯爾比納被稱為智力測量的鼻祖,桑戴克被稱為教育測量學的鼻祖客觀測驗的深入開展階段〔1940年-〕過去教育測量多為對學生知識的測量,很少測量學生的心理和品德?,F在的教育測量,不僅重視測量學生的知識,而且重視學生的智力和思想品德的測量。過去教育測量的量表編制多為單一答案的求同式思維,缺乏多種答案的求異式思維,現在教育測量的量表中,也包括有多種答案的求異式思維題和論文題。過去教育測量多用于對學生的學習成績的測量,很少涉及課程設置、教材、教育改革方案等效益方面的測量,現在在教育工作的各個方面都運用教育測量。過去教育工作中的客觀測驗,一般是常模參照測驗,現在教育工作中的客觀測驗,不僅有“常模參照性測驗〞,而且有“目標參照性測驗〞。第五十三頁,共78頁。

第一章教育測量概述

三、教育測量的要素和種類單位教育測量中的單位不是絕對等價值的參照點教育測量的參照點都屬于人為設定,從參照點起計算的分數不能以“倍數〞的方式解釋量表具有單位和參照點的連續(xù)體。教育測量所使用的量表有四種:百分量表、年齡量表、等級量表、T量表2、教育測量的種類以測量的對象來分:學業(yè)成績測驗、智力測驗、人格測驗、特殊能力測驗以測量的目的來分:預測測驗、形成性測驗、總結性測驗、診斷性測驗、難度測驗、速度測驗以測量的方式來分:個人測驗、團體測驗以試題的形式來分:客觀性測驗、論文式測驗、投射測驗、情景測驗

1、教育測量的要素第五十四頁,共78頁。第一章教育測量概述

四、教育測量的功能及對教育測量的認識態(tài)度1、教育測量的功能教育測量是改進教學的良好工具教育測量是教育管理的重要手段教育測量是教育研究的重要方法2、對教育測量應有的認識態(tài)度教育測量是一種工具教育測量尚需完善對教育測量應持嚴肅的態(tài)度第五十五頁,共78頁。教育測量學原理第二章測驗的信度、效度、難度與區(qū)分度

測驗的信度、效度、難度與區(qū)分度是衡量測量質量的根本標準作為教育測量的工具——測驗,它的編制是一項十分復雜的工作,它需要懂得一些教育測量根本知識和根本方法的人來完成。一個連信度、效度、難度和區(qū)分度等教育測量根本概念都不甚了解的人是難以編出高質量的測驗的。從教育測量的理論上來講,一個良好的測驗應該具備以下條件:測驗的試題與測量的目標吻合測驗的試題應具有代表性測驗的試題有恰當的難度和區(qū)分度測驗的試題的語言陳述簡單、明確測驗的結果有效和可靠〔即效度、信度高〕測驗的實施符合經濟性原那么其中測驗的信度、效度、難度和區(qū)分度是衡量測驗質量的根本指標。第五十六頁,共78頁。測驗的信度、效度、難度與區(qū)分度一、信度〔reliability〕所謂測驗的信度是指測驗的可靠性或者可靠程度。具體地說,測驗的信度是指同一組學生用同一測驗實施兩次后所得分數的一致性,或者同一組學生經過一次測驗后,用另一個同質的測驗再測一次,這兩次測驗所得分數的一致性。根據統(tǒng)計學的根本原理,刻劃測驗的信度有三種方法:①穩(wěn)定性系數穩(wěn)定性系數的求法是:先對某個測驗實施一次,過了一段時間后。再用這個測驗實施一次,然后計算學生在前后再次測驗中所得分數的相關系數。這個相關系數就是穩(wěn)定性系數。②等值性系數等值性系數的求法是:等值性系數是以兩個等值〔題型、題數、難度、區(qū)分度相等〕但具體內容不同的量表,在最短時距內,對相同應試者先后施測兩次的兩組對應分數的相關系數。③內部一致性系數內部一致性系數的求法是:將一個測驗分數分為兩個相等而獨立的局部〔例如奇數題和偶數題〕,然后求兩者的相關系數。對于這個相關系數,再用斯皮爾曼-布朗公式r信=2r/1+r來校正。其中r是相關系數,r信就是內部一致性系數。第五十七頁,共78頁。測驗的信度、效度、難度與區(qū)分度在前述三種類型的信度系數中,前兩個都要學生接受同一〔或同質〕內容的兩次測驗,這在實際的中小學教育過程中是不現實的。因此,在中小學教育或從事教育科學研究的過程中,信度系數的計算一般以內部一致系數為主。測驗的信度是十分重要的,不可靠的測驗是沒有什么意義的,如用一桿秤去稱肉,第一次稱的的重量是1500克,第二次稱得的重量是1000克,那么這種秤還有什么用呢?教育測量也是如此,如用一次去測量學生的數學學業(yè)水平,第一次測驗的成績是92分,第二次測驗的成績卻只有61分,這樣就無法確定這個學生的數學學業(yè)水平。當然,這個測驗是根本不可靠的。就測驗的內容而言,學業(yè)成績測驗要求信度系數在0.9以上,常到達0.95;智力測驗應到達0.85以上;個性測驗和興趣測驗稍低,應在0.7~0.8.第五十八頁,共78頁。測驗的信度、效度、難度與區(qū)分度提高測驗信度的方法:①延長測驗的長度。量表題目越少,得分越容易受試題抽樣的偶然因素影響,當然測驗的信度也越低。新增加的試題必須與原試題同質〔平均難度一樣〕且不使被試感到厭倦。②測驗的難度要適中,同一測驗中的試題難度水平接近。③施測內容盡量單一。不要妄圖在一次測驗中測量被試的所有能力,信度很低。④測驗的時間要充分,使被試沉著答復以下問題。⑤測驗的程序要統(tǒng)一。進行屢次測驗,開始時的指導語、答復以下問題方式、分發(fā)收回試卷的方法、時間掌握都要盡量一致。⑥評分要客觀??陀^性測驗,評分標準明確有助于提高測驗的信度。主觀性試題,受偶然因素影響大,往往評分者的“量尺〞不統(tǒng)一,信度差。⑦加大應試者之間的差異。因為信度系數的大小與實得分數成正比,加大被試能力的差異可提高信度。2σ第五十九頁,共78頁。測驗的信度、效度、難度與區(qū)分度二、效度〔Validity〕所謂測驗的效度是指一個測驗真正能確實測量到它所要測量的東西的程度。它是針對測量的目的和結果而言的。根據測量的目的,可以把測驗的效度分為內容效度、結構效度和效標關聯(lián)效度三種。①內容效度內容效度是指測驗目的代表準備測驗的內容和引起的預期反響所到達的程度。如在教育實驗研究的測量中,“準備測量的內容〞是指實驗自變量的變化,“預期反響〞是指實驗因變量的變化。目前,對測驗的內容效度沒有恰當的計算方法,尚不能用一個簡單數字來刻劃它。現在判斷測驗的內容效度一般是用邏輯分析法或內容分析法。②結構效度測驗的結構效度是指測驗結果能夠說明教育學和心理學理論的某種結構或特征的程度。它可以理解為測驗實際上測量了準備測量的結構特征所到達的程度。測驗的結構效度問題比較復雜。一般在中小學教育和教育科學研究中所使用的自編測驗是不考慮這個問題的。③效標關聯(lián)效度測驗的效標關聯(lián)效度是指測驗結果與作為效標的另一個獨立的測驗結果之間的一致性程度。這種一致性程度一般是用本測驗結果與另一個獨立的測驗結果之間的相關系數來描述的。那個獨立的測驗結果是用來估計本測驗效度的標準,所以叫做效標。實際上,效標在一定程度上用另一個獨立測驗結果反映本測驗準備測量的某些特征。由于效標是計算測驗的效標關聯(lián)效度的主要依據。因此,效標必須確實能反映某個方面的特征。只有這樣才能成計算測驗效標關聯(lián)效度的依據。第六十頁,共78頁。測驗的信度、效度、難度與區(qū)分度效度的統(tǒng)計定義:提高效度的方法

①控制系統(tǒng)誤差。

②精心編制量表。

③妥善組織測驗

④擴充樣本的容量和代表性。

⑤合理處理信度和效度的關系。從某種意義上講效度比信度更重要第六十一頁,共78頁。三、難度:被試完成題目〔item〕任務時所遇到的困難程度。在教育測量中,某測驗的難度一般是用正確解答該測驗題的人數與參與測驗的學生數的比值來刻劃的。用公式表示即P=R/N其中,P表示某測驗題的難度,R表示答對該測驗題的人數,N表示參加測驗的人數。難度對測驗有很大的影響。這種影響主要表達在影響測驗成績的分布,影響測驗成績的離散程度;影響測驗的區(qū)分能力等三個方面。難度計算,常用的以下幾個公式:①P=X/W其中P表示某測驗題的難度,X表示接受測驗的學生在該測驗題上的平均分數,W表示該測驗題的最高得分。②P=PH+PL/2其中P表示某測驗題的難度,PH表示接受測驗的高分組學生〔占總數的27%〕在該測驗題的通過率,PL表示接受測驗的低分組學生〔占總數的27%〕在該測驗題的通過率。③P=XH+XL-2NL/2N〔H-L〕該公式只適宜計算論文式測驗題的難度。其中P表示某測驗題的難度,XH表示接受測驗的高分級學生的得分總數,XL表示接受測驗的低分級學生的得分總數,N表示接受測驗的學生總數。H表示該測驗題的最高可能得分,L表示該測驗題的最低可能得分。測驗的信度、效度、難度與區(qū)分度第六十二頁,共78頁。四、區(qū)分度區(qū)分度又叫鑒別力,它是測驗對學生實際水平的區(qū)分程度的指標。一個具有良好區(qū)分度的測驗題,實際水平高的學生應該得高分,實際水平低的學生應該得低分。測驗的區(qū)分度有積極區(qū)分度和消極區(qū)分度兩種。積極區(qū)分是指區(qū)分的方向與測驗總分的方向一致的區(qū)分,區(qū)分的方向與測驗局部的方向不一致的區(qū)分是消極區(qū)分。測驗題的區(qū)分度的取值范圍在-100至100之間。如果區(qū)分度是負值,那么表示該區(qū)分是消極區(qū)分;如果區(qū)分度為0,那么表示該測驗題沒有區(qū)分;如果區(qū)分度是正值,那么表示該區(qū)分是積極區(qū)分。測驗的信度、效度、難度與區(qū)分度第六十三頁,共78頁。四、區(qū)分度測驗題的區(qū)分度的計算方法很多。在中小學教育和教育科學研究中使用的測驗題的區(qū)分度一般用以下公式來計算。①客觀性測驗題區(qū)分度計算公式D=PH-PL其中D表示某測驗題的區(qū)分度,PH表示測驗高分組學生對該測驗題的通過率,PL表示測驗低分組學生對該測驗題的通過率②論文式測驗題區(qū)分度計算公式D=XH-XL/N〔H-L〕其中D表示某測驗題的區(qū)分度,XH表示接受測驗的高分級學生的得分總數,XL表示接受測驗的低分級學生的得分總數,N表示接受測驗的學生總數。H表示該測驗題的最高可能得分,L表示該測驗題的最低可能得分。測驗的信度、效度、難度與區(qū)分度第六十四頁,共78頁。測驗的信度、效度、難度與區(qū)分度區(qū)分度的一般評價標準

0.2以下應淘汰;

0.2—0.3合格題目,可能需加以改進;

0.3—0.4良好;

0.4—1性能頗佳。

測驗題目難度與區(qū)分度的關系

題目難度、區(qū)分度與測驗信、效度之間關系復雜。

測驗中題目的總體難度過高或過低,都會導致測驗的總體區(qū)分能力降低。所以一般說來,中等難度的題目應占40—60%。第六十五頁,共78頁。

教育測量學原理

第三章

測驗的編制與實施一、確定測驗目的。要編制測驗,首先要明確測驗的目的。在教育活動中,測驗無論多么重要它也只能是為目的效勞的工具,測驗的質量如何,關鍵在于能否有效地促進教育目標的實現。把握常模參照性測驗與目標參照性測驗的區(qū)別。常模參照測驗:是指以學生團體測驗的平均成績作為參照標準,說明某一學生在團體中的相對位置,將學生分類排隊。重在個人與個人之間的比較,主要用于選拔或編組、編班,要求試題難度適中,盡量對所有學生都有較強的鑒別力和區(qū)分度。常模參照測驗以鑒別學生個別差異為指導思想,目的是為了測得學生在所處團體中的相對水平。常模實際上即是該團體在測驗中的平均成績,學生成績便是以常模為參照標準來確定的。這一測驗衡量的是學生的相對水平,故其評分屬相對評價范疇。

目標參照測驗:是以到達教學目標為標準參照點。它提供的信息是完成教學目標的情況,旨在檢查學生的成績與教學之間的差異,不比較個人之間成績的差異。測驗試題,必須完全能代表教學目標要求才能發(fā)揮作用,考試成績就代表學生掌握教學目標要求到達的程度。

二、教育目標分類。1956年布魯姆〔〕制定出了教育目標的分類系統(tǒng)。〞認知目標、情感目標、運動目標〞三大類,每類目標又分成不同的層次排列成由低到高的階梯。1998年霍恩斯坦教育目標分類學是在批判繼承布盧姆教育目標分類學的根底上推出的一個全新的教育目標分類體系.它的主要特點是以建構主義為理論根底,表達了人的行為的整體性,突出了過程性.它將全部教育目標劃分為認知領域、情感領域、動作技能領域和行為領域4個局部,每個領域包含5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論