教育統(tǒng)計學課件_第1頁
教育統(tǒng)計學課件_第2頁
教育統(tǒng)計學課件_第3頁
教育統(tǒng)計學課件_第4頁
教育統(tǒng)計學課件_第5頁
已閱讀5頁,還剩273頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

課程性質(zhì)和教學要求課程的性質(zhì):

《教育統(tǒng)計學》是教育學與統(tǒng)計學交叉結合的學科,同時也是一門應用統(tǒng)計學,是數(shù)理統(tǒng)計方法在教育領域的具體應用。它通過量化的手段來分析、認識教育現(xiàn)象和規(guī)律,是一門重要的工具性學科。教學目標和要求:

理解《教育統(tǒng)計學》的基本概念和原理,掌握從事教育科學研究所必需的一些統(tǒng)計方法,能按照要求對數(shù)據(jù)進行描述統(tǒng)計與推斷統(tǒng)計分析處理,形成較強的統(tǒng)計意識,在今后的實際研究中具有正確地選擇、運用統(tǒng)計方法解決實際問題的能力。第一章緒論

教育統(tǒng)計方法在教育科學研究中的作用

教育統(tǒng)計學的內(nèi)容

教育統(tǒng)計學的發(fā)展教育統(tǒng)計學中幾個基礎概念什么是教育統(tǒng)計學

教育統(tǒng)計學是專門研究如何運用統(tǒng)計學原理和方法,搜集、整理、分析教育科學研究中獲得的隨機性數(shù)據(jù)資料,并根據(jù)這些數(shù)據(jù)資料所傳遞的信息,進行科學推論找出教育活動規(guī)律的一門科學。具體講,就是在教育研究中,通過調(diào)查、實驗、測量等手段有意獲取一些數(shù)據(jù),并將得到的數(shù)據(jù)按統(tǒng)計學原理和步驟加以整理、計算、繪制圖表、分析、判斷、推理,最后得出結論的一種研究方法。教育統(tǒng)計學的性質(zhì)

教育統(tǒng)計學是心理學與統(tǒng)計學交叉結合的學科,是數(shù)理統(tǒng)計方法在教育領域的具體應用,屬于應用統(tǒng)計學的范疇,是應用統(tǒng)計學的一個分支。它是教育科學研究中廣泛應用的、也是最基本的一種定量化的研究工具。教育統(tǒng)計學和數(shù)理統(tǒng)計學的關系

數(shù)理統(tǒng)計學研究的領域包括怎樣設計一個實驗,如何從局部觀測推論整體情況,如何從特殊情況推論一般規(guī)律,如何對假設進行推論估計與檢驗等等。教育統(tǒng)計學偏重于數(shù)理統(tǒng)計方法如何在教育科學研究中的應用,因而對各種統(tǒng)計方法公式的推導及理論上的證明介紹較少,著重介紹各種統(tǒng)計方法在不同的教育研究中應用的條件和具體方法,及其統(tǒng)計結果的解釋。一般講,教育統(tǒng)計學介紹的方法,大都是數(shù)理統(tǒng)計學已確認的,但是,隨著教育科學研究的發(fā)展與深入,實踐中會提出更多的如何處理數(shù)據(jù)的問題,需要教育統(tǒng)計學加以研究解決,這又為數(shù)理統(tǒng)計提供或補充了新的研究內(nèi)容??梢?,數(shù)理統(tǒng)計學和教育統(tǒng)計學二者之間是理論與實踐的關系。學習教育統(tǒng)計學的意義

(1)統(tǒng)計學為科學研究提供了一種科學方法。(2)教育統(tǒng)計學是教育科學研究定量分析的重要重要工具。(3)廣大教育工作者學習教育統(tǒng)計學既可以順利地閱讀國內(nèi)外先進的研究成果,又可以提高工作的科學性和效率,同時也為學習教育測量打下基礎。教育科學研究數(shù)據(jù)的特點

(1)教育科學研究數(shù)據(jù)與結果多用數(shù)字形式呈現(xiàn);(2)教育科學研究數(shù)據(jù)具有隨機性和變異性;(3)教育科學研究數(shù)據(jù)具有規(guī)律性;(4)教育科學研究的目的是通過部分數(shù)據(jù)來推測總體特征??傊诮逃茖W實驗或調(diào)查中,所獲得的數(shù)據(jù)都具有變異性與規(guī)律性的特點。

學習教育統(tǒng)計學要注意的問題

(1)在學習教育統(tǒng)計學時,必須克服畏難情緒。(2)在學習時要重點掌握各種統(tǒng)計方法使用的條件。(3)要做一定的練習。在應用教育統(tǒng)計學

各種方法時要切記的要點

(1)克服“統(tǒng)計無用”與“統(tǒng)計萬能”的思想,要注意科研道德。(2)正確地選用統(tǒng)計方法,防止亂用統(tǒng)計。

思考題

選用統(tǒng)計方法有哪幾個步驟?

①要分析一下實驗設計是否合理,即所獲得的數(shù)據(jù)是否適合用統(tǒng)計方法去處理,正確的數(shù)量化是應用統(tǒng)計方法的起步,如果對數(shù)量化的過程及其意義沒有了解,將一些不著邊際的數(shù)據(jù)加以統(tǒng)計處理是毫無意義的。②要分析實驗數(shù)據(jù)的類型。不同數(shù)據(jù)類型所使用的統(tǒng)計方法有很大差別,了解實驗數(shù)據(jù)的類型和水平,對選用恰當?shù)慕y(tǒng)計方法至關重要。③要分析數(shù)據(jù)的分布規(guī)律,如總體方差的情況,確定其是否滿足所選用的統(tǒng)計方法的前提條件。答:教育統(tǒng)計學的分類

(1)依研究的問題實質(zhì)來劃分,教育統(tǒng)計學的研究內(nèi)容可劃分為描述一件事物的性質(zhì)、比較兩件事物之間的差異、分析影響事物變化的因素、一件事物兩種不同屬性之間的相互關系、取樣方法等等。(2)依統(tǒng)計方法的功能進行分類,教育統(tǒng)計學的研究內(nèi)容可分為描述統(tǒng)計、推論統(tǒng)計和實驗設計。描述統(tǒng)計

主要研究如何整理科學實驗或調(diào)查得來的大量數(shù)據(jù),描述一組數(shù)據(jù)的全貌,表達一件事物的性質(zhì)。具體內(nèi)容包括:

(1)數(shù)據(jù)如何分組,如何使用各種統(tǒng)計圖表描述一組數(shù)據(jù)的分布情況;(2)怎樣計算一組數(shù)據(jù)的特征值,簡縮數(shù)據(jù),進一步描述一組數(shù)據(jù)的全貌;(3)表示一事物兩種或兩種以上屬性間相互關系的描述及各種相關系數(shù)的計算及應用條件,描述數(shù)據(jù)分布特征的峰度及偏度系數(shù)計算方法等。

推論統(tǒng)計

主要研究如何通過局部數(shù)據(jù)所提供的信息,推論總體(或稱全局)的情形。具體內(nèi)容包括:

(1)如何對假設進行檢驗,即各種各樣的假設檢驗,包括大樣本檢驗方法(z檢驗),小樣本檢驗方法(t檢驗),各種計數(shù)資料的假設檢驗的方法(百分數(shù)檢驗、χ2檢驗等),變異數(shù)分析的方法(F檢驗),回歸分析方法等等。(2)總體參數(shù)的估計方法。(3)各種非參數(shù)的統(tǒng)計方法等。實驗設計

主要目的在于研究如何科學地、經(jīng)濟地以及更有效地進行實驗。具體內(nèi)容包括:在實驗以前對研究的基本步驟、取樣方法、實驗條件的控制、實驗結果數(shù)據(jù)的統(tǒng)計分析方法等作出嚴格的規(guī)定。

描述統(tǒng)計、推論統(tǒng)計和實驗設計這三部分統(tǒng)計內(nèi)容有何關系?思考題

教育統(tǒng)計學的三個組成部分的內(nèi)容不是截然分開的,而是相互聯(lián)系的。描述統(tǒng)計是推論統(tǒng)計的基礎,推論統(tǒng)計離不開描述統(tǒng)計計算所獲得的特征值;描述統(tǒng)計只是對數(shù)據(jù)進行一般的分析歸納,如果不進一步應用推論統(tǒng)計作進一步的分析,描述統(tǒng)計的結果就不會產(chǎn)生更大的價值和意義,達不到統(tǒng)計分析的最終目的要求。同樣,只有良好的實驗設計才能使所獲得的數(shù)據(jù)具有意義,進一步的統(tǒng)計處理才能說明問題。當然一個好的實驗設計,也必須符合基本的統(tǒng)計方法的要求,否則,再好的設計,如果事先沒有確定適當?shù)慕y(tǒng)計方法處理,在處理研究結果時可能會遇到許多麻煩問題。答:教育統(tǒng)計與心理統(tǒng)計的異同

相同之處:二者的研究對象都是人,教育現(xiàn)象在很多情況下要通過人的心理現(xiàn)象去觀察和分析,統(tǒng)計方法基本相同。不同之處:

①在統(tǒng)計方法上:在教育方面的研究中,大樣本的統(tǒng)計方法應用較多;而在心理學上小樣本的方法較多。②在實驗設計的水平上:教育實驗中控制因素較難,采用自然實驗、準實驗設計方式較多,對統(tǒng)計結果的解釋需要特別謹慎;而心理學實驗則在實驗室條件下進行較多,對各種實驗變量的控制相對容易,統(tǒng)計處理結果的解釋也較易進行。統(tǒng)計學的發(fā)展歷程

(1)最初的統(tǒng)計是統(tǒng)治者用以治國的方法,對于人口、土地、物產(chǎn)、貢賦、士兵與戰(zhàn)車等都需要統(tǒng)計。(2)隨著科學的進步,在概率論的基礎上逐步形成了推測性的數(shù)理統(tǒng)計。(3)數(shù)理統(tǒng)計的發(fā)展經(jīng)歷了兩個階段:描述統(tǒng)計學與推論統(tǒng)計學。描述統(tǒng)計學產(chǎn)生于20世紀20年代之前,以高爾頓和皮爾遜為代表。推論統(tǒng)計學產(chǎn)生于20年代之后,以費舍為代表。(4)二戰(zhàn)以后,非參數(shù)方法、序列分析、隨機過程的研究、小樣本分布這些都逐漸被認識和應用。而且隨著一元統(tǒng)計方法的逐步完善與拓寬,多元統(tǒng)計理論與方法也被應用到各種實際研究中。統(tǒng)計在教育與心理研究中的應用

(1)作為一門應用統(tǒng)計學分支學科,教育統(tǒng)計學基本上是隨著數(shù)理統(tǒng)計的發(fā)展而發(fā)展的;同時心理與教育研究的發(fā)展也不斷充實著統(tǒng)計學的方法。許多現(xiàn)代統(tǒng)計學理論最初是來自教育與心理研究的。例如,因子分析源出于心理學研究。(2)英國的高爾頓最早將統(tǒng)計方法應用于心理學研究,首創(chuàng)回歸原理。皮爾遜也將相關系數(shù)及χ2檢驗等應用于心理研究中。斯皮爾曼對心理統(tǒng)計的發(fā)展做了很多工作,延伸了相關系數(shù)的概念,導出等級相關系數(shù)的計算方法;提出因子分析的思想,用統(tǒng)計方法處理心理實驗結果。(3)貢獻較大的有卡特爾、桑代克、瑟斯頓等人。1904年,桑代克出版《心理與社會測量》一書,極力提倡以心理學與統(tǒng)計學為工具而研究教育學,推廣運用統(tǒng)計方法研究心理與教育方面的實驗結果。20世紀20年代,瑟斯頓等人對因素分析在心理學研究中的廣泛應用也作了很大貢獻。統(tǒng)計在中國的發(fā)展與應用

(1)教育與心理統(tǒng)計學在辛亥革命以后傳到我國。當時教育與心理統(tǒng)計、教育與心理測量都作為高等、中等師范院校的必修課程,有一大批專家、學者從事這方面的研究、講授工作,出版了不少關于教育與心理統(tǒng)計方面的譯著、專著。

(2)20世紀80年代以后,教育與心理心理統(tǒng)計學開始復蘇。在二十多年中,我國的教育與心理統(tǒng)計學科在教學、研究、培養(yǎng)人才等各方面取得了非常豐碩的成果。(3)目前,教育與心理統(tǒng)計學的教學和研究進入穩(wěn)步快速發(fā)展時期。

數(shù)據(jù)的類型(一)

從數(shù)據(jù)的觀測方法和來源劃分,研究數(shù)據(jù)可區(qū)分為計數(shù)數(shù)據(jù)和測量數(shù)據(jù)兩大類。

計數(shù)數(shù)據(jù)是指計算個數(shù)的數(shù)據(jù),一般屬性的調(diào)查獲得的是此類數(shù)據(jù),它具有獨立的分類單位,一般都取整數(shù)的形式。測量數(shù)據(jù)是借助于一定的測量工具或一定的測量標準而獲得的數(shù)據(jù)。數(shù)據(jù)的類型(二)

根據(jù)數(shù)據(jù)反映的測量水平,可把數(shù)據(jù)區(qū)分為稱名數(shù)據(jù)、順序數(shù)據(jù)、等距數(shù)據(jù)和比率數(shù)據(jù)四種類型。稱名數(shù)據(jù)只說明某一事物與其它事物在屬性上的不同或類別上的差異,它具有獨立的分類單位,其數(shù)值一般都取整數(shù)形式,只計算個數(shù),并不說明事物之間差異的大小。順序數(shù)據(jù)是指既無相等單位,也無絕對零點的數(shù)據(jù),是按事物某種屬性的多少或大小,按次序?qū)⒏鱾€事物加以排列后獲得的數(shù)據(jù)資料。等距數(shù)據(jù)是具有相等單位,但無絕對零點的數(shù)據(jù)。比率數(shù)據(jù)既表明量的大小,也有相等單位,同時還具有絕對零點的數(shù)據(jù)。數(shù)據(jù)的類型(三)

按照數(shù)據(jù)是否具有連續(xù)性,把數(shù)據(jù)劃分為離散數(shù)據(jù)和連續(xù)數(shù)據(jù)。離散數(shù)據(jù)一般取整數(shù),在兩個單位之間不能再劃分細小單位。連續(xù)數(shù)據(jù)的單位可以劃得很細微,細微的程度能達到只可想象而不能看見的程度。

變量、觀測值、隨機變量

變量是指教育實驗、觀察、調(diào)查中想要獲得的數(shù)據(jù)。觀測值是指某一變量的某個確定的取值。隨機變量是指在取值之前不能預料取到什么值的變量。作為連續(xù)隨機變量,其數(shù)值只是表示連續(xù)變量的中央點值,在數(shù)軸上表示的是一段距離,或一個區(qū)間。因此,一個隨機變量不管寫成整數(shù)或小數(shù),實際是用一個單位的中央點表示在它以上和以下各有一段距離。例如:連續(xù)隨機變量1是表示0.5—1.499…。但在心理統(tǒng)計中也有例外的情況。如年齡的表示,一般5歲是指5歲開始到5歲11個月又30天。而作為離散的隨機變量,其數(shù)值表示的是數(shù)軸上的一個點值??傮w、個體和樣本總體是指具有某種特征的一類事物的全體。構成總體的每個基本單元稱為個體。從總體中抽取的一部分個體,稱為總體的一個樣本。樣本中包含的個體數(shù)目稱為樣本容量,一般用n表示。一般情況下,n>30的樣本稱為大樣本;n>30的樣本稱為小樣本。

次數(shù)、頻率與概率

次數(shù)(頻數(shù))

次數(shù)是指某一事件在某一類別中出現(xiàn)的數(shù)目。一般用符號f表示。頻率(相對次數(shù))

頻率是指某一事件的次數(shù)被總的事件數(shù)目除。亦即某一數(shù)據(jù)出現(xiàn)的次數(shù)被一組數(shù)據(jù)總個數(shù)去除。頻率通常用比例或百分數(shù)表示。概率(機率或然率)

概率是指某事件在無限的觀測中所能預料的相對出現(xiàn)的次數(shù)。換一句話說,就是某一事件或某種情況在某一總體中出現(xiàn)的比率。概率常用符號P表示。統(tǒng)計量和參數(shù)

統(tǒng)計量是指樣本的特征值。它是根據(jù)科研實驗所獲得的一組觀測值計算出來的一些量數(shù),它可以描述一組數(shù)據(jù)的情況。參數(shù)是指總體的特征值。它是描述一個總體情況的一些統(tǒng)計指標。思考題統(tǒng)計量與參數(shù)之間有何區(qū)別和聯(lián)系?

區(qū)別:①參數(shù)是從整個總體中計算得到的量數(shù),通常是通過相應樣本特征值來預測得到;統(tǒng)計量是從一個樣本中計算出來的一些量數(shù),它可以描述一組數(shù)據(jù)的情況。②參數(shù)代表總體的特性,它是一個常數(shù);統(tǒng)計量代表樣本的特性,它是一個變量,隨著樣本的變化而變化。③參數(shù)與統(tǒng)計量之間最明顯的區(qū)別是參數(shù)常用希臘字母表示,而統(tǒng)計量常用英文字母表示。聯(lián)系:從數(shù)值計算上講,當總體大小已知并與實驗觀測的總次數(shù)相同時,統(tǒng)計量與參數(shù)是同一統(tǒng)計指標;當總體為無限時,統(tǒng)計量與總體參數(shù)不同,但統(tǒng)計量可在某種程度上作為總體參數(shù)的估計值。通過樣本統(tǒng)計量,對總體參數(shù)做出預測和估計。答:第二章統(tǒng)計圖表

數(shù)據(jù)的初步整理次數(shù)分布表次數(shù)分布圖其他類型的統(tǒng)計圖表數(shù)據(jù)初步整理的方法

(1)數(shù)據(jù)排序

數(shù)據(jù)排序是指按照某種標準,對收集到的雜亂無章的數(shù)據(jù)按照一定的順序標準進行排列。

數(shù)據(jù)排序是整理數(shù)據(jù)最簡單的方法。(2)統(tǒng)計分組

統(tǒng)計分組是指根據(jù)被研究對象的特征,將所得數(shù)據(jù)劃分到各個類別中去。

對研究中所獲得的大量數(shù)據(jù)進行統(tǒng)計分組是對數(shù)據(jù)進行整理的重要步驟。統(tǒng)計分組應注意的事項

統(tǒng)計分組前的準備

將數(shù)據(jù)進行分組前,先要對觀測數(shù)據(jù)做進一步的核對和校驗。校核數(shù)據(jù)的目的是為了盡可能地消去記錄誤差,以便后續(xù)的統(tǒng)計分析建立在一個堅實的基礎上。統(tǒng)計分組時應注意的問題

①分組要以被研究對象的本質(zhì)特性為基礎;

②分類標志要明確,要能包括所有的數(shù)據(jù)。統(tǒng)計分組標志的類型

(1)性質(zhì)類別

主要是根據(jù)事物的屬性不同將被觀測的事物加以劃分,反映事物在組別、種類上的不同,不說明事物之間的數(shù)量差異。性質(zhì)類別可根據(jù)事物的性質(zhì)及研究的需要分成不同的層次,每個層次又可分為不同數(shù)量的細目。(2)數(shù)量類別

這是以數(shù)據(jù)的取值大小為分類標志,把數(shù)據(jù)按數(shù)值大小以分組或不分組的形式排出一個順序來。統(tǒng)計表

統(tǒng)計表的作用

統(tǒng)計表是用來表達統(tǒng)計指標與被說明的事物數(shù)量關系的表格。它可以將大量數(shù)據(jù)的分類結果,清晰、概括、一目了然地表達出來,明顯地反映出事物的全貌及其蘊涵的特性,具有簡明、清晰、準確的特點,表中的數(shù)據(jù)易于比較分析。統(tǒng)計表的結構統(tǒng)計表一般由表號、名稱、標目、數(shù)字、表注等項構成。統(tǒng)計表的編制要求按統(tǒng)計表的結構逐項說明編制的要求(見教材P27—28)。

統(tǒng)計表的結構和組成要素圖示80名員工對主管盡職情況評定人數(shù)①非常不盡職②不盡職③不置可否④盡職⑤非常盡職93010256總計80表2-180名員工對部門主管盡職程度調(diào)查結果表號標題標目表注*注:表中的數(shù)據(jù)來源于例[2-1]標目頂線表線數(shù)字底線統(tǒng)計圖

統(tǒng)計圖的作用

統(tǒng)計圖是用來表達統(tǒng)計指標與被說明的事物之間數(shù)量關系的圖形。它以直觀形象的形式表達出事物的全貌及其分布特征,給人簡明扼要、清晰易懂的印象,便于學習與記憶。統(tǒng)計圖的結構統(tǒng)計圖由圖號、圖題、圖目、圖尺、圖形、圖例、圖注等項構成。統(tǒng)計圖的繪制要求按統(tǒng)計圖的組成部分逐項說明繪制要點(見教材P28—29)。統(tǒng)計圖結構要素意圖Y軸名稱尺度單位填充圖案輪廓線基線X軸名稱

刻度標記圖尺圖號圖題圖目簡單次數(shù)分布表

簡單次數(shù)分布表就是依據(jù)每一個分數(shù)值在一列數(shù)據(jù)中出現(xiàn)的次數(shù)或總計數(shù)資料編制成的統(tǒng)計表。在心理與教育研究中,許多態(tài)度、興趣、偏好等測驗或調(diào)查的結果,都能制作成這種簡單次數(shù)分布表。分組次數(shù)分布表的概念

當數(shù)據(jù)量很大時,應該把所有的數(shù)據(jù)先劃分為若干分組區(qū)間,然后將數(shù)據(jù)按其數(shù)值大小劃歸到相應的組別內(nèi),分別統(tǒng)計各個組別中包括的數(shù)據(jù)個數(shù),再用列表形式呈現(xiàn)出來,就構成了分組次數(shù)分布表。(1)求全距(R):(2)決定組數(shù)(K)與組距(i):決定組距的大小,需要以全距為參考。組數(shù)的多少要根據(jù)數(shù)據(jù)的多少來定。如果數(shù)據(jù)的總體分布為正態(tài),可用經(jīng)驗公式:來計算組數(shù),然后由公式:來確定組距。(3)列出分組區(qū)間:列分組區(qū)間要注意以下幾點:①最高組區(qū)間內(nèi)應包含最大值的數(shù)據(jù),最低組區(qū)間應能含最小值的數(shù)據(jù);②最高組或最低組的下限最好是組距的整數(shù)倍;③各分組區(qū)間一般在縱坐標上按順序排列,數(shù)值大的分組區(qū)間排在上面,數(shù)值小的分組區(qū)間排在下面。(4)登記次數(shù):依次將數(shù)據(jù)登記到各個相應的組別內(nèi),一般用劃線記數(shù)或?qū)懻值姆椒?。?)計算次數(shù):根據(jù)登記的結果計算各組的次數(shù),計算各組次數(shù)的總和即總次數(shù)。(6)抄錄新表:新表包括的欄目有:第一列為分組區(qū)間,第二列為各分組區(qū)間的組中值,第三列為次數(shù)。分組次數(shù)分布表的編制步驟

分組次數(shù)分布表的意義與缺點

分組次數(shù)分布表的意義編制分組次數(shù)分布表,可將一堆雜亂無序的數(shù)據(jù)排列成序。從表中可以發(fā)現(xiàn)各個數(shù)據(jù)的出現(xiàn)次數(shù)是多少,其分布的狀態(tài)如何。分組次數(shù)分布表的缺點分組次數(shù)分布表也有缺點,僅從這張表看,原始數(shù)據(jù)不見了,只見到各分組區(qū)間及各組的次數(shù)。根據(jù)這樣的統(tǒng)計表提供的數(shù)據(jù)資料計算得到的平均值,會與用原始數(shù)據(jù)計算的值有一定的出入。將分組次數(shù)分布表中各組的實際次數(shù)轉(zhuǎn)化為相對次數(shù),即用頻數(shù)比率()或百分比()來表示次數(shù),就可制成相對次數(shù)分布表。相對次數(shù)分布表

累加次數(shù)分布表

在一般的分組次數(shù)分布表上,只標出各分組區(qū)間的數(shù)據(jù)次數(shù)。如果想知道某個數(shù)值以下或以上的數(shù)據(jù)的數(shù)目,就要用累加次數(shù)。累加次數(shù)是把各組的次數(shù)由下而上,或由上而下累加在一起。最后一組的累加次數(shù)應等于數(shù)據(jù)的總次數(shù)。用累加次數(shù)表示的次數(shù)分布表稱為累加次數(shù)分布表。累加次數(shù)分布表中,累加次數(shù)可用實際次數(shù),亦可用相對次數(shù)。累加次數(shù)的計算方法有兩種:①從分布表的小數(shù)值端,逐區(qū)間的進行次數(shù)累加,這種累加次數(shù)可回答次數(shù)分布表某一分組區(qū)間上限以下的次數(shù)是多少。②從分布表的大數(shù)端逐區(qū)間的次數(shù)累加,這種累加次數(shù)可回答某一分組區(qū)間下限以上的次數(shù)是多少。雙列次數(shù)分布表

雙列次數(shù)分布表是對有聯(lián)系的兩列變量用同一表表示其次數(shù)分布。

所謂有聯(lián)系的兩列變量,是指同一組被試中每個被試兩門學業(yè)成績分數(shù),或兩種能力分數(shù)或兩種心理特點的指標,或同一組被試在兩種實驗條件下獲得的結果等。再如,各方面基本相同的兩個被試進行同一測量所得的結果也是有聯(lián)系的。如果有多個這樣的被試,他們的測試數(shù)據(jù)也構成有聯(lián)系的兩列變量。編制雙列次數(shù)分布表,首先按照分組次數(shù)分布表的編制方法,分別列出各變量的分組區(qū)間,將一列變量的分組區(qū)間豎列,將另一變量橫列。豎列的小數(shù)端在下,大數(shù)端在上,橫列的小數(shù)端在左而大數(shù)端在右。登記時,每次同一對變量同時登記在相應的格內(nèi)。不等距次數(shù)分布表

一般分組次數(shù)分布表都是等距的。但實際研究中常遇到不等距的情況,如工資級別,年齡分組等,若按等距分組不能確切地反映實際情況,這時可采用不等距分組的方法。這樣的不等距分組的分組次數(shù)分布表就叫做不等距次數(shù)分布表。直方圖

直方圖(等距直方圖)是以矩形的面積表示連續(xù)性隨機變量次數(shù)分布的圖形。直方圖一般用縱軸表示數(shù)據(jù)的次數(shù)(頻數(shù)),橫軸表示數(shù)據(jù)的等距分組點(即各分組區(qū)間的下限)。在制作直方圖時,以組距為底邊,以分組區(qū)間的精確上下限為底邊二端點,以次數(shù)為高畫矩形,各直條矩形之間不留空隙,沒有間隔(參見教材圖2—3)。也可以不畫矩形,只要使直方圖包圍的面積成封閉的圖形即可,這種圖又叫組織圖(參見教材圖2—4)。次數(shù)多邊形圖

次數(shù)多邊形圖是表示連續(xù)性隨機變量次數(shù)分布的線性圖。

繪制次數(shù)多邊形圖時,橫坐標是以各分組區(qū)間組中值表示的連續(xù)變量,縱坐標是數(shù)據(jù)的頻數(shù)。以每個分組區(qū)間的組中值為橫坐標,以各組的次數(shù)為縱坐標標點,連接各點,就成為一條折線(參見教材圖2—5)。多邊形圖與直方圖雖然都是以面積表示表示連續(xù)性數(shù)據(jù)的次數(shù)分布,但次數(shù)多邊形對次數(shù)的輪廓顯示得更好,組與組之間的次數(shù)過渡是連續(xù)而直接的。如果樣本很大,能描繪出一條分布曲線,還可據(jù)此找到次數(shù)分布的經(jīng)驗公式。這樣就能夠?qū)τ诳傮w的理論次數(shù)分布的分析提供很多有用的信息累加次數(shù)分布圖(1)累加直方圖

這種圖的橫坐標同直方圖一樣,標以分組區(qū)間,縱坐標是累加次數(shù),其余步驟同繪制直方圖的要求一樣(參見教材圖2—7)。(2)累加曲線(又稱遞加線)

它的畫法同次數(shù)多邊形基本相同,不同點是橫坐標為每分組區(qū)間的精確上限或下限,縱坐標是各分組的累加次數(shù),分別標出各個交點,連接各交點即可畫成累加曲線。如果有累加直方圖,連接各組矩形的右頂點可畫累加曲線(參見教材圖2—8)。

其他常用的統(tǒng)計表的類型

(1)簡單表

只列出名稱、地點時序或統(tǒng)計指標名稱的統(tǒng)計表。(2)分組表(單向表)

只有一個分類標志分組的統(tǒng)計表。(3)復合表

統(tǒng)計分組的標志有兩個或兩個以上的表。其他常用的統(tǒng)計圖的類型(1)條形圖(直條圖)

條形圖主要用于表示離散型數(shù)據(jù)資料,它是以條形長短表示各事物間數(shù)量的大小與數(shù)量之間的差異情況。(2)圓形圖

圓形圖主要用于描述間斷性資料,目的為顯示各部分在整體中所占的比重大小,以及各部分之間的比較。圓形圖顯示的資料多以相對數(shù)(如百分數(shù))為主。(3)線形圖

線形圖更多地用于連續(xù)資料,凡欲表示兩個變量之間的函數(shù)關系,或描述某種現(xiàn)象在時間上的發(fā)展趨勢,或一種現(xiàn)象隨另一種現(xiàn)象變化的情形,用線性圖表示是較好的方法。(4)散點圖

散點圖是用相同大小圓點的多少或疏密表示統(tǒng)計資料數(shù)量的大小,以及變化趨勢的圖。通常以圓點的分布的形態(tài)表示兩種現(xiàn)象間相關程度。

直方圖、條形圖、圓形圖、線性圖、散點圖等這些常用的統(tǒng)計圖,根據(jù)它們表現(xiàn)的作用和內(nèi)容,把它們可分為哪幾類?

思考題根據(jù)它們表現(xiàn)的作用和內(nèi)容,把它們可分為五類。第一種是表現(xiàn)分布的圖,比如直方圖。第二種是表現(xiàn)內(nèi)容的圖,如條形圖和圓形圖。第三種是表現(xiàn)變化的圖,這種圖形的代表是線性圖。第四種是表現(xiàn)比較的圖,這幾種圖形都能采用。第五種是表現(xiàn)相關的圖,如散點圖。答:第三章集中量數(shù)算術平均數(shù)中數(shù)眾數(shù)其它集中量數(shù)(加權平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等)集中量數(shù)的概念集中量數(shù)就是對一組數(shù)據(jù)的集中趨勢特點進行度量和描述的統(tǒng)計量。它反映了次數(shù)分布中大量數(shù)據(jù)向某方向集中的程度。

常用的集中量數(shù)有算術平均數(shù)、中數(shù)、眾數(shù)、加權平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等。

算術平均數(shù)是所有觀察值的總和除以總頻數(shù)所得之商。用表示。若以X1,X2,···,XN表示變量X的各個觀察值,N

表示觀察值的個數(shù),則算術平均數(shù)可表示為:

算術平均數(shù)的概念

(1)在一組數(shù)據(jù)中每個變量與平均數(shù)之差的總和等于0,即。(2)在一組數(shù)據(jù)中,每一個數(shù)都加上一常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)加常數(shù)C,即。(3)在一組數(shù)據(jù)中,每一個數(shù)都乘以一常數(shù)C,則所得的平均數(shù)為原來的平均數(shù)乘以常數(shù)C,即。

算術平均數(shù)的特點(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計算法(2)數(shù)據(jù)分組后(次數(shù)分布表)計算法

(式中XC為各區(qū)間的組中值,f為各區(qū)間的次數(shù))

算術平均數(shù)的計算方法

算術平均數(shù)的優(yōu)缺點算術平均數(shù)具備一個良好的集中量數(shù)所應具備的一些條件:

①反應靈敏;②嚴密確定;③簡明易懂;④計算簡單;⑤適合代數(shù)運算;⑥較少受抽樣變動的影響。除此之外,算術平均數(shù)還有以下一些特殊的優(yōu)點:

①只知一組觀察值的總和及總頻數(shù)就可以求出算術平均數(shù);②用加權法可以求出幾個平均數(shù)的總平均數(shù);③用樣本數(shù)據(jù)推斷總體集中量數(shù)時,算術平均數(shù)最接近總體集中量數(shù)的真值,它是總體平均數(shù)的最好估計值;④在計算方差、標準差、相關系數(shù)以及進行統(tǒng)計推斷時,都要用到它。但是算術平均數(shù)也有一些缺點:

①易受極端數(shù)據(jù)的影響;②若出現(xiàn)模糊不清的數(shù)據(jù)時,無法計算平均數(shù)。算術平均數(shù)的意義、適用條件及應用原則算術平均數(shù)的意義

算術平均數(shù)是應用最普遍的集中量數(shù),它是“真值”漸近、最佳的估計值。算術平均數(shù)的適用的條件

一組數(shù)據(jù)是比較準確,可靠又同質(zhì),而且需要每一個數(shù)據(jù)都加入計算,同時還要作進一步代數(shù)運算時,這時就需要用算術平均數(shù)表示其集中趨勢。計算和應用算術平均數(shù)的原則

①同質(zhì)性原則;②平均數(shù)與個體數(shù)值相結合的原則;③平均數(shù)與標準差、方差相結合的原則。

中數(shù)是按順序排列在一起的一組數(shù)據(jù)中居于中間位置的數(shù),即在這組數(shù)據(jù)中,有一半的數(shù)據(jù)比它大,有一半的數(shù)據(jù)比它小。中數(shù)用Md表示。中數(shù)的概念

(1)一組數(shù)據(jù)中無重復數(shù)值的情況

指一組數(shù)據(jù)中沒有相同的數(shù),這時取處于序列中間位置的那個數(shù)為中數(shù)。如果數(shù)據(jù)個數(shù)為奇數(shù),則中數(shù)為位置的那個數(shù);如果數(shù)據(jù)個數(shù)為偶數(shù),則中數(shù)為居于中間位置兩個數(shù)的平均數(shù),即第與第位置的兩個數(shù)據(jù)的平均數(shù)。(2)一組數(shù)據(jù)中有重復數(shù)值的情況

指一組數(shù)據(jù)中有相同數(shù)值的數(shù)據(jù),這時計算中數(shù)的方法基本與無重復數(shù)值的單列數(shù)據(jù)相同。但根據(jù)重復數(shù)值數(shù)據(jù)在該組數(shù)據(jù)中所處的位置又細分為以下兩種情況:①當重復數(shù)值沒有位于數(shù)列中間時,求中數(shù)的方法與無重復數(shù)據(jù)時求中數(shù)的方法相同。②當重復數(shù)目位于數(shù)列中間時,需要假設位于中間的幾個重復數(shù)目為連續(xù)數(shù)目,取序列中上下各那一點上的數(shù)值為中數(shù)。未分組數(shù)據(jù)(原始數(shù)據(jù))求中數(shù)的方法

將原始數(shù)據(jù)整理成次數(shù)分布表后,求中數(shù)的原理同重復數(shù)目求中數(shù)是一樣的,也是取序列中將N平分為兩半的那一點的值作為中數(shù)。

或式中為中數(shù)所在分組區(qū)間的精確下限,為中數(shù)所在分組區(qū)間的精確上限,為該組以下各組的累加次數(shù),為該組以上各組的累加次數(shù),為該組的次數(shù)。數(shù)據(jù)分組后(次數(shù)分布表)求中數(shù)的方法中數(shù)的意義與應用

中數(shù)的意義

中數(shù)雖然也具備一個良好集中量數(shù)所應具備的一些條件,如計算簡單,嚴密確定,簡明易懂;但與算術平均數(shù)相比是相形見絀的,如反應不夠靈敏,受抽樣的影響較大,不適合代數(shù)運算等。因此,在一般情況下,中數(shù)不被普遍應用,但在一些特殊情況下,它的應用受到重視。中數(shù)適用的情況(1)當一組觀測結果中出現(xiàn)兩極端數(shù)目時;(2)當次數(shù)分布的兩端數(shù)據(jù)或個別數(shù)據(jù)不清楚時;(3)當需要快速估計一組數(shù)據(jù)的代表值時。

一項研究調(diào)查了19名大學生,他們的月消費(單位:人民幣元)如下:

220,227,230,231,232,232,235,236,

237,239,240,245,246,249,253,258,

260,510,600現(xiàn)欲了解他們的平均月消費?思考題由于這19名大學生的月消費中存在極端數(shù)據(jù),算術平均數(shù)(元)不能很好地反映他們的平均月消費(19人中17人月消費低于272.63元),應求中數(shù):

(元)答:這些大學生的平均月消費是239元。解:

眾數(shù)有理論眾數(shù)和粗略眾數(shù)兩種定義方法。理論眾數(shù)是指與次數(shù)分布曲線最高點相對應的橫坐標上的一點。粗略眾數(shù)是指一組數(shù)據(jù)(或次數(shù)分布)中次數(shù)出現(xiàn)最多的那個數(shù)的數(shù)值。眾數(shù)用表示。眾數(shù)的概念

(1)用觀察法直接尋找粗略眾數(shù)

在一組原始數(shù)據(jù)中,次數(shù)出現(xiàn)最多的那個數(shù)值就是眾數(shù);在次數(shù)分布表中,次數(shù)最多一組的組中值就是粗略眾數(shù)。(2)用經(jīng)驗公式求理論眾數(shù)的近似值①皮爾遜經(jīng)驗法(適合正態(tài)分布)②金氏插補法(適合偏態(tài)分布)

其中為含眾數(shù)這一區(qū)間的精確下限,為高于眾數(shù)所在組一個組距那一分組區(qū)間的次數(shù),為低于眾數(shù)所在組一個組距那一分組區(qū)間的次數(shù)。眾數(shù)的計算方法眾數(shù)的意義與應用

眾數(shù)的意義

眾數(shù)雖然簡明易懂,較少受兩極端數(shù)值的影響,但它并不具備一個良好集中量數(shù)的基本條件。如極不準確、穩(wěn)定,反應不靈敏,不適合代數(shù)運算,受抽樣的影響較大等。因此,在一般情況下,眾數(shù)應用也不廣泛,但在一些特殊情況下也常有應用。

眾數(shù)適用的情況(1)當需要快速而粗略地尋求一組數(shù)據(jù)的代表值時;(2)當一組數(shù)據(jù)出現(xiàn)不同質(zhì)的情況時;(3)當次數(shù)分布中有兩極端的數(shù)目時;(4)當粗略估計次數(shù)分布的形態(tài)時。

學校要召開運動會,決定從高一年級8個班中抽調(diào)40名男生組成一個整齊的彩旗方陣隊,如果從高一(1)班的體檢表中任意抽出10份男生表格,得到10個男同學的身高(單位:米)如下:

1.631.601.681.661.66

1.631.751.661.581.65請根據(jù)這10個身高值提供的信息確定參加方隊學生的最佳身高值應取多少?并說明理由。思考題

參加方隊學生的最佳身高值應取1.66。這是因為從這10個身高值可以看出,1.66出現(xiàn)的次數(shù)最多,是這組數(shù)的眾數(shù),既然這10個男生中有3個身高為1.66米,而一個班遠不止10個男生,那么8個班的男生中應該能選出40名這種身高的人。答:(1)當次數(shù)分布呈正態(tài)時:(2)當次數(shù)分布呈正偏態(tài)時:且

(3)當次數(shù)分布呈負偏態(tài)時:且

算術平均數(shù)、中數(shù)、眾數(shù)之間的關系

加權平均數(shù)的概念

加權平均數(shù)是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù),用表示。加權平均數(shù)的計算方法

式中為權數(shù)加權平均數(shù)的應用

當測量所得的數(shù)據(jù),其單位權重并不相等時,要用加權平均數(shù)來求平均數(shù)。加權平均數(shù)

幾何平均數(shù)的概念

幾何平均數(shù)是N個數(shù)值連乘積的N次方根,用表示。幾何平均數(shù)的計算方法

幾何平均數(shù)的應用

(1)直接應用公式計算幾何平均數(shù)當一組實驗數(shù)據(jù)中有少數(shù)數(shù)據(jù)偏大或偏小,數(shù)據(jù)的分布呈偏態(tài)時,要用幾何平均數(shù)作為集中趨勢的代表。(2)應用幾何平均數(shù)的變式計算當一組數(shù)據(jù)彼此間變異較大,幾乎是按一定的比例關系變化時,要用幾何平均數(shù)計算平均比率。幾何平均數(shù)

調(diào)和平均數(shù)的概念

調(diào)和平均數(shù)(倒數(shù)平均數(shù))是一組數(shù)據(jù)倒數(shù)的算術平均數(shù)的倒數(shù),用表示。

調(diào)和平均數(shù)的計算方法

調(diào)和平均數(shù)的應用

調(diào)和平均數(shù)在心理與教育研究方面的應用,主要是用以描述學習速度方面的問題。調(diào)和平均數(shù)

第四章差異量數(shù)

全距與百分位差平均差、方差與標準差標準差的應用差異量數(shù)的選用

差異量數(shù)的概念差異量數(shù)就是對一組數(shù)據(jù)的變異性(離中趨勢)特點進行度量和描述的統(tǒng)計量。它反映了次數(shù)分布中數(shù)據(jù)彼此分散的程度。

常用的差異量數(shù)有全距、四分位差、百分位差、平均差、標準差與方差等等。

為什么要引入差異量數(shù)來描述一組數(shù)據(jù)的特征?

思考題在教育研究中,要全面描述數(shù)據(jù)的特征,不但要了解數(shù)據(jù)的典型情況,而且還要了解特殊情況。這些特殊性常表現(xiàn)為數(shù)據(jù)的變異性。因此,只有集中量數(shù)不可能真實地反映它們的分布情況。為了全面反映數(shù)據(jù)的總體情況,除了使用集中量數(shù)外,還需要引入差異量數(shù)。答:全距

全距的概念

全距是一組數(shù)據(jù)中最大值與最小值之差。全距用R表示。

全距的計算方法

原始數(shù)據(jù)的全距是最大值與最小值之差。次數(shù)分布表的全距一般是最大一組與最小一組的組中值之差,或者是最大一組上限與最小一組下限之差

全距的意義與應用

全距概念清楚,意義明確,計算簡單,但它僅由最大值與最小值而求得,易受兩極端數(shù)值影響。不考慮中間數(shù)值的差異,它反應不靈敏,因此,它只是一種低效的差異量數(shù)。它的用處一般只用于研究的預備階段,用它檢查數(shù)據(jù)的大概散布范圍,以便確定如何進行統(tǒng)計分組。

百分位數(shù)的概念

百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。百分位數(shù)一般用表示。

百分位數(shù)的計算方法

這里表示百分位數(shù)所在組的精確下限,表示小于的各組次數(shù)的和。

百分位數(shù)

百分等級的概念

百分等級是指表示某一分數(shù)在整個分數(shù)分布中所處的百分位置。百分等級用表示。

百分等級的計算方法

這里表示該分數(shù)所在組的精確下限,表示小于的各組次數(shù)的和。

百分等級百分位差的概念和計算

百分位差是指兩個百分位數(shù)之差。常用的百分位距有兩種:一為第90與第10百分位數(shù)之差,用表示。一為第93與第7百分位數(shù)之差,用表示。百分位差的意義與應用

百分位差與全距相比,雖然少受兩極端數(shù)值的影響,但仍然不能很好地反映中間數(shù)據(jù)的散布情況,因此只作為主要差異量的補助量數(shù),在實踐中很少使用。百分位差

四分位差的概念

四分位差是指在一個次數(shù)分布中,中間50%的次數(shù)的全距的一半。四分位差用Q表示。

四分位差的計算方法(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計算法

其中(第25百分位數(shù))與(第75百分位數(shù))求法可參照原始數(shù)據(jù)中位數(shù)的計算方法。(2)數(shù)據(jù)分組后(次數(shù)分布表)計算法

其中這里表示百分位數(shù)所在組的精確下限,表示小于的各組次數(shù)的和,表示百分位數(shù)所在組的次數(shù);四分位差(一)

四分位差(二)四分位差的意義

四分位差簡明易懂,計算簡便,較少受兩極端數(shù)值的影響,比全距可靠得多。但它忽略了左右共50%數(shù)據(jù)的差異,又不適合代數(shù)運算,反應不夠靈敏,因而也限制了它的應用,它通常與中數(shù)聯(lián)系起來共同應用。

四分位差適用的情況

有特大或特小兩極端數(shù)值,有個別數(shù)值不確切、不清楚,以及用等級表示的數(shù)據(jù)等情況。

動差是指力與力點與原點之間距離的乘積。統(tǒng)計學用此概念表示次數(shù)分布的離散情況。它把各組次數(shù)當做力學上的力,用數(shù)值(或組中值)與原點之差作為距離來計算動差,并且把以平均數(shù)為原點的動差叫做中心動差。常見的中心動差有:一級動差二級動差(是表示一個分布中離中趨勢的指標)

三級動差(是表示一個分布中偏斜度或偏態(tài)性的指標)四級動差

(是表示一個分布中峰態(tài)性的指標)動差體系

平均差的概念

平均差是指次數(shù)分布中所有原始數(shù)據(jù)與平均數(shù)絕對離差的平均值。平均差用A.D.表示。平均差的計算方法(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計算法

(2)數(shù)據(jù)分組后(次數(shù)分布表)計算法

平均差意義

平均差意義明確,計算容易,反應靈敏,較好地代表了數(shù)據(jù)分布的離散程度。但它計算要用絕對值,不利于進一步做統(tǒng)計分析,應用受到了限制,屬于一種低效差異量數(shù)。平均差方差是指離均差(即每個數(shù)據(jù)與該組平均數(shù)之差)平方的算術平均數(shù)。用表示。標準差是指方差的算術平方根,用表示。方差與標準差的概念(1)未分組數(shù)據(jù)(原始數(shù)據(jù))計算法基本公式:變式公式:

(2)數(shù)據(jù)分組后(次數(shù)分布表)計算法基本公式:變式公式:

或式中(AM為估計平均數(shù))方差與標準差的計算方法由于方差、標準具有可加性,在已知幾個小組的方差或標準差的情況下,可以計算出幾個小組聯(lián)合在一起的總的方差或標準差。計算總方差和總標準差的公式如下:

式中,為總平均數(shù),為各小組的平均數(shù)總標準差的的合成方差與標準差的性質(zhì)(1)每一個觀察值都加一個相同常數(shù)C之后,計算得到的標準差等于原標準差。即如果,則有。(2)每一個觀察值都乘以一個相同常數(shù)C,則所得的標準差等于原標準差乘以這個常數(shù)。即若,則有。(3)每一個觀察值都乘以一個相同常數(shù)C(),再加一個常數(shù)d,所得的標準差等于原標準差乘以這個常數(shù)。即若(),則有。方差與標準差的意義

方差與標準差是表示一組數(shù)據(jù)離散程度的最好的指標。它們是描述統(tǒng)計與統(tǒng)計推斷分析中最常用的差異量數(shù)。標準差基本具備一個良好的差異量數(shù)應具備的條件:①反應靈敏;②嚴密確定;③容易計算;④適合代數(shù)運算;⑤受抽樣變動的影響小;⑥簡單明了。標準差與其他各種差異量數(shù)相比,具有數(shù)學上的優(yōu)越性,特別是當已知一組數(shù)據(jù)的平均數(shù)與標準差后,就可以知道落在平均數(shù)上下各一個標準差、兩個標準差,或三個標準差范圍之內(nèi)的數(shù)據(jù)所占的百分比。方差與標準差的性質(zhì)和意義思考題

為什么說標準差是重要而完善的差異量?

(1)標準差具有簡單明了,反映靈敏,嚴密確定,容易計算,適合代數(shù)運算,受抽樣變動的影響較少等優(yōu)點。(2)標準差在避免兩極端數(shù)值影響方面大大超過全距、百分位差和四分位差;在避免絕對值方面,優(yōu)于平均差;在考慮單位方面,優(yōu)于方差。答差異系數(shù)的概念

差異系數(shù)是指標準差與其算術平均數(shù)的百分比,用CV表示。其計算公式如下:差異系數(shù)的應用(1)同一團體不同觀測值離散程度的比較(即不同單位資料差異程度的比較);(2)對于水平相差較大,但進行的是一種觀測的各種團體,進行觀測值離散程度的比較(即單位相同而平均數(shù)相差較大的兩組資料差異程度的比較)。在應用差異系數(shù)比較相對差異大小時,應注意以下幾點:

①測量的數(shù)據(jù)要保證具有等距尺度;

②觀測工具應具備絕對零;

③差異系數(shù)只能用于一般的相對差異量的描述,至今尚無有效的假設檢驗方法。差異系數(shù)

標準分數(shù)的概念

標準分數(shù)是以標準差為單位表示一個分數(shù)在團體中所處位置的相對位置量數(shù)。標準分數(shù)的計算方法標準分數(shù)的性質(zhì)(1)Z分數(shù)無實際單位,是以平均數(shù)為參照點,以標準差為單位的一個相對量。(2)一組原始分數(shù)轉(zhuǎn)換得到的Z分數(shù)可以是正值,也可以是負值。(3)一組原始分數(shù)中,各個Z分數(shù)的標準差為1,即。(4)若原始分數(shù)呈正態(tài)分布,則轉(zhuǎn)換得到的所有Z分數(shù)值的均值為0,標準差為1的標準正態(tài)分布。標準分數(shù)的優(yōu)點(1)可比性;(2)可加性;(3)明確性;(4)穩(wěn)定性。標準分數(shù)的應用(1)用于比較分屬性質(zhì)不同的觀測值在各自數(shù)據(jù)分布中相對位置的高低;(2)計算不同質(zhì)的觀測值的總和或平均值,以表示在團體中的相對位置;

(3)表示標準測驗分數(shù)。

標準分數(shù)(Z分數(shù))

假定甲、乙兩生高考入學考試成績?nèi)缦卤硭?,試問根?jù)考試成績應該優(yōu)先錄取哪名考生?思考題考試科目全體考生原始分數(shù)平均分數(shù)()標準差()甲乙語文政治外語數(shù)學理化706569507510586885706853728962724087

甲乙兩生高考入學考試成績的原始分數(shù)與標準分數(shù)就原始分數(shù)而言,應該優(yōu)先錄取乙生(甲生總成績(348)低于乙生總績(350)),這一結論是不科學的。因為單位不同,不能比較,也不能合并。但把原始分數(shù)轉(zhuǎn)換成標準分數(shù)后,就可以合并成總成績進行比較。就標準分數(shù)而言,應該優(yōu)先錄取甲生(甲生的總成績(2.5)高于乙生的總成績(1.505))。解考試科目全體考生原始分數(shù)甲乙標準分數(shù)甲乙語文政治外語數(shù)學理化7010655698506758858970626872534072

87

1.5

1.91-0.6-0.125

0.3750.5-1.67-0.375

1.53483502.51.505異常值的取舍(1)數(shù)據(jù)較多的情況在整理數(shù)據(jù)時,常采用三個標準差法則,取舍數(shù)據(jù),即如果有一個數(shù)據(jù)的取值落在平均數(shù)加減三個標準差之外,則在整理數(shù)據(jù)時,可將此數(shù)據(jù)作為異常值加以舍棄。(2)數(shù)據(jù)較少的情況在整理數(shù)據(jù)時,可根據(jù)下表所列的標準差數(shù)的一半(全距與標準差比率一半)乘以標準差,然后再求與平均數(shù)的和、差,并以此二值為界取舍數(shù)據(jù)。

全距與標準差的比率隨N變化表

N

510

152040501002004005007001000全距/s2.33.1

3.5

3.74.34.55.05.5

5.96.16.36.5優(yōu)良差異量數(shù)具備的標準

鑒定一個差異量數(shù),是不是一個良好的統(tǒng)計指標,主要看是否具備以下標準:(1)應該是根據(jù)客觀數(shù)據(jù)資料獲得的,而不是人為的主觀估計決定的;(2)應該是根據(jù)全部觀測值計算得出來的,而不是個別數(shù)據(jù)計算的結果,否則就不能代表全部數(shù)據(jù)的分布特征;(3)應當簡明,容易理解,不應過于帶有數(shù)學抽象性質(zhì);(4)計算應該方便、容易、迅速;(5)應該最少受到抽樣變動的影響(樣本的穩(wěn)定性),在反復取樣的過程中具有相對恒常性;(6)應該能夠采用代數(shù)方法計算。各種差異量數(shù)優(yōu)缺點比較

標準差計算最嚴密,它根據(jù)全部數(shù)據(jù)求得,考慮到每一個樣本數(shù)據(jù),測量具有代表性,適合代數(shù)法處理,受抽樣變動的影響較小,反應靈敏。缺點是較難理解,運算較繁瑣,易受極端值的影響。方差的描述作用不大,但由于它具有可加性,是對一組數(shù)據(jù)中造成各種變異的總和的測量,通常采用方差的可加性分解并確定屬于不同來源的變異性,并進一步說明各種變異對總結果的影響。因此,方差是推論統(tǒng)計中最常用的統(tǒng)計量數(shù)。全距計算簡便,容易理解,適合所有類型的數(shù)據(jù),概念清楚,意義明確,,但它易受極值影響,測量也太粗造,只能反映分布兩極端值的差值。不能顯示全部數(shù)據(jù)的差異情況,僅作為輔助量數(shù)使用。平均差容易理解,容易計算,能說明分布中全部數(shù)值的差異情況,缺點是會受兩極數(shù)值的影響,但當數(shù)據(jù)較多時,這種影響較小,因有絕對值也不適合代數(shù)方法處理。百分位差意義明確,易計算,不易受兩極值影響,但不能反映出分布的中間數(shù)值的差異情況,也僅用作補助量數(shù)。四分位差意義明確,計算方便容易,對極端值不敏感,較不受極端值影響。當組距不確定,其他差異量數(shù)都無法計算時,可以計算四分位差。但四分位差無法反映分布中所有數(shù)據(jù)的離散程度,不適合使用代數(shù)方法處理,受抽樣變動影響較標準差大。通過比較,可以發(fā)現(xiàn)標準差、方差價值較大,它們的應用也比較廣泛,因此,一般稱標準差、方差為高效差異量。相比較,其化差異量數(shù)缺點比較明顯,應用也受到限制,故他們?yōu)榈托Р町惲繑?shù)。

當次數(shù)分布的N值相當大,分布形式呈正態(tài)分布時,各種差異量數(shù)之間存在著固定的數(shù)量關系:各種差異量數(shù)之間的關系

如何選用差異量數(shù)

在選用差異量數(shù)時,可以考慮下面這些因素:(1)當樣本是隨機取樣時,S、Q、R,這幾個差異量數(shù)的可靠性依次降低;(2)當要求計算要容易、快捷時,R、Q、S

依次變得繁雜;(3)當要求統(tǒng)計量進一步使用時,S遠遠勝過其他差異量數(shù);(4)在偏態(tài)分布中,Q比S更常用;(5)當分布是截尾分布時,只有Q能正確地指出分布的變異性。除此之外,還有一點非常重要,就是在選擇差異量數(shù)時,同時應考慮選用合適的集中量數(shù)。第五章相關系數(shù)

相關、相關系數(shù)與散點圖積差相關等級相關質(zhì)與量相關品質(zhì)相關相關系數(shù)的選用與解釋

什么是相關

事物之間的相互關系(1)因果關系:一種現(xiàn)象是另一種現(xiàn)象的原因,而另一種現(xiàn)象是結果。(2)共變關系:表面上看來有聯(lián)系的兩種事物都與第三種現(xiàn)象有關。這時兩種事物之間的關系,便是共變關系。(3)相關關系:兩類現(xiàn)象在發(fā)展變化的方向與大小方面存在一定的關系,但不是前面兩種關系。不能確定這兩類現(xiàn)象之間哪個是因,哪個是果;也有理有認為這兩者并不同時受第三因素的影響,即不存在共變關系。具有相關關系的兩種現(xiàn)象之間的關系是比較復雜的,甚至可能包含有暫時的嘗未認識的因果關系以及共變關系在內(nèi)。相關的類別統(tǒng)計學中所講的相關是指具有相關關系的不同現(xiàn)象之間的關系程度。從變化的方向來看,相關的情況有以下三種:①正相關:兩列變量的變化方向相同。②負相關:兩列變量的變化方向相反。③零相關:兩列變量的變化方向無一定規(guī)律。相關系數(shù)

相關系數(shù)是兩列變量間相關程度的數(shù)字表現(xiàn)形式,或者說是用來表示相關關系強度的指標。作為樣本間相互關系程度的統(tǒng)計特征數(shù),常用r表示,作為總體參數(shù),一般用ρ表示,并且是指線性相關而言。相關系數(shù)的取值介于-1.00至+1.00之間,常用小數(shù)形式表示。它只是一個比率,不代表相關的百分數(shù),更不是相關量的相等單位的度量。

如何理解相關系數(shù)?思考題

相關系數(shù)是兩列變量間相關程度的數(shù)字表現(xiàn)形式。對于這一概念,我們可以從以下幾個方面來理解:(1)相關系數(shù)的取值在-1.00和+1.00之間;(2)相關系數(shù)的絕對值表示兩個變量之間的相關強度,絕對值越接近1表示相關越強,越接近0表示相關越弱;(3)相關系數(shù)的正負號表示相關的方向,相關系數(shù)為正的表示正相關,相關系數(shù)為負的表示負相關;(4)相關系數(shù)可以比較大小,但不能進行加減乘除運算。答:

在直角坐標系中,以X、Y二列變量中的一列變量(如X變量)為橫坐標,以另一列變量(如Y變量)為縱坐標,把每對數(shù)據(jù)Xi、Yi當做同一個平面上的個點(Xi、Yi),一一描繪在XOY坐標系中,產(chǎn)生的圖形就稱為散點圖。

散點圖通過點的散布形狀和疏密程度來顯示兩個變量的相關趨勢和相關程度,能夠?qū)υ紨?shù)據(jù)間的關系做出直觀而有效的預測和解釋。不同形狀的散點圖顯示了兩個變量間不同程度的相關關系。如果所有散點分布呈橢圓狀,則說明二變量之間呈線性關系。在橢圓狀散點圖中,如果橢圓長軸的傾斜方向左低右高(以軸為基準),則為正相關,左高右低則為負相關;如果散點圖呈現(xiàn)圓形,就為零相關或弱相關。散點圖

積差相關的概念當兩列變量都是正態(tài)連續(xù)變量,而且兩者之間呈線性關系,表示這兩列變量之間的相關稱為積差相關。

積差相關的適用資料(1)要求成對的數(shù)據(jù),即若干個體中每個個體都有兩種不同的觀測值。(2)計算相關的成對的數(shù)據(jù)的數(shù)目不宜少于30對。(3)兩列變量各自總體的分布都是正態(tài)分布,至少兩個變量服從的分布是接近正態(tài)的單峰分布。(4)兩個相關的變量是連續(xù)變量,也即兩列數(shù)據(jù)都是測量數(shù)據(jù)。(5)兩列變量之間的關系應是直線性的積差相關(一)

積差相關的計算方法(1)基本公式①運用標準差與離均差的計算公式(,)②運用標準分數(shù)計算相關系數(shù)的公式

③原始觀測值計算公式

(2)差法公式①

減差法

②加差法

積差相關(二)

積差相關的計算方法(3)相關表法

式中

相關系數(shù)的合并

相關系數(shù)的合并需要將其轉(zhuǎn)換成等距的尺度后再求平均,方有意義。求平均的相關系數(shù),一般采用Z-r轉(zhuǎn)換法。具體步驟如下:(1)查附表8,先將各樣本的r轉(zhuǎn)換成費舍Z分數(shù);(2)求每一樣本的Z分數(shù)之和;(3)求平均Z分數(shù),即();(4)再查附表8,將轉(zhuǎn)換成。積差相關(三)

斯皮爾曼等級相關的概念與適用資料

當兩個變量值以等級次序排列或以等級次序表示時,兩個相應總體并不一定呈正態(tài)分布,樣本容量也不一定大于30,表示這兩個變量之間的相關稱為等級相關。它適用于只有兩列變量,而且是屬于等級變量性質(zhì),具有線性關系的資料,主要用于解決稱名數(shù)據(jù)和順序數(shù)據(jù)的問題。

斯皮爾曼等級相關的計算方法(1)等級差數(shù)法(N<30)

(式中N為等級個數(shù),D指二列成對變量的等級差數(shù))(2)等級序數(shù)法

(式中RX與RY為兩列變量各自排列的等級序數(shù))(3)有相同等級時計算等級相關的方法

式中

斯皮爾曼等級相關

肯德爾W系數(shù)的概念與適用資料

當多個(兩個以上)變量值以等級次序排列或以等級次序表示,描述這幾個變量之間的一致性程度(即相關)的量,稱為肯德爾W系數(shù)。它適用于兩列以上的等級變量??系聽朩系數(shù)的計算方法

計算肯德爾和諧系數(shù),原始數(shù)據(jù)資料的獲得一般采用等級評定的方法,即讓K個被試(或稱評價者)對N件事物或N件作品進行等級評定,每個評價者都能對N件事物(或作品)好壞、優(yōu)劣、喜好、大小、高低等排出一個等級順序。因此,最小的等級序數(shù)為1,最大的為N,這樣,K個評價者便可得到K列從1至N的等級變量資料,這是一種情況。另一種情況是一個評價者先后K次評價N件事物或N件作品,也是采用等級評定的方法,這樣也可得到K列從1至N的等級變量資料。這類K列等級變量資料綜合起來求相關,可用肯德爾W系數(shù)。①基本公式

式中,Ri

代表評價對象獲得的K個等級之和,N代表被等級評定的對象的數(shù)目,K代表等級評價者的數(shù)目。②有相同等級出現(xiàn)時計算公式

(修正公式)

式中,,n為相同等級的數(shù)目。

肯德爾W系數(shù)(肯德爾和諧系數(shù))

肯德爾U系數(shù)的概念與適用資料

當多個(兩個以上)變量值以等級次序排列或以等級次序表示,描述這幾個變量之間的一致性程度(即相關)的量,稱為肯德爾U系數(shù)。它適用于對K個評價者的一致性進行統(tǒng)計分析。它與肯德爾W系數(shù)所處理的問題相同,但所處理的資料的獲得方法不同,計算的結果也不一樣。肯德爾U系數(shù)的計算方法

如果有N件事件,由K個評價者對其優(yōu)劣、大小、高低等單一維度的屬性進行評價,若評價者直接使用等級評定的方法,則應采用前述肯德爾W系數(shù)分析K個評價者是否具有一致性;若評價者采用對偶比較的方法,即將N件事物兩兩配對,可配成對,然后對每一對中兩事物進行比較,擇優(yōu)選擇,優(yōu)者記1,非優(yōu)者記0,最后整理所有評價者的評價結果,這樣便應計算肯德爾U系數(shù)了。

式中N為被評價事物的數(shù)目,即等級數(shù);K為評價者的數(shù)目;rij為對偶比較記錄表中i>j(或i<j)格中的擇優(yōu)分數(shù)。肯德爾U系數(shù)(一致性系數(shù))(1)點二列相關的概念與適用資料

當兩個變量其中一個是正態(tài)連續(xù)性變量,另一個是真正的二分變量,這時表示這兩個變量之間的相關稱為點二列相關。點二列相關適用的資料是兩列變量中有一列為等距或等比的測量數(shù)據(jù)而且其總體分布為正態(tài),另一列變量是二分稱名的變量數(shù)據(jù)。(2)點二列相關的計算方法點二列相關

(1)二列相關的概念與適用資料

當兩個變量都是正態(tài)連續(xù)性變量,其中一個變量被人為地劃分成二分變量,這時表示這兩個變量之間的相關稱為二列相關。二列相關適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,其中一列變量為等距或等比的測量數(shù)據(jù),另一列變量為人為劃分的二分變量數(shù)據(jù)。(2)二列相關的計算方法二列相關

(1)多系列相關的概念與適用資料

當兩個變量都是正態(tài)連續(xù)性變量,其中一個變量按不同質(zhì)被人為地分成多種類別(兩類以上)的正態(tài)名義變量,這時表示這兩個變量之間的相關稱為多系列相關。多系列相關適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,其中一列為等距或等比的測量數(shù)據(jù),另一列被人為地分成多種類別的名義變量數(shù)據(jù)。(2)多系列相關的計算方法

多系列相關

(1)四分相關的概念與適用資料

當兩個變量都是正態(tài)連續(xù)性變量,且兩者呈直線關系,但兩者都被人為地劃分成二分變量,表示這兩個變量之間的相關,稱為四分相關。四分相關適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,且每一個變量都被人為地分成兩種類型的等距或等比的測量數(shù)據(jù)。(2)四分相關的計算方法四分相關(1)φ相關的概念與適用資料

當兩個變量都是真正二分變量,表示這兩個變量之間的相關,稱為相關。

φ相關適用的資料是除四分相關之外的四格表資料。(2)φ相關的計算方法①基本公式

②其它公式φ相關(φ系數(shù))

(1)列聯(lián)表相關的概念與適用資料

當兩個變量均被分成兩個以上類別,或其中一個變量被分成兩個以上類別,表示這兩個變量之間的相關,稱為列聯(lián)相關。列聯(lián)表相關適用的資料是兩列數(shù)據(jù)均屬于正態(tài)分布,且至少有一個變量都被分成兩種以上類型的等距或等比的測量數(shù)據(jù)。(2)列聯(lián)表相關的計算方法①基本公式②其它公式列聯(lián)表相關

如何選擇合適的相關系數(shù)選擇計算相關系數(shù)的方法主要取決于要處理的數(shù)據(jù)的性質(zhì)類別以及某一相關系數(shù)需要滿足的假設條件。具體來說,為了選擇一個合適的相關系數(shù)進行相關分析,要分以下幾個步驟考慮:(1)考慮每種測量所產(chǎn)生的數(shù)據(jù)屬于什么類別,測查被試的哪種心理屬性,是分類,還是排序,還是評定等級?是否給出確定的分數(shù)?(2)要對第一種測量數(shù)據(jù)和第二種測量數(shù)據(jù)的類別做出判斷。是二分數(shù)據(jù)、等級數(shù)據(jù),還是等距數(shù)據(jù)?(3)確定采用哪一種相關系數(shù)。相關系數(shù)解釋相關關系是一個指標值,它表示兩個變量之間的關系程度。相關系數(shù)不是等距的測量值,因此在比較相關程度時,不能用倍數(shù)關系說明,只能說絕對值大者比絕對值小者關系更密切一些。相關系數(shù)的大小表明了兩列測量數(shù)據(jù)相互間的相關程度。當然,當兩個變量之間的關系受到其它變量的影響時,兩者之間的高強度相關很可能是一種假象。如果研究表明某一變量確實對欲探討的兩個變量之間存在影響,則可以用協(xié)變量分析方法設法排除或控制那些變量的影響效應,找出要研究的變量之間真正的相關關系。如果兩變量是線性關系,則可以用偏相關和部分相關進行控制,表示這兩個變量間純凈的相關度。在純理論研究中,即使是很小的相關,如果在統(tǒng)計上有顯著性,也能說明心理規(guī)律。另外,需要特別注意這樣一個事實:證實兩個變量之間存在相關關系,并不一定說明一個變量的變化會引起另一個變量發(fā)生變化。相關系數(shù)的特殊用途

相關系數(shù)在教育科學與心理科學研究中,特別是教育與心理測量、評價中,有著重要的特殊用途。它可以用于確定測驗的信度系數(shù)和效度系數(shù),用于對測驗的項目區(qū)分度進行分析。同時,相關系數(shù)值的大小,因為不同類型的測驗,它所表示的價值和意義也有所不同。第六章概率分布

概率的基本概念正態(tài)分布二項分布樣本分布(1)后驗概率(統(tǒng)計概率)的定義

其中是隨機事件出現(xiàn)的頻率(2)先驗概率(古典概率

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論