版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
心理與教育統(tǒng)計學及SPSS應用全套PPT課件第一章緒論第一章緒論學科性質(zhì)數(shù)據(jù)特點學科內(nèi)容學習意義注意問題基本概念一、學科性質(zhì)·
統(tǒng)計(statistic):對數(shù)據(jù)資料的搜集、整理、計算和分析的工作過程。·
統(tǒng)計學(statistics):研究對數(shù)據(jù)資料的搜集、整理、計算和分析的方法及其原理的一門科學。應用統(tǒng)計學(appliedstatistics):數(shù)理統(tǒng)計方法在各種科學實踐領域中的具體應用,包括社會統(tǒng)計學、生物統(tǒng)計學、醫(yī)學統(tǒng)計學、人口統(tǒng)計學、經(jīng)濟統(tǒng)計學、教育統(tǒng)計學、心理統(tǒng)計學等一系列分支。數(shù)理統(tǒng)計學(theoreticalstatistics):應用統(tǒng)計的數(shù)理基礎,以概率論為基礎研究統(tǒng)計方法的數(shù)理原理。
心理與教育統(tǒng)計學是專門研究如何搜集、整理、計算和分析在心理和教育方面由實驗或調(diào)查所獲得的數(shù)據(jù)資料,并如何根據(jù)這些數(shù)據(jù)資料所傳遞的信息,進行科學推論找出客觀規(guī)律的一門科學。心理與教育統(tǒng)計學二、心理與教育科學研究數(shù)據(jù)的特點(一)隨機性和變異性隨機因素(randomfactor):在觀測過程中,造成數(shù)據(jù)變異的一些偶然的不可控制的因素。隨機誤差(randomerror):隨機因素使測量產(chǎn)生的誤差。隨機現(xiàn)象(randomphenomenon):在相同的觀測條件下觀測的結(jié)果不止一個,事先無法確定的現(xiàn)象。隨機變量(randomvariable):在取值之前不能預料取到什么值的變量。思考:統(tǒng)計的目的是什么?
隨機變量是具有變化規(guī)律的變量。(二)規(guī)律性?
三、心理與教育統(tǒng)計的內(nèi)容(1)描述性統(tǒng)計(descriptivestatistics):研究如何整理大量的數(shù)據(jù),描述一組數(shù)據(jù)的全貌,表達一件事物的性質(zhì)。(2)推論性統(tǒng)計(inferentialstatistics):主要研究如何通過局部數(shù)據(jù)提供的信息,推論總體的情形。(3)實驗設計(experimentaldesign):研究如何科學、經(jīng)濟以及有效地進行實驗。按統(tǒng)計功能劃分:按研究問題的實質(zhì)劃分研究內(nèi)容:(1)描述一件事物的性質(zhì);(2)比較兩個群體或兩種處理效果的差異;(3)分析影響事物變化的因素;(4)一件事物兩種不同屬性的相互關系;(5)取樣方法;等等。四、學習心理與教育統(tǒng)計學的意義科研的需要。讀、寫研究報告??茖W管理的需要。成績比較及綜合等??茖W思維的訓練。處理效果、成績差異等。五、學習心理與教育統(tǒng)計學應注意的問題1.克服畏難情緒。2.注意重點掌握各種統(tǒng)計方法適用條件。3.多進行練習和實際操作。4.克服“統(tǒng)計萬能”和“統(tǒng)計無用”的思想。5.正確選用統(tǒng)計方法,防止誤用或亂用。(實驗設計是否合理、實驗的數(shù)據(jù)類型、數(shù)據(jù)的分布規(guī)律)六、基本概念1.數(shù)據(jù)類型按數(shù)據(jù)來源劃分:(1)計數(shù)數(shù)據(jù)(countdata):計算個數(shù)的數(shù)據(jù)。(2)測量數(shù)據(jù)(measurementdata):借助測量工具或標準獲得的數(shù)據(jù)。按數(shù)據(jù)性質(zhì)劃分:(1)稱名數(shù)據(jù)(nominaldata):說明事物的所屬類別,反映事物類別的不同和屬性上的差異。(2)順序數(shù)據(jù)(ordinaldata):按事物某種屬性的多少或大小將事物加以排列,既沒有相等單位又沒有絕對零點的變量。(3)等距數(shù)據(jù)(intervaldata):有大小和相等單位,但沒有絕對零點的變量。(4)比率數(shù)據(jù)(ratiodata):有大小和相等單位又有絕對零點的變量。思考:1.百分制的學業(yè)成績是什么數(shù)據(jù)?2.數(shù)據(jù)的性質(zhì)是現(xiàn)象本身確定的還是研究者確定的?舉例說明。
?按數(shù)據(jù)是否具有連續(xù)性劃分:(1)離散數(shù)據(jù)(discretedata):在任何兩點之間所取的數(shù)據(jù)個數(shù)是有限的。(2)連續(xù)數(shù)據(jù)(continuousdata):在任何兩點之間都可以取無限多個大小不同的數(shù)據(jù)。數(shù)的實限(reallimits):一個數(shù)的實限是指位于這個數(shù)上、下各半個測量單位的點。2.總體、樣本和個體(1)總體(母全體、全域、母體)(population):具有某種特征的一類事物的全體。(3)樣本(sample):從總體中抽取的一部分個體。(2)個體(individual):構(gòu)成總體的每個基本單元。樣本容量(samplesize):樣本中所含個體的多少。大樣本(n>30)小樣本(n≤30)3.次數(shù)、比率、頻率和概率
次數(shù)(頻數(shù),frequency):是指某一事件在某一類別中出現(xiàn)的數(shù)目。
比率(ratio):兩個數(shù)的比。
頻率(比例,proportion):某一事件發(fā)生的次數(shù)與總事件數(shù)的比值。
概率(機率,然率,probability):是指某一事件在無限的觀測次數(shù)中所能預料出現(xiàn)的相對次數(shù)。4.統(tǒng)計量和參數(shù)
統(tǒng)計量(statistics):統(tǒng)計量又稱統(tǒng)計特征數(shù),是描述樣本特征的量數(shù),通常是通過實際觀察測量得到的。
參數(shù)(parameter):參數(shù)又稱總體參數(shù),是描述一個總體情況的一些統(tǒng)計指標。統(tǒng)計量用英文字母表示。參數(shù)用希臘字母表示。幾個統(tǒng)計量和參數(shù)符號統(tǒng)計量參數(shù)
第二章統(tǒng)計圖表數(shù)據(jù)的初步整理次數(shù)分布表次數(shù)分布圖其它類型的統(tǒng)計圖表SPSS基本操作內(nèi)容:一、數(shù)據(jù)的初步整理(一)數(shù)據(jù)的排序(sort)
按照一定標準,對收集到的雜亂無章的數(shù)據(jù)按照順序進行排列。方式:升序(ascendingorder)
降序(descendingorder)標準:年齡、學號、字母順序等。(二)數(shù)據(jù)的分組(classification,grouping)
1.分類標志:性質(zhì)類別數(shù)量類別2.分組前的準備異常數(shù)據(jù)(outlier)的取舍:三標準差法則按照一定標準,將收集到的數(shù)據(jù)劃分到各個類(組)別中。3.統(tǒng)計分組應注意的問題:(1)依據(jù)研究對象的本質(zhì)特征進行分組(2)分組要符合相斥性原則和周延性原則相斥性原則:每個數(shù)據(jù)僅有一類可歸。周延性原則:每個數(shù)據(jù)都有類可歸。(三)統(tǒng)計表為了實際需要,按照一定的要求對原始數(shù)據(jù)進行整理、歸類,并按照一定的順序把數(shù)據(jù)排列起來,制成表格,這種表格叫做統(tǒng)計表(tabulation)。
把統(tǒng)計指標和被說明的事物之間的關系用表格的形式表示就形成統(tǒng)計表。統(tǒng)計表的組成要素
表2.1200名高中三年級學生睡眠時間調(diào)查結(jié)果睡眠時間人數(shù)男生女生大于9小時9148-9小時29367-8小時39336-7小時1517小于6小時35總計80標題標目表號表線表注注:表中數(shù)據(jù)來源于例2-1數(shù)字1.表號的格式一級表號: 表1,表2等二級表號:表1-1或表2.3三級表號: 表1-1-4或1.3.22.名稱名稱是表格的標題,寫在表的正上方。表號與名稱之間空一個漢字的空格。二者居中排在頂線的上方。長度不宜超過表的寬度,如果過長,應轉(zhuǎn)行排列。3.標目標目即分類項目。位置在表的上面一行或左側(cè)一列;如分類標志只有一個,在上行或在左側(cè)均可,如有兩個且兩者沒有隸屬關系,上行左側(cè)各一個.如果兩個標志有隸屬關系,則要放在同一個方向分兩行分述.4.數(shù)字用阿位伯數(shù)字表示,位次要對齊,小數(shù)位數(shù)要一致;暫缺或未記錄是在表格內(nèi)用橫線或斜線表示;數(shù)字如果是0則填寫0。數(shù)字是統(tǒng)計表的主要部分。統(tǒng)計表中對數(shù)字的記錄需要注意以下幾點:5.線條三線表是基本格式包括頂線、底線和標目線;如果有總和也可在總和上方添加一橫線6.表注是表的可選項對表中內(nèi)容進行補充性說明;包括數(shù)據(jù)來源和附記(四)統(tǒng)計圖統(tǒng)計圖(graph或chart):統(tǒng)計圖是根據(jù)統(tǒng)計數(shù)字,用點、線、幾何圖形等繪制的表示事物的特征及事物或特征間關系的圖形。
統(tǒng)計圖的組成要素:二、次數(shù)分布表(一)簡單次數(shù)分布表表2.1150名大學生對當前專業(yè)的認同度(二)分組次數(shù)分布表1.次數(shù)分布表的編制步驟計算全距(極差)確定組數(shù)和組距(寬度)
通常在5和15組之間確定組限,計算組中值登記次數(shù)計算各組的分布次數(shù)1、分組次數(shù)分布表原始數(shù)據(jù):24,26,24,21,27,27,30,41,32,38組限(下限,上限)組中值=(上限+下限)/2組距=上限-下限分組區(qū)間組中值(XC)
次數(shù)(f)35-402
25-305
15-2032、相對次數(shù)分布表組限組中值XC)次數(shù)(f)相對次數(shù)(p)35~4020.225~3050.515~2030.3合計1013.累積次數(shù)分布表組限組中值XC)次數(shù)(f)累積次數(shù)(cf)35~3021025~305815~2033合計104.百分次數(shù)分布表組限組中值XC)次數(shù)(f)百分次數(shù)(f%)35~4022025~3055015~20330合計101005.累加百分比分布組限組中值XC)次數(shù)(f)累加百分比(f%)35~40210025~3058015~20330合計106.雙列次數(shù)分布表表2.77.不等距次數(shù)分布表
表2.8三、次數(shù)分布圖0123451、直方圖(histogram)次數(shù)0 15 25 35 45 55圖2-1直方圖條形線分組區(qū)間次數(shù)35~225~515~3計數(shù)0123452、多邊圖(freauencypolygon)次數(shù)0 15 25 35 45 55圖2-2多邊圖分組區(qū)間次數(shù)35~225~515~3(三)累加次數(shù)分布圖1.累加直方圖2.累加曲線圖例1:原始數(shù)據(jù)
(60個學生數(shù)學成績)表2-3分組次數(shù)表2015105次數(shù)405060708090100成績圖2-860個學生數(shù)學成績直方圖2015105次數(shù)405060708090100成績圖2-960個學生數(shù)學成績多邊圖四、其它類型的統(tǒng)計表和統(tǒng)計圖統(tǒng)計圖表的選取以能夠準確反映事物或現(xiàn)象的本質(zhì)特征為目的。(一)統(tǒng)計表的種類1、簡單表:只列出名稱地點和時序或統(tǒng)計指標名稱的統(tǒng)計表。2、分組表:只有一個分類標志的表,也稱單向表。3、復合表:統(tǒng)計標志有兩個或兩個以上的表。按內(nèi)容還可分為定性式、統(tǒng)計式、函數(shù)式(二)統(tǒng)計圖的種類
1.條形圖(barcharts)2.圓形圖(circlecharts)3.線形圖(linegraph)4.散點圖(scatterplots)1.條形圖圖2-1某大學教師 職稱情況人數(shù)助教講師副教授教授1000750500250適用資料:離散數(shù)據(jù)2.圓形圖圖2-3某企業(yè)人員組成比例管理人員15%技術(shù)人員15%后勤人員10%生產(chǎn)工人60%適用情況:反映總體結(jié)構(gòu)3.線形圖4.散點圖SPSS上機操作1數(shù)據(jù)基本操作(定義變量、輸入數(shù)據(jù)等)計算新變量、重新編碼、個案選擇統(tǒng)計圖表SPSS數(shù)據(jù)編輯窗口“數(shù)據(jù)視窗”和“變量視窗”可以交互切換。菜單欄SPSS菜單欄文件(File):打開、新建、保存SPSS文件等操作管理。編輯(Edit):對SPSS進行剪切、復制、粘貼、插入變量、插入個案等操作。視圖(View):選擇現(xiàn)實狀態(tài)欄、工具欄、網(wǎng)格線、設置字體等數(shù)據(jù)(Data):實現(xiàn)數(shù)據(jù)文件的管理,包括數(shù)據(jù)排序、記錄篩選、記錄拆分、合并文件等。轉(zhuǎn)換(Transform):實現(xiàn)變量轉(zhuǎn)換,如計算新變量、變量數(shù)據(jù)重新編碼等。分析(Analyze):包含SPSS的各種統(tǒng)計功能,是最主要的菜單。制圖(Graphs):繪制各種統(tǒng)計圖。窗口(
Windows):窗口拆分、最小化、當前窗口顯示等幫助(Help):幫助實用程序(Utilities):提供各種實用性管理設置,如變量信息管理,輸出結(jié)果文件設置、菜單管理等定義變量變量名稱不能以數(shù)字、橫線或下劃線開頭變量名不能重名,兼容中文。
寬度和小數(shù)點位默認寬度是8位英文字符或數(shù)字默認的小數(shù)位是2位。變量類型:一般采用數(shù)值型變量標簽和值標簽等SPSS軟件統(tǒng)計圖表操作的演示主要演示數(shù)據(jù)文件的建立與統(tǒng)計圖等的操作。建立例2.2的數(shù)據(jù)文件,并進行基本操作、繪制圖表。第三章集中量數(shù)集中量數(shù)(measureofcentraltendency)用來表現(xiàn)數(shù)據(jù)資料的典型水平或集中趨勢(centraltendency)。
常用的集中量數(shù)包括算術(shù)平均數(shù)、中位數(shù)、眾數(shù)、加權(quán)平均數(shù)、幾何平均數(shù)、調(diào)和平均數(shù)等。一.算術(shù)平均數(shù)算術(shù)平均數(shù)(arithmeticaverage
)一般簡稱為平均數(shù)(average)或均數(shù)、均值(mean)。一般用M,或者用表示。算術(shù)平均數(shù)是最常用的集中量。1.算術(shù)平均數(shù)的計算公式原始數(shù)據(jù)計算公式基本公式:(1)25272827252930343233
次數(shù)分布表計算公式表3.1
132名學生學習狀態(tài)滿意度的次數(shù)分布表成績組中值Xc次數(shù)ffXc計算95-9997219490-9492873685-898712104480-848222180475-7977312387=9979/13270-7472261872
65-6967151005=75.6060-6462849655-5957528550-54523156合計13299792.平均數(shù)的特點(1)(2)(3)3.算術(shù)平均數(shù)的意義算術(shù)平均數(shù)是應用最普遍的一種集中量數(shù)。它是“真值”(truescore)的最好估計值。真值是反映某種現(xiàn)象的真實水平的分數(shù)。由于測量過程中的各種偶然因素的影響,真值往往很難得到。在實際測量中,往往采用“多次測量,取平均數(shù)”的方法,用平均數(shù)去估計真值。4.算術(shù)平均數(shù)的優(yōu)缺點
算術(shù)平均數(shù)具備一個良好的集中量所應具備的一些特點:反應靈敏、有公式嚴密確定、簡明易懂、適合代數(shù)運算等等,因此是一個最常用的集中量。主要不足:容易受兩極端數(shù)值的影響;一組數(shù)據(jù)中有模糊不清的數(shù)值時無法計算;不同質(zhì)數(shù)據(jù)不能直接計算算術(shù)平均數(shù)。5.計算和應用算術(shù)平均數(shù)的原則同質(zhì)性原則:算術(shù)平均數(shù)只能用于表示同類數(shù)據(jù)的集中趨勢。平均數(shù)與標準差、方差相結(jié)合原則:描述一組數(shù)據(jù)時既要分析其集中趨勢,也要分析離散程度。二、中數(shù)中數(shù)(median)又稱為中位數(shù),是按順序排列的一組數(shù)據(jù)中位于中間位置的數(shù)。中數(shù)是常用集中量的一種。一般用Md或Mdn表示。1、中數(shù)的計算方法(1)原始數(shù)據(jù)計算法無重復數(shù)據(jù)首先將一組數(shù)據(jù)按順序排列有重復數(shù)據(jù)重復數(shù)沒有位于數(shù)列中間,求中數(shù)的方法與無重復數(shù)一樣重復數(shù)位于數(shù)列中間,也分奇偶個數(shù)處理38917282727282624284519374631先將數(shù)據(jù)從小到大(從大到小)排列91719242627272828283137384546正處于中數(shù)位置的數(shù)是28,是重復數(shù),是3個28重復,理解為3個28占據(jù)了一個分數(shù)單位的全距,3個28的0.5/3小于中數(shù),2.5/3大于中數(shù),
眾數(shù)就是27.5+0.5/3=27.66。2.50.527.5Md28.5次數(shù)分布表計算法由次數(shù)分布表計算中位數(shù)需要用到累積次數(shù)分布表。當表中數(shù)據(jù)的累積方向不同時,計算公式也不同。例3.7:求例3.2次數(shù)分布表中學生學習狀態(tài)滿意度的中位數(shù)。表3.2132名學生學習狀態(tài)滿意度中數(shù)的計算組限組中值XC次數(shù)f
由下向上累積次數(shù)
由上向下累積次數(shù)95-99972132290-949281301085-8987121222280-8482221104475-797731887570-7472265710165-6967153111660-646281612455-59575812950-545233132合計745132
基于由下至上累積頻數(shù)的計算公式公式中:Lb為中位數(shù)所在組的精確下限
n為數(shù)據(jù)總和
fMd為中位數(shù)所在組的頻數(shù)
i為組距基于由上至下累積頻數(shù)計算公式公式中:La為中位數(shù)所在組的精確上限
fa為中位數(shù)所在組上限以上的累積頻數(shù)
n為數(shù)據(jù)總和
fMd為中位數(shù)所在組的頻數(shù)
i為組距將有關指標代入公式3.4得:將有關數(shù)據(jù)代入公式3.5得:2.中位數(shù)的特點及應用優(yōu)點:(1)中位數(shù)是根據(jù)全部數(shù)據(jù)的個數(shù)來確定其位置的,意義簡明;(2)對按順序排列的數(shù)據(jù)來講,計算中位數(shù)也比較容易;(3)中位數(shù)不受兩端極端數(shù)據(jù)的影響?!裰袛?shù)一般用于下列情況:(1)一組數(shù)據(jù)中有極端數(shù)據(jù)時;(2)一組數(shù)據(jù)中有個別數(shù)據(jù)不確切、不清楚時;(3)資料屬于等級性質(zhì)時?!袢秉c:(1)反應不靈敏;(2)不適合進一步代數(shù)運算的要求三.眾數(shù)眾數(shù)(mode)用Mo表示,有兩種定義:理論眾數(shù)是指與頻數(shù)分布曲線最高點相對應的橫坐標上的一點;粗略眾數(shù)是一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的那個數(shù)。眾數(shù)也是一種集中量,也可用來表示一組數(shù)據(jù)的集中趨勢。1.眾數(shù)的計算方法
(1)觀察法尋找粗略眾數(shù)未分組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)即為眾數(shù)。次數(shù)分布表中,頻數(shù)最多那一組數(shù)據(jù)的組中值,即為眾數(shù)。(2)公式法計算理論眾數(shù)的近似值用公式計算的眾數(shù)稱為理論眾數(shù)。一般在心理與教育統(tǒng)計中常用的公式有皮爾遜的經(jīng)驗公式和金氏插補法公式。皮爾遜經(jīng)驗公式金氏插補法皮爾遜經(jīng)驗公式只有當數(shù)據(jù)分布呈正態(tài)或接近正態(tài)時才能使用。當數(shù)據(jù)分布呈偏態(tài)時,一般用金氏插補法計算眾數(shù)。2.眾數(shù)的優(yōu)缺點優(yōu)點:眾數(shù)的概念簡單易懂,容易計算。缺點:眾數(shù)比較粗略,不能靈敏地反映一組數(shù)據(jù)的變化,而且不適合進一步代數(shù)運算。一般用于類別變量或等級變量的資料。4.算術(shù)平均數(shù)、中位數(shù)、眾數(shù)三者的關系在正態(tài)分布中:在正偏態(tài)分布中:在負偏態(tài)分布中:四、其它集中量除了算術(shù)平均數(shù)、中位數(shù)和眾數(shù)以外,在應用中還有加權(quán)平均數(shù)、幾何平均數(shù)和調(diào)和平均數(shù)等一些其它集中量數(shù)。這些統(tǒng)計量數(shù)可以從其它角度描述一組數(shù)據(jù)的集中趨勢。1.加權(quán)平均數(shù)(weightedmean)加權(quán)平均數(shù)是不同比重數(shù)據(jù)(或平均數(shù))的平均數(shù),一般用表示。其計算公式有兩種:
2.幾何平均數(shù)(geometricmean)幾何平均數(shù)是n個數(shù)值連乘積的n次方根,用或表示。計算公式為當數(shù)據(jù)的分布呈偏態(tài)時,可用幾何平均數(shù)表示該組數(shù)據(jù)的集中趨勢。
用于心理物理學的等距、等比量表,或求平均增長率。幾何平均數(shù)的變式幾何平均數(shù)計算的是平均比率,平均增長率是從幾何平均數(shù)中減去基數(shù)1。3.調(diào)和平均數(shù)(harmonicmean)調(diào)和平均數(shù)是先將各個數(shù)據(jù)取倒數(shù)平均,然后再取倒數(shù),故又稱倒數(shù)平均數(shù)。主要用于求平均速率工作量相同,時間不同---調(diào)和平均數(shù)工作量不同,時間相同---算數(shù)平均數(shù)第四章差異量數(shù)差異量數(shù)(measureofdispersion)是描述數(shù)據(jù)離散程度的統(tǒng)計量差異量數(shù)越大,表明數(shù)據(jù)越分散、不集中;差異量數(shù)越小,表明數(shù)據(jù)越集中,變動范圍越小。常用的差異量數(shù)包括全距、百分位距和四分位距、平均差、方差、標準差、差異系數(shù)。一、全距、百分位距和四分位距1、全距R(range)全距是一組數(shù)據(jù)中的最大值(maximum)與該組數(shù)據(jù)中最小值(minimum)之差,又稱極差。R=Xmax-Xmin2、百分位差(百分位距)
百分位差是指兩個百分位數(shù)(percentile)之差。常用的百分位距有兩種:
P90-P10和P93-P7用幾個百分位距能較好地反映一組數(shù)據(jù)的差異程度。百分位數(shù)
百分位數(shù)是位于依一定順序排列的一組數(shù)據(jù)中某一百分位置的數(shù)值。一般用表示。百分位數(shù)的計算方法公式中:Lb為百分位數(shù)所在組的精確下限
fb為百分位數(shù)所在組下限以下的累積頻數(shù)
p為百分數(shù)
n為數(shù)據(jù)總和
fp為百分位數(shù)所在組的頻數(shù)
i為組距計算公式式中:fbp為某一百分位數(shù)所在組下限以下的累積頻數(shù)
fp為某一百分位數(shù)所在組的頻數(shù)
Lbp為某一百分位數(shù)所在組的精確下限組別次數(shù)f向上累加次數(shù)向下累積次數(shù)110-11951505100-10991451490-99251363980-89571119670-79275412360-69162713950-5981114740-492314930-3911150合計150
例4.1求下表數(shù)據(jù)的百分位距P90-P10。表4.1150名學生某次考試成績的次數(shù)分布表解:首先計算兩個百分位數(shù)以下的分布次數(shù),150x10%=15,150x90%=135。根據(jù)向上累積分布次數(shù)可以確定,第10個百分位數(shù)在60-69分組區(qū)間內(nèi),第90個百分位數(shù)在90-99分組區(qū)間內(nèi)。由公式4.2計算P10,Lb=59.5,F(xiàn)b=11,fp=16由公式4.2計算P90,Lb=89.5,F(xiàn)b=111,fp=253.四分位距(quartiledeviation)四分位差是第一個四分位數(shù)與第三個四分位數(shù)之差的一半,計算公式為:四分位距(interquartilerange,IQR)是第一個四分位數(shù)與第三個四分位數(shù)之差的,計算公式為IQR=Q3-Q1例4.2
計算表4.1數(shù)據(jù)的四分位距。解:計算Q1和Q3以下的分布次數(shù),
從而判斷兩個四分位點分別在70-79和90-99兩個分組區(qū)間。四分位距為:四分位差為:二、平均差平均差(averagedeviation
或者meandeviation)是指一組數(shù)據(jù)中,每一個數(shù)據(jù)與該組數(shù)據(jù)的平均數(shù)離差的絕對值的算術(shù)平均數(shù),通常用AD或MD表示。原始數(shù)據(jù)計算公式次數(shù)分布表計算公式平均差意義明確,計算容易,反應靈敏。但計算時要用絕對值,不適合代數(shù)運算,因此在進一步統(tǒng)計分析中應用較少。例4.2求下列數(shù)據(jù)平均差1618202224例4.3求平均差組別組中值
次數(shù)60-65350-551040-451530-351220-25810-152合計50三、方差和標準差方差(variance又稱為變異數(shù)、均方)。是表示一組數(shù)據(jù)離散程度的統(tǒng)計指標。一般樣本的方差用表示,總體的方差用表示。標準差(standarddeviation)是方差的算術(shù)平方根。一般樣本的標準差用S表示,總體的標準差用表示。1.方差和標準差的定義中心動差一級動差二級動差三級動差四級動差峰態(tài)指標偏態(tài)指標2.方差和標準差的計算公式(2)原始數(shù)據(jù)導出公式(1)定義式次數(shù)分布表計算公式導出公式例4.5求以下數(shù)據(jù)的方差和標準差23456
3.總標準差的合成
方差具有可加性的特點。當已知幾個小組數(shù)據(jù)的方差或標準差時,可以計算幾個小組聯(lián)合在一起的總的方差或標準差。需要注意的是,只有在應用同一種觀測手段,測量的是同一種特質(zhì),只是樣本不同的數(shù)據(jù)時,才能計算合成方差或標準差。計算公式公式中:為總方差,為總標準差
Si為各小組標準差
ni為各小組數(shù)據(jù)個數(shù)四.相對差異量1.差異系數(shù)差異系數(shù)(coefficientofvariation)是指標準差與其算術(shù)平均數(shù)的百分比,它是沒有單位的相對數(shù)。常以CV表示,其計算公式為差異系數(shù)的應用:比較不同單位數(shù)據(jù)的差異程度;比較單位相同而平均數(shù)相差較大的兩組資料的差異程度。
例4.7初三某班男同學參加體育項目測試,在1000米跑測試中,平均用時326秒,標準差為27秒;在立定跳遠測試中,平均成績?yōu)?.98米,標準差為0.13米,試比較兩項成績的離散程度。解:由于兩項測試成績的單位不同,不能通過比較標準差來比較它們的離散程度,采用差異系數(shù)進行比較。8.28%>6.57%答:該班男同學1000米跑測試成績的離散程度高于立定跳遠成績的離散程度。例4.8
某教師要了解一年級和六年級小學生的詞匯應用情況,其拍攝一套畫面美觀、內(nèi)容豐富的照片,分別對兩個年級的學生進行了抽樣測試,測試中誘導學生盡可能用豐富的語言描述照片的畫面和內(nèi)容,記錄學生用詞。測試結(jié)果為,一年級學生平均用詞17個,標準差為9個;6年級學生平均用詞68個,標準差為21個,試比較兩個年級學生所用詞匯量的離散程度。解:因為兩個年級的學生參加同一測驗,所以單位相同。兩個年級的平均水平差異較大,因此屬于單位相同,平均數(shù)相差較大的兩組數(shù)據(jù)。采用差異系數(shù)比較兩組數(shù)據(jù)的離散程度。53.9%<30.9%因此,一年級學生用詞的離散程度大于六年級學生用詞的離散程度。2.標準分數(shù)標準分數(shù)(standardscore),又稱為基分數(shù)或Z分數(shù)(Z-score),是以標準差為單位表示一個原始分數(shù)在團體中所處的相對位置的量數(shù)。標準分數(shù)是依據(jù)數(shù)據(jù)的離散程度考慮分數(shù)對平均數(shù)的相對地位。標準分數(shù)的計算公式為或Z分數(shù)可以表明原始分數(shù)在團體中的相對位置,因此稱為相對位置量數(shù)。把原始分數(shù)轉(zhuǎn)換成Z分數(shù),就把單位不等距的和缺乏明確參照點的分數(shù)轉(zhuǎn)換成以標準差為單位、以平均數(shù)為參照點的分數(shù)。標準分數(shù)的性質(zhì)Z分數(shù)無實際單位,是以平均數(shù)為參照點、以標準差為單位的相對量。一組原始分數(shù)得到的Z分數(shù)既有正值,也有負值,所有原始分數(shù)的Z分數(shù)之和為零。一組原始數(shù)據(jù)中,各個Z分數(shù)的標準差為1。標準正態(tài)分布的平均值為0,標準差為1。標準分數(shù)的優(yōu)點
可比性:標準分數(shù)以團體的平均數(shù)為基準,以標準差為單位,因而具有可比性??杉有裕簶藴史謹?shù)使不同的原始分數(shù)具有相同的參照點,因而具有可加性。明確性:標準分數(shù)較原始分數(shù)意義更為明確。合理性:標準分數(shù)保證了不同性質(zhì)分數(shù)在總分數(shù)中的權(quán)重相同,使分數(shù)更合理地反映事實??颇咳w考生原始分數(shù)標準分數(shù)平均分標準差甲乙丙甲乙丙數(shù)學96.317.51211101021.410.780.33語文93.411.61151251351.862.723.59外語89.613.21121131081.701.771.39∑
3483483454.975.275.31表4.33名學生各科成績的綜合表示標準測驗分數(shù)
標準分數(shù)表示測驗結(jié)果存在負數(shù)和小數(shù)。為了克服標準分數(shù)出現(xiàn)的小數(shù)、負數(shù)和不易為人們所接受等缺點,常將其轉(zhuǎn)換成正態(tài)標準測驗分數(shù)。轉(zhuǎn)換公式為:
例如:早期智力測驗中運用智力商數(shù)表示智力測查的指標這種表示智力的方法后來被離差智商取代:異常值的取舍
在一個正態(tài)分布中,平均數(shù)上下一定的標準差處,包含有確定百分數(shù)的數(shù)據(jù)個數(shù)?!?σP=68.26%±2σP=95.45%±3σP=99.73%
在平均數(shù)上下各三個標準差的范圍內(nèi),分布著全部數(shù)據(jù)的99.73%,在三個標準差之外的數(shù)據(jù)占比很小,為0.27%,因此常把“三個標準差”做為判斷可疑值取舍的依據(jù)。SPSS基本操作求和:Transform(轉(zhuǎn)換)Compute(計算)排序:Data(數(shù)據(jù))SortCases(個案排序)
集中量數(shù)、差異量數(shù):Analyze(分析)DescriptiveStatistics(描述統(tǒng)計Descriptives(描述))(或Explore(探索)Z分數(shù):在描述統(tǒng)計步驟中勾選“Savestandardizedvaluesasvariables”(保存標準分數(shù)變量)重新編碼:
Transform(轉(zhuǎn)換)Recordintodifferentvariable(重新編碼為不同變量),
演示:例4.11、例4.12實例數(shù)據(jù)
第五章相關分析一、相關概念事物之間的關系:
因果關系共變關系相關關系1、定義:兩個變量之間不精確、不穩(wěn)定的變化關系,稱為相關關系。兩個變量之間的變化關系,既表現(xiàn)在變化方向上,又表現(xiàn)在密切程度上。兩個變量之間的變化方向有:正相關:兩個變量的變化方向相同。負相關:兩個變量的變化方向相反。零相關:兩個變量的變化方向無一定規(guī)律。
正相關負相關散點的分布形狀為橢圓形,兩變量之間線性相關。
零相關散點的分布沒有明顯集中在某一方向的趨勢,分布在圓形區(qū)域時,兩變量之間的關系為零相關。2、相關系數(shù)用來描述兩個變量相互之間變化方向及密切程度的統(tǒng)計指標稱為相關系數(shù),一般樣本的相關系數(shù)用r表示,總體的相關系數(shù)用ρ表示。相關系數(shù)的取值:-1≤r≤+10≤∣r∣≤1相關系數(shù)的符號:“+”表示正相關,“-”表示負相關。從關系密切程度來看,相關可大致分為
完全相關:兩個變量的變化程度完全一致, ︱r︱=1強相關:兩個變量變化的一致性比較強, 0.7≦︱r︱<1。中等相關:兩個變量變化的一致程度中等, 0.4≦︱r︱<0.7。弱相關:兩個變量變化的一致性比較差,0<︱r︱<0.4。完全不相關:兩個變量變化程度沒有一致性, ︱r︱=0。︳二、積差相關1、積差相關及其適用條件積差相關是英國統(tǒng)計學家皮爾遜(pearson)于20世紀初提出的一種計算相關的方法,因而被稱為皮爾遜積差相關,也稱為積矩相關(productmomentcorrelation)。積差相關適用于:兩個變量都是連續(xù)數(shù)據(jù);兩變量總體都為正態(tài)分布;兩變量之間為線性關系。成對數(shù)據(jù),樣本容量要大。2、積差相關條件的判斷方法連續(xù)變量根據(jù)得到數(shù)據(jù)的方式判斷,測量數(shù)據(jù)。正態(tài)分布正常人群的身高、體重、智力水平、心理與教育測驗的結(jié)果,都可按總體正態(tài)分布對待;如果要求比較高,則需要對數(shù)據(jù)進行正態(tài)性檢驗。線性關系根據(jù)相關散布圖可判斷兩個變量之間是否線性關系。3.積差相關系數(shù)的計算公式:公式中:為變量X的平均數(shù),為變量Y的平均數(shù),為變量X的標準差,為變量Y的標準差,
n為數(shù)據(jù)的對數(shù)或例5.112名學生初一年級第一學期和第二學期的數(shù)學成績?nèi)缦卤恚嬎銉蓚€學期成績的積差相關系數(shù)。表5.112名學生初一第一學期數(shù)學成績(X)與第二學期成績(Y)的相關學生XYxyxyZXZYZXZY186900.531.50.0780.4930.03927683-9.5-438.0-1.485-0.6580.977393957.5860.01.1721.3151.54248490-1.53-4.5-0.2340.493-0.116589853.5-2-7.00.547-0.329-0.1867980-6.5-745.5-1.016-1.1511.169791935.5633.00.860.9860.848889853.5-2-7.00.547-0.329-0.1897477-11.5-10115-1.798-1.6442.956108589-0.52-1.0-0.0780.329-0.026118480-1.5-710.5-0.234-1.1510.2712969710.5101051.6411.6442.699∑1026104400389009.998被試XYxyx2y2xy11361172.1-5.34.4128.09-1116.7102.0144.8967.673112108-21.9-14.3479.61204.49313.174131125-2.92.78.417.29-7.835120113-13.9-9.3193.2186.49129.2761401226.1-0.337.210.09-1.8371391275.14.726.0122.0923.9781421328.19.765.6194.0978.57915213118.18.7327.6175.69157.4710123119-10.9-3.3118.8110.8935.97∑13391223001362.9574.1785.312名學生初一第一學期數(shù)學成績(X)與第二學期成績(Y)的相關積差相關系數(shù)的原始數(shù)據(jù)計算公式:兩種公式計算結(jié)果相同。當平均數(shù)或標準差用不精確的小數(shù)(四舍五入)時,以原始數(shù)據(jù)的計算公式更為簡捷和準確。相關系數(shù)的計算和解釋是應該注意的問題有相關再計算相關;計算相關系數(shù)時樣本容量足夠大;相關系數(shù)不是等距變量;相關系數(shù)接近零時,不能解釋為兩列變量不存在相關,而是不存在線性相關。三、等級相關
等級相關(rankcorrelation)是指以等級次序排列或以等級次序表示的變量之間的相關。主要包括斯皮爾曼(spearman)二列等級相關和肯德爾和諧系數(shù)(thekandallcoefficientofconcordance)多列等級相關。
1、斯皮爾曼等級相關
斯皮爾曼等級相關是等級相關的一種。它適用于兩個以等級次序表示的變量,并不要求兩個變量總體呈正態(tài)分布,也不要求樣本的容量必須大于30。當連續(xù)數(shù)據(jù)不能滿足計算積差相關的條件時,可以轉(zhuǎn)換成等級數(shù)據(jù)從而計算斯皮爾曼等級相關系數(shù)。計算公式斯皮爾曼等級相關系數(shù)表示為rR,其計算公式為:公式中:RX為變量X的等級數(shù),
RY為變量Y的等級數(shù),
D為兩變量的等級數(shù)之差,即D=RX-RYn為樣本的容量例5.5求下表數(shù)據(jù)的等級相關系數(shù)。表5.510名學生的自我評價與班主任評價結(jié)果的等級排序?qū)W生編號X(Rx)Y(RY)DD2RXRY115-4165226-41612337-4162144400165532415668-244877163678810-248099274918101091190總和
146312解:整理計算得:n=10由斯皮爾曼等級相關系數(shù)的計算公式(5.7)得:
由公式(5.8)得:如果有相同等級時,可用它們所占等級位置的平均數(shù)作為它們的等級。2、肯德爾和諧系數(shù)肯德爾等級相關方法有許多種,肯德爾和諧系數(shù)是其中一種??系聽柡椭C系數(shù)常以rW表示,適用于多列等級變量的資料??系聽柡椭C系數(shù)可以反映多個等級變量變化的一致性??系聽柡椭C系數(shù)的計算公式
公式中:rw表示肯德爾和諧系數(shù)
K表示等級評定者的數(shù)目,即變量數(shù)
n為被等級評定的對象的數(shù)目
R為被評定對象獲得的K個等級之和
SSR為R的離差平方和,即例5.8
現(xiàn)有7名評委對8篇參賽作品進行評價,每位評委按參賽作品的優(yōu)秀程度依次排出等級,評價結(jié)果如表5.8,試分析7位評委評價結(jié)果的一致性。解:本例符合肯德爾W系數(shù)的分析條件。如果評委的偏好比較一致,每篇作品所得評價等級和就有較大的差別,肯德爾W系數(shù)的數(shù)值較大;如果評委的偏好差異較大,每篇作品所得評價等級和差別較小,肯德爾W系數(shù)的數(shù)值較小。表5.87名評委對8篇作品的評價等級作品N=8評委(K=6)
1234567
112211211010022114413162563345384229841443662543090055787566441936665457353512257763268739152188878378492401∑
25291807位評價者對8篇作品評價結(jié)果的肯德爾和諧系數(shù)為0.60,評委之間的評價一致性中等,需要進一步交流評價標準。四、質(zhì)與量相關一列變量為等比或等距的測量數(shù)據(jù)另一列變量是按性質(zhì)劃分的類別包括點二列相關、二列相關、多系列相關1.點二列相關適用資料:兩列變量一列為等距或等比測量數(shù)據(jù);另一列變量是二分稱名變量(真正的二分變量:離散型的二分變量)
公式:2.二列相關適用資料:兩列變量一列為等距或等比測量數(shù)據(jù);另一列變量是二分稱名變量(人為的二分變量:本是一個連續(xù)型的測量數(shù)據(jù),但被某種人為規(guī)定劃分為兩個類別)公式:五.品質(zhì)相關四分相關(tetrachoriccorrelation)
1.適用于兩列人為二分的測量數(shù)據(jù)
2.計算公式:
Φ相關兩列變量為真正二分變量·列聯(lián)相關相關分析的SPSS操作
積差相關
Spearman等級相關*Kendall等級相關1.積差相關(Pearson相關)
積差相關資料:連續(xù)數(shù)據(jù);正態(tài)分布;線性關系。成對數(shù)據(jù),樣本容量要大。SPSS操作:分析相關雙變量Pearson(默認)
積差相關(Pearson相關)
2.Spearman等級相關Spearman等級相關使用資料:順序數(shù)據(jù);非正態(tài)分布的連續(xù)數(shù)據(jù);成對數(shù)據(jù)。SPSS操作:分析相關雙變量Spearman(默認)
Spearman等級相關
*Kendall等級相關
Kendall
W系數(shù)適用資料:
K個評價者對N個事物進行排序評定的結(jié)果SPSS操作:分析非參數(shù)檢驗舊對話框K個相關樣本Kendall’sW
Kendall等級相關
p>0.05相關不顯著p<0.05相關顯著*p<0.01相關非常顯著**p<0.001相關極其顯著***結(jié)果判斷舉例:變量A和變量B相關不顯著(r=0.16,p>0.05);變量A和變量B具有顯著的正相關關系(r=0.56,p<0.05);變量X和變量Y具有極其顯著的負相關關系(r=-0.76,p<0.001);等。結(jié)果表述形式
演示例5.14、例5.15、例5.16、例5.17演示
練習
練習例題及實際數(shù)據(jù)
第六章概率分布一、概率基礎后驗概率(或統(tǒng)計概率)
隨機事件的頻率當n無限增大時,隨機事件A的頻率會穩(wěn)定在一個常數(shù)P,這個常數(shù)就是隨機事件A的概率。(6.1)先驗概率(古典概率)古典概率模型要求滿足兩個條件:⑴試驗的所有可能結(jié)果是有限的;⑵每一種可能結(jié)果出現(xiàn)的可能性相等。概率公理系統(tǒng)1.任何隨機事件A的概率都是在0與1之間的正數(shù),即0≤P(A)≤12.不可能事件的概率等于零,即P(A)=03.必然事件的概率等于1,即P(A)=1概率的加法定理若事件A發(fā)生,則事件B就一定不發(fā)生,這樣的兩個事件為互不相容事件。兩互不相容事件和的概率,等于這兩個事件的概率之和,即概率的乘法定理若事件A發(fā)生不影響事件B是否發(fā)生,這樣的兩個事件為互相獨立事件。兩個互相獨立事件積的概率,等于這兩個事件概率的乘積,即例6.1一個硬幣在一次投擲中出現(xiàn)正面或出現(xiàn)反面的概率是多少?
在投擲硬幣的試驗中,一個硬幣在一次投擲中出現(xiàn)正面或出現(xiàn)反面這兩個事件不能同時發(fā)生,所以這兩個事件就是互不相容事件。根據(jù)概率的加法定理,投擲一枚硬幣出現(xiàn)正面或出現(xiàn)反面的概率,其為出現(xiàn)正面和出現(xiàn)反面這兩個互不相容事件的概率的和。即,。例6.2
中文、數(shù)學、體育和音樂學院分別有230、210、60和10名大學生經(jīng)過自愿報名和組織篩選參加了支教活動,如果隨機從四個學院參加支教的全體同學的名單中選取一名同學交流有關收獲,抽取體育或音樂專業(yè)同學的概率是多少?
由于是隨機抽取一名同學,抽取到體育和音樂專業(yè)同學這兩個事件只能發(fā)生一件,二者互不相容,因此,根據(jù)概率的加法定理,抽取到體育或音樂專業(yè)同學的概率為:。例6.4一枚硬幣投擲兩次,兩次都出現(xiàn)正面的概率是多少?一枚硬幣第一次投擲和第二次投擲的結(jié)果兩者互不影響,因此,第一次出現(xiàn)正面和第二次出現(xiàn)正面兩個事件是相互獨立的事件。根據(jù)概率的乘法定理,兩次投擲都出現(xiàn)正面的概率為第一次出現(xiàn)正面的概率與第二次出現(xiàn)正面的概率的乘積。即:例6.5某公司在招聘管理人員的面試環(huán)節(jié)中準備了5個試題,應聘者到場后隨機選取一個題目(抽取后放回),小王和他的同學小張都來參加面試,他們兩人都抽到第一個題目的概率是多少?解:在抽取題目過抽中,小王抽到哪道題對小張的抽取結(jié)果沒有影響,同樣,小張抽到哪個題目也不會影響小王的抽取結(jié)果,因此,他們兩個的抽取結(jié)果相互獨立。根據(jù)概率的乘法定理,小王和小張都抽到第一題的概率為:例6.7同時擲2枚骰子,問擲得點數(shù)和為3點的概率是多少?解:兩個篩子分別用A和B表示,A、B兩個骰子的點數(shù)和為3可以由兩個綜合事件實現(xiàn),一個是A為1點B為2點,表示為A1B2;另一個是A為2點B為1點,表示為A2B1。A1B2和A2B1這兩個事件不能同時發(fā)生,是兩個互不相容事件。根據(jù)概率的加法定理,兩個骰子的點數(shù)和為3的概率為這兩個互不相容事件的概率和,
A1B2這個綜合事件是由A1和B2兩個事件組成,A2B1是由A2和B1兩個事件組成,而A、B兩個骰子出現(xiàn)的點數(shù)互不影響,因此,A1和B2以及A2和B1都是相互獨立的事件,由概率的乘法定理得:
兩個骰子的點數(shù)和為3的概率為:二、概率分布類型概率分布(probabilitydistribution)是指對隨機變量取不同值時的概率的描述,一般用概率分布函數(shù)進行描述。依不同的標準,對概率分布可作不同的分類。1、離散型分布與連續(xù)型分布依隨機變量的類型,可將概率分布分為離散型概率分布與連續(xù)型概率分布。心理與教育統(tǒng)計學中最常用的離散型分布是二項分布,最常用的連續(xù)型分布是正態(tài)分布。2、經(jīng)驗分布與理論分布
依分布函數(shù)的來源,可將概率分布分為經(jīng)驗分布與理論分布。
經(jīng)驗分布(empiricaldistribution)是指根據(jù)觀察或?qū)嶒炈@得的數(shù)據(jù)而編制的次數(shù)分布或相對頻率分布。理論分布(theoreticaldistribution)是按某種數(shù)學模型計算出的概率分布。3、基本隨機變量分布與抽樣分布
依所描述的數(shù)據(jù)的樣本特性,可將概率分布分為基本隨機變量分布與抽樣分布?;倦S機變量分布是隨機變量各種不同取值情況的概率分布;抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。三.正態(tài)分布正態(tài)分布(normaldistribution)也稱為常態(tài)分布,是連續(xù)型隨機變量概率分布的一種,是在數(shù)理統(tǒng)計理論與實際應用中占有最重要地位的一種理論分布。正態(tài)分布由棣.莫弗于1733年發(fā)現(xiàn)的。拉普拉斯、高斯對正態(tài)分布的研究也做出貢獻,故有時稱正態(tài)分布為高斯分布。1.正態(tài)分布曲線函數(shù)
正態(tài)分布曲線函數(shù)又稱概率密度函數(shù),其一般公式為
公式所描述的正態(tài)曲線,由σ和μ兩個參數(shù)決定。2.標準正態(tài)分布曲線
將標準分數(shù)代入正態(tài)曲線函數(shù)并且,令σ=1
則公式變換為標準正態(tài)分布函數(shù):以Z為橫坐標,以Y為縱坐標,可繪制標準正態(tài)分布曲線。標準正態(tài)分布曲線的縱線高度Y為概率密度,曲線下的面積為概率。3.標準正態(tài)分布曲線的特點⑴曲線在Z=0處達到最高點,并且曲線以Z=0處為中心,雙側(cè)對稱。⑵曲線從最高點向左右緩慢下降,向兩側(cè)無限延伸,但永不與基線相交。⑶標準正態(tài)分布曲線的平均數(shù)為0,標準差為1。從Z=-3至Z=+3之間幾乎分布著全部數(shù)據(jù)。⑷曲線的拐點為正負一個標準差處。⑸正態(tài)分布是一族分布。平均數(shù)、標準差不同分布不同。五.標準正態(tài)分布表及使用1.標準正態(tài)分布表利用積分公式可求出正態(tài)曲線下任何區(qū)間的面積,但需要計算,非常麻煩。統(tǒng)計學家已編制好了標準正態(tài)分布表,使其使用非常方便。正態(tài)分布表的特點:
表中僅列有標準正態(tài)曲線下的面積,因此,查表前應先將原始變量X轉(zhuǎn)換為Z。表中列出的數(shù)據(jù),是從Z=0到右邊某一Z值之間的面積,查表時應注意合理使用。2.已知Z值求概率⑴.求Z=0至某一Z值之間的概率:直接查表⑵.求兩個Z值之間的概率兩Z值符號相同:P(Z1-Z2)=PZ2-PZ1兩Z值符號相反:P(Z1-Z2)=PZ2+PZ1⑶求某一Z值以上的概率Z>0時,PZ-∞=0.5-PZZ<0時,PZ-∞=0.5+PZ⑷求某一Z值以下的概率Z>0時,P-∞-Z=0.5+PZZ<0時,P-∞-Z=0.5-PZ3.已知面積(概率)求Z值⑴求Z=0以上或以下某一面積對應的Z值:直接查表⑵求與正態(tài)曲線上端或下端某一面積P相對應的Z值:先用0.5-PZ,再查表⑶求與正態(tài)曲線下中央部位某一面積相對應的Z值:先計算P/2,再查表4.已知概率P或Z值,求概率密度Y直接查正態(tài)分布表就能得到相應的概率密度Y值。如果由概率P求Y值,要注意區(qū)分已知概率是位于正態(tài)曲線的中間部分,還是兩尾端部分,才能通過查表求得正確的概率密度。六.正態(tài)分布
在測驗記分方面的應用1.以標準分數(shù)表示考試成績
比較學生的考試成績時,使用原始分數(shù)有其不合理之處:⑴.原始分制度沒有提示考生成績在考生團體成績中的位置。⑵.由于各科命題難度不同,導致各科原始分之間不能直接比較,造成分數(shù)解釋上的困難。⑶.各科原始分相加不合理。采用標準分數(shù),有如下特點:⑴標準分的大小,既表明考生水平的高低,也表明該生在考生團體中的位置的高低。⑵各科標準分都表示考生各科在同一團體中的位置,可根據(jù)標準分大小直接比較考生的各科成績水平。⑶各科標準分的參照點(平均分為500分)和單位(1個標準差為100分)都一樣,具有可加性,克服了原始分的缺陷。
目前我國一些省在高考中采用標準分數(shù)表示考生的成績,為了使分數(shù)更適合一般習慣,對標準分數(shù)進一步做轉(zhuǎn)換:2.確定等級評定的人數(shù)如要將某種能力的分數(shù)分成等距的幾個等級,在確定各等級人數(shù)時,可將正態(tài)分布基線上Z=-3至Z=+3之間6個標準差的距離分成相等的幾份,然后查表求出各段Z值之間的面積,再乘以總?cè)藬?shù),即為各等級人數(shù)。3.品質(zhì)評定數(shù)量化在心理與教育研究中,常常遇到等級評定的結(jié)果。但是不同評定者的評定結(jié)果往往不一致,無法綜合他們的評定結(jié)果,而且等級分數(shù)不是等距數(shù)據(jù),不同事物的評定結(jié)果不能直接比較。將品質(zhì)評定的結(jié)果轉(zhuǎn)化為數(shù)量結(jié)果,就可解決這些問題。具體方法根據(jù)各等級被評者的數(shù)目求各等級的人數(shù)比率;求各等級比率值的中間值;求各等級中點以上(或以下)的累積比率;用累積比率查正態(tài)分布表;求被評者所得評定等級的數(shù)量化值的平均值。四、二項分布二項分布(bionimaldistribution)是一種具有廣泛用途的離散型隨機變量的概率分布,它是由貝努里創(chuàng)始的,因此又稱為貝努里分布。1.二項試驗
滿足以下條件的試驗稱為二項試驗:一次試驗只有兩種可能的結(jié)果,即成功和失?。桓鞔卧囼炏嗷オ毩?,即各次試驗之間互不影響;各次試驗中成功的概率相等,失敗的概率也相等;有n次試驗。2.二項分布函數(shù)二項分布是一種離散型隨機變量的概率分布。用n次方的二項展開式來表達在n次二項試驗中成功事件出現(xiàn)的不同次數(shù)(X=0,1…)的概率分布,叫做二項分布函數(shù)。二項展開式的通式(即二項分布函數(shù)):二項展開式的基本特點:項數(shù):二項展開式中共有n+1項。方次:p的方次,從n→0為降冪;
q的方次從0→n為升冪。每項p與q方次之和等于n。系數(shù):各項系數(shù)是成功事件次數(shù)的組合數(shù)。
3.二項分布圖
以成功事件出現(xiàn)的次數(shù)為橫坐標,以成功事件出現(xiàn)不同次數(shù)的概率為縱坐標,繪制直方圖或多邊圖,即為二項分布圖。二項分布是離散型分布,其概率直方圖是躍階式。二項分布的基本性質(zhì):從概率直方圖可以看到,二項分布有如下性質(zhì):①當p=q時,圖形是對稱的。②當p≠q時,直方圖呈偏態(tài)。p>q與p<q時的偏斜方向相反。當n增大時,偏斜程度降低。③當np≥5,并且nq≥5時,二項分布接近正態(tài)分布,可用正態(tài)分布的概率計算二項分布的概率。4.二項分布的平均數(shù)和標準差如果二項分布滿足p>q且nq≥5(或者p<q且np≥5時,二項分布接近于正態(tài)分布??捎孟旅娴姆椒ㄓ嬎愣椃植嫉钠骄鶖?shù)和標準差。二項分布的平均數(shù)為二項分布的標準差為5.二項分布的應用在心理與教育研究中,二項分布主要用來判斷試驗結(jié)果發(fā)生的概率。例6.101粒骰子擲5次,2次和3次6點向上的概率分別是多少?解:在此問題中,一粒骰子擲5次,符合二項試驗的條件,且有,n=5,p=1/6,x=2和x=3。采用二項分布函數(shù)計算概率:答:1粒骰子擲5次,2次和3次正面向上的概率分別為0.161和0.032。例6.1110道四選一選擇題,如果完全隨機猜測,答對8、9和10題的概率分別是多少?解:根據(jù)二項分布的概率函數(shù),10道四選一題猜8題、9題和10題的概率分別為:答:10道四選一題,完全靠隨機猜測答對8題及8題以上的概率為0.00042。例6.1110道四選一選擇題,如果完全隨機猜測,答對8題及8題以上的概率是多少?解:根據(jù)二項分布的概率函數(shù),10道四選一題猜8題、9題和10題的概率為:=0.000386+0.0000286+0.000000954=0.00042如果靠隨機猜測,猜對8題及8題以上的概率為0.00042,一般概率小于0.05時,則認為答題者是真會而不是隨機猜測答題了。所以,答對8題有充分把握認為答題者不是猜測的。八、抽樣分布區(qū)分三種不同性質(zhì)的分布:總體分布:總體內(nèi)個體數(shù)值的頻數(shù)分布樣本分布:樣本內(nèi)個體數(shù)值的頻數(shù)分布抽樣分布:某一種統(tǒng)計量的概率分布1.抽樣分布的概念
抽樣分布是從同一總體內(nèi)抽取的不同樣本的統(tǒng)計量的概率分布。抽樣分布是一個理論的概率分布,是統(tǒng)計推斷的依據(jù)。2.平均數(shù)抽樣分布的幾個定理
⑴從總體中隨機抽出容量為n的一切可能樣本的平均數(shù)之平均數(shù)等于總體的平均數(shù)。⑵容量為n的平均數(shù)在抽樣分布上的標準差(即平均數(shù)的標準誤),等于總體標準差除以n的平方根。⑶從正態(tài)總體中,隨機抽取的容量為n的一切可能樣本平均數(shù)的分布也呈正態(tài)分布。⑷雖然總體不呈正態(tài)分布,如果樣本容量較大,反映總體μ和σ的樣本平均數(shù)的抽樣分布,也接近于正態(tài)分布。二.標準誤
某種統(tǒng)計量在抽樣分布上的標準差,稱為標準誤。標準誤用來衡量抽樣誤差。標準誤越小,表明樣本統(tǒng)計量與總體參數(shù)的值越接近,樣本對總體越有代表性,用樣本統(tǒng)計量推斷總體參數(shù)的可靠度越大。因此,標準誤是統(tǒng)計推斷可靠性的指標。平均數(shù)標準誤的計算1.總體正態(tài),σ已知(不管樣本容量大?。?,或總體非正態(tài),σ已知,大樣本平均數(shù)的標準誤為:2.總體正態(tài),σ未知(不管樣本容量大?。?,或總體非正態(tài),σ未知,大樣本,平均數(shù)標準誤的估計值為總體分布總體方差樣本平均數(shù)的分布正態(tài)已知正態(tài)正態(tài)未知t分布非正態(tài)(n>30)已知漸近正態(tài)非正態(tài)(n>30)未知近似t分布第七章參數(shù)估計一、總體參數(shù)估計的基本原理根據(jù)樣本統(tǒng)計量對相應總體參數(shù)所作的估計叫作總體參數(shù)估計。總體參數(shù)估計分為點估計和區(qū)間估計。由樣本的平均數(shù)估計總體的平均數(shù)即為點估計;而由樣本的平均數(shù)估計總體平均數(shù)的取值范圍則為區(qū)間估計。1.良好的點估計量應具備的條件無偏性
如果一切可能個樣本統(tǒng)計量的值與總體參數(shù)值偏差的平均值為0,這種統(tǒng)計量就是總體參數(shù)的無偏估計量。有效性
當總體參數(shù)不止有一種無偏估計量時,某一種估計量的一切可能樣本值的方差小者為有效性高,方差大者為有效性低。一致性當樣本容量無限增大時,估計量的值能越來越接近它所估計的總體參數(shù)值,這種估計是總體參數(shù)一致性估計量。充分性一個容量為n的樣本統(tǒng)計量,應能充分地反映全部n個數(shù)據(jù)所反映的總體的信息。2.區(qū)間估計以樣本統(tǒng)計量的抽樣分布(概率分布)為理論依據(jù),按一定概率的要求,由樣本統(tǒng)計量的值估計總體參數(shù)值的所在范圍,稱為總體參數(shù)的區(qū)間估計。對總體參數(shù)值進行區(qū)間估計,就是要在一定可靠度上求出總體參數(shù)的置信區(qū)間的上下限。⑴要知道與所要估計的參數(shù)相對應的樣本統(tǒng)計量的值,以及樣本統(tǒng)計量的理論分布;⑵要求出該種統(tǒng)計量的標準誤;⑶要確定在多大的可靠度上對總體參數(shù)作估計,再通過某種理論概率分布表,找出與某種可靠度相對應的該分布橫軸上記分的臨界值,才能計算出總體參數(shù)的置信區(qū)間的上下限。置信區(qū)間置信度,即置信概率,是作出某種推斷時正確的可能性(概率)。置信區(qū)間,也稱置信間距(confidenceinterval,CI)是指在某一置信度時,總體參數(shù)所在的區(qū)域距離或區(qū)域長度。置信區(qū)間是帶有置信概率的取值區(qū)間。顯著性水平對總體平均數(shù)進行區(qū)間估計時,置信概率表示做出正確推斷的可能性,但這種估計還是會有犯錯誤的可能。顯著性水平就是指估計總體參數(shù)落在某一區(qū)間時,可能犯錯誤的概率,用符號α表示。
P=1-α3.平均數(shù)區(qū)間估計的基本原理通過樣本的平均數(shù)估計總體的平均數(shù),首先假定該樣本是隨機取自一個正態(tài)分布的母總體(或非正態(tài)總體中的n>30的樣本),而計算出來的實際平均數(shù)是無數(shù)容量為n的樣本平均數(shù)中的一個。根據(jù)樣本平均數(shù)的分布理論,可以對總體平均數(shù)進行估計,并以概率說明其正確的可能性。二.總體平均數(shù)的區(qū)間估計1.總體平均數(shù)區(qū)間估計的基本步驟①.根據(jù)樣本的數(shù)據(jù),計算樣本的平均數(shù)和標準差;②.計算平均數(shù)抽樣分布的標準誤;③.確定置信概率或顯著性水平;④.根據(jù)樣本平均數(shù)的抽樣分布確定查何種統(tǒng)計表;⑤.計算置信區(qū)間;⑥.解釋總體平均數(shù)的置信區(qū)間。2.平均數(shù)區(qū)間估計的計算①總體正態(tài),σ已知(不管樣本容量大?。蚩傮w非正態(tài),σ已知,大樣本平均數(shù)離差的的抽樣分布呈正態(tài),平均數(shù)的置信區(qū)間為:
例7.1某研究者從其所居住的市區(qū)隨機抽取25名小學一年級同學進行比內(nèi)智力測驗,測試結(jié)果顯示,25名小學生的平均智商為103.2,試求該區(qū)小學一年級學生智商的.95和.99置信區(qū)間(置信水平為0.95和0.99)。全區(qū)小學一年級學生的智商分布為正態(tài)分布,比內(nèi)智力量表的標準差常模為)
解:由題目中信息可知,該區(qū)小學一年級學生智商總體分布為正態(tài)分布,總體標準差σ=16,樣本平均數(shù)的抽樣分布為正態(tài)分布,置信區(qū)間計算公式為:其中,當=0.05時,,0.95置信區(qū)間為:當=0.01時,,0.99置信區(qū)間為:比較對應兩個置信度0.95和0.99的置信區(qū)間[96.93,109.47]和[94.94,111.46],較低的置信度0.95對應的置信區(qū)間比較高的置信度0.99對應的置信區(qū)間范圍要小。即,置信度較低時,置信區(qū)間范圍較小;置信度較高時,置信區(qū)間范圍較大。例7.2
如果例7.1中研究者抽取100名小學生進行測試,測試結(jié)果的平均數(shù)為103.2,試計算全區(qū)一年級小學生智商的.95和.99置信區(qū)間。將計算結(jié)果與例7.1的計算結(jié)果進行比較。解:與例7.1相同,問題屬于總體分布為正態(tài)分布,總體標準差已知的問題,置信區(qū)間的計算公式為:其中,當=0.05時,,0.95置信區(qū)間為:當=0.01時,,0.99置信區(qū)間為:
對應兩個置信度0.95和0.99的置信區(qū)間分別為[100.06,106.34]和[99.07,107.33]。與例7.1所得的對應置信度0.95和0.99的兩個置信區(qū)間[96.93,109.47]和[94.94,111.46]進行比較,可以看出,本例中采用n=100的樣本計算所得的兩個置信區(qū)間范圍較小,例7.1通過n=25的樣本計算所得的相應置信區(qū)間范圍較大。也就是,樣本容量越大,同樣置信水平下的置信區(qū)間范圍越小。例7.4
某研究者在某社區(qū)隨機抽取49名70歲至80歲老人,調(diào)查他們的幸福感水平,調(diào)查結(jié)果的平均數(shù)是79.6分,標準差是7.7分。試估計該社區(qū)70至80歲老人幸福感的.95置信區(qū)間。解:本例主觀幸福感符合正態(tài)分布,總體標準差σ未知,因此,樣本平均數(shù)的抽樣分布為t分布。置信區(qū)間計算公式為:其中,t分布的自由度df=n-1=49-1=48當α=0.05時,例7.6對大學四年級學生進行抽樣體能測試,男生測試項目為1500米跑,測試的100名學生的平均成績?yōu)?71秒,標準差(Sn-1)為63秒,試估計全校四年級男生1500米跑平均用時的95%置信區(qū)間。(假設全體男生跑1500米所用時間的分布不是正態(tài)分布)解:根據(jù)題目信息,總體為非正態(tài)分布,且總體標準差σ未知,樣本容量n=100>30,可知樣本平均數(shù)的抽樣分布近似t分布,此時,置信區(qū)間計算公式為:當=0.05時,④總體非正態(tài),小樣本
不能進行參數(shù)估計,即不能根據(jù)樣本分布對總體平均數(shù)進行估計。SPSS基本操作
1.總體平均數(shù)與總體標準差的點估計總體平均數(shù)的無偏估計值是樣本平均數(shù),總體標準差的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學農(nóng)學(農(nóng)村社會學)試題及答案
- 2025年大學大一(水產(chǎn)養(yǎng)殖學)水產(chǎn)養(yǎng)殖生態(tài)學基礎階段測試試題及答案
- 2026年客運司機(車輛檢查)試題及答案
- 2025年高職鐵道工程技術(shù)(鐵道施工基礎)試題及答案
- 2025年大學健康管理(慢病實操)試題及答案
- 2025年高職高分子材料工程技術(shù)(高分子工程工藝)試題及答案
- 2025年高職形象設計(婚慶造型設計)試題及答案
- 2025年高職應用心理學(咨詢技巧)試題及答案
- 2025年高職(客戶關系管理)客戶維護單元測試試題及答案
- 2026年運動營養(yǎng)(健身補劑選擇)試題及答案
- 2025年雞飼料采購合同
- 模擬電子技術(shù)基礎 第4版黃麗亞課后參考答案
- 電信營業(yè)廳運營方案策劃書(2篇)
- JBT 14850-2024 塔式起重機支護系統(tǒng)(正式版)
- 專精特新申報材料范本
- 牽引供電系統(tǒng)短路計算-三相對稱短路計算(高鐵牽引供電系統(tǒng))
- (完整版)第一性原理
- 安全技術(shù)勞動保護措施管理規(guī)定
- 學習主題班會課件 高三寒假攻略
- 高一年級主任工作總結(jié)(4篇)
- 論高級管理人員應具備的財務知識
評論
0/150
提交評論