第2講 描述性統(tǒng)計(jì)_第1頁(yè)
第2講 描述性統(tǒng)計(jì)_第2頁(yè)
第2講 描述性統(tǒng)計(jì)_第3頁(yè)
第2講 描述性統(tǒng)計(jì)_第4頁(yè)
第2講 描述性統(tǒng)計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

SPSS統(tǒng)計(jì)軟件姓名:曹玉茹電話:67703852E-mail:caoyuru2003@答疑地點(diǎn):學(xué)院樓B418答疑時(shí)間:商務(wù)信息學(xué)院計(jì)算機(jī)教學(xué)部上節(jié)回顧一、數(shù)據(jù)的編碼、錄入與整理二、數(shù)據(jù)問(wèn)卷與編碼三、編碼類型四、缺失值的處理五、數(shù)據(jù)處理中的操作術(shù)語(yǔ)六、定義變量七、數(shù)據(jù)的錄入八、數(shù)據(jù)的導(dǎo)入九、數(shù)據(jù)的整理分值轉(zhuǎn)換、量表統(tǒng)分、排序、限選、加權(quán)、計(jì)數(shù)、合并于聚合第2講

描述性統(tǒng)計(jì)分析一、描述性統(tǒng)計(jì)分析概念目的通過(guò)變量的描述性統(tǒng)計(jì)分析,能夠掌握和了解樣本數(shù)據(jù)的統(tǒng)計(jì)特征和總體分布形態(tài),進(jìn)而更深入地揭示變量變化的統(tǒng)計(jì)規(guī)律。方法

數(shù)據(jù)計(jì)算:計(jì)算常見(jiàn)的描述性統(tǒng)計(jì)量的值,準(zhǔn)確反映樣本數(shù)據(jù)的統(tǒng)計(jì)特征。

圖形繪制:繪制常見(jiàn)的統(tǒng)計(jì)圖形,通過(guò)圖形來(lái)直觀展現(xiàn)數(shù)據(jù)的分布特征,比較

數(shù)據(jù)分布的異同。

通常,兩種方法混合使用。SPSS軟件中相關(guān)的7種功能頻數(shù)分析(Frenquencies):描述統(tǒng)計(jì)量(Descriptives):探索性分析(Explore):交叉列聯(lián)表(Crosstabs):比率分析(Ratio):P-P圖Q-Q圖

頻數(shù)分析二、頻數(shù)分析概念統(tǒng)計(jì)的是每一組中觀測(cè)點(diǎn)的個(gè)數(shù),而不考慮其實(shí)際取值。了解變量取值的一般特征。如,哪些數(shù)值出現(xiàn)的頻率高?變量取值的大致范圍是什么?考察數(shù)據(jù)是否符合要進(jìn)行的統(tǒng)計(jì)分析的假設(shè)。如:樣本數(shù)足夠大嗎?每個(gè)變量的觀測(cè)值是否合理呢?評(píng)估數(shù)據(jù)的質(zhì)量。如,有多少缺失值或者有多少數(shù)據(jù)錄入錯(cuò)誤?二、頻數(shù)分析SPSS中的頻數(shù)分布表

頻數(shù)分析的基本功能之一:是編制頻數(shù)分布表,以下是幾個(gè)頻數(shù)分析時(shí)常用的概念:頻數(shù)(Frenquency):變量值落在某個(gè)區(qū)間或者某個(gè)取值點(diǎn)的個(gè)數(shù)。百分比(Percent):各頻數(shù)占總樣本數(shù)的百分比。有效百分比(ValidPercent):各頻數(shù)占有效樣本數(shù)的百分比。累計(jì)百分比(CumulativePercent):各百分比逐級(jí)累加起來(lái)的結(jié)果,最終取值是100。取值不及格及格中等良好優(yōu)秀合計(jì)取值區(qū)間0-5960-6970-7980-8990-1000-100頻數(shù)1919321677百分比1.30%11.69%24.68%41.56%20.78%100.00%累計(jì)百分比1.30%12.99%37.66%79.22%100.00%100.00%二、頻數(shù)分析頻數(shù)分析中的統(tǒng)計(jì)圖

頻數(shù)分析的基本功能之二:是繪制統(tǒng)計(jì)圖,統(tǒng)計(jì)圖能非常清晰直觀地展示變量的取值狀況,包括以下三種圖:條形圖(BarChart):餅圖(PieChart):直方圖(Histograms):條形圖與直方圖區(qū)別條形圖1.用條形的長(zhǎng)度表示各類別頻數(shù)的多少,其寬度是固定的2.各矩形通常是分開(kāi)排列的;3.主要用于展示分類數(shù)據(jù)。直方圖1.用面積表示各組頻數(shù)的多少,矩形的高度表示每一組的頻數(shù)或頻率寬度表示各組的組距;2.由于分組數(shù)據(jù)具有連續(xù)性,各矩形通常是連續(xù)排列;3.主要用于展示數(shù)值型數(shù)據(jù)。二、頻數(shù)分析SPSS操作及案例例一:各門(mén)成績(jī)統(tǒng)計(jì)結(jié)果保存為:3-StudentScore.spo二、頻數(shù)分析SPSS操作及案例(數(shù)據(jù)文件:3-StudentScore.sav)Analyze→DescriptiveStatistics→Frequencies…SPSS操作及案例(數(shù)據(jù)文件:3-StudentScore.sav)例二:語(yǔ)文成績(jī)區(qū)間頻度分布表

步驟1:對(duì)“語(yǔ)文”成績(jī)進(jìn)行分段Transform→RecodeIntoDifferentVariables…

(結(jié)果保存為:3-StudentScore_成績(jī)分段.sav)

二、頻數(shù)分析二、頻數(shù)分析SPSS操作及案例步驟2:對(duì)“分?jǐn)?shù)分段”進(jìn)行統(tǒng)計(jì)Analyze→DescriptiveStatistics→Frequencies…二、頻數(shù)分析SPSS操作及案例

二、頻數(shù)分析SPSS操作及案例輸出三門(mén)成績(jī)的均值、標(biāo)準(zhǔn)差

極差及4分位數(shù)

基本描述統(tǒng)計(jì)量三、基本描述統(tǒng)計(jì)量概念

通過(guò)頻數(shù)分析對(duì)數(shù)據(jù)的總體分布狀況有了基本了解之后,通常還需要對(duì)定距變量的分布特征有更為精確的認(rèn)識(shí),這就需要通過(guò)計(jì)算基本描述統(tǒng)計(jì)量等途徑來(lái)實(shí)現(xiàn)。

常見(jiàn)的描述統(tǒng)計(jì)量大致可以分為三類:第一類:描述集中趨勢(shì)(CentralTendency)的統(tǒng)計(jì)量第二類:描述離散趨勢(shì)(Dispersion)的統(tǒng)計(jì)量第三類:描述分布形態(tài)(Distribution)的統(tǒng)計(jì)量變量的值之間可以比較大小,兩個(gè)值的差有實(shí)際意義,這樣的變量叫定距變量。在調(diào)查被訪者的“年齡”和“每月平均收入”,都是定距變量。三、基本描述統(tǒng)計(jì)量描述集中趨勢(shì)的統(tǒng)計(jì)量指一組數(shù)據(jù)向某一中心集中的程度,即在某一中心附近觀測(cè)值數(shù)目較多,遠(yuǎn)離該中心的觀測(cè)值數(shù)目較少。有如下統(tǒng)計(jì)量:

平均值(Mean):即算術(shù)平均值(=(X1+X2+…+Xn)/n)。

易受極端值影響。

中位數(shù)(Median):把變量的值有序排列,位于中間位置的值即中位數(shù)。

是位置平均置,不易受極端值的影響。

眾數(shù)(Mode):樣本中出現(xiàn)次數(shù)最多的值,代表數(shù)據(jù)的集中程序。

求和(Sum):所有變量之和,反映變量的總體水平。三、基本描述統(tǒng)計(jì)量描述離散趨勢(shì)的統(tǒng)計(jì)量與“集中趨勢(shì)”相反,“離散趨勢(shì)”反映的是一組資料中各個(gè)觀察值之間的差異或離散程度。即考察所有數(shù)據(jù)相對(duì)于“中心值”分布的疏密程度。有如下統(tǒng)計(jì)量:方差(Variance):

樣本方差越大,說(shuō)明變量值之間的差異越大,樣本方差沒(méi)有單位。標(biāo)準(zhǔn)差(std.deviation):

樣本標(biāo)準(zhǔn)差越大,說(shuō)明變量的觀測(cè)值之間

的差異越大,距離均值這個(gè)“中心”的離散程

度越大。三、基本描述統(tǒng)計(jì)量描述離散趨勢(shì)的統(tǒng)計(jì)量極差(Range):也稱全距或跨度或范圍,R=最大值-最小值

極差不考慮最大值與最小值之間的觀測(cè)值,僅僅依靠端點(diǎn)值來(lái)確定,因而穩(wěn)定性差。

最小值(Minimum):一組資料中各個(gè)觀測(cè)值的最小者。最大值(Maximum):一組資料中各個(gè)觀測(cè)值的最大者。均值標(biāo)準(zhǔn)誤差(S.E.Mean,StandardErrorofMean,簡(jiǎn)稱標(biāo)準(zhǔn)誤):樣本數(shù)據(jù)是從總體數(shù)據(jù)中抽取出來(lái)的。雖然在一定程度上,樣本數(shù)據(jù)可以反映總體數(shù)據(jù)的特征。但在不同次抽樣中所得的樣本均值是不同的,并且它們與總體均值間存在差異。均值標(biāo)準(zhǔn)誤差就是描述這些樣本均值與總體均值之間平均差異程度的統(tǒng)計(jì)量。即:樣本均值的標(biāo)準(zhǔn)差。三、基本描述統(tǒng)計(jì)量描述分布形態(tài)的統(tǒng)計(jì)量

考察數(shù)據(jù)分布形態(tài)特征的統(tǒng)計(jì)量,例如,數(shù)據(jù)分布是否對(duì)稱、偏斜程度以及陡緩程度,主要有如下兩種統(tǒng)計(jì)量:偏度(Skewness):

偏度值>0,為正偏或右偏;偏度值<0,為負(fù)偏或左偏。偏度絕對(duì)值越大,偏斜越大。峰度(Kurtosis):

峰度值>0,數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭,為尖峰分布;峰度值<0,數(shù)據(jù)分布比標(biāo)準(zhǔn)正態(tài)分布更平緩,為平峰分布。三、基本描述統(tǒng)計(jì)量SPSS操作及案例分析(數(shù)據(jù)文件:3-StudentScore.sav)

例三:計(jì)算全部學(xué)生各門(mén)成績(jī)的平均值、標(biāo)準(zhǔn)差、最大值和最小值,并考察學(xué)生成績(jī)的分布形態(tài)。三、基本描述統(tǒng)計(jì)量SPSS操作及案例分析

數(shù)據(jù)文件:3-StudentScore.sav

Analyze→DescriptiveStatistics→Descriptives…

探索性分析四、探索性分析概念

數(shù)據(jù)探索是統(tǒng)計(jì)分析中非常重要的一步,可以幫助我們決定選擇哪種統(tǒng)計(jì)方法進(jìn)行數(shù)據(jù)分析,有如下三方面的考察:(1)考察數(shù)據(jù)的正確性

考察數(shù)據(jù)中的一些異常值,分析這些值產(chǎn)生的原因,判斷其正確性,再?zèng)Q定修改、刪除或保留它們。(2)考察數(shù)據(jù)的分布特征

考察數(shù)據(jù)的正態(tài)分布特征可以為以后進(jìn)行統(tǒng)計(jì)分析時(shí)采用正確的統(tǒng)計(jì)方法提供正確的依據(jù)。(3)考察變量之間數(shù)據(jù)的相互關(guān)系

變量與變量之間相關(guān)性的考察、方差齊性的考察,是一些統(tǒng)計(jì)分析過(guò)程必須事先了解的。四、探索性分析通過(guò)莖葉圖(Stem-and-LeafPlots)描述頻度分布例四:

數(shù)據(jù)文件:3-StudentScore.sav

莖葉圖由數(shù)字構(gòu)成,表達(dá)變量的頻數(shù)分布。Analyze→DescriptiveStatistics→Explore…

例如,語(yǔ)文成績(jī)莖葉圖。

通過(guò)箱圖(Boxplots)描述數(shù)據(jù)分布箱圖也稱為箱線圖(箱式圖),顯示了變量數(shù)據(jù)的中位數(shù)、25%百分位數(shù)和75%百分位數(shù),并給出偏離總體分布的奇異個(gè)案和極端個(gè)案。四、探索性分析通過(guò)箱圖(Boxplots)描述數(shù)據(jù)分布

四、探索性分析通過(guò)箱圖(Boxplots)描述數(shù)據(jù)分布

語(yǔ)文成績(jī)箱圖四、探索性分析通過(guò)箱圖(Boxplots)描述數(shù)據(jù)分布

(數(shù)據(jù)文件:3-StudentScore.sav)四、探索性分析四、探索性分析通過(guò)正態(tài)分布檢驗(yàn)的Q-Q概率圖描述數(shù)據(jù)分布的正態(tài)性(有兩種)

(1)正態(tài)概率圖以變量(語(yǔ)文成績(jī))的觀測(cè)值為X軸坐標(biāo),以該變量分布的Z分?jǐn)?shù)為縱坐標(biāo)。斜線為正態(tài)分布的Z分?jǐn)?shù)的期望標(biāo)準(zhǔn)線,若觀測(cè)點(diǎn)離線越近,表示點(diǎn)越符合正態(tài)分布。反之,越不符合正態(tài)分布。四、探索性分析通過(guò)正態(tài)分布檢驗(yàn)的Q-Q概率圖描述數(shù)據(jù)分布的正態(tài)性

(2)反趨勢(shì)正態(tài)概率圖也是以變量(語(yǔ)文成績(jī))的觀測(cè)值為X軸坐標(biāo),以該變量分布的Z分?jǐn)?shù)與正態(tài)分布期望值的偏差為縱坐標(biāo)。水平直線為期望標(biāo)準(zhǔn)線,若觀測(cè)點(diǎn)離線越近,表示該點(diǎn)越符合正態(tài)分布。反之,越不符合正態(tài)分布。四、探索性分析通過(guò)正態(tài)分布檢驗(yàn)的Q-Q概率圖描述數(shù)據(jù)分布的正態(tài)性(數(shù)據(jù)文件:3-StudentScore.sav)Analyze→DescriptiveStatistics→Explore…四、探索性分析四、探索性分析SPSS操作及案例分析例五:按照書(shū)上要求完成案例(數(shù)據(jù)文件:4-Explore.sav)考察學(xué)生“英語(yǔ)”、“數(shù)學(xué)”、“語(yǔ)文”三門(mén)課程成績(jī)的分布、極端值以及正態(tài)分布性和方差的齊性。以語(yǔ)文為例:四、探索性分析SPSS操作及案例分析箱圖四、探索性分析SPSS操作及案例分析

正態(tài)概率圖反趨勢(shì)正態(tài)概率圖

四、探索性分析SPSS操作及案例分析

從K-S檢驗(yàn)以及S-W檢驗(yàn)兩種方法的Sig.值看,均大于0.05,表明三門(mén)課程成績(jī)按男女分開(kāi)的樣本都是正態(tài)分布的。四、探索性分析SPSS操作及案例分析

根據(jù)方差齊性檢驗(yàn)結(jié)果可以看出,語(yǔ)文成績(jī)按照男女分開(kāi)的樣本顯著性水平Sig.值都大于0.05,表明方差的差異不顯著,也就是說(shuō)方差是齊性的。四、探索性分析SPSS操作及案例分析

例五:操作步驟(數(shù)據(jù)文件:4-Explore.sav)

Analyze→DescriptiveStatistics→Explore...

交叉列聯(lián)表分析五、交叉列聯(lián)表分析概念

通過(guò)頻數(shù)分析,能夠掌握單個(gè)變量的數(shù)據(jù)分布情況。

實(shí)際情況,還要了解和分析多個(gè)變量不同取值下的分布,掌握多變量的聯(lián)合分布特征,進(jìn)而分析變量之間的相互影響和關(guān)系。例如:年齡段和成績(jī)水平之間的關(guān)系

本節(jié)主要講交叉列聯(lián)表分析,它包括如下兩大基本任務(wù):

五、交叉列聯(lián)表分析根據(jù)樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表

交叉列聯(lián)表是兩個(gè)或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。例如,一個(gè)二維交叉列聯(lián)表,反映了不同年齡段和成績(jī)水平交叉分組下的分?jǐn)?shù)頻數(shù)分布情況。例六:數(shù)據(jù)文件:4-crosstabulation1.sav數(shù)據(jù)格式:如圖(部分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論