版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第四章 SPSS基本統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析7/25/20221SPSS的主要分析工具Analyze菜單描述性統(tǒng)計(jì)分析Descriptive Statistics菜單均數(shù)間的比較Compare Means菜單一般線(xiàn)性模型General Linear Model菜單相關(guān)分析Correlate菜單多元線(xiàn)性回歸與曲線(xiàn)擬合 Regression菜單對(duì)數(shù)線(xiàn)性模型Loglinear菜單聚類(lèi)分析與判別分析Classify菜單因子分析與對(duì)應(yīng)分析Data Reduction菜單信度分析與多維尺度分析Scale菜單非參數(shù)檢驗(yàn)Nonparametric Tests菜單7/25/20222 描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第
2、一步,做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可完成描述性分析,但專(zhuān)門(mén)為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在Descriptive Statistics菜單中,包括:Frequencies:頻數(shù)分析過(guò)程,特色是產(chǎn)生頻數(shù)表Descriptives:數(shù)據(jù)描述過(guò)程,進(jìn)行一般性的統(tǒng)計(jì)描述Explore:數(shù)據(jù)探察過(guò)程,用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析Crosstabs:列聯(lián)表分析過(guò)程Ratio statistics:比率分析7/25/202234.1 頻數(shù)分析4.1.1 頻數(shù)分析的目的和基本任務(wù) 1、目的:基本統(tǒng)計(jì)分析往往從頻數(shù)分析開(kāi)始。通過(guò)頻數(shù)分析能夠了解變量取值的狀況,對(duì)把握數(shù)據(jù)
3、的分布特征是非常有用的。 例如:在問(wèn)卷數(shù)據(jù)分析中,通常應(yīng)首先對(duì)本次調(diào)查的被調(diào)查者的狀況,如被訪(fǎng)者的總?cè)藬?shù)、年齡特點(diǎn)、職業(yè)特點(diǎn)、性別特征等進(jìn)行分析和總結(jié)。通過(guò)這些分析,能夠在一定程度上反映樣本是否具有總體代表性,抽樣是否存在系統(tǒng)偏差等,并以此證明以后相關(guān)問(wèn)題分析的代表性和可信性。這些可以通過(guò)頻數(shù)分析來(lái)實(shí)現(xiàn)。7/25/20224 2、基本任務(wù) (1)頻數(shù)分析的第一個(gè)基本任務(wù)是編制頻數(shù)分布表。頻數(shù)(Frequency):即變量值落在某個(gè)區(qū)間(或某個(gè)類(lèi)別)中的次數(shù)百分比(Percent):即各頻數(shù)占總樣本數(shù)的百分比有效百分比(Valid Percent):即各頻數(shù)占有效樣本數(shù)的百分比,這里有效樣本數(shù)總
4、樣本缺失樣本數(shù)累計(jì)百分比(Cumulative Percent):即各百分比逐級(jí)累加起來(lái)的結(jié)果。最終取值為100。7/25/20225 (2)頻數(shù)分析的第二個(gè)任務(wù)是繪制統(tǒng)計(jì)圖條形圖(Bar Chart):用寬度相同的條形的高度或長(zhǎng)短來(lái)表示頻數(shù)分布變化的圖形,適用于定序和定類(lèi)變量的分析。餅圖(Pie Chart):用圓形及圓內(nèi)扇形的面積來(lái)表示頻數(shù)百分比變化的圖形,以利于研究事物內(nèi)在結(jié)構(gòu)組成等問(wèn)題。直方圖(Histograms):用矩形的面積來(lái)表示頻數(shù)分布變化的圖形,適用于定距型變量的分析。7/25/20226注:變量的尺度:a 定類(lèi) (Category Scale):只能計(jì)次b 定序 (Ordi
5、nal Scale):計(jì)次、排序c 定距(Interval Scale):計(jì)次、排序、加減d 定比 (Ratio Scale):計(jì)次、排序、加減、乘除7/25/202274.1.2 頻數(shù)分析的基本操作(1)選擇菜單AnalyzeDescriptive StatisticsFrequencies。(2)將若干頻數(shù)分析變量選擇到Variable(s)框中。(3)單擊Chart按鈕選擇繪制統(tǒng)計(jì)圖形,在Chart Values框中選擇條形圖中縱坐標(biāo)(或餅圖中扇形面積)的含義,其中Frequencies表示頻數(shù);Percentages表示百分比。 至此,SPSS將自動(dòng)編制頻數(shù)分布表并顯示到輸出窗口中。7
6、/25/20228頻數(shù)分析過(guò)程對(duì)話(huà)框統(tǒng)計(jì)量選擇對(duì)話(huà)框 7/25/202294.1.3 SPSS頻數(shù)分析的擴(kuò)展功能 1、計(jì)算分位數(shù)(Percentile Values) 分位數(shù)是變量在不同分位點(diǎn)上的取值。分位點(diǎn)在0100之間。一般使用較多的是四分位點(diǎn)(Quartiles),即將所有數(shù)據(jù)按升序排序后平均等分成四份,各分位點(diǎn)依次是25,50,75。于是四分位數(shù)便分別是25,50,75點(diǎn)所對(duì)應(yīng)的變量值。此外,還有八分位數(shù)、十六分位數(shù)等。 SPSS提供了計(jì)算任意分位數(shù)的功能,用戶(hù)可以指定將數(shù)據(jù)等分為n份(Cut points for n equal groups)。還可以直接指定分位點(diǎn)(Percenti
7、le)。7/25/202210 2、計(jì)算其他基本描述統(tǒng)計(jì)量 SPSS頻數(shù)分析還能夠計(jì)算其他基本統(tǒng)計(jì)量,其中包括描述集中趨勢(shì)(Central Tendency)的基本統(tǒng)計(jì)量、描述離散程度(Dispersion)的基本統(tǒng)計(jì)量、描述分布形態(tài)(Distribution)的基本統(tǒng)計(jì)量等。7/25/2022113、頻數(shù)分布表格式(Format)的定義 (1)調(diào)整頻數(shù)分布表中數(shù)據(jù)的輸出順序(Order by) 頻數(shù)分布表中的內(nèi)容的輸出順序可以按變量值的升序輸出(Ascending values),按變量值的降序輸出(Descending values),按頻數(shù)的升序輸出( Ascending counts)
8、,按頻數(shù)的降序輸出( Descending counts)。7/25/202212 (2)壓縮頻數(shù)分布表(Suppress tables with more than n categories) 如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)太多,頻數(shù)分布表將很龐大,此時(shí)可以壓縮它。SPSS默認(rèn),如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)大于10,則不輸出相應(yīng)的頻數(shù)分布表。應(yīng)用中可以修改該值。7/25/2022134.1.4 頻數(shù)分析的應(yīng)用舉例 利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析,有以下兩個(gè)分析目標(biāo):目標(biāo)一:分析儲(chǔ)戶(hù)的戶(hù)口和職業(yè)的基本情況。目標(biāo)二:分析儲(chǔ)戶(hù)一次存(?。┛罱痤~的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較。7
9、/25/202214分析:目標(biāo)一:分析儲(chǔ)戶(hù)的戶(hù)口和職業(yè)的基本情況 (1)戶(hù)口和職業(yè)兩個(gè)變量都是定類(lèi)型變量,可通過(guò)基本頻數(shù)分析實(shí)現(xiàn)。 (2)職業(yè)變量的取值(分類(lèi))數(shù)目較多,為使頻數(shù)分布表更一目了然,應(yīng)對(duì)內(nèi)容的輸出順序進(jìn)行調(diào)整,單擊Format按鈕,選擇Descending counts按頻數(shù)的降序輸出。 (3)單擊Chart按鈕指定輸出戶(hù)口變量的餅圖和職業(yè)變量的條形圖。7/25/202215目標(biāo)二:分析儲(chǔ)戶(hù)一次存(取)款金額的分布,并對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較。1、分析思路:(1)由于存(?。┛罱痤~數(shù)據(jù)為定距型變量,直接采用頻數(shù)分析不利于對(duì)其分布形態(tài)的把握,因此考慮依據(jù)第三章中的數(shù)據(jù)分組功能對(duì)
10、數(shù)據(jù)分組后再編制頻數(shù)分布表。(2)進(jìn)行數(shù)據(jù)拆分,并分別計(jì)算城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)的一次存(?。┛罱痤~的四分位數(shù),并通過(guò)四分位數(shù)比較兩者分布上的差異。7/25/2022162、分析過(guò)程:(1)數(shù)據(jù)分組,將存(?。┛罱痤~重新分成五組,五組區(qū)間分布為,少于500元,5002000元,20003500元,35005000元,5000元以上。分組后進(jìn)行頻數(shù)分析并繪制帶正態(tài)曲線(xiàn)的直方圖。(2)利用SPSS的頻數(shù)分析計(jì)算所有樣本的存(?。┛罱痤~的四分位數(shù);然后,按照戶(hù)口類(lèi)型對(duì)數(shù)據(jù)進(jìn)行拆分(Split file)并重新計(jì)算分位數(shù),分別得到城鎮(zhèn)戶(hù)口和農(nóng)村戶(hù)口的存(取)款金額的四分位數(shù)。7/25/2022174.2
11、計(jì)算基本描述統(tǒng)計(jì)量4.2.1 基本描述統(tǒng)計(jì)量 常見(jiàn)的基本描述統(tǒng)計(jì)量有三大類(lèi):刻畫(huà)集中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)離中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)分布形態(tài)的統(tǒng)計(jì)量7/25/2022181、刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量 集中趨勢(shì)是指一組數(shù)據(jù)向某一中心值靠攏的傾向。(1)均值(Mean):即算術(shù)平均數(shù),是反映某變量所有取值的集中趨勢(shì)或平均水平的指標(biāo)。如某企業(yè)職工的平均月收入。其計(jì)算公式為:7/25/202219(2)中位數(shù)(Median):即一組數(shù)據(jù)按升序排序后,處于中間位置上的數(shù)據(jù)值。如評(píng)價(jià)社會(huì)的老齡化程度時(shí),可用中位數(shù)。(3)眾數(shù)(Mode):即一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值。如生產(chǎn)鞋的廠商在制定各種型號(hào)鞋的生產(chǎn)計(jì)劃時(shí)應(yīng)該
12、運(yùn)用眾數(shù)。7/25/202220(4)均值標(biāo)準(zhǔn)誤差(Standard Error of Mean):描述樣本均值與總體均值之間的平均差異程度的統(tǒng)計(jì)量。其計(jì)算公式為: 其中: 為總體標(biāo)準(zhǔn)差,n為樣本單位數(shù)7/25/2022212、刻畫(huà)離散程度的描述統(tǒng)計(jì)量 離散程度是指一組數(shù)據(jù)遠(yuǎn)離其“中心值”的程度。 如果數(shù)據(jù)都緊密地集中在“中心值”的周?chē)?,?shù)據(jù)的離散程度較小,說(shuō)明這個(gè)“中心值”對(duì)數(shù)據(jù)的代表性好;相反,如果數(shù)據(jù)僅是比較松散地分布在“中心值”的周?chē)瑪?shù)據(jù)的離散程度較大,則此“中心值”說(shuō)明數(shù)據(jù)特征是不具有代表性的。7/25/202222常見(jiàn)的刻畫(huà)離散程度的描述統(tǒng)計(jì)量如下:(1)樣本標(biāo)準(zhǔn)差(Standa
13、rd Deviation:Std Dev):表示變量取值距離均值的平均離散程度的統(tǒng)計(jì)量。其計(jì)算公式為: 標(biāo)準(zhǔn)差值越大,說(shuō)明變量值之間的差異越大,距均值這個(gè)“中心值”的離散趨勢(shì)越大。7/25/202223(2)樣本方差(Variance):也是表示變量取值離散程度的統(tǒng)計(jì)量,是樣本標(biāo)準(zhǔn)差的平方。其計(jì)算公式為:(3)全距(Range):也稱(chēng)極差,是數(shù)據(jù)的最大值(Maximum)與最小值(Minimum)之間的絕對(duì)差。7/25/2022243、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量 數(shù)據(jù)的分布形態(tài)主要指數(shù)據(jù)分布是否對(duì)稱(chēng),偏斜程度如何,分布陡峭程度等。 刻畫(huà)分布形態(tài)的統(tǒng)計(jì)量主要有兩種:(1)偏度(Skewness):
14、描述變量取值分布形態(tài)對(duì)稱(chēng)性的統(tǒng)計(jì)量。其計(jì)算公式為:7/25/202225 當(dāng)分布為對(duì)稱(chēng)分布時(shí),正負(fù)總偏差相等,偏度值等于0;當(dāng)分布為不對(duì)稱(chēng)分布時(shí),正負(fù)總偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,為正偏或稱(chēng)右偏;偏度值小于0表示負(fù)偏差值大,為負(fù)偏或稱(chēng)左偏。偏度絕對(duì)值越大,表示數(shù)據(jù)分布形態(tài)的偏斜程度越大。另外,SPSS還計(jì)算偏度標(biāo)準(zhǔn)誤差(S.E.of Skewness)。7/25/202226(2)峰度(Kurtosis):描述變量取值分布形態(tài)陡峭程度的統(tǒng)計(jì)量。其計(jì)算公式為: 當(dāng)數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡峭程度相同時(shí),峰度值等于0;峰度大于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭,
15、為尖峰分布;峰度小于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布平緩,為平峰分布。另外,SPSS還計(jì)算峰度標(biāo)準(zhǔn)誤差(S.E.of Kurtosis)。7/25/2022274.2.2 計(jì)算基本描述統(tǒng)計(jì)量的基本操作(1)選擇菜單AnalyzeDescriptive StatisticsDescriptives,出現(xiàn)如下窗口:7/25/202228(2)將需計(jì)算的數(shù)值型變量選擇到Variable(s)框中。(3)單擊Option按鈕指定計(jì)算哪些基本描述統(tǒng)計(jì)量,出現(xiàn)如下窗口:7/25/202229 在上面窗口中,用戶(hù)可以指定分析多變量時(shí)結(jié)果輸出的次序(Display Order)。其中,Variable list
16、表示按變量在數(shù)據(jù)窗口中從左到右的次序輸出;Alphabetic表示按字母順序輸出;Ascending Means表示按均值升序輸出;Descending Means表示按均值降序輸出。 至此,SPSS便自動(dòng)計(jì)算所選變量的基本描述統(tǒng)計(jì)量并顯示到輸出窗口中。7/25/2022304.2.3 計(jì)算基本描述統(tǒng)計(jì)量的應(yīng)用舉例 利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù),對(duì)一次存(?。┛罱痤~變量計(jì)算基本描述統(tǒng)計(jì)量。有以下分析目標(biāo):計(jì)算存(取)款金額的基本描述統(tǒng)計(jì)量,并分別對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較 分析:首先按照戶(hù)口對(duì)數(shù)據(jù)進(jìn)行拆分(Split file),然后計(jì)算存(?。┛罱痤~的基本描述統(tǒng)計(jì)量。7/25/2022314.3
17、交叉分組下的頻數(shù)分析4.3.1 目的和基本任務(wù) 1、目的:交叉分組下的頻數(shù)分析又稱(chēng)列聯(lián)表分析。通過(guò)前面的頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況,在實(shí)際分析中,不僅要了解單個(gè)變量的分布特征,還要分析多個(gè)變量不同取值下的分布,進(jìn)而分析變量之間的相互影響和關(guān)系。對(duì)于這種涉及兩個(gè)或兩個(gè)以上變量分布情況的研究通常要利用交叉分組下的頻數(shù)分析來(lái)完成。7/25/2022322、基本任務(wù): (1)根據(jù)收集到的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表; (2)在交叉列聯(lián)表的基礎(chǔ)上,對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。4.3.2 交叉列聯(lián)表的主要內(nèi)容 編制交叉列聯(lián)表是交叉分組下頻數(shù)分析的第一個(gè)任務(wù)。交叉列聯(lián)表是兩個(gè)
18、或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。 例:職工基本情況數(shù)據(jù)按職稱(chēng)和文化程度編制的二維交叉列聯(lián)表(見(jiàn)下頁(yè)表):7/25/2022337/25/202234 上表中的職稱(chēng)變量稱(chēng)為行變量(Row),文化程度稱(chēng)為列變量(Column)。行標(biāo)題和列標(biāo)題分別是兩個(gè)變量的變量值(或分組值)。表格中間是觀測(cè)頻數(shù)(Observed Counts)和各種百分比。16名職工中,本科、專(zhuān)科、高中、初中的人數(shù)分別為4,4,5,3,構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的列邊緣分布;高級(jí)工程師、工程師、助理工程師、無(wú)技術(shù)職稱(chēng)的人數(shù)分別為3,4,6,3,構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的行邊緣分布;4個(gè)本科學(xué)歷職工中各職稱(chēng)的人數(shù)分別是1
19、,1,2等,這些頻數(shù)構(gòu)成的分布稱(chēng)為條件分布,即在行變量(列變量)取值條件下的列變量(行變量)的分布。7/25/202235 在交叉列聯(lián)表中,除了頻數(shù)外還引進(jìn)了各種百分比。例如表中第一行中的33.3, 33.3, 33.3分別是高級(jí)工程師3人中各學(xué)歷人數(shù)所占的比例,稱(chēng)為行百分比(Row percentage),一行的百分比總和為100;表第一列中的25.0,25.0,50.0分別是本科學(xué)歷4人中各職稱(chēng)人數(shù)所占的比例,稱(chēng)為列百分比(Column percentage),一列的列百分比總和為100,表中的6.3,6.3,12.5等分別是總?cè)藬?shù)16人中各交叉組中人數(shù)所占的百分比,稱(chēng)為總百分比(Tota
20、l percentage),所有格子中的總百分比之和也為100。7/25/2022364.3.3 交叉列聯(lián)表行列變量間關(guān)系的分析 對(duì)交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是交叉分組下頻數(shù)分析的第二個(gè)任務(wù)。 為了理解行、列變量之間的關(guān)系,可以從分析兩個(gè)極端的例子出發(fā): (1)年齡與工資收入的交叉列聯(lián)表(一)工 資 收 入年齡段低中高青40000中05000老006007/25/202237(2)年齡與工資收入交叉列聯(lián)表(二) 表一中表示年齡與工資收入呈正相關(guān)關(guān)系,表二表示年齡與工資收入呈負(fù)相關(guān)關(guān)系。但大多數(shù)情況下,觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中,不容易直接發(fā)現(xiàn)行列變量之間的關(guān)系強(qiáng)弱程度
21、,此時(shí)就要借助非參數(shù)檢驗(yàn)方法。通常用的方法是卡方檢驗(yàn)和相關(guān)性檢驗(yàn)等。工 資 收 入年齡段低中高青00600中05000老400007/25/202238交叉列聯(lián)表的卡方檢驗(yàn)卡方檢驗(yàn)屬假設(shè)檢驗(yàn)的范疇,步驟如下:(1)建立原假設(shè)( ) 在列聯(lián)表分析中卡方檢驗(yàn)的原假設(shè)為行變量與列變量獨(dú)立(2)選擇和計(jì)算檢驗(yàn)統(tǒng)計(jì)量 列聯(lián)表分析卡方檢驗(yàn)統(tǒng)計(jì)量是Pearson卡方統(tǒng)計(jì)量,其數(shù)學(xué)定義為:7/25/202239 其中,r為列聯(lián)表的行數(shù),c為列聯(lián)表的列數(shù); 為觀察頻數(shù), 為期望頻數(shù)(Expected Count)。期望頻數(shù)的計(jì)算方法是: 其中,RT是指定單元格所在行的觀測(cè)頻數(shù)合計(jì),CT是指定單元格所在列的觀測(cè)頻
22、數(shù)合計(jì),n是觀測(cè)頻數(shù)的合計(jì)。7/25/202240(3)確定顯著性水平(Significant Level)和臨界值 顯著性水平 是指原假設(shè)為真卻將其拒絕的風(fēng)險(xiǎn),即棄真的概率。通常設(shè)為0.05或0.01。在卡方檢驗(yàn)中,由于卡方統(tǒng)計(jì)量服從一個(gè)(行數(shù)1)(列數(shù)1)個(gè)自由度的卡方分布,因此,在行列數(shù)目和顯著性水平確定時(shí),卡方臨界值是可唯一確定的。7/25/202241(4)結(jié)論和決策 對(duì)統(tǒng)計(jì)推斷做決策通常有兩種方式:根據(jù)統(tǒng)計(jì)量觀測(cè)值和臨界值比較的結(jié)果進(jìn)行決策。如果卡方觀測(cè)值大于臨界值,則認(rèn)為實(shí)際分布與期望分布之間的差距顯著,可以拒絕原假設(shè),斷定列聯(lián)表的行列變量間不獨(dú)立,存在相關(guān)關(guān)系;反之,接受原假設(shè)
23、。根據(jù)統(tǒng)計(jì)量觀測(cè)值的概率p值和顯著性水平 比較的結(jié)果進(jìn)行決策。如果p值小于等于 ,則認(rèn)為卡方觀測(cè)值出現(xiàn)的概率是很小的,拒絕原假設(shè),斷定列聯(lián)表的行列變量間不獨(dú)立,存在依存關(guān)系;反之,接受原假設(shè) 這兩種決策方式本質(zhì)上是完全一致的。7/25/2022424.3.4 交叉分組下的頻數(shù)分析的基本操作(1)菜單選項(xiàng)AnalyzeDescriptive StatisticsCrosstabs,出現(xiàn)窗口7/25/202243(2)如果進(jìn)行二維列聯(lián)表分析,則將行變量選擇到Row(s)框中,將列變量選擇到Column(s)框中。如果Row(s) 和Column(s)框中有多個(gè)變量名,SPSS會(huì)將行列變量一一配對(duì)后
24、產(chǎn)生多張二維列聯(lián)表。如果進(jìn)行三維或多維列聯(lián)表分析,則將其他變量作為控制變量選到Layer框中。多控制變量間可以是同層次的,也可以是逐層疊加的,可通過(guò)Previous或Next按鈕確定控制變量間的層次關(guān)系。7/25/202244(3)選擇Display clustered bar charts選項(xiàng),指定繪制各變量交叉分組下頻數(shù)分布柱形圖。Suppress tables表示不輸出列聯(lián)表,在僅分析行列變量間關(guān)系時(shí)可選擇該選項(xiàng)。(4)單擊Cells按鈕指定列聯(lián)表單元格中的輸出內(nèi)容,窗口如下:7/25/202245 SPSS默認(rèn)列聯(lián)表單元格中只輸出觀測(cè)頻數(shù)(Observed)。為便于分析,通常還應(yīng)指定輸
25、出Percentage框中的行百分比(Row)、列百分比(Column)、總百分比(Total)。Counts框中的Expected表示輸出期望頻數(shù);Residuals框中的各個(gè)選項(xiàng)表示在各個(gè)單元格中輸出剩余。其中,Unstandardized為非標(biāo)準(zhǔn)化剩余,定義為觀測(cè)頻數(shù)期望頻數(shù);Standardized為標(biāo)準(zhǔn)化剩余,又稱(chēng)Pearson剩余,定義為:7/25/202246(5)單擊Format按鈕指定列聯(lián)表各單元格的輸出排列順序。Ascending表示以行變量取值的升序排列,是SPSS默認(rèn)項(xiàng);Descending表示以行變量取值的降序排列。(6)單擊Statistics按鈕指定用哪種方法分析
26、行變量和列變量間的關(guān)系,窗口如下,其中,Chi-Square為卡方檢驗(yàn)。7/25/2022474.3.5 SPSS中列聯(lián)表分析的其他方法 對(duì)列聯(lián)表中行列變量的分析,除上述卡方檢驗(yàn)方法之外,SPSS還提供了其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法,方法選擇窗口見(jiàn)上面Statistics窗口,包括:適用于兩定類(lèi)變量的方法:Nominal框中列出的方法屬該類(lèi)方法。適用于兩定序變量的方法:Ordinal框中列出的方法屬該類(lèi)方法。適用于一定類(lèi)變量、一定距變量的方法:Nominal by interval框中的Eta方法屬該類(lèi)方法。其他方法。7/25/2022484.3.6 交叉分組下的頻數(shù)分析應(yīng)用舉例 利用居民
27、儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析,實(shí)現(xiàn)以下目標(biāo): 分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶(hù)對(duì)“未來(lái)兩年內(nèi)收入狀況的變化趨勢(shì)”是否持相同的態(tài)度。 分析:該問(wèn)題列聯(lián)表的行變量為戶(hù)口,列變量為未來(lái)收入狀況,在列聯(lián)表中輸出各種百分比、期望頻數(shù)、剩余、標(biāo)準(zhǔn)化剩余,顯示各交叉分組下頻數(shù)分布柱形圖,并利用卡方檢驗(yàn)方法,對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶(hù)對(duì)該問(wèn)題的態(tài)度是否一致進(jìn)行分析。7/25/2022494.4 比率分析4.4.1 比率分析的目的和主要指標(biāo) 比率分析用于對(duì)兩變量間變量值比率變化的描述分析,適用于定距型變量。 例如根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù),分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況。7/25/202250 通常的
28、分析可以生成各個(gè)地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量,然后對(duì)該比率變量計(jì)算基本描述統(tǒng)計(jì)量(如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等),進(jìn)而刻畫(huà)比率變量的集中趨勢(shì)和離散程度。 SPSS的比率分析除能夠完成上述分析外,還提供了其他相對(duì)比描述指標(biāo),大致也屬于集中趨勢(shì)描述指標(biāo)和離散程度描述指標(biāo)的范疇,具體包括:7/25/202251(1)加權(quán)比率均值(Weighted mean):兩變量均值的比,屬集中趨勢(shì)描述指標(biāo)。(2)AAD(Average Absolute Deviation)平均絕對(duì)離差:是對(duì)比率變量離散程度的描述,計(jì)算公式為: 其中, 是比率數(shù),M是比率變量的中位數(shù),N為樣本數(shù)7/2
29、5/202252(3)COD(Coefficient of Dispersion)離散系數(shù):也是對(duì)比率變量離散程度的描述,計(jì)算公式為:(4)PRD(Price-related Differential)相關(guān)價(jià)格微分:是比率均值與加權(quán)比率均值的比,也是比率變量離散程度的描述。7/25/202253(5)COV變異系數(shù):用于對(duì)比率變量離散程度的描述,分為基于均值的變異系數(shù)(Mean centered COV)和中位數(shù)的變異系數(shù)(Median centered COV )。前者是通常意義下的變異系數(shù),是標(biāo)準(zhǔn)差除以均值;后者定義為:7/25/2022544.4.2 比率分析的基本步驟(1)選擇菜單An
30、alyzeDescriptive StatisticsRadio,出現(xiàn)窗口7/25/202255(2)將比率變量的分子選擇到Numerator框中,將比率變量的分母選到Denominator框中。(3)如果做不同組間的比率比較,則將分組變量選擇到Group Variable框中。(4)單擊Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量,出現(xiàn)如下窗口:7/25/202256 至此,SPSS將自動(dòng)計(jì)算比率變量,并將相關(guān)指標(biāo)輸出到輸出窗口中。7/25/2022574.4.3 比率分析的應(yīng)用舉例 根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù),分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例
31、情況,可以采用SPSS的比率分析來(lái)實(shí)現(xiàn)。7/25/2022584.5 多選項(xiàng)分析4.5.1 多選項(xiàng)分析的目的 SPSS中的多選項(xiàng)分析是針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的。例如,居民儲(chǔ)蓄調(diào)查的問(wèn)卷中有一個(gè)問(wèn)題是“本次存(?。┛畹哪康摹?,并列出了十一種目的供被調(diào)查者選擇,對(duì)該問(wèn)題顯然會(huì)有一個(gè)以上的答案。這類(lèi)問(wèn)題就屬于多選項(xiàng)問(wèn)題。7/25/202259 對(duì)多選項(xiàng)問(wèn)題的分析一般包括以下兩步:(1)將多選項(xiàng)問(wèn)題分解 (2)利用前面講到的頻數(shù)分析或交叉分組下的頻數(shù)分析等方法進(jìn)行分析。4.5.2 多選項(xiàng)問(wèn)題的分解 1、多選項(xiàng)二分法(Multiple Dichotomies Method) 將多選項(xiàng)問(wèn)題中的每個(gè)答案
32、設(shè)為一個(gè)SPSS變量,每個(gè)變量只有0或1兩個(gè)取值,分別表示選擇了該答案和不選擇該答案。7/25/202260 2、多選項(xiàng)分類(lèi)法(Multiple Category Method) 首先估計(jì)多選項(xiàng)問(wèn)題最多可能出現(xiàn)的答案?jìng)€(gè)數(shù),然后為每個(gè)答案設(shè)置為一個(gè)SPSS變量,變量取值為多選項(xiàng)問(wèn)題中的可選答案。 例如,居民儲(chǔ)蓄調(diào)查中的存(?。┛钅康奈覀?cè)O(shè)置了目的一、目的二、目的三三個(gè)變量,每個(gè)變量取值都是一種情況。7/25/2022614.5.3 多選項(xiàng)分析的基本操作 1、多選項(xiàng)分析的基本思路 第一,按多選項(xiàng)二分法或多選項(xiàng)分類(lèi)法將多選項(xiàng)問(wèn)題分解成若干問(wèn)題,并設(shè)置若干個(gè)SPSS變量。 第二,采用多選項(xiàng)頻數(shù)分析或多
33、選項(xiàng)交叉分組下的頻數(shù)分析數(shù)據(jù)。 第一步已經(jīng)介紹過(guò)了,下面介紹第二步。7/25/202262 2、定義多選項(xiàng)變量集(1)選擇菜單AnalyzeMultiple ResponseDefine Sets;(2)從數(shù)值型變量中將進(jìn)入多選項(xiàng)變量集的變量選擇到Variables in Sets框中;(3)在Variables Are Coded As框中指定多選項(xiàng)變量集中是按照哪種方法分解的。Dichotomies表示以多選項(xiàng)二分法分解,并在Counted Value中輸入對(duì)哪組值進(jìn)行分析;Categories表示以多選項(xiàng)分類(lèi)法分解,并在Range框和through框中輸入變量取值的最小值和最大值。7/25/202263(4)為多選項(xiàng)變量集命名,系統(tǒng)會(huì)自動(dòng)在該名字前加字符$;(5)單擊Add按鈕將定義好的多選項(xiàng)變量集加到Mult Response Sets框中。SPSS可以定義多個(gè)多選項(xiàng)變量集。 3、多選項(xiàng)頻數(shù)分析的基本操
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 培訓(xùn)課件設(shè)計(jì)
- 基本邏輯電路培訓(xùn)課件
- 音樂(lè)一課的教學(xué)設(shè)計(jì)
- 基于“綠色何以成為發(fā)展底色”總議題的初中道德與法治九年級(jí)上冊(cè)《共筑生命家園》教學(xué)設(shè)計(jì)
- 九年級(jí)英語(yǔ)Unit 10 Section B 讀寫(xiě)整合教學(xué)設(shè)計(jì)
- 基于深度學(xué)習(xí)與素養(yǎng)導(dǎo)向的初中英語(yǔ)閱讀課教學(xué)設(shè)計(jì)-以“Life is full of the unexpected.”為例
- 中醫(yī)康復(fù)護(hù)理技術(shù)
- 小學(xué)生通過(guò)地理模型探究城市交通擁堵治理措施的創(chuàng)新性課題報(bào)告教學(xué)研究課題報(bào)告
- 初中生物重金屬污染對(duì)光合作用抑制的定量影響因素分析教學(xué)研究課題報(bào)告
- 2025安徽蕪湖市鳩江中小企業(yè)融資擔(dān)保有限公司招聘業(yè)務(wù)經(jīng)理筆試筆試歷年參考題庫(kù)附帶答案詳解
- 2025年司法鑒定人資格考試歷年真題試題及答案
- 江蘇省連云港市2024-2025學(xué)年第一學(xué)期期末調(diào)研考試高二歷史試題
- 生成式人工智能與初中歷史校本教研模式的融合與創(chuàng)新教學(xué)研究課題報(bào)告
- 2025年湖北煙草專(zhuān)賣(mài)局筆試試題及答案
- 2026年開(kāi)工第一課復(fù)工復(fù)產(chǎn)安全專(zhuān)題培訓(xùn)
- 特殊人群(老人、兒童)安全護(hù)理要點(diǎn)
- 2026年檢察院書(shū)記員面試題及答案
- 《煤礦安全規(guī)程(2025)》防治水部分解讀課件
- 2025至2030中國(guó)新癸酸縮水甘油酯行業(yè)項(xiàng)目調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 2025年保安員職業(yè)技能考試筆試試題(100題)含答案
- 尾礦庫(kù)閉庫(kù)綜合治理工程項(xiàng)目可行性研究報(bào)告
評(píng)論
0/150
提交評(píng)論