第四章-SPSS基本統(tǒng)計(jì)分析課件

上傳人：9*** IP屬地：貴州上傳時(shí)間：2022-07-25 格式：PPT 頁(yè)數(shù)：71 大?。?04.51KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩66頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第四章 SPSS基本統(tǒng)計(jì)分析描述性統(tǒng)計(jì)分析7/25/20221SPSS的主要分析工具Analyze菜單描述性統(tǒng)計(jì)分析Descriptive Statistics菜單均數(shù)間的比較Compare Means菜單一般線(xiàn)性模型General Linear Model菜單相關(guān)分析Correlate菜單多元線(xiàn)性回歸與曲線(xiàn)擬合 Regression菜單對(duì)數(shù)線(xiàn)性模型Loglinear菜單聚類(lèi)分析與判別分析Classify菜單因子分析與對(duì)應(yīng)分析Data Reduction菜單信度分析與多維尺度分析Scale菜單非參數(shù)檢驗(yàn)Nonparametric Tests菜單7/25/20222 描述性統(tǒng)計(jì)分析是統(tǒng)計(jì)分析的第

2、一步，做好這第一步是下面進(jìn)行正確統(tǒng)計(jì)推斷的先決條件。SPSS的許多模塊均可完成描述性分析，但專(zhuān)門(mén)為該目的而設(shè)計(jì)的幾個(gè)模塊則集中在Descriptive Statistics菜單中，包括：Frequencies：頻數(shù)分析過(guò)程，特色是產(chǎn)生頻數(shù)表Descriptives：數(shù)據(jù)描述過(guò)程，進(jìn)行一般性的統(tǒng)計(jì)描述Explore：數(shù)據(jù)探察過(guò)程，用于對(duì)數(shù)據(jù)概況不清時(shí)的探索性分析Crosstabs：列聯(lián)表分析過(guò)程Ratio statistics：比率分析7/25/202234.1 頻數(shù)分析4.1.1 頻數(shù)分析的目的和基本任務(wù) 1、目的：基本統(tǒng)計(jì)分析往往從頻數(shù)分析開(kāi)始。通過(guò)頻數(shù)分析能夠了解變量取值的狀況，對(duì)把握數(shù)據(jù)

3、的分布特征是非常有用的。例如：在問(wèn)卷數(shù)據(jù)分析中，通常應(yīng)首先對(duì)本次調(diào)查的被調(diào)查者的狀況，如被訪(fǎng)者的總?cè)藬?shù)、年齡特點(diǎn)、職業(yè)特點(diǎn)、性別特征等進(jìn)行分析和總結(jié)。通過(guò)這些分析，能夠在一定程度上反映樣本是否具有總體代表性，抽樣是否存在系統(tǒng)偏差等，并以此證明以后相關(guān)問(wèn)題分析的代表性和可信性。這些可以通過(guò)頻數(shù)分析來(lái)實(shí)現(xiàn)。7/25/20224 2、基本任務(wù) （1）頻數(shù)分析的第一個(gè)基本任務(wù)是編制頻數(shù)分布表。頻數(shù)（Frequency）：即變量值落在某個(gè)區(qū)間（或某個(gè)類(lèi)別）中的次數(shù)百分比（Percent）：即各頻數(shù)占總樣本數(shù)的百分比有效百分比（Valid Percent）：即各頻數(shù)占有效樣本數(shù)的百分比，這里有效樣本數(shù)總

4、樣本缺失樣本數(shù)累計(jì)百分比（Cumulative Percent）：即各百分比逐級(jí)累加起來(lái)的結(jié)果。最終取值為100。7/25/20225 （2）頻數(shù)分析的第二個(gè)任務(wù)是繪制統(tǒng)計(jì)圖條形圖（Bar Chart）：用寬度相同的條形的高度或長(zhǎng)短來(lái)表示頻數(shù)分布變化的圖形，適用于定序和定類(lèi)變量的分析。餅圖（Pie Chart）：用圓形及圓內(nèi)扇形的面積來(lái)表示頻數(shù)百分比變化的圖形，以利于研究事物內(nèi)在結(jié)構(gòu)組成等問(wèn)題。直方圖（Histograms）：用矩形的面積來(lái)表示頻數(shù)分布變化的圖形，適用于定距型變量的分析。7/25/20226注：變量的尺度：a 定類(lèi) （Category Scale）：只能計(jì)次b 定序（Ordi

5、nal Scale）：計(jì)次、排序c 定距（Interval Scale）：計(jì)次、排序、加減d 定比（Ratio Scale）：計(jì)次、排序、加減、乘除7/25/202274.1.2 頻數(shù)分析的基本操作（1）選擇菜單AnalyzeDescriptive StatisticsFrequencies。（2）將若干頻數(shù)分析變量選擇到Variable(s)框中。（3）單擊Chart按鈕選擇繪制統(tǒng)計(jì)圖形，在Chart Values框中選擇條形圖中縱坐標(biāo)（或餅圖中扇形面積）的含義，其中Frequencies表示頻數(shù)；Percentages表示百分比。至此，SPSS將自動(dòng)編制頻數(shù)分布表并顯示到輸出窗口中。7

6、/25/20228頻數(shù)分析過(guò)程對(duì)話(huà)框統(tǒng)計(jì)量選擇對(duì)話(huà)框 7/25/202294.1.3 SPSS頻數(shù)分析的擴(kuò)展功能 1、計(jì)算分位數(shù)（Percentile Values）分位數(shù)是變量在不同分位點(diǎn)上的取值。分位點(diǎn)在0100之間。一般使用較多的是四分位點(diǎn)（Quartiles），即將所有數(shù)據(jù)按升序排序后平均等分成四份，各分位點(diǎn)依次是25，50，75。于是四分位數(shù)便分別是25，50，75點(diǎn)所對(duì)應(yīng)的變量值。此外，還有八分位數(shù)、十六分位數(shù)等。 SPSS提供了計(jì)算任意分位數(shù)的功能，用戶(hù)可以指定將數(shù)據(jù)等分為n份（Cut points for n equal groups）。還可以直接指定分位點(diǎn)（Percenti

7、le）。7/25/202210 2、計(jì)算其他基本描述統(tǒng)計(jì)量 SPSS頻數(shù)分析還能夠計(jì)算其他基本統(tǒng)計(jì)量，其中包括描述集中趨勢(shì)（Central Tendency）的基本統(tǒng)計(jì)量、描述離散程度（Dispersion）的基本統(tǒng)計(jì)量、描述分布形態(tài)（Distribution）的基本統(tǒng)計(jì)量等。7/25/2022113、頻數(shù)分布表格式（Format）的定義（1）調(diào)整頻數(shù)分布表中數(shù)據(jù)的輸出順序（Order by）頻數(shù)分布表中的內(nèi)容的輸出順序可以按變量值的升序輸出（Ascending values），按變量值的降序輸出（Descending values），按頻數(shù)的升序輸出（ Ascending counts）

8、，按頻數(shù)的降序輸出（ Descending counts）。7/25/202212 （2）壓縮頻數(shù)分布表（Suppress tables with more than n categories）如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)太多，頻數(shù)分布表將很龐大，此時(shí)可以壓縮它。SPSS默認(rèn)，如果變量取值的個(gè)數(shù)或取值區(qū)間的個(gè)數(shù)大于10，則不輸出相應(yīng)的頻數(shù)分布表。應(yīng)用中可以修改該值。7/25/2022134.1.4 頻數(shù)分析的應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行頻數(shù)分析，有以下兩個(gè)分析目標(biāo)：目標(biāo)一：分析儲(chǔ)戶(hù)的戶(hù)口和職業(yè)的基本情況。目標(biāo)二：分析儲(chǔ)戶(hù)一次存（?。┛罱痤~的分布，并對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較。7

9、/25/202214分析：目標(biāo)一：分析儲(chǔ)戶(hù)的戶(hù)口和職業(yè)的基本情況（1）戶(hù)口和職業(yè)兩個(gè)變量都是定類(lèi)型變量，可通過(guò)基本頻數(shù)分析實(shí)現(xiàn)。（2）職業(yè)變量的取值（分類(lèi)）數(shù)目較多，為使頻數(shù)分布表更一目了然，應(yīng)對(duì)內(nèi)容的輸出順序進(jìn)行調(diào)整，單擊Format按鈕，選擇Descending counts按頻數(shù)的降序輸出。（3）單擊Chart按鈕指定輸出戶(hù)口變量的餅圖和職業(yè)變量的條形圖。7/25/202215目標(biāo)二：分析儲(chǔ)戶(hù)一次存（取）款金額的分布，并對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較。1、分析思路：（1）由于存（?。┛罱痤~數(shù)據(jù)為定距型變量，直接采用頻數(shù)分析不利于對(duì)其分布形態(tài)的把握，因此考慮依據(jù)第三章中的數(shù)據(jù)分組功能對(duì)

10、數(shù)據(jù)分組后再編制頻數(shù)分布表。（2）進(jìn)行數(shù)據(jù)拆分，并分別計(jì)算城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)的一次存（?。┛罱痤~的四分位數(shù)，并通過(guò)四分位數(shù)比較兩者分布上的差異。7/25/2022162、分析過(guò)程：（1）數(shù)據(jù)分組，將存（?。┛罱痤~重新分成五組，五組區(qū)間分布為，少于500元，5002000元，20003500元，35005000元，5000元以上。分組后進(jìn)行頻數(shù)分析并繪制帶正態(tài)曲線(xiàn)的直方圖。（2）利用SPSS的頻數(shù)分析計(jì)算所有樣本的存（?。┛罱痤~的四分位數(shù)；然后，按照戶(hù)口類(lèi)型對(duì)數(shù)據(jù)進(jìn)行拆分（Split file）并重新計(jì)算分位數(shù)，分別得到城鎮(zhèn)戶(hù)口和農(nóng)村戶(hù)口的存（取）款金額的四分位數(shù)。7/25/2022174.2

11、計(jì)算基本描述統(tǒng)計(jì)量4.2.1 基本描述統(tǒng)計(jì)量常見(jiàn)的基本描述統(tǒng)計(jì)量有三大類(lèi)：刻畫(huà)集中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)離中趨勢(shì)的統(tǒng)計(jì)量刻畫(huà)分布形態(tài)的統(tǒng)計(jì)量7/25/2022181、刻畫(huà)集中趨勢(shì)的描述統(tǒng)計(jì)量集中趨勢(shì)是指一組數(shù)據(jù)向某一中心值靠攏的傾向。（1）均值（Mean）：即算術(shù)平均數(shù)，是反映某變量所有取值的集中趨勢(shì)或平均水平的指標(biāo)。如某企業(yè)職工的平均月收入。其計(jì)算公式為：7/25/202219（2）中位數(shù)（Median）：即一組數(shù)據(jù)按升序排序后，處于中間位置上的數(shù)據(jù)值。如評(píng)價(jià)社會(huì)的老齡化程度時(shí)，可用中位數(shù)。（3）眾數(shù)（Mode）：即一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù)據(jù)值。如生產(chǎn)鞋的廠商在制定各種型號(hào)鞋的生產(chǎn)計(jì)劃時(shí)應(yīng)該

12、運(yùn)用眾數(shù)。7/25/202220（4）均值標(biāo)準(zhǔn)誤差（Standard Error of Mean）：描述樣本均值與總體均值之間的平均差異程度的統(tǒng)計(jì)量。其計(jì)算公式為：其中：為總體標(biāo)準(zhǔn)差，n為樣本單位數(shù)7/25/2022212、刻畫(huà)離散程度的描述統(tǒng)計(jì)量離散程度是指一組數(shù)據(jù)遠(yuǎn)離其“中心值”的程度。如果數(shù)據(jù)都緊密地集中在“中心值”的周?chē)?，?shù)據(jù)的離散程度較小，說(shuō)明這個(gè)“中心值”對(duì)數(shù)據(jù)的代表性好；相反，如果數(shù)據(jù)僅是比較松散地分布在“中心值”的周?chē)瑪?shù)據(jù)的離散程度較大，則此“中心值”說(shuō)明數(shù)據(jù)特征是不具有代表性的。7/25/202222常見(jiàn)的刻畫(huà)離散程度的描述統(tǒng)計(jì)量如下：（1）樣本標(biāo)準(zhǔn)差（Standa

13、rd Deviation：Std Dev）：表示變量取值距離均值的平均離散程度的統(tǒng)計(jì)量。其計(jì)算公式為：標(biāo)準(zhǔn)差值越大，說(shuō)明變量值之間的差異越大，距均值這個(gè)“中心值”的離散趨勢(shì)越大。7/25/202223（2）樣本方差（Variance）：也是表示變量取值離散程度的統(tǒng)計(jì)量，是樣本標(biāo)準(zhǔn)差的平方。其計(jì)算公式為：（3）全距（Range）：也稱(chēng)極差，是數(shù)據(jù)的最大值（Maximum）與最小值（Minimum）之間的絕對(duì)差。7/25/2022243、刻畫(huà)分布形態(tài)的描述統(tǒng)計(jì)量數(shù)據(jù)的分布形態(tài)主要指數(shù)據(jù)分布是否對(duì)稱(chēng)，偏斜程度如何，分布陡峭程度等。刻畫(huà)分布形態(tài)的統(tǒng)計(jì)量主要有兩種：（1）偏度（Skewness）：

14、描述變量取值分布形態(tài)對(duì)稱(chēng)性的統(tǒng)計(jì)量。其計(jì)算公式為：7/25/202225 當(dāng)分布為對(duì)稱(chēng)分布時(shí)，正負(fù)總偏差相等，偏度值等于0；當(dāng)分布為不對(duì)稱(chēng)分布時(shí)，正負(fù)總偏差不相等，偏度值大于0或小于0。偏度值大于0表示正偏差值大，為正偏或稱(chēng)右偏；偏度值小于0表示負(fù)偏差值大，為負(fù)偏或稱(chēng)左偏。偏度絕對(duì)值越大，表示數(shù)據(jù)分布形態(tài)的偏斜程度越大。另外，SPSS還計(jì)算偏度標(biāo)準(zhǔn)誤差（S.E.of Skewness）。7/25/202226（2）峰度（Kurtosis）：描述變量取值分布形態(tài)陡峭程度的統(tǒng)計(jì)量。其計(jì)算公式為：當(dāng)數(shù)據(jù)分布與標(biāo)準(zhǔn)正態(tài)分布的陡峭程度相同時(shí)，峰度值等于0；峰度大于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布更陡峭，

15、為尖峰分布；峰度小于0表示數(shù)據(jù)的分布比標(biāo)準(zhǔn)正態(tài)分布平緩，為平峰分布。另外，SPSS還計(jì)算峰度標(biāo)準(zhǔn)誤差（S.E.of Kurtosis）。7/25/2022274.2.2 計(jì)算基本描述統(tǒng)計(jì)量的基本操作（1）選擇菜單AnalyzeDescriptive StatisticsDescriptives,出現(xiàn)如下窗口：7/25/202228（2）將需計(jì)算的數(shù)值型變量選擇到Variable(s)框中。（3）單擊Option按鈕指定計(jì)算哪些基本描述統(tǒng)計(jì)量，出現(xiàn)如下窗口：7/25/202229 在上面窗口中，用戶(hù)可以指定分析多變量時(shí)結(jié)果輸出的次序（Display Order）。其中，Variable list

16、表示按變量在數(shù)據(jù)窗口中從左到右的次序輸出；Alphabetic表示按字母順序輸出；Ascending Means表示按均值升序輸出；Descending Means表示按均值降序輸出。至此，SPSS便自動(dòng)計(jì)算所選變量的基本描述統(tǒng)計(jì)量并顯示到輸出窗口中。7/25/2022304.2.3 計(jì)算基本描述統(tǒng)計(jì)量的應(yīng)用舉例利用居民儲(chǔ)蓄調(diào)查數(shù)據(jù)，對(duì)一次存（?。┛罱痤~變量計(jì)算基本描述統(tǒng)計(jì)量。有以下分析目標(biāo)：計(jì)算存（取）款金額的基本描述統(tǒng)計(jì)量，并分別對(duì)城鎮(zhèn)儲(chǔ)戶(hù)和農(nóng)村儲(chǔ)戶(hù)進(jìn)行比較分析：首先按照戶(hù)口對(duì)數(shù)據(jù)進(jìn)行拆分（Split file），然后計(jì)算存（?。┛罱痤~的基本描述統(tǒng)計(jì)量。7/25/2022314.3

17、交叉分組下的頻數(shù)分析4.3.1 目的和基本任務(wù) 1、目的：交叉分組下的頻數(shù)分析又稱(chēng)列聯(lián)表分析。通過(guò)前面的頻數(shù)分析能夠掌握單個(gè)變量的數(shù)據(jù)分布情況，在實(shí)際分析中，不僅要了解單個(gè)變量的分布特征，還要分析多個(gè)變量不同取值下的分布，進(jìn)而分析變量之間的相互影響和關(guān)系。對(duì)于這種涉及兩個(gè)或兩個(gè)以上變量分布情況的研究通常要利用交叉分組下的頻數(shù)分析來(lái)完成。7/25/2022322、基本任務(wù)：（1）根據(jù)收集到的樣本數(shù)據(jù)，產(chǎn)生二維或多維交叉列聯(lián)表；（2）在交叉列聯(lián)表的基礎(chǔ)上，對(duì)兩兩變量間是否存在一定的相關(guān)性進(jìn)行分析。4.3.2 交叉列聯(lián)表的主要內(nèi)容編制交叉列聯(lián)表是交叉分組下頻數(shù)分析的第一個(gè)任務(wù)。交叉列聯(lián)表是兩個(gè)

18、或兩個(gè)以上的變量交叉分組后形成的頻數(shù)分布表。例：職工基本情況數(shù)據(jù)按職稱(chēng)和文化程度編制的二維交叉列聯(lián)表（見(jiàn)下頁(yè)表）：7/25/2022337/25/202234 上表中的職稱(chēng)變量稱(chēng)為行變量（Row），文化程度稱(chēng)為列變量（Column）。行標(biāo)題和列標(biāo)題分別是兩個(gè)變量的變量值（或分組值）。表格中間是觀測(cè)頻數(shù)（Observed Counts）和各種百分比。16名職工中，本科、專(zhuān)科、高中、初中的人數(shù)分別為4，4，5，3，構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的列邊緣分布；高級(jí)工程師、工程師、助理工程師、無(wú)技術(shù)職稱(chēng)的人數(shù)分別為3，4，6，3，構(gòu)成的分布稱(chēng)為交叉列聯(lián)表的行邊緣分布；4個(gè)本科學(xué)歷職工中各職稱(chēng)的人數(shù)分別是1

19、，1，2等，這些頻數(shù)構(gòu)成的分布稱(chēng)為條件分布，即在行變量（列變量）取值條件下的列變量（行變量）的分布。7/25/202235 在交叉列聯(lián)表中，除了頻數(shù)外還引進(jìn)了各種百分比。例如表中第一行中的33.3， 33.3， 33.3分別是高級(jí)工程師3人中各學(xué)歷人數(shù)所占的比例，稱(chēng)為行百分比（Row percentage），一行的百分比總和為100；表第一列中的25.0，25.0，50.0分別是本科學(xué)歷4人中各職稱(chēng)人數(shù)所占的比例，稱(chēng)為列百分比（Column percentage），一列的列百分比總和為100，表中的6.3，6.3，12.5等分別是總?cè)藬?shù)16人中各交叉組中人數(shù)所占的百分比，稱(chēng)為總百分比（Tota

20、l percentage），所有格子中的總百分比之和也為100。7/25/2022364.3.3 交叉列聯(lián)表行列變量間關(guān)系的分析對(duì)交叉列聯(lián)表中的行變量和列變量之間關(guān)系進(jìn)行分析是交叉分組下頻數(shù)分析的第二個(gè)任務(wù)。為了理解行、列變量之間的關(guān)系，可以從分析兩個(gè)極端的例子出發(fā)：（1）年齡與工資收入的交叉列聯(lián)表（一）工資收入年齡段低中高青40000中05000老006007/25/202237（2）年齡與工資收入交叉列聯(lián)表（二）表一中表示年齡與工資收入呈正相關(guān)關(guān)系，表二表示年齡與工資收入呈負(fù)相關(guān)關(guān)系。但大多數(shù)情況下，觀測(cè)頻數(shù)分散在列聯(lián)表的各個(gè)單元格中，不容易直接發(fā)現(xiàn)行列變量之間的關(guān)系強(qiáng)弱程度

21、，此時(shí)就要借助非參數(shù)檢驗(yàn)方法。通常用的方法是卡方檢驗(yàn)和相關(guān)性檢驗(yàn)等。工資收入年齡段低中高青00600中05000老400007/25/202238交叉列聯(lián)表的卡方檢驗(yàn)卡方檢驗(yàn)屬假設(shè)檢驗(yàn)的范疇，步驟如下：（1）建立原假設(shè)（）在列聯(lián)表分析中卡方檢驗(yàn)的原假設(shè)為行變量與列變量獨(dú)立（2）選擇和計(jì)算檢驗(yàn)統(tǒng)計(jì)量列聯(lián)表分析卡方檢驗(yàn)統(tǒng)計(jì)量是Pearson卡方統(tǒng)計(jì)量，其數(shù)學(xué)定義為：7/25/202239 其中，r為列聯(lián)表的行數(shù)，c為列聯(lián)表的列數(shù)；為觀察頻數(shù)，為期望頻數(shù)（Expected Count）。期望頻數(shù)的計(jì)算方法是：其中，RT是指定單元格所在行的觀測(cè)頻數(shù)合計(jì)，CT是指定單元格所在列的觀測(cè)頻

22、數(shù)合計(jì)，n是觀測(cè)頻數(shù)的合計(jì)。7/25/202240（3）確定顯著性水平（Significant Level）和臨界值顯著性水平是指原假設(shè)為真卻將其拒絕的風(fēng)險(xiǎn)，即棄真的概率。通常設(shè)為0.05或0.01。在卡方檢驗(yàn)中，由于卡方統(tǒng)計(jì)量服從一個(gè)（行數(shù)1）（列數(shù)1）個(gè)自由度的卡方分布，因此，在行列數(shù)目和顯著性水平確定時(shí)，卡方臨界值是可唯一確定的。7/25/202241（4）結(jié)論和決策對(duì)統(tǒng)計(jì)推斷做決策通常有兩種方式：根據(jù)統(tǒng)計(jì)量觀測(cè)值和臨界值比較的結(jié)果進(jìn)行決策。如果卡方觀測(cè)值大于臨界值，則認(rèn)為實(shí)際分布與期望分布之間的差距顯著，可以拒絕原假設(shè)，斷定列聯(lián)表的行列變量間不獨(dú)立，存在相關(guān)關(guān)系；反之，接受原假設(shè)

23、。根據(jù)統(tǒng)計(jì)量觀測(cè)值的概率p值和顯著性水平比較的結(jié)果進(jìn)行決策。如果p值小于等于，則認(rèn)為卡方觀測(cè)值出現(xiàn)的概率是很小的，拒絕原假設(shè)，斷定列聯(lián)表的行列變量間不獨(dú)立，存在依存關(guān)系；反之，接受原假設(shè) 這兩種決策方式本質(zhì)上是完全一致的。7/25/2022424.3.4 交叉分組下的頻數(shù)分析的基本操作（1）菜單選項(xiàng)AnalyzeDescriptive StatisticsCrosstabs，出現(xiàn)窗口7/25/202243（2）如果進(jìn)行二維列聯(lián)表分析，則將行變量選擇到Row(s)框中，將列變量選擇到Column(s)框中。如果Row(s) 和Column(s)框中有多個(gè)變量名，SPSS會(huì)將行列變量一一配對(duì)后

24、產(chǎn)生多張二維列聯(lián)表。如果進(jìn)行三維或多維列聯(lián)表分析，則將其他變量作為控制變量選到Layer框中。多控制變量間可以是同層次的，也可以是逐層疊加的，可通過(guò)Previous或Next按鈕確定控制變量間的層次關(guān)系。7/25/202244（3）選擇Display clustered bar charts選項(xiàng)，指定繪制各變量交叉分組下頻數(shù)分布柱形圖。Suppress tables表示不輸出列聯(lián)表，在僅分析行列變量間關(guān)系時(shí)可選擇該選項(xiàng)。（4）單擊Cells按鈕指定列聯(lián)表單元格中的輸出內(nèi)容，窗口如下：7/25/202245 SPSS默認(rèn)列聯(lián)表單元格中只輸出觀測(cè)頻數(shù)（Observed）。為便于分析，通常還應(yīng)指定輸

25、出Percentage框中的行百分比（Row）、列百分比（Column）、總百分比（Total）。Counts框中的Expected表示輸出期望頻數(shù)；Residuals框中的各個(gè)選項(xiàng)表示在各個(gè)單元格中輸出剩余。其中，Unstandardized為非標(biāo)準(zhǔn)化剩余，定義為觀測(cè)頻數(shù)期望頻數(shù)；Standardized為標(biāo)準(zhǔn)化剩余，又稱(chēng)Pearson剩余，定義為：7/25/202246（5）單擊Format按鈕指定列聯(lián)表各單元格的輸出排列順序。Ascending表示以行變量取值的升序排列，是SPSS默認(rèn)項(xiàng)；Descending表示以行變量取值的降序排列。（6）單擊Statistics按鈕指定用哪種方法分析

26、行變量和列變量間的關(guān)系，窗口如下，其中，Chi-Square為卡方檢驗(yàn)。7/25/2022474.3.5 SPSS中列聯(lián)表分析的其他方法對(duì)列聯(lián)表中行列變量的分析，除上述卡方檢驗(yàn)方法之外，SPSS還提供了其他測(cè)度變量間相關(guān)關(guān)系的檢驗(yàn)方法，方法選擇窗口見(jiàn)上面Statistics窗口，包括：適用于兩定類(lèi)變量的方法：Nominal框中列出的方法屬該類(lèi)方法。適用于兩定序變量的方法：Ordinal框中列出的方法屬該類(lèi)方法。適用于一定類(lèi)變量、一定距變量的方法：Nominal by interval框中的Eta方法屬該類(lèi)方法。其他方法。7/25/2022484.3.6 交叉分組下的頻數(shù)分析應(yīng)用舉例利用居民

27、儲(chǔ)蓄調(diào)查數(shù)據(jù)進(jìn)行分析，實(shí)現(xiàn)以下目標(biāo)：分析城鎮(zhèn)和農(nóng)村儲(chǔ)戶(hù)對(duì)“未來(lái)兩年內(nèi)收入狀況的變化趨勢(shì)”是否持相同的態(tài)度。分析：該問(wèn)題列聯(lián)表的行變量為戶(hù)口，列變量為未來(lái)收入狀況，在列聯(lián)表中輸出各種百分比、期望頻數(shù)、剩余、標(biāo)準(zhǔn)化剩余，顯示各交叉分組下頻數(shù)分布柱形圖，并利用卡方檢驗(yàn)方法，對(duì)城鎮(zhèn)和農(nóng)村儲(chǔ)戶(hù)對(duì)該問(wèn)題的態(tài)度是否一致進(jìn)行分析。7/25/2022494.4 比率分析4.4.1 比率分析的目的和主要指標(biāo) 比率分析用于對(duì)兩變量間變量值比率變化的描述分析，適用于定距型變量。例如根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù)，分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例情況。7/25/202250 通常的

28、分析可以生成各個(gè)地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比率變量，然后對(duì)該比率變量計(jì)算基本描述統(tǒng)計(jì)量（如均值、中位數(shù)、標(biāo)準(zhǔn)差、全距等），進(jìn)而刻畫(huà)比率變量的集中趨勢(shì)和離散程度。 SPSS的比率分析除能夠完成上述分析外，還提供了其他相對(duì)比描述指標(biāo)，大致也屬于集中趨勢(shì)描述指標(biāo)和離散程度描述指標(biāo)的范疇，具體包括：7/25/202251（1）加權(quán)比率均值（Weighted mean）：兩變量均值的比，屬集中趨勢(shì)描述指標(biāo)。（2）AAD（Average Absolute Deviation）平均絕對(duì)離差：是對(duì)比率變量離散程度的描述，計(jì)算公式為：其中，是比率數(shù)，M是比率變量的中位數(shù)，N為樣本數(shù)7/2

29、5/202252（3）COD（Coefficient of Dispersion）離散系數(shù)：也是對(duì)比率變量離散程度的描述，計(jì)算公式為：（4）PRD（Price-related Differential）相關(guān)價(jià)格微分：是比率均值與加權(quán)比率均值的比，也是比率變量離散程度的描述。7/25/202253（5）COV變異系數(shù)：用于對(duì)比率變量離散程度的描述，分為基于均值的變異系數(shù)（Mean centered COV）和中位數(shù)的變異系數(shù)（Median centered COV ）。前者是通常意義下的變異系數(shù)，是標(biāo)準(zhǔn)差除以均值；后者定義為：7/25/2022544.4.2 比率分析的基本步驟（1）選擇菜單An

30、alyzeDescriptive StatisticsRadio，出現(xiàn)窗口7/25/202255（2）將比率變量的分子選擇到Numerator框中，將比率變量的分母選到Denominator框中。（3）如果做不同組間的比率比較，則將分組變量選擇到Group Variable框中。（4）單擊Statistics按鈕指定輸出哪些關(guān)于比率的描述統(tǒng)計(jì)量，出現(xiàn)如下窗口：7/25/202256 至此，SPSS將自動(dòng)計(jì)算比率變量，并將相關(guān)指標(biāo)輸出到輸出窗口中。7/25/2022574.4.3 比率分析的應(yīng)用舉例根據(jù)1999年各地區(qū)保險(xiǎn)業(yè)務(wù)情況的數(shù)據(jù)，分析各地區(qū)財(cái)產(chǎn)保險(xiǎn)業(yè)務(wù)的保費(fèi)收入占全部業(yè)務(wù)保費(fèi)收入的比例

31、情況，可以采用SPSS的比率分析來(lái)實(shí)現(xiàn)。7/25/2022584.5 多選項(xiàng)分析4.5.1 多選項(xiàng)分析的目的 SPSS中的多選項(xiàng)分析是針對(duì)問(wèn)卷調(diào)查中的多選項(xiàng)問(wèn)題的。例如，居民儲(chǔ)蓄調(diào)查的問(wèn)卷中有一個(gè)問(wèn)題是“本次存（?。┛畹哪康摹?，并列出了十一種目的供被調(diào)查者選擇，對(duì)該問(wèn)題顯然會(huì)有一個(gè)以上的答案。這類(lèi)問(wèn)題就屬于多選項(xiàng)問(wèn)題。7/25/202259 對(duì)多選項(xiàng)問(wèn)題的分析一般包括以下兩步：（1）將多選項(xiàng)問(wèn)題分解（2）利用前面講到的頻數(shù)分析或交叉分組下的頻數(shù)分析等方法進(jìn)行分析。4.5.2 多選項(xiàng)問(wèn)題的分解 1、多選項(xiàng)二分法（Multiple Dichotomies Method）將多選項(xiàng)問(wèn)題中的每個(gè)答案

32、設(shè)為一個(gè)SPSS變量，每個(gè)變量只有0或1兩個(gè)取值，分別表示選擇了該答案和不選擇該答案。7/25/202260 2、多選項(xiàng)分類(lèi)法（Multiple Category Method）首先估計(jì)多選項(xiàng)問(wèn)題最多可能出現(xiàn)的答案?jìng)€(gè)數(shù)，然后為每個(gè)答案設(shè)置為一個(gè)SPSS變量，變量取值為多選項(xiàng)問(wèn)題中的可選答案。例如，居民儲(chǔ)蓄調(diào)查中的存（?。┛钅康奈覀?cè)O(shè)置了目的一、目的二、目的三三個(gè)變量，每個(gè)變量取值都是一種情況。7/25/2022614.5.3 多選項(xiàng)分析的基本操作 1、多選項(xiàng)分析的基本思路第一，按多選項(xiàng)二分法或多選項(xiàng)分類(lèi)法將多選項(xiàng)問(wèn)題分解成若干問(wèn)題，并設(shè)置若干個(gè)SPSS變量。第二，采用多選項(xiàng)頻數(shù)分析或多

33、選項(xiàng)交叉分組下的頻數(shù)分析數(shù)據(jù)。第一步已經(jīng)介紹過(guò)了，下面介紹第二步。7/25/202262 2、定義多選項(xiàng)變量集（1）選擇菜單AnalyzeMultiple ResponseDefine Sets；（2）從數(shù)值型變量中將進(jìn)入多選項(xiàng)變量集的變量選擇到Variables in Sets框中；（3）在Variables Are Coded As框中指定多選項(xiàng)變量集中是按照哪種方法分解的。Dichotomies表示以多選項(xiàng)二分法分解，并在Counted Value中輸入對(duì)哪組值進(jìn)行分析；Categories表示以多選項(xiàng)分類(lèi)法分解，并在Range框和through框中輸入變量取值的最小值和最大值。7/25/202263（4）為多選項(xiàng)變量集命名，系統(tǒng)會(huì)自動(dòng)在該名字前加字符$；（5）單擊Add按鈕將定義好的多選項(xiàng)變量集加到Mult Response Sets框中。SPSS可以定義多個(gè)多選項(xiàng)變量集。 3、多選項(xiàng)頻數(shù)分析的基本操

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第四章-SPSS基本統(tǒng)計(jì)分析課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第四章-SPSS基本統(tǒng)計(jì)分析課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔