spss簡(jiǎn)介和基本操作.ppt_第1頁
spss簡(jiǎn)介和基本操作.ppt_第2頁
spss簡(jiǎn)介和基本操作.ppt_第3頁
spss簡(jiǎn)介和基本操作.ppt_第4頁
spss簡(jiǎn)介和基本操作.ppt_第5頁
已閱讀5頁,還剩103頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS應(yīng)用1:基本知識(shí),1. SPSS簡(jiǎn)介2. SPSS菜單命令3. SPSS數(shù)據(jù)文件的建立:變量定義及數(shù)據(jù)錄入4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,SPSS的基本知識(shí),1. SPSS簡(jiǎn)介,SPSS是世界著名的統(tǒng)計(jì)分析軟件之一。經(jīng)近40余年的發(fā)展,在全球已擁有大量的用戶。目前,SPSS使用Windows的窗口方式展示各種管理和分析數(shù)據(jù)的方法,可方便地用于特定的科研統(tǒng)計(jì)。概要介紹SPSS的發(fā)展、主要版本、運(yùn)行方式、啟動(dòng)與退出以及幫助系統(tǒng)的使用。,1.1 SPSS的發(fā)展,1968年,3位美國(guó)斯坦福大學(xué)的學(xué)生開發(fā)了最早的SPSS系統(tǒng),并基于這一系統(tǒng)于1975年在芝加哥合伙成立了SPSS公司。

2、SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計(jì)分析、圖表分析、輸出管理等。 SPSS最初名為社會(huì)學(xué)統(tǒng)計(jì)軟件包(Solutions Statistical Package for the Social Sciences),這是為了強(qiáng)調(diào)其社會(huì)科學(xué)應(yīng)用的一面(因?yàn)樯鐣?huì)科學(xué)研究中的許多現(xiàn)象都是隨機(jī)的,要使用統(tǒng)計(jì)學(xué)和概率論的定理來進(jìn)行研究)。 但是隨著SPSS產(chǎn)品服務(wù)領(lǐng)域的擴(kuò)大和服務(wù)深度的增加,SPSS公司已于2000年正式將英文全稱更改為“統(tǒng)計(jì)產(chǎn)品與服務(wù)解決方案” (Statistical Product and Service Solutions)。,1.2 SPSS的版本,到目前為止,SPSS已成為適合于D

3、OS,Windows,UNIX,Macintosh及OS/2等多種操作系統(tǒng)使用的產(chǎn)品,國(guó)內(nèi)常用的是其適用于DOS和Windows的版本。 SPSS for DOS通常稱為SPSS/PC+,現(xiàn)已較少使用。 2009年4月9日 美國(guó)芝加哥SPSS公司宣布重新包裝旗下的SPSS產(chǎn)品線,定位為預(yù)測(cè)統(tǒng)計(jì)分析軟件(Predictive Analytics Software) PASW,IBM于2009年7月28日宣布以12億美元收購(gòu)SPSS公司,SPSS正式成為IBM Information Management產(chǎn)品線下品牌。 2010年:隨著SPSS公司被IBM公司并購(gòu),各子產(chǎn)品家族名稱前面不再以PAS

4、W為名,修改為統(tǒng)一加上IBM SPSS字樣。,1.2 SPSS的版本,SPSS版本升級(jí)在近幾年非常快,目前市場(chǎng)上已出現(xiàn)IBM SPSS Statistics 21.0。 spss17.0版本占用空間小且運(yùn)行快,非常適合使用。 PASW 18.0具有過度性, IBM SPSS Statistics 19.0在最新教材中開始使用。19.0是多國(guó)語言版。 SPSS的系列產(chǎn)品有 SPSS Statistics (統(tǒng)計(jì)分析軟件),SPSS Collection(數(shù)據(jù)收集產(chǎn)品),SPSS Modeler(數(shù)據(jù)挖掘產(chǎn)品)等。SPSS功能強(qiáng)大,在國(guó)際學(xué)術(shù)界有條不成文的規(guī)定,即在國(guó)際學(xué)術(shù)交流中,凡是使用SPSS

5、完成的計(jì)算和統(tǒng)計(jì)分析,可以不說明算法,可見該軟件的影響之大和信譽(yù)之高。,1.3 SPSS的運(yùn)行方式,SPSS主要有3種運(yùn)行方式: 完全窗口菜單運(yùn)行方式:錄入數(shù)據(jù)后,大部分操作和統(tǒng)計(jì)方法的實(shí)現(xiàn)都是通過菜單、圖標(biāo)和對(duì)話框來完成 批處理方式和程序運(yùn)行方式是從使用者的特殊的分析需求出發(fā),編寫SPSS命令程序,通過語句直接運(yùn)行的。,圖1-1 命令(Syntax)窗口/語法窗口,1.4.1 安裝與啟動(dòng)SPSS,1.4 SPSS的啟動(dòng)、主界面和退出,SPSS安裝完畢后,系統(tǒng)會(huì)自動(dòng)在Windows菜單中創(chuàng)建快捷方式。,1.4.2 SPSS的數(shù)據(jù)編輯窗口,SPSS主界面主要有兩個(gè),一個(gè)是SPSS數(shù)據(jù)編輯窗口,另

6、一個(gè)是SPSS輸出窗口。 數(shù)據(jù)編輯窗口由標(biāo)題欄、菜單欄、工具欄、編輯欄、變量名欄、內(nèi)容區(qū)、窗口切換標(biāo)簽頁和狀態(tài)欄組成,如圖1-2所示。,圖1-2 數(shù)據(jù)編輯窗口,標(biāo)題欄,菜單欄,編輯欄,變量名欄,內(nèi)容區(qū),窗口切,換標(biāo)簽,頁,狀態(tài)欄,工具攔,該窗口下方有兩個(gè)標(biāo)簽:“Data View”(數(shù)據(jù)視圖)和“Variable View”(變量視圖)。 如果使用過電子表格,如Microsoft Excel等,那么數(shù)據(jù)編輯窗口中“Data View”所對(duì)應(yīng)表格許多功能應(yīng)該已經(jīng)熟悉。但是它和一般的電子表格處理軟件還有以下區(qū)別。,(1)一個(gè)列對(duì)應(yīng)一個(gè)變量,即每一列代表一個(gè)變量(Variable)或一個(gè)被觀測(cè)量的特

7、征。例如問卷上的每一項(xiàng)就是一個(gè)變量。 (2)行是觀測(cè),即每一行代表一個(gè)個(gè)體、一個(gè)觀測(cè)、一個(gè)樣品,在SPSS中稱為事件/個(gè)案(Case)。例如,問卷上的每一個(gè)人就是一個(gè)觀測(cè)。,(3)單元包含值,即每個(gè)單元包括一個(gè)觀測(cè)中的單個(gè)變量值。單元(Cell)是觀測(cè)和變量的交叉。 (4)數(shù)據(jù)文件是一張長(zhǎng)方形的二維表。數(shù)據(jù)文件的范圍是由觀測(cè)和變量的數(shù)目決定的??梢栽谌我粏卧休斎霐?shù)據(jù)。如果在定義好的數(shù)據(jù)文件邊界以外鍵入數(shù)據(jù),SPSS將數(shù)據(jù)長(zhǎng)方形延長(zhǎng)到可包括那個(gè)單元和文件邊界之間的任何行和列。,1.4.3 SPSS結(jié)果輸出窗口,SPSS結(jié)果輸出窗口名為Viewer,它是顯示和管理SPSS統(tǒng)計(jì)分析結(jié)果、報(bào)表及圖形

8、的窗口??梢詫⒋舜翱谥械膬?nèi)容以結(jié)果文件.spv的形式保存。,結(jié)果輸出部分分成左右兩個(gè)部分,左邊部分是索引輸出區(qū),用于顯示已有的分析結(jié)果標(biāo)題和內(nèi)容索引;右邊部分是各個(gè)分析的具體結(jié)果,稱為詳解輸出區(qū)。這和Word的文檔結(jié)構(gòu)視圖十分類似。編輯輸出的表格時(shí),可以雙擊在輸出窗口中顯示,也可以在點(diǎn)“透視透視托盤”在新的窗口顯示。編輯圖形可以雙擊或者點(diǎn)右鍵選擇,1.4.4 退出SPSS,選擇數(shù)據(jù)編輯窗口的“File”菜單中的“Exit”命令,或單擊標(biāo)題欄上的“關(guān)閉”按鈕退出SPSS。,1.4.5 有關(guān)統(tǒng)計(jì)方法指導(dǎo),SPSS對(duì)一些基本模塊中的統(tǒng)計(jì)提供了Statistics Coach幫助,也就是“手把手”式的

9、指導(dǎo),2. SPSS菜單命令,2.1 基本菜單欄,SPSS中英文界面的轉(zhuǎn)換,當(dāng)首次安裝軟件時(shí),SPSS界面為英文顯示,此時(shí)可以采用如下方法將其轉(zhuǎn)換為中文界面。 1. 選擇菜單欄中的【Edit(編輯)】菜單中的【Option(選項(xiàng))】命令。 2.在彈出的對(duì)話框的【User Interface(用戶界面)】選項(xiàng)卡的【Language(語言)】選項(xiàng)組中點(diǎn)選【Simplified Chinese(簡(jiǎn)體中文)】單選鈕,表示選定軟件中文界面顯示。 3.最后單擊【OK(確定)】按鈕,表示SPSS軟件的界面語言轉(zhuǎn)換過程結(jié)束。 如果需要從中文界面轉(zhuǎn)換為英文界面,也可按照上述操作來實(shí)現(xiàn)。,3. SPSS的數(shù)據(jù)文件

10、建立變量定義及數(shù)據(jù)錄入,3.1 變量的定義 3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件 3.3 變量及數(shù)據(jù)顯示的相關(guān)設(shè)置,3. SPSS的變量定義及數(shù)據(jù)錄入,1.SPSS數(shù)據(jù)的屬性及其定義方法,一個(gè)完整的SPSS數(shù)據(jù)結(jié)構(gòu)包括: 變量名、變量類型、變量取值的長(zhǎng)度、變量名標(biāo)簽、變量的小數(shù)點(diǎn)位數(shù)、變量名的標(biāo)簽、變量值的標(biāo)簽、缺失值的定義、變量在數(shù)據(jù)窗口顯示的長(zhǎng)度、變量在數(shù)據(jù)格中的對(duì)齊方式、度量的尺度(變量取值的測(cè)量類型)、角色(定義變量在后繼分析中的功能作用,目標(biāo):輸出變量;分區(qū):劃分樣本),3.1 變量的定義,3.1.1 變量名,首字符必須是字母或漢字,后面可以是除(!、?*)之外的任意字符。 變量名的結(jié)

11、尾不能是圓點(diǎn)、句點(diǎn)、下劃線 變量名的長(zhǎng)度:版本差異 變量名必須唯一,不可以有空格,不區(qū)分大小寫 SPSS的保留字不能作為變量名(ALL、NE、LE、BY、GE、EQ、GT、AND、OR、NOT、WITH等) 如不指定變量名,則系統(tǒng)默認(rèn)變量名以VAR開頭后面跟5個(gè)數(shù)字 為了便于記憶和理解,變量名與其所代表的具體含義最好一致。,3.1.2 變量的類型(Type),數(shù)值型:根據(jù)其功能和形式又可細(xì)分為(標(biāo)準(zhǔn)數(shù)值型、逗號(hào)型、句點(diǎn)型、科學(xué)計(jì)數(shù)型、美元型和自定義貨幣型)默認(rèn)長(zhǎng)度為8,小數(shù)位數(shù)為2 字符串型 日期型 系統(tǒng)默認(rèn)為標(biāo)準(zhǔn)數(shù)值型,(1) 數(shù)值型變量,標(biāo)準(zhǔn)型:是SPSS默認(rèn)的類型,寬度8、小數(shù)點(diǎn)2、小數(shù)

12、點(diǎn)用圓點(diǎn)。 科學(xué)計(jì)數(shù)類型:適合數(shù)值很大或很小的變量,變量顯示為指數(shù)形式。如:-1.28E+002表示-1.28102 逗號(hào)型(comma ):整數(shù)部分從右到左每三位用,分割 圓點(diǎn)型(Dot):整數(shù)部分從右到左每三位用.分割,小數(shù)點(diǎn)用,表示 美元型(Dollar) 自定義貨幣型,(2) 日期型變量(Date),用于表示日期和時(shí)間的變量類型SPSS提供了多達(dá)29種日期型變量的格式.,(3) 字符型變量(String),是非數(shù)值型變量類型,其值是由字符串組成的.對(duì)其定義的對(duì)話框只有一個(gè)輸入項(xiàng),不參與運(yùn)算,且區(qū)分大小寫,(4) 修改數(shù)據(jù)變量的默認(rèn)值,對(duì)于SPSS變量的參數(shù),系統(tǒng)都會(huì)自動(dòng)給出默認(rèn)值.也可

13、通過Edit菜單中的Data對(duì)話框重新設(shè)置,點(diǎn)擊,3.1.3 變量標(biāo)簽(Label),變量名標(biāo)簽(variable label) 對(duì)變量名含義的進(jìn)一步補(bǔ)充說明。,變量值標(biāo)簽(alue Label) 是對(duì)數(shù)值型變量各個(gè)取值的含義給予進(jìn)一步的解釋和說明,3.1.4 變量缺失數(shù)據(jù)(missing value),系統(tǒng)默認(rèn)無缺失值:如當(dāng)前變量測(cè)試值、記錄完全正確、無遺漏,則可用無缺失值。,離散缺失值:如性別0、3、4都是非法的,可分 別填入,點(diǎn)擊,定義缺失值范圍:這種缺失值針對(duì)連續(xù)的變量值。當(dāng)指定某一范圍的值出現(xiàn)在當(dāng)前定義的變量中,則被當(dāng)作缺失值處理。如在性別變量值中輸入了3、4、5、6??梢栽贚OW后

14、面輸入3,HIGHT后面輸入6。注意這個(gè)定義范圍內(nèi)不能有合法值。,”0“就是包括不了的離散值,如果不能明確數(shù)據(jù)中可能存在的缺失值,可以選擇“數(shù)據(jù)定義變量屬性”來確認(rèn)。 SPSS默認(rèn)缺失值用一個(gè)圓點(diǎn)表示,3.1.5 度量標(biāo)準(zhǔn),度量(S):定距 (scale)以上尺度,包括定距和定比尺度,可以表示如溫度、重量等含義的連續(xù)性數(shù)值變量,也可以表示年齡、次數(shù)等離散型變量.還可以表示時(shí)間的日期變量或者貨幣的貨幣型變量,但不能是字符型變量. 序號(hào)(O):定序尺度(ordinal),其值表示一種順序的前后,如職稱變量可分為高中低三個(gè)檔次,可用A(1)、B(2)、C(3)表示,定序型變量可以是數(shù)值型也可以字符型

15、 名義(N):即定類尺度(nominal) ,該變量不存在變量值之間的大小、順序的前后等。只表示屬于的類別。如性別中“1”表示男,“2”表示女等,可以是數(shù)值型也可以字符型,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,SPSS數(shù)據(jù)文件由數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)內(nèi)容構(gòu)成, 結(jié)構(gòu)規(guī)定了數(shù)據(jù)文件的基本構(gòu)成屬性 (變量名、變量類型、變量名標(biāo)簽、變量值標(biāo)簽、缺失值定義、度量尺度及數(shù)據(jù)顯示屬性如寬度列寬度和對(duì)齊方式等) 如一個(gè)班考試成績(jī)表包含姓名、考號(hào)、各科科目成績(jī)(英語、數(shù)學(xué)、政治、專業(yè))等六個(gè)變量。對(duì)每一個(gè)變量定義其屬性,如“姓名”變量定義為字符型、寬度定義為8個(gè)字符,度量尺度為定類型,由于變量含義清楚,無須定義變量標(biāo)簽

16、和變量值標(biāo)簽,缺失值默認(rèn)為0,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,1. 在“變量視圖”窗口定義變量及其變量的屬性 2.在“數(shù)據(jù)視圖” 窗口錄入數(shù)據(jù)文件的內(nèi)容 瀏覽數(shù)據(jù)文件變量名的三種方法 在Variable View視區(qū)中瀏覽 在SPSS菜單中選擇實(shí)用程序Utilities Varibles 在SPSS主界面選擇File Display Date File information,3. 2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,當(dāng)變量的屬性定義完成后就可以開始進(jìn)行數(shù)據(jù)的輸入 切換窗口從Variables View Date View出現(xiàn)了二維的空白表格如Excel(見03 Date1) Enter輸入一

17、列相同參數(shù) Tab 輸入一行同一案例的數(shù)據(jù)Shift+Tab光標(biāo)左移,多項(xiàng)選擇題的變量定與編碼 不定項(xiàng)選擇:每個(gè)選項(xiàng)看作一個(gè)變量,選則編碼為1,不選則編碼為0 定項(xiàng)選擇:限選幾項(xiàng)就定義幾個(gè)變量,編碼與單項(xiàng)選擇一樣 排序題:根據(jù)參與排序的選項(xiàng)數(shù)目定義變量個(gè)數(shù),編碼與單項(xiàng)選擇一樣 開放式問題的編碼:時(shí)候抽查部分問卷結(jié)果確定 缺失值編碼:沒有回答的問題,用研究者容易識(shí)別的數(shù)字表示,SPSS數(shù)據(jù)的編輯,保證錄入的數(shù)據(jù)準(zhǔn)確無誤,需要對(duì)SPSS數(shù)據(jù)進(jìn)行修改、刪除、插入、復(fù)制、定位等操作。,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,缺失值的處理方法:轉(zhuǎn)換替換缺失值 刪除法:刪除所有缺失值,但會(huì)減少樣本容量 插補(bǔ)法

18、:在計(jì)算相關(guān)系數(shù)時(shí),去掉這些位置上的缺失數(shù)據(jù)上的點(diǎn),以最可能的值來插補(bǔ)缺失值。信息缺失少,該變量的所有非缺失值的均數(shù)做替代,用缺失值相鄰點(diǎn)的非缺失值的均數(shù)做替代,用缺失值相鄰點(diǎn)的非缺失值的中位數(shù)做替代,用該列數(shù)據(jù)缺失值前一個(gè)數(shù)據(jù)和后一個(gè)數(shù)據(jù)建立插值直線,然后用缺失點(diǎn)在線性插值函數(shù)的函數(shù)值填充該缺失值,應(yīng)用缺失值所在的整個(gè)序列建立線性回歸方程,然后用該回歸方程在缺失點(diǎn)的預(yù)測(cè)值填充缺失值,例:對(duì)“就業(yè)意愿.Sav”數(shù)據(jù)中的工資缺失值進(jìn)行替換 執(zhí)行如下操作,在數(shù)據(jù)窗口中會(huì)出現(xiàn)一個(gè)無缺失值的新變量,選擇進(jìn)入缺失值分析的變量,分析時(shí)按列表排除個(gè)案,按配對(duì)的方式對(duì)缺失值進(jìn)行分析,用Expectationt

19、 Maxiumum方法對(duì)缺失值進(jìn)行修補(bǔ),用線性回歸的方法對(duì)對(duì)缺失值進(jìn)行修補(bǔ),缺失值的分析方法:分析缺失值分析,3.2 創(chuàng)建和讀取SPSS數(shù)據(jù)文件,直接通過SPSS數(shù)據(jù)編輯窗口定義變量輸入數(shù)據(jù)(如前所述) 通過打開不同格式的數(shù)據(jù)文件,間接創(chuàng)建SPSS數(shù)據(jù)文件。 支持*.doc,*.xls,*.txt等,保存SPSS數(shù)據(jù),經(jīng)讀取、修改后把SPSS窗口的數(shù)據(jù)以數(shù)據(jù)文件的形式保存到外部的儲(chǔ)介質(zhì)中。,3. 2創(chuàng)建和讀取SPSS數(shù)據(jù)文件,3.3變量及數(shù)據(jù)顯示的相關(guān)設(shè)置,編輯選項(xiàng),3.3 變量顯示的相關(guān)設(shè)置,在數(shù)據(jù)窗口及分析窗口,順序顯示的規(guī)則,角色設(shè)置:輸入(自變量),輸出(因變量),分區(qū)(區(qū)分、檢驗(yàn)、驗(yàn)

20、證樣本,無(無角色分配),設(shè)置單元格的度量單位,程序運(yùn)行結(jié)果顯示方式,設(shè)置輸出文字的字體、顏色、大小等,設(shè)置數(shù)據(jù)處理過程的更新方式、新變量的顯示格式、隨機(jī)數(shù)的生成等,先掛起,下次用到再計(jì)算,可加快速度,新的生成器,設(shè)置輸出結(jié)果中的標(biāo)簽選項(xiàng)(可以方便的觀察個(gè)變量的實(shí)際意義),設(shè)置輸出窗口的圖形默認(rèn)參數(shù):比例、邊框、線形、顏色、填充方式等,指定新輸出圖表的填充方式,圖表邊框設(shè)置,即:要點(diǎn)表,能方便地改變表格行、列的交叉顯示方式,設(shè)置樞紐表的顯示風(fēng)格、調(diào)整列款方式和編輯模式等,最近使用的文件列表,在文件下拉菜單最近使用的文件的顯示數(shù)量,為缺失值的標(biāo)記和生成可能的數(shù)值進(jìn)行設(shè)定,4. SPSS數(shù)據(jù)的預(yù)處

21、理:一些基本操作,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.1 個(gè)案標(biāo)識(shí),4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.1 個(gè)案標(biāo)識(shí) 數(shù)據(jù)檢查,識(shí)別無效個(gè)案、變量或數(shù)值,并采取糾偏措施,標(biāo)識(shí)出異常個(gè)案 (1)數(shù)據(jù)驗(yàn)證:數(shù)據(jù)驗(yàn)證驗(yàn)證數(shù)據(jù) 首先要定義驗(yàn)證規(guī)則 單變量規(guī)則:對(duì)單一變量的特定檢查(SPSS提供了一些單變量驗(yàn)證規(guī)則) 交叉變量規(guī)則:變量之間關(guān)系,邏輯表達(dá)式 操作: (2)標(biāo)識(shí)重復(fù)個(gè)案:數(shù)據(jù)標(biāo)識(shí)重復(fù)個(gè)案 (3)標(biāo)識(shí)異常個(gè)案:數(shù)據(jù)標(biāo)識(shí)異常個(gè)案,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.2 個(gè)案排序:數(shù)據(jù)排序個(gè)案 按照某個(gè)變量進(jìn)行排序:于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量

22、的多少等;快捷的找到數(shù)據(jù)的最值,進(jìn)而可計(jì)算數(shù)據(jù)的全距,初步把握離散程度;發(fā)現(xiàn)數(shù)據(jù)的異常值等。 舉例:將“休閑調(diào)查”數(shù)據(jù)文件按照“年齡”和“住房面積”兩個(gè)變量重新排序。 應(yīng)用舉例: 2005GDP.sav列出了2005年我國(guó)部分省份的地區(qū)生產(chǎn)總值及第一產(chǎn)業(yè)、第二產(chǎn)業(yè)和第三產(chǎn)業(yè)的生產(chǎn)總值,請(qǐng)根據(jù)這些數(shù)據(jù)分析不同省份經(jīng)濟(jì)發(fā)展?fàn)顩r的差異性。,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.3 變量排列:數(shù)據(jù)排列變量 操作與個(gè)案排序相似,選擇之后可以形成一個(gè)新變量,用于恢復(fù)原來的變量排序,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.4 數(shù)據(jù)文件的轉(zhuǎn)置:數(shù)據(jù)轉(zhuǎn)置 對(duì)社會(huì)調(diào)查結(jié)果的分析,有時(shí)既需要對(duì)變量進(jìn)行

23、分析,也需要對(duì)個(gè)案進(jìn)行分析。SPSS主要是針對(duì)變量進(jìn)行分析的,而需要對(duì)個(gè)案進(jìn)行分析時(shí),需要先把個(gè)案轉(zhuǎn)變成變量。 轉(zhuǎn)置之后會(huì)形成一個(gè)新的數(shù)據(jù)文件 例:對(duì)數(shù)據(jù)文件“休閑調(diào)查1”中的“滿意度1”、至“滿意度7”、進(jìn)行轉(zhuǎn)置。,名稱變量:可以使數(shù)據(jù)文件中的序號(hào)變量,也可以使在每個(gè)個(gè)案上取值都是唯一的變量。在轉(zhuǎn)置后的文件中,名稱變量的值稱為新變量的變量名。,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.5 合并文件:數(shù)據(jù)合并文件 添加個(gè)案:即觀測(cè)量合并,將兩個(gè)文件的個(gè)案合并在一起,具體事把外部文件的與當(dāng)前工作文件具有相同變量的觀測(cè)量添加到當(dāng)前工作文件中 添加變量:將兩個(gè)文件的變量合并在一起 直接合并: 按

24、關(guān)鍵變量合并: 注意:按某一關(guān)鍵變量進(jìn)行合并,需要先對(duì)兩個(gè)數(shù)據(jù)文件按照該關(guān)鍵變量進(jìn)行升序排序,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.5合并 文件:數(shù)據(jù)合并文件 例1:將“休閑調(diào)查1”和 “休閑調(diào)查2”中的個(gè)案合并,合并過程中對(duì)不匹配的變量要作出處理(進(jìn)入新變量or不進(jìn)入) 例2:已知固定投資1.sav、固定投資2.sav和固定投資3.sav中的數(shù)據(jù)是部分省市在2005年部分行業(yè)的固定投資額(億元)數(shù)據(jù),分別執(zhí)行個(gè)案合并( 固定投資1.sav+固定投資2.sav,省份不同但行業(yè)類型相同)和變量合并( 固定投資1.sav、固定投資3.sav,省份相同但行業(yè)類型不同 )。,非成對(duì)變量即兩個(gè)數(shù)

25、據(jù)文件不匹配的變量,兩個(gè)文件中變量名不相同的變量,或者變量名雖相同但變量定義不同的變量。,選中則生成一個(gè)新的變量,用于表明每個(gè)個(gè)案的來源:是來自當(dāng)前文件還是外部文件,已排除的變量:兩文件中的同名變量,關(guān)鍵變量:兩文件中的相同變量(變量名、變量類型、變量值排序完全相同),4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.6分割文件:數(shù)據(jù)拆分文件 (為了后繼分析) 兩種分割形式: 比較組:分割之后,進(jìn)行其它分析,輸出分析結(jié)果時(shí),各組分析結(jié)果放在同一表格中,可對(duì)比 按組織輸出:分割之后,進(jìn)行其它分析,輸出分析結(jié)果時(shí),單獨(dú)顯示每一分組的分析結(jié)果 舉例:將“職工工資.sav”數(shù)據(jù)按“行業(yè)類型”變量進(jìn)行分割,

26、并分別統(tǒng)計(jì)不同組的平均值 將“休閑調(diào)查1.sav”數(shù)據(jù)按“性別”變量進(jìn)行分割,可以選擇多個(gè)變量進(jìn)入,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.7數(shù)據(jù)重組:數(shù)據(jù)重組 分析數(shù)據(jù)時(shí),常常需要分析變量隨著某個(gè)條件如何變化,而在數(shù)據(jù)文件中關(guān)于變量的信息可能位于多個(gè)列中,關(guān)于個(gè)案的信息可能位于多個(gè)行中。如果分析所需要的數(shù)據(jù)結(jié)構(gòu)與當(dāng)前的數(shù)據(jù)文件中的結(jié)構(gòu)不符合,則就需進(jìn)行重組來變換數(shù)據(jù)結(jié)構(gòu)。,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.7數(shù)據(jù)重組:數(shù)據(jù)重組 個(gè)案組結(jié)構(gòu):變量與因子記錄在單獨(dú)的列中,一個(gè)因子的每個(gè)水平占一行或不止一行,一個(gè)因子的若干水平稱為一個(gè)個(gè)案組。在SPSS數(shù)據(jù)分析中,當(dāng)數(shù)據(jù)以這種方式

27、構(gòu)造時(shí),因子通常稱為分組變量。(單因素方差分析、多因素方差分析、獨(dú)立樣本體檢驗(yàn)等) 變量組結(jié)構(gòu):變量與因子記錄在同一列中,一個(gè)因子的每個(gè)水平占一列,一個(gè)因素的若干列稱為一個(gè)變量組。在SPSS數(shù)據(jù)分析中,當(dāng)數(shù)據(jù)以這種方式構(gòu)造時(shí),因子通常稱為重復(fù)度量。(重復(fù)測(cè)量的方差分析、協(xié)方差分析、配對(duì)樣本T檢驗(yàn)),肥料的不同水平,高度的不同水平,變量或因素,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,以文件“西紅柿.sav”為例 數(shù)據(jù)重組 選擇“將個(gè)案 重組為變量”,肥料的不同水平,高度的不同水平,變量或因素,選擇個(gè)案組的標(biāo)識(shí)符變量或索引變量,用于標(biāo)識(shí)個(gè)案組的變量,以便能將每個(gè)組合并到新文件的單獨(dú)一行中,用于組

28、成新變量組的變量,選擇是否對(duì)當(dāng)前數(shù)據(jù)進(jìn)行排序。系統(tǒng)根據(jù)上一步選擇的標(biāo)識(shí)符變量,每次遇到標(biāo)識(shí)值的新組合時(shí),將創(chuàng)建一個(gè)新行,因此當(dāng)前文件的個(gè)案應(yīng)按標(biāo)識(shí)符變量的值排序,順序與“標(biāo)識(shí)符變量”列表中列出變量的順序相同。 選擇:是 下一步,設(shè)置應(yīng)用于重組數(shù)據(jù)文件的選項(xiàng),用于表明觀測(cè)的一個(gè)值是 出現(xiàn)(1)還是缺失(2),用于在心數(shù)據(jù)文件中創(chuàng)建行的 當(dāng)前數(shù)據(jù)中的行數(shù),完成操作 還可以反過來操作,把變量組結(jié)構(gòu)轉(zhuǎn)換為個(gè)案組結(jié)構(gòu)。不再講解!,用于表明觀測(cè)的一個(gè)值是 出現(xiàn)(1)還是缺失(2),用于在心數(shù)據(jù)文件中創(chuàng)建行的 當(dāng)前數(shù)據(jù)中的行數(shù),4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.8 分類匯總:數(shù)據(jù)分類匯總 以指定

29、分類變量的取值為依據(jù),將另一個(gè)或多個(gè)變量按照分類的結(jié)果進(jìn)行統(tǒng)計(jì),并將統(tǒng)計(jì)結(jié)果生成新的數(shù)據(jù)文件 分類變量必須為定序變量或定類變量 匯總變量必須為定序及以上的數(shù)值型變量 例:對(duì)“考試成績(jī)”中的各門課程按照“班級(jí)號(hào)”分類,以各科成績(jī)的平均值為內(nèi)容進(jìn)行分類匯總 將“班級(jí)號(hào)”進(jìn)入到“分組變量”中,將五門課程進(jìn)入到“匯總變量”中,此時(shí)激活下面的兩個(gè)按鈕:“函數(shù)”,“變量名和標(biāo)簽”,這兩個(gè)按鈕就是要輸出的匯總變量的描述統(tǒng)計(jì)內(nèi)容。 選定“個(gè)案數(shù)”,命名文件,然后選擇存放地址,決定了按照什么量合并,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.9 選擇個(gè)案/數(shù)據(jù):數(shù)據(jù)篩選,選出符合需要的數(shù)據(jù),分析時(shí)只對(duì)這些數(shù)據(jù)

30、進(jìn)行分析。數(shù)據(jù)選擇個(gè)案 舉例:在“休閑調(diào)查1”中選擇年齡50歲以上的個(gè)案 ;從前100個(gè)個(gè)案中隨機(jī)選擇30個(gè)個(gè)案;選擇第3到第6個(gè)個(gè)案;選擇文化程度為過濾變量,在該變量中有缺失值的個(gè)案將被過濾掉,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.10 數(shù)據(jù)加權(quán):數(shù)據(jù)加權(quán)個(gè)案 加權(quán)操作對(duì)于列聯(lián)表分析非常重要,在繪制散點(diǎn)圖、直方圖以及回歸分析等過程中都非常重要。 某經(jīng)銷商希望掌握菜市場(chǎng)的蔬菜銷售的平均價(jià)格,收集數(shù)據(jù)見數(shù)據(jù)文件“蔬菜銷售.sav”?,F(xiàn)請(qǐng)利用這些數(shù)據(jù),求出這些蔬菜的平均價(jià)格。,分析:由于經(jīng)銷商要求掌握蔬菜的平均價(jià)格,如果僅僅只用蔬菜的單價(jià)進(jìn)行簡(jiǎn)單的算術(shù)平均是很不合理的,這是因?yàn)椴煌卟说匿N

31、售量不同,所以要考慮銷售量對(duì)平均價(jià)格的影響。因此,我們以蔬菜的銷售量為權(quán)重計(jì)算各種蔬菜銷售的平均價(jià)格更為合適。 這里選擇“銷售量”變量作為權(quán)重變量,將其放入頻率變量列表框中,此時(shí)就可以進(jìn)行后續(xù)的求平均值工作了。,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.11 SPSS運(yùn)算符與函數(shù),4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.11 變量計(jì)算:轉(zhuǎn)換計(jì)算變量 目的:產(chǎn)生新變量,例如根據(jù)職工的基本工資、失業(yè)保險(xiǎn)、獎(jiǎng)金等數(shù)據(jù),計(jì)算實(shí)際月收入;對(duì)原變量進(jìn)行必要的轉(zhuǎn)換處理(尤其是對(duì)數(shù)據(jù)的原有分布狀態(tài)進(jìn)行轉(zhuǎn)換),由于數(shù)據(jù)分析和建模中某些模型對(duì)數(shù)據(jù)的分布有一定的要求,因此可以利用變量計(jì)算對(duì)原有數(shù)據(jù)的分布進(jìn)

32、行轉(zhuǎn)換。如預(yù)測(cè)問題、產(chǎn)生比率數(shù)據(jù)、偏態(tài)數(shù)據(jù)的正態(tài)處理、時(shí)間序列的平穩(wěn)處理等。 包括變量的重置和計(jì)算,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.11 變量計(jì)算:轉(zhuǎn)換計(jì)算變量 (1)變量的重置: 例:“貧困調(diào)查”數(shù)據(jù)是2006年在哈爾濱和沈陽進(jìn)行的,當(dāng)時(shí)詢問的是被調(diào)查者的出生年份,現(xiàn)將該變量的內(nèi)容重置為年齡。 解:定義年齡變量,年齡=2006-出生年份,輸入“數(shù)字表達(dá)式”內(nèi),確定即可 例:在上例數(shù)據(jù)中,將來自哈爾濱的個(gè)案的問卷編號(hào)前加1,來自沈陽的個(gè)案問卷編號(hào)前加2。 解:?jiǎn)螕魧?duì)話框中的if按鈕,選擇”如果個(gè)案滿足條件則包括”,輸入“所在城市=1”,繼續(xù),回到原對(duì)話框,在“數(shù)字表達(dá)式”中輸入:

33、問卷編號(hào)+1000。同理,沈陽的也如此操作。,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.11 變量計(jì)算:轉(zhuǎn)換計(jì)算變量 (2)新變量的生成: 例: “貧困調(diào)查”數(shù)據(jù)中的“糧油”、“副食”、“水果”三個(gè)變量是貧困家庭的食品總支出,變量“總支出”是貧困家庭一個(gè)月所有支出之和,計(jì)算貧困家庭的恩格爾系數(shù)。 解:恩格爾系數(shù)=食品總支出/總支出 =(糧油 + 副食 + 水果) / 月支出,4. SPSS數(shù)據(jù)的預(yù)處理:一些基本操作,4.12 計(jì)數(shù)過程:轉(zhuǎn)換對(duì)個(gè)案內(nèi)的值計(jì)數(shù) 計(jì)算一些變量在同一個(gè)觀測(cè)量中滿足要求的特定變量值出現(xiàn)的次數(shù)。例如:在產(chǎn)品市場(chǎng)調(diào)查中,要了解被調(diào)查者中有多少人使用過該產(chǎn)品。 例:利用我國(guó)城鄉(xiāng)消費(fèi)價(jià)格分類指數(shù)數(shù)據(jù)(數(shù)據(jù)文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論