1、SPSS數(shù)據(jù)的預處理_第1頁
1、SPSS數(shù)據(jù)的預處理_第2頁
1、SPSS數(shù)據(jù)的預處理_第3頁
1、SPSS數(shù)據(jù)的預處理_第4頁
1、SPSS數(shù)據(jù)的預處理_第5頁
已閱讀5頁,還剩121頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、一一 SPSSSPSS數(shù)據(jù)的預處理數(shù)據(jù)的預處理 在數(shù)據(jù)文件建立之后,通常還需要對分析的數(shù)據(jù)進行必要的預加工處理,這是數(shù)據(jù)分析過程中必不可少的一個關鍵步驟。 數(shù)據(jù)的預加工處理服務于數(shù)據(jù)分析和建模,主要包括以下幾個問題: 1、缺失值和異常數(shù)據(jù)的處理; 2、數(shù)據(jù)的轉換處理; 3、數(shù)據(jù)抽樣; 4、選取變量。 數(shù)據(jù)的排序 變量計算 數(shù)據(jù)選取 計數(shù) 分類匯總 數(shù)據(jù)分組 數(shù)據(jù)預處理的其他功能:轉置、加權、數(shù)據(jù)拆分、缺失值處理、數(shù)據(jù)排秩、定義變量集。 SPSS的數(shù)據(jù)排序是將數(shù)據(jù)編輯窗口中的數(shù)據(jù)按照某個或多個指定變量的變量值升序或降序重新排列。這里的變量也稱為排序變量排序變量。排序變量只有一個時,排序稱為單值排

2、序單值排序。排序變量有多個時,排序稱為多重排序多重排序。多重排序中,第一個指定的排序變量稱為主排序變量主排序變量,其他依次指定的變量分別稱為第二排序變第二排序變量量、第三排序變量第三排序變量等。 數(shù)據(jù)排序便于數(shù)據(jù)的瀏覽,有助于了解數(shù)據(jù)的取值狀況、缺失值數(shù)量的多少等; 通過數(shù)據(jù)排序能夠快捷的找到數(shù)據(jù)的最大值和最小值,進而可以計算出數(shù)據(jù)的全距,初步把握和比較數(shù)據(jù)的離散程度; 通過數(shù)據(jù)排序能夠快捷地發(fā)現(xiàn)數(shù)據(jù)的異常值,為進一步明確它們是否會對分析產生重要影響提供幫助。 SPSS數(shù)據(jù)排序的基本操作步驟: (1)選擇菜單數(shù)據(jù)排列個案數(shù)據(jù)排列個案 (2)將主排序變量從左邊的列表中選到Sort by框中,并在

3、Sort Order框中選擇按該變量的升序還是降序排序。 (3)如果是多重排序,還要一次指定第二、第三排序變量及相應的排序規(guī)則。1.1.2 數(shù)據(jù)排序的基本操作在左邊的源變量框源變量框中選擇排序變量進入Sort by框。如果選擇2個以上的變量,觀測量的排序結果與排序變量在Sort by框中的順序有關。列于首位的為第一排序變量。在Sort Order 欄欄內選擇排序方式升序與降序 1、數(shù)據(jù)排序是整行數(shù)據(jù)排序,而不是只對某列變量排序; 2、多重排序中指定排序變量的次序很關鍵。先指定的變量優(yōu)先于后指定的變量。多重排序可以在按某個變量值升序(或降序)排序的同時再按其他變量值降序(或升序)排序; 3、數(shù)據(jù)

4、排序后,原有數(shù)據(jù)的排序次序必然被打亂。 數(shù)據(jù)的轉換處理是在原有數(shù)據(jù)的基礎上,計算產生一些含有更豐富信息的新數(shù)據(jù)。例如根據(jù)職工的基本工資、失業(yè)保險、獎金等數(shù)據(jù),計算實際月收入,這些新變量具有更直觀更有效的特點。1.2.1 變量計算的目的 SPSS變量計算是在原有數(shù)據(jù)的基礎上,根據(jù)用戶給出的SPSS算術表達式以及函數(shù),對所有個案或滿足條件的部分個案,計算產生一系列新變量。 (1)變量計算是針對所有個案(或指定的部分個案)的,每個個案都有自己的計算結果。 (2)變量計算的結果應保存到一個指定變量中,該變量的數(shù)據(jù)類型應與計算結果的數(shù)據(jù)類型相一致。 在變量計算過程中涉及到幾個概念:SPSS算數(shù)表達式、S

5、PSS條件表達式和SPSS函數(shù)。 指出按照什么方法計算變量; SPSS算術表達式(Numeric Expression)是由常量、變量、算術運算符、圓括號、函數(shù)等組成的式子。 字符型常量應當用引號括起來 變量是指那些已存在于數(shù)據(jù)編輯窗口中的原有變量 算術運算符主要包括、*、/、*(乘方) 在同一算術表達式中的常量及變量,數(shù)據(jù)類型應該一致,否則無法計算 1.2.2 SPSS算術表達式 在變量計算中通常要求對不同的個案分別按照不同的方法進行計算,于是就需要通過一定的方式來指定個案; SPSS條件表達式是一個對條件進行判斷的式子。其結果有兩種取值:如果判斷條件成立,則結果為真;如果判斷條件不成立,則結果為假。條件表達式包括簡單條簡單條件表達式件表達式和復合條件表達式復合條件表達式。1.2.3 SPSS條件表達式(1)簡單條件表達式 由關系運算符、常量、變量以及算術表達式等組成的式子。其中關系運算符包括、。(nl35)(2)復合條件表達式 又稱邏輯表達式,是由邏輯運算符號、圓括號和簡單條件表達式等組成的式子。其中,邏輯運算符號包括&或或AND(并且)、(并且)、|或或OR(或(或者)、或者)、或NOT(非)(非)。NOT的運算優(yōu)先級最高,其次是AND,最低是OR??梢酝ㄟ^圓括號改變運算的優(yōu)先級。(nl=35)and not (z

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論