已閱讀5頁,還剩426頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第1章 數(shù)據(jù)分析概述與軟件入門,1.1 SPSS軟件概述 1.1.1 SPSS簡介 SPSS(Statistics Package for Social Science )for Windows是一種運行在Windows系統(tǒng)下的社會科學統(tǒng)計軟件軟件包。 SPSS的基本功能包括數(shù)據(jù)管理、統(tǒng)計分析、圖表分析、輸出管理等,具體內(nèi)容包括描述統(tǒng)計、列聯(lián)分析,總體的均值比較、相關(guān)分析、回歸模型分析、聚類分析、主成份分析、時間序列分析、非參數(shù)檢驗等多個大類,每個類中還有多個專項統(tǒng)計方法。,一、功能強大,(1)囊括了各種成熟的統(tǒng)計方法與模型,為統(tǒng)計分析用戶提供了全方位的統(tǒng)計學算法,為各種研究提供了相應(yīng)的統(tǒng)計學方法。 (2)提供了各種數(shù)據(jù)準備與數(shù)據(jù)整理技術(shù)。 (3)自由靈活的表格功能。 (4)各種常用的統(tǒng)計學圖形。,二、SPSS的實驗環(huán)境要求,(1)系統(tǒng)運行環(huán)境 SPSS10.0以上版本軟件包可以工作在兩種模式下,單機模式和作為網(wǎng)絡(luò)系統(tǒng)的用戶界面模式。 (2)輔助軟件環(huán)境 三、SPSS的主要界面 SPSS的主要界面有數(shù)據(jù)編輯窗口和結(jié)果輸出窗口。 四、SPSS的幫助系統(tǒng) SPSS對一些基本模塊中的統(tǒng)計提供了幫助,可以通過單擊Help菜單中的Statistics Coach命令,選擇所需要的統(tǒng)計指導。,五、SPSS的運行方式,SPSS提供了3種基本運行方式:完全窗口菜單方式,程序運行方式、混合運行方式。程序運行方式和混合運行方式是使用者從特殊的分析需要出發(fā),編寫自己的SPSS命令程序,通過語句直接運行。 SPSS中使用的對話框主要有兩類,一類是文件操作對話框,文件操作對話窗口操作與Windows應(yīng)用軟件操作風格一致。另一類是統(tǒng)計分析對話框,統(tǒng)計分析對話框可以分為主窗口和下級窗口,在該類對話框中,選擇參與分析的各類變量及統(tǒng)計方法是對話框的主要任務(wù)。,1.1.2 spss的安裝,一、啟動Windows 后,把SPSS 系統(tǒng)安裝軟盤(或光盤)插入軟驅(qū)(或光驅(qū)),并找到SPSS的安裝程序的可執(zhí)行文件Setup.exe。 二、雙擊 Setup.exe 文件,安裝程序向?qū)⒔o出每一步操作的提示。在出現(xiàn)Welcome(歡迎)窗口后,選擇Next進入下一步。 三、安裝程序顯示Software License Agreement對話框時,選擇Yes接受顯示的協(xié)議條款。,1.2 spss操作入門,1.2.1 spss軟件的啟動與退出 單擊Windows 的開始按鈕,在程序菜單項SPSS for Windows中找到SPSS 10.0 for Windows并單擊。,1.2.2 SPSS的5個窗口,(1)數(shù)據(jù)編輯窗口(SPSS Data Editor),Spss處理數(shù)據(jù)的工作全在此窗口進行。,(2)結(jié)果管理窗口(SPSS Output viewer),此窗口用于存放分析結(jié)果。左邊是目錄區(qū),右邊是內(nèi)容區(qū)。,(3)草稿結(jié)果窗口(SPSS Draft Viewer),草稿結(jié)果是結(jié)果的一種簡化文本格式。實際上就是WORD所兼容的rtf超文本格式,因此可以在沒有安裝SPSS的PC機上使用文字編輯軟件打開。,(4)語法編輯窗口(SPSS Syntax Editor),(5)腳本窗口(SPSS Script Editor),1.2.3 SPSS的四種運行方式,一、菜單對話方式 首先打開SPSS軟件,然后選擇菜單File Open file。,然后,利用菜單Analyze Descriptive Statistics Frequencies,,二、程序方式,在Syntax編輯窗口中鍵入以下程序:,Get file=c:program filesspssemployee data.sav. Frequencies variables = jobcat/order = analysis。,只需要選擇菜單Run All,運行該程序也一樣會出現(xiàn)相同的分析結(jié)果。,三、Include命令方式,當編寫Syntax程序時,如果發(fā)現(xiàn)將要編寫的程序語句正好是另一個Syntax文件的內(nèi)容;或者發(fā)現(xiàn)所需要的程序語句其實是幾個Syntax文件的總和是,除了可以通過“Copy”、“Paste”的方法利用資源,生產(chǎn)一個新的Syntax文件外,還可以利用Include命令。,Include c:sytaxsample.sps.,四、spss Production Faccility 方式,在Windows的程序菜單中,spss菜單組除了有“spss for windows”項之外,還有一個“spss production facility”。,(1)單擊Syntax框下的“Add”按鈕,到C盤根目錄下打開“syntaxsample”。,(2)單擊Syntax框下的“Edit”按鈕,對程序進行編輯。,(3)單擊右下角的“uesr prompts”按鈕,添加對程序的交互分析界面。,(4)單擊“Browse”按鈕制定結(jié)果保存路徑,單擊“export options”按鈕還可以制定結(jié)果保存格式。,1.2.4 spss的四種輸出結(jié)果,1、表格格式 2、文本格式 3、標準圖與交互圖 4、結(jié)果的保存和導出,第2章 數(shù)據(jù)錄入與數(shù)據(jù)獲取,本章主要解決兩個問題: 第一個問題,根據(jù)問題類型的不同,將會從開放題、單選題和多選題的錄入方式為例進行介紹。 第二個問題,重點介紹如何用SPSS直接讀取Excel類型和文本格式的數(shù)據(jù),以及如何用ODBC接口讀取數(shù)據(jù)庫文件。,2.1.1 統(tǒng)計軟件中數(shù)據(jù)的錄入格式 (1)不同觀測對象的數(shù)據(jù)不能在同一記錄中出現(xiàn),即同一觀測數(shù)據(jù)應(yīng)當獨占一行。 (2)每一個觀測量指標或影響因素只能占據(jù)一列的位置,即同一指標的數(shù)量觀測值都應(yīng)當錄入到同一個變量中去。,2.1 數(shù)據(jù)格式概述,即:一個觀測占一行,一個變量占一列,在錄入數(shù)據(jù)時,歸納為以下三步: 第一步:定義變量名; 第一步:指定每個變量的各種屬性; 第一步:錄入數(shù)據(jù)。 變量名不能與spss保留字相同,spss的保留字有ALL、END、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WITH。,2.1.2 變量屬性介紹,一、變量的儲存類型,SPSS中,變量有三種的基本類型:數(shù)值型、字符型和日期型。,標準 數(shù)值型,逗號 數(shù)值型,圓點 數(shù)值型,科學技術(shù)法 數(shù)值型,美元 數(shù)值型,用戶自 定義型,數(shù)值型:數(shù)值型的數(shù)據(jù)是0-9的阿拉伯數(shù)字和其他符號,如美元符號、逗號或圓點組成的。,字符型:字符型數(shù)據(jù)的默認顯示寬度為8個字符位,系統(tǒng)不區(qū)分變量名中的大小寫字母,并且不能進行數(shù)學運算。 注意:在輸入數(shù)據(jù)時不應(yīng)輸入引號,否則雙引號將會作為字符型數(shù)據(jù)的一部分。,日期型:日期型數(shù)據(jù)是用來表示日期或時間的。日期型數(shù)據(jù)的顯示格式有很多,SPSS以菜單方式列出日期型數(shù)據(jù)的顯示格式以供用戶選擇。事實上,SPSS存儲中的日期型變量是該實踐與1582年10月14日零點相差的秒數(shù)。,關(guān)于日期型格式的幾點說明:,“m”在年與日(字母y與d)之間表示月份;在時與秒(字母h與s)之間表示“分”鐘。 “mmm”表示要求書寫英文月份單詞的前三個字母組成的縮寫。 “ddd”三個字母d表示要求用從元月一日算起的日數(shù)表示日期。 指定了日期變量的格式,不一定在輸入時就使用指定的格式??梢暂斎胗谩?”或“”作分隔符的具體日期,回車后,系統(tǒng)將自動將輸入的格式轉(zhuǎn)化為指定的格式,顯示在單元各種。,二、變量的測量尺度,在SPSS中使用Measure屬性對變量的測量尺度進行定義。,(1)定類尺度(Nominal Measurement):定類尺度是對事物的類別或?qū)傩缘囊环N測度,按照事物的某種屬性對其進行分類或分組。,特點:其值僅代表了事物的類別和屬性,即能測度類別差異,不能比較各類之間的大小,所以各類之間沒有順序和等級。對定類尺度的變量只能計算頻數(shù)和頻率。,在spss中,能適用定類尺度的數(shù)據(jù)可以是數(shù)值型,也可以是字符型變量。使用定類變量對事物進行分類時,必須符合窮盡原則和互斥原則。,(2)定序尺度(Ordinal Measurement):定序尺度是對事物之間的等級或順序差別的一種測度,可比較優(yōu)劣或排序。,特點:由于定序變量只能側(cè)度類別之間的順序,無法測出類別之間的準確差值,即測量數(shù)值不代表絕對的數(shù)量大小,所以其測量結(jié)果只能排序,不能進行運算。,(3)定矩尺度(Interval Measurement):定矩尺度是對事物類別或次序之間間距的測度。,特點:不僅能將事物區(qū)分為不同類型并進行排序,而且可能準確指出類別之間的差距是多少;定居變量通常以自然或物理單位為計量尺度,因此測量結(jié)果往往表現(xiàn)為數(shù)值,所以計量結(jié)果可以進行加減運算。,(4)定比尺度(Scale Measurement):定比尺度是能夠測算兩個測度值之間比值的一種計量尺度,它的測量結(jié)果同定距變量一樣表現(xiàn)為數(shù)值。,特點:定必變量是測量尺度的最高水平,它除了具有其他三種測量尺度的全部特點外,還具有可計算兩個側(cè)度至之間筆直的特點,因此它可以進行加、減、乘、除運算,而定居變量值可進行加減運算。,三、變量名與變量標簽值,Label:定義變量名標簽 Value:定義變量值標簽,四、缺失值,Spss中缺失值有用戶自定義缺失值和系統(tǒng)缺失值兩大類。,在SPSS中,對字符型變量,默認的缺失值為空格;對數(shù)值型變量,默認的缺失值為零。,2.2 數(shù)據(jù)的直接錄入,2.1.1 操作界面說明,Data View表可以直接輸入觀測數(shù)據(jù)值或存放數(shù)據(jù),表的左端列邊框顯示觀測個體的序號,最上端行邊框顯示變量名。,Variable View表用來定義和修改變量的名稱、類型及其他屬性,如圖所示。,如果輸入變量名后回車,將給出變量的默認屬性。如果不定義變量的屬性,直接輸入數(shù)據(jù),系統(tǒng)將默認變量Var00001,Var00002等。,在Variable View表中,每一行描述一個變量,依次是: Name:變量名。變量名必須以字母、漢字及開頭,總長度不超過8個字符,共容納4個漢字或8個英文字母,英文字母不區(qū)別大小寫,最后一個字符不能是句號。 Type:變量類型。變量類型有8 種,最常用的是Numeric數(shù)值型變量。其它常用的類型有:String字符型,Date日期型,Comma逗號型(隔3位數(shù)加一個逗號)等。 Width:變量所占的寬度。 Decimals:小數(shù)點后位數(shù)。 Label:變量標簽。關(guān)于變量涵義的詳細說明。 Values:變量值標簽。關(guān)于變量各個取值的涵義說明。 Missing:缺失值的處理方式。 Columns:變量在Date View 中所顯示的列寬(默認列寬為8)。 Align:數(shù)據(jù)對齊格式(默認為右對齊)。 Measure:數(shù)據(jù)的測度方式。系統(tǒng)給出名義尺度、定序尺度和等間距尺度三種(默認為等間距尺度)。,為了在統(tǒng)計分析過程中能有效的利用其它軟件產(chǎn)生的數(shù)據(jù),SPSS軟件編輯窗口除可以使用*.sav擴展名數(shù)據(jù)文件,還可以直接打開和保存下述類型的文件: SPSS DOS版本產(chǎn)生的數(shù)據(jù)文件*.sys; Excel 報表程序產(chǎn)生的數(shù)據(jù)文件*.xls; DBASE 數(shù)據(jù)庫格式文件*.dbf; SAS統(tǒng)計軟件產(chǎn)生的數(shù)據(jù)文件。,2.2.2 開放題和簡單單選題的錄入,一、在spss中定義變量,錄入數(shù)據(jù)的第一步是定義變量屬性,隨后才能進行數(shù)據(jù)錄入。,二、開放題的錄入,三、單選題的錄入 單選題的錄入可以采用字符直接錄入、字符代碼+值標簽、數(shù)值代碼+值標簽三種方式。,2.2.3多選題的錄入,一、多重二分法(Multiple Dichotomy Method) 所謂多重二分法,是在編碼的時候,對應(yīng)每一個選項都要定義一個變量,有幾個選項就有幾個變量,這些變量均為二分類,他們各自代表對一個選項的選擇結(jié)果。 二、多重分類法(Multiple Category Method) 多重分類法,也是利用多個變量對一個多選題的答案進行定義,應(yīng)該用多少個變量,由被訪者實際可能給出的最多答案數(shù)而定。,三、多選題錄入在spss中的實現(xiàn),2.3 外部數(shù)據(jù)的獲取,SPSS讀入非SPSS類型的文件數(shù)據(jù),有三種主要方式:直接打開,利用文本導向讀入文本數(shù)據(jù)以及利用數(shù)據(jù)庫OBDC接口讀入數(shù)據(jù)。,2.3.1 電子表格數(shù)據(jù)如何導入spss中,SPSS中可以直接讀入許多常用格式的數(shù)據(jù)文件,選擇菜單File Open Data或直接單擊快捷鍵工具欄上的 快捷按鈕,系統(tǒng)就會彈出Open File 對話框,單擊“文件類型”列表框,在里面能夠看到可以直接打開的數(shù)據(jù)文件格式。,2.3.2 文本數(shù)據(jù)如何導入spss中,第一步:首先,在Open File 文件框中選中文件,單擊“打開”,系統(tǒng)會自動啟動文本倒入向?qū)υ捒颉?第二步:選擇“NO”并單擊“下一步”按鈕。,用某種字符區(qū)分,固定寬度,第三步:分別選擇“Delimited”和“yes”,然后單擊“下一步”按鈕。,第四步,第五步,第六步,第七步,2.4 數(shù)據(jù)的保存,2.4.1 存為spss格式 2.4.2 存為其他數(shù)據(jù)格式,第3章 數(shù)據(jù)管理,3.1 變量級別的數(shù)據(jù)管理,對變量進行操作的內(nèi)容主要集中于Transform菜單中,包括新變量的生成、記錄的排序、對變量進行計數(shù)等。,計算新變量:就是用Compute過程。 變量轉(zhuǎn)換:包括Recode、Visual Bander、Count、Rank Case、Automatic Recode這五個過程。 專用過程:包括建立時間序列、缺失值代替和設(shè)定隨機種子三個過程。 Run Pending Transforming:用于執(zhí)行編程中被掛起的數(shù)據(jù)整理操作。,計算產(chǎn)生新變量,變量值自動編碼,設(shè)定隨機數(shù)種子,創(chuàng)建代替缺失值變量,創(chuàng)建時間序列變量,運行其它轉(zhuǎn)換程序,變量值重新編碼,創(chuàng)建計數(shù)變量,觀測量排秩,連續(xù)變量進行分段,3.1.1 計算新變量,計算新變量的功能就是在原有spss數(shù)據(jù)文件的基礎(chǔ)上,根據(jù)用戶的要求,使用spss算術(shù)表達式及函數(shù),對所有記錄或滿足SPSS條件表達式的記錄,計算出一個新結(jié)果,并將結(jié)果存入一個用戶指定的變量中。 一、常用基本概念 (1)spss算術(shù)表達式 spss算術(shù)表達式是由常量、spss變量名、spss的算術(shù)運算符、圓括號等組成的式子。 (2)spss函數(shù) spss提供了多達70多種函數(shù),分為八大類:算術(shù)函數(shù)、統(tǒng)計函數(shù)、分布函數(shù)、邏輯函數(shù)、字符串函數(shù)、日期時間函數(shù)、缺失值函數(shù)和其它函數(shù)。 (3)spss條件表達式 通過spss的算術(shù)表達式和函數(shù)可以對所有記錄計算一個結(jié)果,如果僅希望對部分記錄進行計算,則應(yīng)當利用spss的條件表達式指定對那些記錄進行計算。,二、compute過程的分析實例,例3.1 統(tǒng)計英語成績在60分以上的學生的數(shù)學和語文的平均成績。,例3.2 計算工人工資的所得稅。,學生自己練習。,3.1.2 對變量值進行分組合并,一、對連續(xù)變量進行分組,在SPSS中可以將連續(xù)變量轉(zhuǎn)換為離散(等級或定序)變量,按照某種一一對應(yīng)的關(guān)系生成新變量值,可以將新值賦給原變量。Recode過程和Visual Bander過程都可以完成這一任務(wù),但前者給為簡單和常用。,例3.3 當學生英語成績小于60時取值為“不及格”,大于等于60且小于70為“及格”,大于等于70且小于80為“較好”,大于等于80為“優(yōu)秀”。,二、分類變量類別的合并,Recode過程也常用于合并某個分類變量的幾個水平為一個水平。,將上例grade中優(yōu)秀、良好和及格三個等級合并為一個等級“PASS”,將grade的等級“不及格”轉(zhuǎn)換為“NOPASS”。,3.1.3 連續(xù)變量的可視化分段,VISUAL Bander 用于將連續(xù)變量進行分段,該過程使用百分位數(shù)、標準差范圍或者等間距方式將連續(xù)變量劃分為若干組段,并采用圖形化操作的方式。,例3.4 對數(shù)學成績進行分段,假設(shè)現(xiàn)在希望按變量math將學生分為5組,60分 以下為第一組,60分以上的按照等間距的方式分為4組。,3.1.4 將字符變量轉(zhuǎn)換為數(shù)值變量,用automatic recode將字符變量轉(zhuǎn)換為數(shù)值變量。,3.1.5 變量的編秩,所謂編秩,就是對記錄按照某個變量值大小來排序。Rank case過程就是用來排序的一個專用過程。,例:根據(jù)性別分組計算數(shù)學成績的秩次。,3.1.6 Transform菜單中的其它功能,(1)count過程 如果用戶需要對滿足某項條件的數(shù)據(jù)進行計數(shù),可以使用Count命令。,先在Target Variable中指定一個變量(可以是已經(jīng)存在的變量或新變量),并定義變量標簽,然后指定要統(tǒng)計的變量加到Numeric Variables框中,再單擊Define Values按紐,打開Value to Count對話框。,Value:輸入某個值為清點對象; System-missing:以系統(tǒng)的缺失值為清點對象; System-or user missing:以系統(tǒng)或用戶指定的缺失值為清點對象; Range:指定數(shù)值的計數(shù)區(qū)域:其中包括: ( )through( )在框內(nèi)指定下限和上限 lowest through( ): 在框內(nèi)只指定上限; ( )highest through: 在框內(nèi)只指定下限。,(2)random Number Seed過程: 用于設(shè)定偽隨機函數(shù)的隨機種子。,3.2 文件級別的數(shù)據(jù)管理(一),數(shù)據(jù)編輯窗口的Data菜單為用戶創(chuàng)建和定義數(shù)據(jù)提供了方便的功能。這個菜單是SPSS統(tǒng)計軟件數(shù)據(jù)整理的特有功能菜單。它的功能包括:對變量、觀測量的編輯處理;對變量數(shù)據(jù)的變換;對觀察量數(shù)據(jù)整理。 (1)簡單命令:包括插入變量、插入記錄和到達某條記錄,他們的功能實際上都可以用鼠標在數(shù)據(jù)表界面上直接完成,很少會使用菜單來調(diào)用。 (2)常用的簡單過程:包括排序、拆分文件、選擇記錄和加權(quán)記錄。 (3)變量與數(shù)據(jù)文件屬性導向:用于定義數(shù)據(jù)字典,或者將于定義的數(shù)據(jù)字典直接引入當前數(shù)據(jù)文件。,(4)數(shù)重構(gòu)過導向:用于進行數(shù)據(jù)轉(zhuǎn)置,或者對重復測量數(shù)據(jù)表進行長型、寬型記錄間的轉(zhuǎn)換。 (5)文件合并過程:將幾個數(shù)據(jù)文件合并為一個大的spss數(shù)據(jù)文件,含橫向合并和縱向合并兩種情況。 (6)正交設(shè)計過程:實際上是聯(lián)合分析模塊的一部分,用于生成實施聯(lián)合分析所需要的設(shè)計。 (7)其他過程:包括定義日期變量過程、數(shù)據(jù)匯總過程和查找重復記錄導向。,定義變量屬性,定義變量日期,插入觀測量,拷貝數(shù)據(jù)屬性,插入一個變量,定位觀測量,觀測量排序,重構(gòu)數(shù)據(jù)結(jié)構(gòu),分類或不分類匯總,正交設(shè)計,數(shù)據(jù)文件轉(zhuǎn)置,合并數(shù)據(jù)文件,標識重復觀測量,拆分數(shù)據(jù)文件,選擇觀測量,觀測量加權(quán),3.2.1 記錄排序,一、排序的兩種方法: (1)在數(shù)據(jù)表格的變量名處單擊右鍵,彈出的右鍵菜單最后兩項就是“sort Ascending”和“Sort Descending”。 (2)對于多變量排序,則需要使用Sort Cases過程來進行。 二、多變量排序需要注意的三點: (1)在多重排序中,制定排序變量名是很關(guān)鍵的,先指定的變量在排序時必然優(yōu)先于后制訂的變量。 (2)可以指定按某變量值升序排序的同時按另一變量值降序排序,或相反。 (3)排序以后,原來記錄數(shù)據(jù)的排列次序?qū)⒈淮騺y。,3.2.2 記錄拆分,Split File 分割文件的功能是把當前工作分割成兩個或兩個以上的組,隨后的分析將對每個組進行。,3.2.3 記錄篩選,Select Cases:當用戶不需要分析全部的數(shù)據(jù),而是按要求分析其中的一部分,使用該選擇。,All case:選擇所有數(shù)據(jù); If condition is satisfied: 按指定條件選擇數(shù)據(jù)。,Random Sample of cases:對觀察值進行隨機抽樣。,Use filter variable:用指定變量作過濾。先選擇一個變量,系統(tǒng)自動在數(shù)據(jù)管理器中將該變量值為0的觀測單位標上刪除記號,系統(tǒng)對標有刪除記號的觀測單位不作分析。,Based on time or case range:順序抽樣。單擊Range按紐,打開Select Case: Range對話框,用戶自行定義從第幾個觀察值開始抽到第幾個觀察值結(jié)束。,3.2.4 加權(quán)記錄,Weight Cases:設(shè)定某變量為頻數(shù)變量。,3.2.5 數(shù)據(jù)匯總,所謂分類匯總就是按指定的分類變量對觀測值進行分組,對每組記錄的各變量求指定的描述統(tǒng)計量,結(jié)果可以存入新數(shù)據(jù)文件,也可以替換當前數(shù)據(jù)文件。,一、匯總的概念,二、進行分類匯總的方法,1、打開“data”菜單,選擇“Aggregate”,展開aggregate data”對話框。,2、在左側(cè)的源變量框中選擇一個或多個變量作為分類變量進入分類變量(Break Variables)框中。,3、在左側(cè)的源變量框中選擇一個或多個變量作為要求匯總的變量進入?yún)R總變量(Aggregate Variables)框中,即要求這些變量的值進行分類匯總。,4、“name& label” (名稱與標簽):單擊此按鈕可以修改組合后所生成新變量名稱以及標簽:可以在name后面的矩形框中輸入新變量名。在Label后面的矩形框中輸入新變量標簽。單擊“continue”按鈕繼續(xù)。,5、“Function”(函數(shù)) 選擇此項可以確定匯總變量的描述內(nèi)容;系統(tǒng)默認函數(shù)為平均數(shù)。,3.3文件級別的數(shù)據(jù)管理(二),3.3.1 數(shù)據(jù)字典的定義與應(yīng)用 在大型的數(shù)據(jù)分析項目中,數(shù)據(jù)管理是非常重要的一個環(huán)節(jié),為了保證工作質(zhì)量,數(shù)據(jù)處理人員往往會事先定義好一個非常詳細的數(shù)據(jù)格式,包括變量格式、變量標簽、標簽值、缺失值定義等,這被稱為數(shù)據(jù)字典。 一、變量屬性定義導向:Define Variable Properties,具體說來,可以列出所選變量的所有值;分辨沒有值標簽的值,并且提供自動給出值標簽的功能;可以將另一個變量的屬性拷貝到所選變量,也可以將所選變量的屬性拷貝到其他變量。,二、復制數(shù)據(jù)文件屬性導向,Copy Data Properties 過程用于將定義好的數(shù)據(jù)字典直接應(yīng)用到當前文件中。,操作時不僅可以將一個外部數(shù)據(jù)文件相關(guān)屬性拷貝到當前數(shù)據(jù)文件中,還可以進行自行定義,只選擇某些變量,或者某些屬性進行拷貝,這無疑大大提高了連續(xù)性項目對原有資源的利用程度。,3.3.2 查找重復記錄,Identifying Duplicate Cases:用于查找重復記錄。,運行結(jié)束后,結(jié)果窗口會給出本次操作的信息匯總:,3.3.3 數(shù)據(jù)文件的重新排列與轉(zhuǎn)置,一、數(shù)據(jù)的長型與寬型格式: 長型格式和寬型格式指的是重復測量數(shù)據(jù)的兩種不同的排列方式。,由于重復測量模型可以使用不同的統(tǒng)計模型加以分析,因此根據(jù)模型的要求進行長型格式和寬型格式之間的互轉(zhuǎn)換是數(shù)據(jù)分析中經(jīng)常要遇到的問題。,二、長型格式轉(zhuǎn)換為寬型格式:Restructure。,選擇Data Restructure,系統(tǒng)就會彈出下圖導向。,三、數(shù)據(jù)轉(zhuǎn)置,Transpose:用于對數(shù)進行行列轉(zhuǎn)置,數(shù)據(jù)文件的轉(zhuǎn)置就是將數(shù)據(jù)編輯窗口中數(shù)據(jù)的行列互換,即將記錄轉(zhuǎn)為變量,將變量轉(zhuǎn)為記錄后,重新顯示在數(shù)據(jù)編輯窗口中。,Variable(s):放入將要行列轉(zhuǎn)置的變量名。在數(shù)據(jù)文件中,未放入欄中的變量會遺失。字符串變量不能轉(zhuǎn)換,如強迫轉(zhuǎn)換,變量值轉(zhuǎn)變?yōu)橄到y(tǒng)缺失值。,Name variable:變量命名欄,在左側(cè)源變量欄中選擇一個變量,放入name variable欄,技改變量的數(shù)據(jù)作為轉(zhuǎn)置后的變量名。,3.3.4 多個數(shù)據(jù)文件的合并,縱向連接:幾個數(shù)據(jù)集中的數(shù)據(jù)相加,組成一個新的數(shù)據(jù)集,新數(shù)據(jù)集中的記錄是原來幾個數(shù)據(jù)集中記錄數(shù)的總和。 橫向連接:指的是按照記錄的次序,或者某個關(guān)鍵變量的數(shù)值,將不同數(shù)據(jù)集中的不同變量合并為一個數(shù)據(jù)集,新數(shù)據(jù)集中的變量數(shù)是所有原數(shù)據(jù)集中不重名變量的總和。 一、數(shù)據(jù)文件的縱向連接 縱向合并實質(zhì)就是將兩個數(shù)據(jù)文件的變量列,按照各個變量名的含義,一一對應(yīng)的進行首尾相接。 縱向合并必須遵循兩個條件: 第一,兩個合并的spss數(shù)據(jù)文件,其內(nèi)容合并是有實際意義的。 第二,為方便spss數(shù)據(jù)文件的合并,在不同的數(shù)據(jù)文件中,最好起相同的名字,變量類型和變量長度也要盡量相同。,Unpaired variable:不匹配變量欄。指變量名相同而變量定義不同的變量,或變量名不同的變量。 Variable in new working data:新工作數(shù)據(jù)變量欄。 Indicate case source as variable:指示記錄來源的變量選項/,二、數(shù)據(jù)文件的橫向合并,橫向合并的實質(zhì)是將兩個數(shù)據(jù)文件的記錄,按照記錄對應(yīng),一一進行左右對接。 橫向合并遵循三個條件: 第一,如果不是按照記錄號對應(yīng)的規(guī)律進行合并,則兩個數(shù)據(jù)文件必須至少有一個變量名相同的公共變量,這個變量是兩個數(shù)據(jù)文件橫向合并的依據(jù),成為關(guān)鍵變量。 第二,如果是使用關(guān)鍵變量進行合并的對應(yīng),則兩個數(shù)據(jù)文件都必須事先按關(guān)鍵變量進行升序排列。 第三,為方便SPSS文件的合并,在不同的數(shù)據(jù)文件中,數(shù)據(jù)含義不相同的列,變量名不應(yīng)取相同的名稱。,Excluded Variables:拒絕變量名。外部文件與當前數(shù)據(jù)的同變量,拒絕加到新工作區(qū)中。,New Working Data:新工作數(shù)據(jù)變量欄。,Match Case on Key Variable in sort:排序文件中按關(guān)鍵變量匹配記錄選項。,Both files provide case:由外部文件和當前數(shù)據(jù)量兩者提供記錄。 External file is keyed table:外部文件為關(guān)鍵表,以當前數(shù)據(jù)為基準,外部文件匹配當前數(shù)據(jù)的關(guān)鍵變量值,如匹配成功,外部文件的新變量值加入到當前數(shù)據(jù)的新變量中,匹配不成功則不加入。 Working Data File is keyed table:當前數(shù)據(jù)為關(guān)鍵表。 Key Variables:關(guān)鍵變量欄,在拒絕變量選擇某變量作為關(guān)鍵變量。 Indicate case source as variable:指示記錄來源的變量選項。,第4章 連續(xù)性變量的統(tǒng)計描述與參數(shù)估計,4.1 連續(xù)變量的統(tǒng)計描述概述 4.1.1 統(tǒng)計描述中的可用工具 (1)各種初步匯總描述方法 頻數(shù)、百分位數(shù)。 (2)各種統(tǒng)計描述指標 均值、標準差、四分位數(shù)間距。 (3)統(tǒng)計表 (4)統(tǒng)計圖,4.1.2 連續(xù)變量的統(tǒng)計描述指標體系,(1)集中趨勢 (Central Trend): 均數(shù)(Mean) 中位數(shù)(Median) 眾數(shù)(Mode) 總合(Sum),(4)其他趨勢 百分位數(shù)指標(Percentile)、M統(tǒng)計量(M-Estimators)、極端值(Outlier)。,(2)離散趨勢(Dispersion Trend) 標準差(Std. Deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、標準誤(S.E. Mean),(3)分布特征(Distribution Tendency) 偏度系數(shù)(Skewness)和峰度系數(shù)(Kurtosis),4.1.3 spss中的相應(yīng)功能,1、Spss的用于連續(xù)變量統(tǒng)計描述的過程,均集中在Descriptive Statistics子菜單中。 (1)Frequencies:產(chǎn)生原始數(shù)據(jù)的頻數(shù)表,并能計算各種百分位數(shù)。,控制頻數(shù)表輸出范圍類型的最大數(shù)目,(2)Descriptive過程,該過程用于一般性的統(tǒng)計描述,相對于Frequencies過程而言,它不能繪制統(tǒng)計圖。,(3)Explore 過程,該過程用于對連續(xù)性資料分布狀況不清楚時的探索性分析,它可以計算許多描述統(tǒng)計量,給出各種統(tǒng)計圖,并進行簡單的參數(shù)估計。,(4)Ratio 過程,用于對兩個連續(xù)性變量計算相對比指標。,2、Compares means 均值比較,means過程:means過程的優(yōu)勢在于各組的描述指標被放在一起便于相互比較,并且如果需要,可以直接輸出結(jié)果,無須再次調(diào)用其它過程。,4.2集中趨勢的的描述指標,4.2.1 算術(shù)平均 算術(shù)平均(Arithmetic Mean)是最常用的描述輸送距分布的集中趨勢的統(tǒng)計良??傮w均數(shù)(Population Mean)用希臘字母 表示,樣本均數(shù)常用 表示。 一、算術(shù)平均數(shù)的定義和性質(zhì),二、均數(shù)的意義,任何一個平均數(shù)值首先是同類現(xiàn)象的平均數(shù)。任何一個平均數(shù)總是一個平衡點。 但平均數(shù)在高度概括觀測數(shù)據(jù)從而使問題簡化的同時,卻丟失了某些有用的信息,一方面它把各個觀測數(shù)據(jù)之間的差異性掩蓋了起來,另一方面由于平均數(shù)對于個別極端值反應(yīng)比較靈敏,因而平均數(shù)在某些情況下可能具有一定的欺騙性。,三、均數(shù)的適用范圍,嚴格的講平均數(shù)指示用于定距變量。但有時對于定序變量,求平均等級也可以使用平均數(shù)。,4.2.2 中位數(shù),中位數(shù)(Median)是將總體各單位的標志值按大小順序排列,處于中間位置的那個標志。 一、中位數(shù)的定義 對于未分組的原始資料,首先必須將標志值按大小順序。設(shè)排序結(jié)果為: 則中位數(shù)就可以按下列方式確定: 二、中位數(shù)的適用范圍,4.2.3其他集中趨勢指標,一、截尾均數(shù) 由于均數(shù)較易受極端之的影響,因此可以考慮將數(shù)據(jù)排序后,按照一定的比例去掉最兩端的數(shù)據(jù),只是用中部的數(shù)據(jù)來求均數(shù)。如果截尾均數(shù)河源均數(shù)相差不大,則說明數(shù)據(jù)不存在極端值,或者兩側(cè)極端值的影響正好抵消;反之,則說明數(shù)據(jù)中有極端值,此時截為均數(shù)更好地反映數(shù)據(jù)的集中趨勢。 常用的截尾均數(shù)有5%截尾均數(shù),即兩端各去掉5%的數(shù)據(jù)。,二、幾何均數(shù),幾何均數(shù)適用于原始數(shù)據(jù)分布不對稱,但經(jīng)過對數(shù)轉(zhuǎn)換后稱對稱分布的資料。,幾何均數(shù)世紀上就是對數(shù)轉(zhuǎn)換后的數(shù)據(jù)lgX的算術(shù)平均數(shù)的反對數(shù)。,四、調(diào)和均數(shù) 它實際上是觀察值X倒數(shù)之均數(shù)的倒數(shù)。,三、眾數(shù)(Mode) 眾數(shù)指的是樣本數(shù)據(jù)中出現(xiàn)頻次最多的那個數(shù)。,眾數(shù)適用于任何層次的變量,特別適用于單峰對稱的情況,是比較兩個分布是否接近首先要考慮的參數(shù)。,在SPSS中,眾數(shù)可以在Report子菜單和Tables子菜單的全部報表過程和制表過程中計算出來。,在SPSS中,調(diào)和均數(shù)可以在Report子菜單的4個報表過程過程中計算出來。,4.3 離散趨勢的描述指標,4.3.1全距(Range) 又稱為極差,是一組數(shù)據(jù)中最大值(Maximun)與最小值(Minimum)之差。 極差反映的是變量分布的差異范圍或離散程度,在總體中,任何兩個標志值之差都不可能超過極差。 極差存在兩點不足: 一是它僅僅取決于兩個極端之的水平,不能反映其間的變量分布情況,提供的信息太少。 二是它容易受個別極端值的影響,不符合穩(wěn)健型的要求。,4.3.2 方差和標準差,一、方差(Variance)和標準差(Standard Deviation)的定義 將離均差平方和(Sum of Squares of Deviation from Mean,SS)除以觀察例數(shù)N,就得到方差: 方差越大,數(shù)據(jù)分布離散程度越大。 對于樣本數(shù)據(jù)而言,方差的計算公式為: 將方差開方,就得到標準差。對于同性質(zhì)的數(shù)據(jù)來說,標準差越小,表明數(shù)據(jù)的變異程度越小,即數(shù)據(jù)越整齊,數(shù)據(jù)的分布范圍越集中;標準差越大,表明數(shù)據(jù)的變異程度越大,即數(shù)據(jù)越參差不齊,分布越分散。 二、方差和標準差的適用范圍: 方差和標準差的適用范圍應(yīng)當是正態(tài)分布。,4.3.3 百分位數(shù)、四分位數(shù)與四分位數(shù)間距,分位差是對極差指標的一種改進,是從變量數(shù)列中剔除了一部分極端值后重新計算的類似于極差的指標。常用的分位差有四分位差、十分位差、百分位差。,一、分位數(shù),分位數(shù):是一種位置指標,用PX表示。一個百分位數(shù)PX將一組觀測之分為兩部分,理論上有x%的觀測值比它小,(100-x)%的觀測值比它大。 四分位數(shù)(quartile)、十分位數(shù)(decile)、百分位數(shù)(percentile),他們分別是用3個點、9個點、99個點將數(shù)據(jù)4等分、10等分和100等分后各分位點上的值。,二、四分位數(shù),四分位數(shù):實際上是三個數(shù)值的總稱,分別是P25、P50、P75分位數(shù)。 很顯然,中間的分位數(shù)是中位數(shù),因此通常所說的四分位數(shù)是指 第一個四分位數(shù)(下四分位數(shù))和第三個四分位數(shù)(上四分位數(shù))。,上下四分位數(shù)的差值稱為四分位數(shù)間距:,QR=Q3-Q1,4.3.4 變異系數(shù),當需要比較兩組數(shù)據(jù)離散程度大小的時候,往往直接使用標準差來進行比較并不合適。這可以被分為兩種情況: (1)測量尺度相差太大; (2)數(shù)據(jù)量綱不同。 在以上情形中,就應(yīng)當消除測量尺度和量綱的影響,而變異系數(shù)(Coefficient of Variance),它是標準差和其平均數(shù)的比率。,4.4 連續(xù)變量統(tǒng)計描述實例,4.4.1 數(shù)據(jù)背景介紹 4.4.2 使用Explore過程進行分析 探索分析是對數(shù)據(jù)進行初步的觀察分析,主要的分析項目有: 觀察數(shù)據(jù)的分布特征:可通過繪制箱圖和莖葉圖等圖形直觀地反映數(shù)據(jù)的分布形式和數(shù)據(jù)的一些規(guī)律性,包括考察數(shù)據(jù)中是否存在異常值等。 正態(tài)分布檢驗:檢驗數(shù)據(jù)是否服從正態(tài)分布。 方差齊性的檢驗:用Levene檢驗比較各組的方差是否相等。,1、單擊Analyze-Descriptive statistics-Explore,打開Explore主對話框:,一、分析操作,(3)在Display欄中選擇輸出項,依次是Both選擇項,輸出圖形與描述統(tǒng)計量(系統(tǒng)默認),只輸出描述統(tǒng)計量和只輸出圖形。本例中選擇默認項。,(1)從左側(cè)的變量列表中選出變量”身高”,送入Dependent List欄。,(2)選擇”性別”作為因子變量,送入Factor List欄。有了因子變量,SPSS會把所有的觀測個體按照因子變量的取值分成若干各組,再分組考察Dependent List中的各個變量,如果不選擇因子變量,SPSS會對全部觀測來做探索分析。,2、單擊Statistics統(tǒng)計量按鈕,打開Statistics對話框,選擇統(tǒng)計輸出量。,(1)Descriptives基本統(tǒng)計描述。同時指定均值的置信區(qū)間的置信度,系統(tǒng)默認為95。,(2)M-估計(M估計在計算時對所有觀測量賦予權(quán)重,隨觀測量距分布中心的遠近而變化)。 (3)Outliers輸出分析數(shù)據(jù)中五個最大值和五個最小值。 (4)Percentiles輸出百分數(shù)。,3、單擊Plots 圖形按鈕,打開Plots對話框。,(1)Boxplot 箱圖選擇欄,Factor levels together因變量按因素水平分組(系統(tǒng)默認); Dependents together 所有因變量生成一個并列箱圖(本例中選擇項);None不顯示箱圖。,(2)Descriptive 描述圖形欄 Stem-and-leaf 莖葉圖Histogram 直方圖,(3)Normality plots with test(復選項),正態(tài)分布檢驗并輸出Q-Q圖。,None:不產(chǎn)生回歸直線的斜率和方差齊性檢驗; Power Estimation轉(zhuǎn)換冪值估計(對每組數(shù)據(jù)產(chǎn)生一個中位數(shù)自然對數(shù)及四個分位數(shù)的自然對數(shù)的散點圖)選項; Transformed 變換原始數(shù)據(jù)選擇項; Untransformed不變換變換原始數(shù)據(jù)選擇項。,(4)Spread vs level with Levene Test欄,對所有的散布層次圖,同時輸出回歸直線的斜率以及方差齊性的Levenes檢驗。,4、單擊Option按紐,打開Option對話框如圖所示??蛇x擇缺失值的處理方式,SPSS提供三種處理方式:,(1)Exclude cases listwies 剔除帶缺失值的觀測量(系統(tǒng)默認)。 (2)Exclude cases pairwise 剔除帶缺失值的觀測量時還一并剔除與缺失值有成對關(guān)系的觀測量。 (3)Report values 輸出頻數(shù)表時同時輸出缺失值。,5、單擊OK,得到相應(yīng)的輸出結(jié)果如表所示。,二、基本的分析結(jié)果,三、輸出百分位數(shù)和極端值列表,身高 Stem-and-Leaf Plot for sex= 男 Frequency Stem & Leaf 1.00 15 . 9 .00 16 . 9.00 16 . 555778999 20.00 17 . 00000000011112334444 24.00 17 . 555555555556677777788889 12.00 18 . 000000122234 3.00 18 . 668 Stem width: 10 Each leaf: 1 case(s),箱圖中,最底部的水平線段是數(shù)據(jù)的最小值(奇異點除外),頂部的水平線段是數(shù)據(jù)的最大值(奇異點除外),中間矩形箱子的底所在位置是數(shù)據(jù)的第一個四分位數(shù)(即25分位數(shù)),箱子頂部所在位置是數(shù)據(jù)的第三個四分位數(shù)據(jù)(即75分位數(shù))。箱子中間的水平線段刻畫的是數(shù)據(jù)的中位數(shù)(即50分位數(shù))。,4.4.3使用其他過程過程進行分析 一、Descriptive過程的結(jié)果,二、Frequencies過程的結(jié)果,4.5 連續(xù)性變量的參數(shù)估計,根據(jù)樣本數(shù)據(jù)對總體的客觀規(guī)律性作出合理估計的過程被稱為統(tǒng)計推斷(Statistical Inference),它可以被分為參數(shù)估計和假設(shè)檢驗兩大類。 4.5.1 正態(tài)分布 一、正態(tài)分布的定義 若連續(xù)性隨即變量X的概率分布密度函數(shù)為 則稱隨機變量X服從正態(tài)分布(Normal Distribution),二、正態(tài)分布的特征,(1)正態(tài)分布是一條對稱曲線,關(guān)于均數(shù)對稱,因此均數(shù)被稱為正態(tài)分布的位置參數(shù)。 (2)曲線是單峰,在均值出達到最高點。 (3)正態(tài)分布曲線的尖削與標準差有關(guān)。因此標準差被稱為正態(tài)分布曲線的尺度參數(shù)。 (4)曲線無論向左或向右延伸,都越來越接近橫軸,但不會與橫軸相交,以橫軸為漸近線。 (5)約68%的個體的取值與平均數(shù)在距離一個標準差之內(nèi)。 (6)約95%的個體取值與平均數(shù)的距離在1.96個標準差之內(nèi)。 (7)99%個體的取值與平均數(shù)的距離在2.58個標準差。,三、標準正態(tài)分布(Standard Normal Distribution),將原來的正態(tài)分布轉(zhuǎn)換為標準正態(tài)分布。,在SPSS中的Descriptive過程可以將原變量轉(zhuǎn)換為標準正態(tài)分布的得分,只需要選中主對話框左下角的Save standardized values as variables 復選框即可。,四、偏度和峰度,(1)偏度(Skewness):偏度是用來描述變量取值分布形態(tài)的統(tǒng)計量,只分布不對稱的方向和程度。樣本偏度系數(shù):,偏態(tài)的方向指的應(yīng)當是長尾的方向,而不是高峰的位置。,(2)峰度(Kurtosis):峰度用來描述變量取值分布形態(tài)陡緩的統(tǒng)計量,是指分布圖形的的尖削程度或峰凸程度。樣本的峰度系數(shù):,4.5.2 參數(shù)的點估計,參數(shù)的點估計就是選定一個適當?shù)臉颖窘y(tǒng)計量作為參數(shù)的估計量,并計算出估計值。 對于所選統(tǒng)計量是否適于作參數(shù)估計量,有無偏性、一致性和有效性三個評選標準。 無偏性是指雖然估計量的值不全等于參數(shù),但應(yīng)在真實值附近擺動。 一致性是指樣本容量越大,估計值離真實值的差異應(yīng)當越小。 有效性是指如果兩個統(tǒng)計量都符合上述要求,則應(yīng)當選取誤差更小的一個作為估計值。,在許多種情況下,樣本統(tǒng)計量本身往往就是相應(yīng)的總體參數(shù)的最佳估計,此時就可以直接取相應(yīng)的樣本統(tǒng)計量作為總體參數(shù)的點估計。,一、矩法,二、極大似然估計法 該方法的原理是在已知總體的分布,但未知其參數(shù)值時,在待估參數(shù)的可能取值范圍內(nèi)進行搜索,使似然函數(shù)值最大的那個數(shù)值為極大似然估計值。 三、穩(wěn)健估計值 穩(wěn)健估計值的是該統(tǒng)計量具有穩(wěn)健性,當數(shù)據(jù)存在異常值時受影響較小,而且對大部分的分布而言都很好。,文件估計有M估計、R估計等不同方法。,SPSS中數(shù)出的M估計量有4種,它們分別是Huber、Andrews、Hampel和Tukey所提出的,實際上就是所用的函數(shù)不同。一般而言,Huber適用于數(shù)據(jù)接近正態(tài)分布的情況,另外三種則適用于數(shù)據(jù)中許多異常值的情況。如果M估計量里平均數(shù)和中位數(shù)較遠,則數(shù)據(jù)中可能存在異常值。此時,應(yīng)該用M估計量替代平均數(shù)以反映集中趨勢。,4.5.3 參數(shù)的區(qū)間估計,一、標準誤 標準誤就是用來描述參數(shù)估計值可能離真實值究竟有多遠的統(tǒng)計量。 二、區(qū)間估計的計算 結(jié)合樣本統(tǒng)計量和標準誤可以確定一個具有較大的可信度包含總體參數(shù)的區(qū)間,該區(qū)間稱為總體參數(shù)的1-a可信區(qū)間或置信區(qū)間(Confidence Interval)。 對于任意可信度的區(qū)間情況,總體均值在100(1-a)%可信區(qū)間為:,第5章 分類變量的統(tǒng)計描述與參數(shù)估計,5.1分類變量的統(tǒng)計描述概述 5.1.1分類變量的統(tǒng)計描述指標體系 一、頻數(shù)分布情況描述 各個類別的樣本數(shù)和所占比例分別稱為頻數(shù)(絕對頻數(shù))和百分比(構(gòu)成比)。 累計頻數(shù)是指本類別及較低類別出現(xiàn)的次數(shù)之和,累計百分比則是指本類別及較低類別出現(xiàn)的次數(shù)之和占總次數(shù)的百分比。,根據(jù)類別的有序性,分類變量可以分為有序分類變量(Ordinal Variable)和無序分類變量(Nominal Variable)。,當集中趨勢顯著時,用眾數(shù)(Mode)作為總體的代表值。,二、集中趨勢的描述,所謂眾數(shù),使之出現(xiàn)次數(shù)最多的那個數(shù)。如果只有一個眾數(shù)稱為單眾數(shù),多于一個的稱為復眾數(shù)。,(1)比(Ratio):比指的是兩個有關(guān)指標之比A/B,用于反映兩個指標在數(shù)量/頻數(shù)上的大小關(guān)系。,三、使用相對數(shù)進行深入描述,(2)構(gòu)成比(Proportion),率是一個時間概念,或者說具有速度、強度含義的指標,用于說明某個時間發(fā)生的頻率或強度。,分觀察對象為K部分(A1、A2、Ak),其中某一個/多個部分的例數(shù)占總例的比例未構(gòu)成比,它描述某個事物內(nèi)部各構(gòu)成部分所占的比重。,(3)率(Rate),5.1.2 分類變量的聯(lián)合描述,當一共有兩個分類變量時,這匯總因分類變量的各類別交叉而成的復合頻數(shù)表被稱為行*列表,也稱列聯(lián)表。,當觀察的現(xiàn)象與兩個因素有關(guān)時,如某種服裝的銷量受價格和居民收入影響;某種產(chǎn)品的生產(chǎn)成本受原材料價格和產(chǎn)量的影響等等,交叉列聯(lián)表分析可以比較好的反映出兩個因素之間有無關(guān)聯(lián)性,兩因素與現(xiàn)象之間的相關(guān)關(guān)系。因此,數(shù)據(jù)交叉列聯(lián)表分析主要包括兩個基本任務(wù): 1、根據(jù)收集的樣本數(shù)據(jù),產(chǎn)生二維或多維交叉列聯(lián)表; 2、在交叉列聯(lián)表的基礎(chǔ)上,對兩兩變量間是否存在關(guān)聯(lián)性進行檢驗。,5.2分類變量的統(tǒng)計描述實例,5.2.1使用Frequencies過程輸出頻數(shù)表 具體操作: Analysis Descriptive Statistics Frequencies,1、打開數(shù)據(jù),單擊AnalyzeDescriptive Statistics Crosstabs對話框。,2、如果是二維列聯(lián)表分析,可以將行變量選擇進入Row(s)中,將列變量選擇進入Column(s)框中。如進行三維以上的列聯(lián)表,可以將其它變量作為控制變量選到Layer框中。多控制變量可以是同層次的也可以是逐層疊加的。,5.2.2 使用Crosstabs過程輸出列聯(lián)表,3、Display clustered bar chart選擇項,可以指定繪制各變量交叉頻數(shù)分布柱形圖。Suppress table表示不輸出列聯(lián)表,只有在分析行列變量間關(guān)系時選擇此項。此例中不選擇這一項。,4、單擊Cell按紐,打開Crosstabs:Cell Display對話框
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 大學生職業(yè)發(fā)展與就業(yè)指導策略考試
- 2025年護士資格證考試備考時間管理技巧試題及答案
- 團支部考核制度細則
- 物業(yè)綠化部考核制度
- 游艇會碼頭考核制度
- 業(yè)務(wù)水平及考核制度
- 阿里271考核制度
- 傳統(tǒng)kpi考核制度
- 團干部評議考核制度
- (正式版)DB2327∕T 074-2023 《大興安嶺升麻栽培技術(shù)規(guī)范》
- 2026年中考歷史復習必背重點考點知識點清單
- GJB939A-2022外購器材的質(zhì)量管理
- GB/T 4127.14-2025固結(jié)磨具尺寸第14部分:角向砂輪機用去毛刺、荒磨和粗磨砂輪
- 《建筑業(yè)10項新技術(shù)(2025)》全文
- 2023版金屬非金屬地下礦山重大事故隱患判定標準
- (人教版)地理七年級下冊填圖訓練及重點知識
- 二十四點大全
- TB-T 3263.1-2023 動車組座椅 第1部分:一等座椅和二等座椅
- 延遲焦化操作工(中級)考試(題庫版)
- JJG596-2012電子式交流電能表
評論
0/150
提交評論