常用統(tǒng)計分析軟件.ppt_第1頁
常用統(tǒng)計分析軟件.ppt_第2頁
常用統(tǒng)計分析軟件.ppt_第3頁
常用統(tǒng)計分析軟件.ppt_第4頁
常用統(tǒng)計分析軟件.ppt_第5頁
已閱讀5頁,還剩65頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、常用統(tǒng)計分析軟件,SPSS 10.0 for Windows,主講:楊澤峰 電話:7979358 Email:,統(tǒng)計學與統(tǒng)計軟件,市場經濟呼喚統(tǒng)計學 統(tǒng)計學是研究客觀事物數量特征和數量關系的方法論學科,能夠告訴人們如何通過打開幾扇窗口去探索一個未知的世界,教會人們怎樣用一種新的方式來思考問題,是一門很實用的學科。 大至國家的宏觀決策,小至企事業(yè)單位的微觀管理,都離不開統(tǒng)計的應用?,F代市場經濟對統(tǒng)計信息的需求急劇增加,對統(tǒng)計理論與方法提出了更高的要求。 社會發(fā)展問題、經濟可持續(xù)發(fā)展問題、國際競爭力問題、金融風險管理問題、保險精算問題、人口與社會保障問題、環(huán)境保護問題、科學研究探索問題等等,這些都

2、迫切地等待著我們去深入地研究。,統(tǒng)計學的分類,統(tǒng)計方法的基本功用,提供了整理和描述數據的科學的方法 提供由樣本推論總體的科學的方法 提供通過誤差分析以鑒定處理效應的科學的方法 提供了分析多個變數間相關密切程度的科學的方法 提供進行科學試驗設計的科學的方法,推薦使用的幾本教材,以上教材均被超星數字圖書館收藏,校園網用戶均可直接下載。 SPSS等統(tǒng)計軟件的下載地址: ftp:/,本課程的教學網站,網站地址 內容 教案 教學大綱 習題 留言,SPSS入門,序言 SPSS基礎 SPSS數據文件的建立與管理 SPSS數據的基本加工和處理 SPSS輸出窗口,序 言,統(tǒng)計分析軟件是數據分析的主要工具 完整的

3、數據分析過程包括: 數據的收集 數據的整理 數據的分析 結果的解釋和推論 統(tǒng)計學為數據分析過程提供一套完整的科學的方法論。統(tǒng)計軟件為數據分析提供了實現手段。,序 言,統(tǒng)計分析軟件的一般特點 功能全面,系統(tǒng)地集成了多種成熟的統(tǒng)計分析方法; 有完善的數據定義、操作和管理功能; 方便地生成各種統(tǒng)計圖形和統(tǒng)計表格; 使用方式簡單,有完備的聯(lián)機幫助功能; 軟件開放性好,能方便地和其他軟件進行數據交換。,序 言,常用統(tǒng)計軟件簡介 SAS (Ver9.1) -真正的巨無霸。被譽為國際上的標準統(tǒng)計軟件和最權威的組合式優(yōu)秀統(tǒng)計軟件。 人機對話界面太不友好 圖形操作界面比較糟糕 一切圍繞編程設計 學習起來較困難(

4、編程) 說明書非常難懂 價格貴的人直跳,序 言,常用統(tǒng)計軟件簡介SPSS (Ver13) -統(tǒng)計軟件中的貴族 操作界面極為友好 所有統(tǒng)計軟件中最友好的 精心設計的圖形操作界面 美觀的結果輸出 強大的輔助教學功能 輸出結果與中文WORD尚存在一定兼容問題 在國內深受歡迎,特別是市場調研行業(yè) 在歐洲各研究機構中得到廣泛應用,序 言,常用統(tǒng)計軟件簡介S-Plus(Ver6) S語言(AT 是目前國內功能最完整的統(tǒng)計軟件包。 自稱:DPS=Excel+SPSS 網站地址 ,序 言,學習使用統(tǒng)計分析軟件的基本方法 弄清分析的目的 正確收集待處理和分析的數據(目的、影響因素的剔除)。 弄清統(tǒng)計概念和統(tǒng)計含

5、義,知道統(tǒng)計方法的適用范圍,無需記憶公式。 選擇一種或幾種統(tǒng)計分析方法探索性地分析數據。 讀懂計算機分析的數據結果,發(fā)現規(guī)律,得出分析,SPSS基礎,軟件名稱 Statistical Package for Social Science Statistical Product and Service Solutions 軟件發(fā)展 60年代:美國斯坦福大學三位研究生研制 70年代:SPSS總部成立于芝加哥,推出 SPSS中小型機版SPSSX 80年代:微機版(V1-3)SPSS/PC+ 90年代:Windows版(v5-11) 2003年:Windows版(v12),SPSS基礎,基本窗口 數據

6、編輯窗口(data editor) 功能:對SPSS的數據進行定義、錄入、修改、管理等基本操作的窗口 組成:窗口主菜單(Data、Transform、Analyze、Graphs)、工具欄、數據編輯區(qū)、狀態(tài)顯示區(qū) SPSS運行過程中自動打開;且只能打開一個窗口;運行過程中無法關閉 SPSS中各統(tǒng)計分析功能都是針對該窗口中的數據進行的;窗口中的數據以.sav存于磁盤上,SPSS基礎,基本窗口 輸出窗口(viewer) 功能:SPSS統(tǒng)計分析報表及圖形的輸出窗口 組成:窗口主菜單、工具欄、結果顯示區(qū)、狀態(tài)顯示區(qū) 在進行第一次分析時自動打開,也可手工打開;可以手工打開若干個可相互切換的viewer窗

7、口;輸出窗口可以關閉; 狀態(tài)欄上的!表示當前輸出窗口 窗口內容以.spo存于磁盤上,SPSS基礎,SPSS的菜單,SPSS基礎,利用SPSS做數據分析的一般步驟 建立SPSS數據文件 定義數據文件結構 錄入修改和編輯待分析的數據 分析數據 統(tǒng)計分析之前的數據預處理 統(tǒng)計分析和建模 結果的說明和解釋 數據和分析結果的保存,SPSS數據文件的建立與管理,數據文件的特點 結構的定義 數據的錄入和保存 數據的編輯 與其他軟件數據共享,SPSS數據文件的特點,SPSS數據文件是一種有結構的數據文件 數據文件的每一行代表一個觀測量(概率事件) 每一列代表一個變量 在數據編輯器中可以輸入和編輯數據,但是不能

8、輸入數學表達式和函數,定義數據文件的結構,變量名(Variable name) 變量名是變量存取的唯一標志 變量類型(type)和顯示寬度(width) 數值型:常用標準數值型(Numeric):默認類型8.2如:12345678、12345.67、-1234.56 字符型(String): 存儲字符數據8位。如:beijing處理時用雙引號擴起來 日期型(Date):存儲日期數據,如:20-AUG-1999 注意:顯示寬度不影響數據的存儲,定義數據文件的結構,變量名標簽(Variable label) 變量值標簽(Value label) 變量列格式(Column Format) 缺失值(M

9、issing Values) 變量度量(Measurement) scale: 數值型 Ordinal:序數型 Nominal:名詞型,數據的編輯,打開數據文件 數據定位 插入和刪除個案 插入和刪除變量 數據單元數據的移動和復制,與其他軟件共享數據,打開其他格式的數據文件 直接打開 在SPSS10已經可以直接讀入許多常用格式的數據文件 使用數據庫查詢打開 利用通用數據庫ODBC接口讀取數據文件 在9.0及以前版本中非常重要 使用文本導入向導讀入文本文件 和大型機交換文件時常用,與其它軟件共享,直接打開,SPSS數據的基本加工和處理,數據文件的整理 個案排序、個案選取、文件合并、文件轉置 數據加

10、工 計算變量、產生計數變量、分類匯總 數據分組 手工分組 數據文件的其他處理功能 指定加權變量、SPSS變量集的定義和使用,數據文件的整理,個案排序(sort) 將所有個案按照用戶指定的某一個或多個變量的變量值的升序或降序重新排列 快速查找異常值、極端值 個案選取(select cases) 個案選取方式,數據文件的整理,文件合并(merge file) 將兩個SPSS數據文件合并到一個數據文件中。 縱向合并(add cases)、橫向合并(add variables) 文件轉置(transpose) 將數據文件行列互換,即:將個案轉為變量,變量轉為個案。 將數值型變量的數據旋轉90。,數據的

11、加工,變量計算(compute) 產生新變量或對原變量進行必要的轉換 SPSS算術表達式和邏輯表達式 SPSS函數 產生計數變量(count) 對所有或部分個案,計算若干個變量中有幾個變量的值落在指定的區(qū)域內,并將結果存入新變量中。,數據的加工,分類匯總(aggreate) 按指定的分類變量的變量值對個案分組; 計算每組個案的匯總變量的基本統(tǒng)計量; 將計算結果生成到一新文件中,即:在新文件中對應分類變量的每一個分類值產生一個個案。,數據的分組,目的:了解數據的總體分布狀況 手工分組(recode) 將指定按哪個變量分組,即:指定分組變量;定義分組變量的分組區(qū)間(不重、不漏);指定一個存放分組結

12、果的標志變量 自動分組(Categorize Variables) 將連續(xù)性變量自動按分位數要求分成幾類,數據文件的其它處理功能,加權(weight cases) 指定某一變量為加權變量。 變量集 加快變量選擇的速度 變量集的定義 變量集的使用,第二章 統(tǒng)計分析,基礎統(tǒng)計 包括:描述性統(tǒng)計、方差分析、t-檢驗、線性回歸、相關分析等 專業(yè)統(tǒng)計: 包括:辨別分析、因子分析、聚類分析、主成分分析等 高級統(tǒng)計分析 包括:logistic回歸分析、多元方差分析、非線性回歸、probit回歸分析、曲線估計等,2.1 描述性統(tǒng)計分析,頻數分布分析(Frequencies) 描述性統(tǒng)計分析(Descripti

13、ves) 探索性分析(Explore) 列聯(lián)表資料分析(Crosstabs),2.1.1 頻數分布分析,目的 頻數分布分析主要通過頻數分布表、條圖和直方圖,以及集中趨勢和離散趨勢的各種統(tǒng)計量,描述數據的分布特征。 采用的方法 計算頻率分布表 繪制統(tǒng)計圖形 上述方法適用于定序、定類、定距類型數據,2.1.2 描述性統(tǒng)計分析,目的: 描述性統(tǒng)計分析主要用以計算描述集中趨勢和離散趨勢的各種統(tǒng)計量,并可對變量進行標準化處理。 步驟: 【 Analyze 】 【 Descriptive Statistics 】 【 Descriptives 】,2.2 均值檢驗,統(tǒng)計假設測驗概述 單樣本的t測驗 兩個獨

14、立樣本的t測驗 兩個配對樣本的t測驗,2.2.1統(tǒng)計假設測驗概述,統(tǒng)計推斷(statistical inference),就是根據抽樣分布律和概率理論,由樣本結果(統(tǒng)計數)來推論總體特征(參數)。 統(tǒng)計推斷的基本內容: 統(tǒng)計假設測驗(hypothesis test) 參數估計(parametric estimate) 統(tǒng)計假設測驗是指根據某種實際需要,對未知的或不完全知道的統(tǒng)計總體提出一些假設(這些假設通常構成完全事件系),然后由樣本的實際結果,經過一定的計算,作出在概率的意義上應當接受那種假設的測驗。,假設測驗的步驟,提出無效假設 :實得差異由誤差造成;備擇假設 :實得差異由總體參數不同造成

15、。 確定顯著水平 。 在 為正確的假設下,根據統(tǒng)計數的一定分布律,算出實得差異由誤差造成的概率。 如果這個概率 ,則在 水平上否定 ,接受 ;反之亦然。,2.2.2 單樣本的t測驗,含義: 檢驗某變量的總體均值與指定的檢驗值之間是否存在顯著差異。 要求: 樣本來自的總體服從正態(tài)分布。 步驟: 【Analyze】 【Compare means】 【One sample t test】,2.2.3 兩獨立樣本的t測驗,(一)含義: 根據兩獨立樣本的數據,對兩總體均值是否有顯著差異進行推斷。 例如:男生和女生的計算機平均成績有顯著差異嗎? 城鎮(zhèn)和農村的平均存(?。┛罱痤~有顯著差異嗎? (二)要求:

16、兩樣本必須相互獨立,即:抽取其中一批樣本對抽取另一批樣本沒有任何影響。(如:北京周歲兒童與上海兒童的平均身高) 兩總體服從正態(tài)分布,2.2.3 兩獨立樣本的t測驗,步驟 【Analyze】 【Compare Means】 【Independent-sample t test】 結論 首先,如果F檢驗的P,認為方差不齊性;其次看Unequal行的t檢驗概率。如果,則拒絕t檢驗的H0,認為兩總體均值有顯著差異;如果,則不拒絕t檢驗的H0。 首先,如果F檢驗的P,認為方差齊性;其次看equal行的t檢驗概率。其余同上,2.2.4 兩配對樣本的t測驗,含義: 根據配對樣本對兩總體均值是否有顯著差異進行

17、推斷. 例如:某種減肥茶是否有效 要求: 兩樣本數據必須兩兩配對,即:樣本個數相同,個案順序相同.如:減肥茶的效果、不同廣告形式對銷售額的影響.(控制了個案自身的影響) 兩總體服從正態(tài)分布,2.2.4 兩配對樣本的t測驗,基本思路 計算兩樣本對應的個案的差值di=Y1i-Y2i 計算t統(tǒng)計量和對應的相伴概率P(絕對值大于等于的雙側概率) 結論:P,則拒絕H0,認為兩總體均值有顯著差異.P ,不能拒絕H0. 步驟 【Analyze】 【Compare Means】 【Paired-sample t test】,2.3 方差分析,目的: 方差分析是從數據間的差異入手,分析哪些因素是影響數據差異的眾

18、多因素中的主要因素。 例如: 影響某農作物畝產量的因素(品種、施肥量、氣候等) 影響推銷某種商品的推銷額(不同的推銷策略、價格、包裝方式、推銷人員的形象等) 核心問題 從數據差異角度看: 觀測變量的數據差異=控制因素造成+隨機因素造成 方差分析正是要分析觀測變量的變動是否主要是由控制因素造成還是由隨機因素造成的,以及控制變量的各個水平是如何對觀測變量造成影響的。,2.3 方差分析,單因素試驗資料方差分析 多因素試驗資料方差分析 協(xié)方差分析,2.3.1 單因素方差分析,目的 檢驗某一個控制因素的改變是否會給觀察變量帶來顯著影響. 例如: 考察不同肥料對某農作物畝產量是否有顯著差異. 考察不同學歷

19、是否對工資收入產生顯著影響. 步驟 【Analyze】 【Compare Means】 【One-way ANOVA】,方差分析中的多重比較,目的 如果總體均值存在差異,F檢驗不能說明哪個水平造成了觀察變量的顯著差異。多重比較將對每個水平的均值逐對進行比較檢驗。 常用方法 LSD法 實際上就是t檢驗的變形,只是在變異和自由度的計算上利用了整個樣本信息。 Duncan氏新復極差測驗法 Tukey氏固定極差測驗法 Dunnett氏最小顯著差數測驗法,2.3.2 多因素方差分析,控制因素的種類 固定效應因素(Fixed Factor):指的是該因素在樣本中所有可能的水平都出現了。 隨機效應因素(Ra

20、ndom Factor):該因素所有可能的取值在樣本中沒有都出現,因此要用樣本來推論總體情況,包括未出現的水平。這不可避免的存在誤差(即隨機效應),需要估計該誤差的大小,因此被稱為隨機因素。,2.3.2 多因素方差分析,基本思路: 以兩個控制變量的方差分析為例: SS總=SSA+SSB+SSAB+SSe 表示兩個控制變量的交互影響,即:兩個控制變量各水平之間搭配時對觀察變量的影響. 步驟 【Analyze】 【General Linear Model】 【Univariate】,2.3.3 協(xié)方差分析,目的: 將無法或很難控制的因素作為協(xié)變量,在排除協(xié)變量影響的條件下更精確地分析控制變量對觀察

21、變量的影響。,2.3.3 協(xié)方差分析,應用實例,2.3.3 協(xié)方差分析,基本思路: 協(xié)變量是數值型的;與觀測變量的線性關系在各水平均成立,且斜率大致相同。 SS總= SS協(xié)+SSA+SSB+SSAB+SSe 步驟 【Analyze】 【General Linear Model】 【Univariate】 注意:在彈出的對話框中將協(xié)變量選入【Covariate(s)】欄,2.4 相關和回歸分析,相關分析 一元回歸分析 多元回歸分析 曲線擬合 非線性回歸分析,2.4 相關和回歸分析,相關分析和回歸分析的任務 研究對象:統(tǒng)計關系 相關分析旨在測度變量間線性關系的強弱程度。 回歸分析側重考察變量之間的

22、數量變化規(guī)律,并通過一定的數學表達式來描述這種關系,進而確定一個或幾個變量的變化對另一個變量的影響程度.,2.4 相關和回歸分析,目的 通過樣本數據,研究兩變量間線性相關程度的強弱。(例如:職工的年齡和收入之間的關系、工人數和管理人員之間的數量關系) 基本方法 繪制散點圖、計算相關系數,2.4.1 相關系數,作用: 以精確的相關系數(r)體現兩個變量間的線性關系程度. r:-1,+1; r=1:完全正相關; r=-1:完全負相關; r=0:無線性相關。 說明: 相關系數只是較好地度量了兩變量間的線性相關程度,不能描述非線性關系。 數據中存在極端值時不好。,2.4.2 一元線性回歸方程,一元回歸

23、方程: Y=a+bX a為常數項;b為Y對X回歸系數,即:X每變動一個單位所引起的Y的平均變動 回歸方程的顯著性檢驗 (1)目的: 檢驗自變量與因變量之間的線性關系是否顯著,是否可用線性模型來表示. (2)檢驗方法 t檢驗 F檢驗(一元回歸中,F檢驗與t檢驗一致,即: F=t2,兩種檢驗可以相互替代) 步驟 【Analyze】 【Regression】 【Linear】,2.4.3 多元線性回歸分析,多元線性回歸方程 多元回歸方程:Y=0+1X1+2x2+.+kxk 1、2、k為偏回歸系數。 1表示在其他自變量保持不變的情況下,自變量X1變動一個單位所引起的因變量Y的平均變動 多元線性回歸分析

24、的主要問題 回歸方程的檢驗 自變量篩選 多重共線性問題,2.4.3 多元線性回歸分析,自變量篩選法 Enter:所選擇的自變量將全部進入建立的回歸方程中,該項為默認方式。對一元線性回歸采用較多。 Remove:將進入方程中的自變量同時剔除。 Forward:向前篩選法,是自變量不斷進入回歸方程的過程。 Backward:向后篩選法,是自變量不斷剔除出回歸方程的過程。 Stepwise:逐步篩選法,是“向前法”和“向后法”的結合,2.4.4 曲線擬合,目的: 在一元回歸分析或時間序列中,因變量與自變量(時間)之間的關系不呈線性關系,但通過適當處理,可以轉化為線性模型??蛇M行曲線估計。 曲線估計的常用模型: Y=a+bX(線性擬和linear) Y=a+b1X+b2X2(二次曲線quadratic) Y=a+b1X+b2X2+b3X3(三次曲線cubic) X為時間,也可為某一自變量。 步驟 【Analyze】 【Regression】 【Curve Estimation】,2.4.5 非線性回歸分析,意義 非

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論