常用統(tǒng)計(jì)分析軟件使用介紹ppt課件_第1頁(yè)
常用統(tǒng)計(jì)分析軟件使用介紹ppt課件_第2頁(yè)
常用統(tǒng)計(jì)分析軟件使用介紹ppt課件_第3頁(yè)
常用統(tǒng)計(jì)分析軟件使用介紹ppt課件_第4頁(yè)
常用統(tǒng)計(jì)分析軟件使用介紹ppt課件_第5頁(yè)
已閱讀5頁(yè),還剩76頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、常用統(tǒng)計(jì)分析軟件,醫(yī)學(xué)科研工作中需要處理大量統(tǒng)計(jì)問題,其數(shù)據(jù)統(tǒng)計(jì)分析主要回答兩個(gè)問題:一是反應(yīng)變量的差異是否可歸因于分組因素或?qū)Ρ纫蛩兀欢嵌鄠€(gè)反應(yīng)變量間是否存在某種聯(lián)系。統(tǒng)計(jì)分析大致分為以下幾個(gè)方面:,1,常用統(tǒng)計(jì)分析軟件,1、數(shù)據(jù)質(zhì)量檢查: 即考察數(shù)據(jù)分布及變量轉(zhuǎn)換等??磾?shù)據(jù)是否符合特定統(tǒng)計(jì)方法所要求的條件,如計(jì)算平均數(shù)、標(biāo)準(zhǔn)差等時(shí)要求數(shù)據(jù)基本呈正態(tài)分布(正態(tài)性檢驗(yàn)),方差分析還要求各組方差的差別不宜過大(方差齊性檢驗(yàn)),對(duì)于非正態(tài)分布的資料需要進(jìn)行變量轉(zhuǎn)換(通過對(duì)數(shù)變換、平方根變換等轉(zhuǎn)化成正態(tài)分布資料),2,常用統(tǒng)計(jì)分析軟件,2、統(tǒng)計(jì)描述:按分組因素或控制因素分組,計(jì)算反映變量特性的基本

2、統(tǒng)計(jì)量。 3、統(tǒng)計(jì)推斷:對(duì)不同資料,用特定的統(tǒng)計(jì)方法作分析處理。各種推斷的假設(shè)檢驗(yàn)得到的P值是下結(jié)論的主要依據(jù)。 通過上述分析得到的結(jié)論,提供了專業(yè)分析時(shí)的統(tǒng)計(jì)學(xué)背景。但這些分析時(shí)計(jì)算公式和表格繁多,目前均可在計(jì)算機(jī)上借助統(tǒng)計(jì)軟件完成,將各種分析結(jié)果簡(jiǎn)單明了地表達(dá)出來。,3,常用統(tǒng)計(jì)分析軟件,統(tǒng)計(jì)軟件是一種應(yīng)用軟件,是對(duì)資料進(jìn)行各種統(tǒng)計(jì)處理分析的系列程序組合。 常用的統(tǒng)計(jì)分析軟件有:中國(guó)醫(yī)學(xué)百科全書-醫(yī)學(xué)統(tǒng)計(jì)學(xué)統(tǒng)計(jì)軟件包(PEMS)、線性模型統(tǒng)計(jì)軟件包(SPLM)、社會(huì)科學(xué)統(tǒng)計(jì)軟件包(SPSS)、標(biāo)準(zhǔn)統(tǒng)計(jì)軟件系統(tǒng)(SAS)等。國(guó)際上最流行并具有權(quán)威性的統(tǒng)計(jì)分析軟件中,SAS以其最專業(yè)化和功能最

3、全面為統(tǒng)計(jì)專業(yè)人員用軟件,而SPSS則因易于操作而成為在非統(tǒng)計(jì)專業(yè)人員中應(yīng)用最多的統(tǒng)計(jì)軟件。,4,常用統(tǒng)計(jì)分析軟件,SPSS for Windows Ver 10.0 概述,5,推薦使用的幾本教材,6,SPSS入門,序言 SPSS基礎(chǔ) SPSS數(shù)據(jù)文件的建立與管理 SPSS數(shù)據(jù)的基本加工和處理 SPSS輸出窗口,7,序 言,統(tǒng)計(jì)分析軟件是數(shù)據(jù)分析的主要工具 完整的數(shù)據(jù)分析過程包括: 數(shù)據(jù)的收集 數(shù)據(jù)的整理 數(shù)據(jù)的分析 統(tǒng)計(jì)學(xué)為數(shù)據(jù)分析過程提供一套完整的科學(xué)的方法論。統(tǒng)計(jì)軟件為數(shù)據(jù)分析提供了實(shí)現(xiàn)手段。,8,序 言,統(tǒng)計(jì)分析軟件的一般特點(diǎn) 功能全面,系統(tǒng)地集成了多種成熟的統(tǒng)計(jì)分析方法; 有完善的數(shù)

4、據(jù)定義、操作和管理功能; 方便地生成各種統(tǒng)計(jì)圖形和統(tǒng)計(jì)表格; 使用方式簡(jiǎn)單,有完備的聯(lián)機(jī)幫助功能; 軟件開放性好,能方便地和其他軟件進(jìn)行數(shù)據(jù)交換,9,序 言,常用統(tǒng)計(jì)軟件簡(jiǎn)介 SAS (Ver8.2) -真正的巨無霸。被譽(yù)為國(guó)際上的標(biāo)準(zhǔn)統(tǒng)計(jì)軟件和最權(quán)威的組合式優(yōu)秀統(tǒng)計(jì)軟件。 人機(jī)對(duì)話界面太不友好 圖形操作界面比較糟糕 一切圍繞編程設(shè)計(jì) 學(xué)習(xí)起來較困難(編程) 說明書非常難懂 價(jià)格貴的人直跳,10,序 言,常用統(tǒng)計(jì)軟件簡(jiǎn)介SPSS (Ver10) -統(tǒng)計(jì)軟件中的貴族 操作界面極為友好 所有統(tǒng)計(jì)軟件中最友好的 精心設(shè)計(jì)的圖形操作界面 美觀的結(jié)果輸出 強(qiáng)大的輔助教學(xué)功能 輸出結(jié)果與中文WORD尚存在

5、一定兼容問題 在國(guó)內(nèi)深受歡迎,特別是市場(chǎng)調(diào)研行業(yè) 在歐洲各研究機(jī)構(gòu)中得到廣泛應(yīng)用,11,序 言,常用統(tǒng)計(jì)軟件簡(jiǎn)介S-Plus(Ver6) S語(yǔ)言(AT 是目前國(guó)內(nèi)功能最完整的統(tǒng)計(jì)軟件包。,14,序 言,學(xué)習(xí)使用統(tǒng)計(jì)分析軟件的基本方法 弄清分析的目的 正確收集待處理和分析的數(shù)據(jù)(目的、影響因素的剔除)。 弄清統(tǒng)計(jì)概念和統(tǒng)計(jì)含義,知道統(tǒng)計(jì)方法的適用范圍,無需記憶公式。 選擇一種或幾種統(tǒng)計(jì)分析方法探索性地分析數(shù)據(jù)。 讀懂計(jì)算機(jī)分析的數(shù)據(jù)結(jié)果,發(fā)現(xiàn)規(guī)律,得出分析,15,SPSS基礎(chǔ),軟件名稱 Statistical Package for Social Science Statistical Prod

6、uct and Service Solutions 軟件發(fā)展 60年代:美國(guó)斯坦福大學(xué)三位研究生研制 70年代:SPSS總部成立于芝加哥,推出 SPSS中小型機(jī)版SPSSX 80年代:微機(jī)版(V1-3)SPSS/PC+ 90年代:Windows版(v5-11) 2003年:Windows版(v12),16,SPSS簡(jiǎn)介,SPSS(Statistical Package for Social Sciences,社會(huì)科學(xué)統(tǒng)計(jì)軟件包) ,是當(dāng)前國(guó)際上公認(rèn)的最為強(qiáng)大的統(tǒng)計(jì)分析軟件之一。它不僅適用于社會(huì)科學(xué),同樣可應(yīng)用于經(jīng)濟(jì)學(xué)、心理學(xué)、醫(yī)學(xué)等各個(gè)領(lǐng)域。 最顯著的特點(diǎn)是運(yùn)用菜單和對(duì)話框的操作方式,除了數(shù)據(jù)

7、錄入外,它不需要編寫程序, 絕大多數(shù)操作過程僅靠鼠標(biāo)擊鍵即可完成,易于操作,完全可以在Windows下通過“菜單”、“對(duì)話框”使用單擊或雙擊鼠標(biāo)來操作,非常方便,深受用戶歡迎。 是應(yīng)用最多的統(tǒng)計(jì)軟件之一。 目前最新版本為SPSS 14.0版。,17,SPSS 目前尚無漢化版本,但它可在漢化的Windows95或以上平臺(tái)上使用。界面友好,使用直觀、 靈活,操作簡(jiǎn)便,是一個(gè)易學(xué)、 好用的統(tǒng)計(jì)分析和圖表制作工具,是較為理想的統(tǒng)計(jì)分析軟件。 1.本軟件特點(diǎn) (1)操作簡(jiǎn)便: 系統(tǒng)提供了“窗口菜單” 、“對(duì)話框”等簡(jiǎn)便操作方式。,18,(2)數(shù)據(jù)轉(zhuǎn)換功能強(qiáng): 可存取和轉(zhuǎn)換多種數(shù)據(jù)類型,如DBASE、FO

8、XBASE、FOXPRO產(chǎn)生的.dbf數(shù)據(jù)文件;Excel產(chǎn)生的.xls數(shù)據(jù)文件;由SPSS for DOS產(chǎn)生的.sys數(shù)據(jù)文件等都可方便地讀入。而本軟件產(chǎn)生的數(shù)據(jù)文件也可方便地轉(zhuǎn)化為相應(yīng)的其他數(shù)據(jù)文件。 (3)數(shù)據(jù)管理功能強(qiáng)大: 集數(shù)據(jù)錄入、 轉(zhuǎn)換、 檢索、管理、 統(tǒng)計(jì)分析、 作圖、制表及編輯功能于一身。,19,(4)統(tǒng)計(jì)分析方法全面、豐富: 含有最新的統(tǒng)計(jì)分析方法且所用方法具有權(quán)威性。 (5)結(jié)果輸出規(guī)范: 輸出結(jié)果主要為圖形方式,規(guī)范而簡(jiǎn)潔,還可根據(jù)個(gè)人要求編輯輸出方式。,20,2.主要窗口及其功能 SPSS 10.0 主要有3大窗口:數(shù)據(jù)編輯窗(Data Editor) 、結(jié)果輸出窗

9、(Output Navigator)和語(yǔ)句編輯窗(Syntax Editor),數(shù)據(jù)編輯窗主要有建立新的數(shù)據(jù)文件 、編輯和顯示已有數(shù)據(jù)文件等功能.啟動(dòng)SPSS后,數(shù)據(jù)編輯窗回自動(dòng)打開.,21,所有統(tǒng)計(jì)分析結(jié)果,包括文本、圖形和表格形式,均顯示在結(jié)果輸出窗內(nèi).結(jié)果輸出窗相應(yīng)地設(shè)有3個(gè)編輯器,即文本編輯器、統(tǒng)計(jì)圖編輯器和統(tǒng)計(jì)表編輯器,輸出結(jié)果可通過激活這些編輯器進(jìn)行編輯. 語(yǔ)句編輯窗的功能在于SPSS過程以命令語(yǔ)句形式出現(xiàn).該窗口還可編輯對(duì)話框操作不能實(shí)現(xiàn)的特殊過程的命令語(yǔ)句.,22,3、統(tǒng)計(jì)分析功能概述,(1)基本統(tǒng)計(jì)分析 SPSS 10.0的基本統(tǒng)計(jì)分析功能是通過 Summarize完成的,打

10、開Statistic菜單即可。包括頻數(shù)分布分析(frequencies)、描述性統(tǒng)計(jì)分析(descriptive)、探索性分析(explore)、列聯(lián)表資料分析(crosstabs)及觀測(cè)量列表(list cases)等。通過這些內(nèi)容可對(duì)數(shù)據(jù)的分布特征有全面的了解。,23,3、統(tǒng)計(jì)分析功能概述,(2).其他統(tǒng)計(jì)分析功能 有關(guān)統(tǒng)計(jì)分析方法,有均數(shù)比較(compare means)、廣義因素分析(GLM-general factorial ANOVA)、相關(guān)分析(correlate)、回歸分析(regresssion)、聚類分析(classify)、因子分析(factor)、非參數(shù)檢驗(yàn)(nonpa

11、rametic test)、Logistic 回歸分析、生存分析(survival)等分析功能,24,4、輸出結(jié)果的編輯,結(jié)果輸出窗口的主要功能有:瀏覽輸出結(jié)果、編輯輸出的統(tǒng)計(jì)圖表及文本、輸出可供其他應(yīng)用軟件所用的結(jié)果. 結(jié)果輸出窗又分為兩個(gè)窗口:左窗為輸出的標(biāo)題,稱為標(biāo)題窗;右窗內(nèi)為分析的具體輸出內(nèi)容,包括統(tǒng)計(jì)圖、表和文字說明,稱為內(nèi)容窗. 在結(jié)果窗內(nèi)選擇內(nèi)容后,單擊鼠標(biāo)右鍵,在彈出菜單中選擇Copy/ Copy Objects,然后打開Word文件,選擇粘貼命令,即可將所選內(nèi)容粘貼到文本文件中.,25,SPSS簡(jiǎn)介(一),SPSS for Windows版本由最初的4.0版本發(fā)展升級(jí)到現(xiàn)在

12、的11.0以上版本。 安裝SPSS10.0 for Windows 軟、硬件要求: 1、 Windows 95及以上版本; 2、16MB或以上內(nèi)存; 3、80MB及以上可用硬盤空間。,26,SPSS簡(jiǎn)介(二),SPSS的啟動(dòng): 在快捷工具欄單擊SPSS 10.0 圖標(biāo) 開始 程序 SPSS 10.0 for Windows SPSS軟件分析的基本步驟: 數(shù)據(jù) 選擇分析程序 選擇要分析的變量進(jìn)行分析 得出結(jié)果 以文件 pan.sav 為例。,27,28,SPSS簡(jiǎn)介(三),SPSS的四個(gè)窗口: 數(shù)據(jù)編輯窗口(Data Editor):?jiǎn)?dòng)SPSS后自動(dòng)打開; File new data 。 程序

13、編輯窗口(Syntax Editor): File new syntax 。 結(jié)果輸出窗口(Viewer):第一次產(chǎn)生分析結(jié)果的SPSS過程 后自動(dòng)出現(xiàn);File new output。 圖表編輯窗口(Chart Editor):選定要編輯的圖表,雙擊它,即進(jìn)入此窗口。,29,SPSS基礎(chǔ),基本窗口 數(shù)據(jù)編輯窗口(data editor) 功能:對(duì)SPSS的數(shù)據(jù)進(jìn)行定義、錄入、修改、管理等基本操作的窗口 組成:窗口主菜單(Data、Transform、Analyze、Graphs)、工具欄、數(shù)據(jù)編輯區(qū)、狀態(tài)顯示區(qū) SPSS運(yùn)行過程中自動(dòng)打開;且只能打開一個(gè)窗口;運(yùn)行過程中無法關(guān)閉 SPSS中各

14、統(tǒng)計(jì)分析功能都是針對(duì)該窗口中的數(shù)據(jù)進(jìn)行的;窗口中的數(shù)據(jù)以.sav存于磁盤上,30,SPSS基礎(chǔ),基本窗口 輸出窗口(viewer) 功能:SPSS統(tǒng)計(jì)分析報(bào)表及圖形的輸出窗口 組成:窗口主菜單、工具欄、結(jié)果顯示區(qū)、狀態(tài)顯示區(qū) 在進(jìn)行第一次分析時(shí)自動(dòng)打開,也可手工打開;可以手工打開若干個(gè)可相互切換的viewer窗口;輸出窗口可以關(guān)閉; 狀態(tài)欄上的!表示當(dāng)前輸出窗口 窗口內(nèi)容以.spo存于磁盤上,31,SPSS基礎(chǔ),利用SPSS做數(shù)據(jù)分析的一般步驟 建立SPSS數(shù)據(jù)文件 定義數(shù)據(jù)文件結(jié)構(gòu) 錄入修改和編輯待分析的數(shù)據(jù) 分析數(shù)據(jù) 統(tǒng)計(jì)分析之前的數(shù)據(jù)預(yù)處理 統(tǒng)計(jì)分析和建模 結(jié)果的說明和解釋 數(shù)據(jù)和分析結(jié)

15、果的保存,32,SPSS數(shù)據(jù)文件的建立與管理,數(shù)據(jù)文件的特點(diǎn) 數(shù)據(jù)庫(kù)的建立 數(shù)據(jù)的錄入和保存 數(shù)據(jù)的編輯 與其他軟件數(shù)據(jù)共享,33,SPSS數(shù)據(jù)文件的特點(diǎn),SPSS數(shù)據(jù)文件是一種有結(jié)構(gòu)的數(shù)據(jù)文件 數(shù)據(jù)文件的每一行代表一個(gè)觀測(cè)量(概率事件) 每一列代表一個(gè)變量 在數(shù)據(jù)編輯器中可以輸入和編輯數(shù)據(jù),但是不能輸入數(shù)學(xué)表達(dá)式和函數(shù),34,數(shù)據(jù)庫(kù)的建立,新建數(shù)據(jù)文件: File New Data 第一步: 定義變量(Variable View) 第二步: 錄入數(shù)據(jù)(Data View) 參見文件 use1.sav.,35,36,定義變量: Name(變量名)-最大允許8個(gè)英文字符、4個(gè)中文字符 Type(

16、變量類型)-最常用的有數(shù)值型(Numeric)、 字符型(String)、日期型(date)等 Labels (變量名標(biāo)簽)-對(duì)變量的說明 Values (變量值標(biāo)簽)-說明分組變量的取值情況 Missing (缺失值) Column (變量列) Measure (變量量度)- Scale為連續(xù)型變量(數(shù)值型) Ordinal為有序分類變量(序數(shù)型) Nominal為無序分類變量(名詞型),37,變量名(Variable name) 變量名是變量存取的唯一標(biāo)志 變量類型(type)和顯示寬度(width) 數(shù)值型:常用標(biāo)準(zhǔn)數(shù)值型(Numeric):默認(rèn)類型8.2如:12345678、12345

17、.67、-1234.56 字符型(String): 存儲(chǔ)字符數(shù)據(jù)8位。如:beijing處理時(shí)用雙引號(hào)擴(kuò)起來 日期型(Date):存儲(chǔ)日期數(shù)據(jù),如:20-AUG-1999 注意:顯示寬度不影響數(shù)據(jù)的存儲(chǔ),38,數(shù)據(jù)庫(kù)的建立,例 用下面數(shù)據(jù)建立數(shù)據(jù)庫(kù):,39,40,數(shù)據(jù)庫(kù)的建立,錄入數(shù)據(jù): 數(shù)據(jù)庫(kù)為一個(gè)二維表結(jié)構(gòu),一行為一個(gè)個(gè)體或一條記錄,一列為一個(gè)變量。 有三種錄入方法: (1)直接錄入; (2)連續(xù)多個(gè)相同值的輸入; (3)將Excel數(shù)據(jù)直接引入SPSS; (4) 其他數(shù)據(jù)庫(kù)格式的導(dǎo)入;如EPI,SAS,WORD等;,41,數(shù)據(jù)的編輯,打開數(shù)據(jù)文件 數(shù)據(jù)定位 插入和刪除個(gè)案 插入和刪除變量

18、 數(shù)據(jù)單元數(shù)據(jù)的移動(dòng)和復(fù)制,42,與其他軟件共享數(shù)據(jù),打開其他格式的數(shù)據(jù)文件 直接打開 在SPSS 10已經(jīng)可以直接讀入許多常用格式的數(shù)據(jù)文件 使用數(shù)據(jù)庫(kù)查詢打開 利用通用數(shù)據(jù)庫(kù)ODBC接口讀取數(shù)據(jù)文件 在9.0及以前版本中非常重要 使用文本導(dǎo)入向?qū)ёx入文本文件 和大型機(jī)交換文件時(shí)常用,43,與其它軟件共享,直接打開,44,SPSS數(shù)據(jù)的基本加工和處理,數(shù)據(jù)文件的整理 個(gè)案排序、個(gè)案選取、文件合并、文件轉(zhuǎn)置 數(shù)據(jù)加工 計(jì)算變量、產(chǎn)生計(jì)數(shù)變量、分類匯總 數(shù)據(jù)分組 手工分組 數(shù)據(jù)文件的其他處理功能 指定加權(quán)變量、SPSS變量集的定義和使用,45,數(shù)據(jù)文件的整理,個(gè)案排序(sort) 將所有個(gè)案按照

19、用戶指定的某一個(gè)或多個(gè)變量的變量值的升序或降序重新排列 快速查找異常值、極端值 個(gè)案選取(select cases) 個(gè)案選取方式,46,數(shù)據(jù)文件的整理,文件合并(merge file) 將兩個(gè)SPSS數(shù)據(jù)文件合并到一個(gè)數(shù)據(jù)文件中。 縱向合并、橫向合并 文件轉(zhuǎn)置(transpose) 將數(shù)據(jù)文件行列互換,即:將個(gè)案轉(zhuǎn)為變量,變量轉(zhuǎn)為個(gè)案.,47,數(shù)據(jù)的加工,變量計(jì)算(compute) 產(chǎn)生新變量或?qū)υ兞窟M(jìn)行必要的轉(zhuǎn)換 SPSS算術(shù)表達(dá)式和邏輯表達(dá)式 SPSS函數(shù) 產(chǎn)生計(jì)數(shù)變量(count) 對(duì)所有或部分個(gè)案,計(jì)算若干個(gè)變量中有幾個(gè)變量的值落在指定的區(qū)域內(nèi),并將結(jié)果存入新變量中。,48,數(shù)據(jù)的

20、加工,分類匯總(aggreate) 按指定的分類變量的變量值對(duì)個(gè)案分組; 計(jì)算每組個(gè)案的匯總變量的基本統(tǒng)計(jì)量; 將計(jì)算結(jié)果生成到一新文件中,即:在新文件中對(duì)應(yīng)分類變量的每一個(gè)分類值產(chǎn)生一個(gè)個(gè)案。,49,數(shù)據(jù)的分組,目的:了解數(shù)據(jù)的總體分布狀況 手工分組(recode) 將指定按哪個(gè)變量分組,即:指定分組變量;定義分組變量的分組區(qū)間(不重、不漏);指定一個(gè)存放分組結(jié)果的標(biāo)志變量 自動(dòng)分組(Categorize Variables) 將連續(xù)性變量自動(dòng)按分位數(shù)要求分成幾類,50,數(shù)據(jù)文件的其它處理功能,加權(quán)(weight cases) 指定某一變量為加權(quán)變量。 變量集 加快變量選擇的速度 變量集的定

21、義 變量集的使用,51,第二章 統(tǒng)計(jì)分析,基本統(tǒng)計(jì)分析 均值檢驗(yàn) 方差分析 相關(guān)和回歸分析 聚類分析,52,2.1 基本統(tǒng)計(jì)分析,頻數(shù)分布分析(Frequencies) 描述性統(tǒng)計(jì)分析(Descriptives) 探索性分析(Explore) 列聯(lián)表資料分析(Crosstabs),53,2.1.1 頻數(shù)分布分析,目的 頻數(shù)分布分析主要通過頻數(shù)分布表、條圖和直方圖,以及集中趨勢(shì)和離散趨勢(shì)的各種統(tǒng)計(jì)量,描述數(shù)據(jù)的分布特征。 采用的方法 計(jì)算頻分布表 繪制統(tǒng)計(jì)圖形 上述方法適用于定序、定類、定距類型數(shù)據(jù),54,2.1.2 描述性統(tǒng)計(jì)分析,目的: 描述性統(tǒng)計(jì)分析主要用以計(jì)算描述集中趨勢(shì)和離散趨勢(shì)的各種

22、統(tǒng)計(jì)量,并可對(duì)變量進(jìn)行標(biāo)準(zhǔn)化處理。 步驟: 【 Analyze 】 【 Descriptive Statistics 】 【 Descriptives 】,55,2.2 均值檢驗(yàn),統(tǒng)計(jì)假設(shè)檢驗(yàn)概述 單樣本的t檢驗(yàn) 兩個(gè)獨(dú)立樣本的t檢驗(yàn) 兩個(gè)配對(duì)樣本的t檢驗(yàn),56,2.2.1統(tǒng)計(jì)假設(shè)檢驗(yàn)概述,統(tǒng)計(jì)推斷(statistical inference),就是根據(jù)抽樣分布律和概率理論,由樣本結(jié)果(統(tǒng)計(jì)數(shù))來推論總體特征(參數(shù))。 統(tǒng)計(jì)推斷的基本內(nèi)容: 統(tǒng)計(jì)假設(shè)檢驗(yàn)(hypothesis test) 參數(shù)估計(jì)(parametric estimate) 統(tǒng)計(jì)假設(shè)檢驗(yàn)是指根據(jù)某種實(shí)際需要,對(duì)未知的或不完全知道

23、的統(tǒng)計(jì)總體提出一些假設(shè)(這些假設(shè)通常構(gòu)成完全事件系),然后由樣本的實(shí)際結(jié)果,經(jīng)過一定的計(jì)算,作出在概率的意義上應(yīng)當(dāng)接受那種假設(shè)的檢驗(yàn)。,57,假設(shè)檢驗(yàn)的步驟,提出無效假設(shè) :實(shí)得差異由誤差造成;備擇假設(shè) :實(shí)得差異由總體參數(shù)不同造成。 確定顯著水平 。 在 為正確的假設(shè)下,根據(jù)統(tǒng)計(jì)數(shù)的一定分布律,算出實(shí)得差異由誤差造成的概率。 如果這個(gè)概率 ,則在 水平上否定 ,接受 ;反之亦然。,58,2.2.2 單樣本的t檢驗(yàn),含義: 檢驗(yàn)?zāi)匙兞康目傮w均值與指定的檢驗(yàn)值之間是否存在顯著差異。 要求: 樣本來自的總體服從正態(tài)分布。 步驟: 【Analyze】 【Compare means】 【One sam

24、ple t test】,59,2.2.3 兩獨(dú)立樣本的t檢驗(yàn),(一)含義: 根據(jù)兩獨(dú)立樣本的數(shù)據(jù),對(duì)兩總體均值是否有顯著差異進(jìn)行推斷。 例如:男生和女生的計(jì)算機(jī)平均成績(jī)有顯著差異嗎? 城鎮(zhèn)和農(nóng)村的平均存(?。┛罱痤~有顯著差異嗎? (二)要求: 兩樣本必須相互獨(dú)立,即:抽取其中一批樣本對(duì)抽取另一批樣本沒有任何影響。(如:北京周歲兒童與上海兒童的平均身高) 兩總體服從正態(tài)分布,60,2.2.3 兩獨(dú)立樣本的t檢驗(yàn),步驟 【Analyze】 【Compare Means】 【Independent-sample t test】 結(jié)論 首先,如果F檢驗(yàn)的P,認(rèn)為方差不齊性;其次看Unequal行的t檢

25、驗(yàn)概率。如果,則拒絕t檢驗(yàn)的H0,認(rèn)為兩總體均值有顯著差異;如果,則不拒絕t檢驗(yàn)的H0。 首先,如果F檢驗(yàn)的P,認(rèn)為方差齊性;其次看equal行的t檢驗(yàn)概率。其余同上,61,2.2.4 兩配對(duì)樣本的t檢驗(yàn),含義: 根據(jù)配對(duì)樣本對(duì)兩總體均值是否有顯著差異進(jìn)行推斷. 例如:某種減肥茶是否有效 要求: 兩樣本數(shù)據(jù)必須兩兩配對(duì),即:樣本個(gè)數(shù)相同,個(gè)案順序相同.如:減肥茶的效果、不同廣告形式對(duì)銷售額的影響.(控制了個(gè)案自身的影響) 兩總體服從正態(tài)分布,62,2.2.4 兩配對(duì)樣本的t檢驗(yàn),基本思路 計(jì)算兩樣本對(duì)應(yīng)的個(gè)案的差值di=Y1i-Y2i 計(jì)算t統(tǒng)計(jì)量和對(duì)應(yīng)的相伴概率P(絕對(duì)值大于等于的雙側(cè)概率)

26、 結(jié)論:P,則拒絕H0,認(rèn)為兩總體均值有顯著差異.P ,不能拒絕H0. 步驟 【Analyze】 【Compare Means】 【Paired-sample t test】,63,2.3 方差分析,目的: 方差分析是從數(shù)據(jù)間的差異入手,分析哪些因素是影響數(shù)據(jù)差異的眾多因素中的主要因素。 例如: 影響某農(nóng)作物畝產(chǎn)量的因素(品種、施肥量、氣候等) 影響推銷某種商品的推銷額(不同的推銷策略、價(jià)格、包裝方式、推銷人員的形象等) 核心問題 從數(shù)據(jù)差異角度看: 觀測(cè)變量的數(shù)據(jù)差異=控制因素造成+隨機(jī)因素造成 方差分析正是要分析觀測(cè)變量的變動(dòng)是否主要是由控制因素造成還是由隨機(jī)因素造成的,以及控制變量的各個(gè)

27、水平是如何對(duì)觀測(cè)變量造成影響的。,64,2.3 方差分析,單因素試驗(yàn)資料方差分析 多因素試驗(yàn)資料方差分析 協(xié)方差分析,65,2.3.1 單因素方差分析,目的 檢驗(yàn)?zāi)骋粋€(gè)控制因素的改變是否會(huì)給觀察變量帶來顯著影響. 例如: 考察不同肥料對(duì)某農(nóng)作物畝產(chǎn)量是否有顯著差異. 考察不同學(xué)歷是否對(duì)工資收入產(chǎn)生顯著影響. 步驟 【Analyze】 【Compare Means】 【One-way ANOVA】,66,方差分析中的多重比較,目的 如果總體均值存在差異,F(xiàn)檢驗(yàn)不能說明哪個(gè)水平造成了觀察變量的顯著差異。多重比較將對(duì)每個(gè)水平的均值逐對(duì)進(jìn)行比較檢驗(yàn)。 常用方法 LSD法 實(shí)際上就是t檢驗(yàn)的變形,只是在

28、變異和自由度的計(jì)算上利用了整個(gè)樣本信息。 Duncan氏新復(fù)極差檢驗(yàn)法 Tukey氏固定極差檢驗(yàn)法 Dunnett氏最小顯著差數(shù)檢驗(yàn)法,67,2.3.2 多因素方差分析,控制因素的種類 固定效應(yīng)因素(Fixed Factor):指的是該因素在樣本中所有可能的水平都出現(xiàn)了。 隨機(jī)效應(yīng)因素(Random Factor):該因素所有可能的取值在樣本中沒有都出現(xiàn),因此要用樣本來推論總體情況,包括未出現(xiàn)的水平。這不可避免的存在誤差(即隨機(jī)效應(yīng)),需要估計(jì)該誤差的大小,因此被稱為隨機(jī)因素。 基本思路: 以兩個(gè)控制變量的方差分析為例: SS總=SSA+SSB+SSAB+SSe 表示兩個(gè)控制變量的交互影響,即

29、:兩個(gè)控制變量各水平之間搭配時(shí)對(duì)觀察變量的影響.,68,2.3.3 協(xié)方差分析,目的: 將無法或很難控制的因素作為協(xié)變量,在排除協(xié)變量影響的條件下更精確地分析控制變量對(duì)觀察變量的影響。,69,2.3.3 協(xié)方差分析,應(yīng)用實(shí)例,70,2.3.3 協(xié)方差分析,基本思路: 協(xié)變量是數(shù)值型的;與觀測(cè)變量的線性關(guān)系在各水平均成立,且斜率大致相同。 SS總= SS協(xié)+SSA+SSB+SSAB+SSe 步驟 【Analyze】 【General Linear Model】 【Univariate】 注意:在彈出的對(duì)話框中將協(xié)變量選入【Covariate(s)】欄,71,2.4 相關(guān)和回歸分析,相關(guān)分析 一元

30、回歸分析 多元回歸分析 曲線擬合 非線性回歸分析,72,2.4 相關(guān)和回歸分析,相關(guān)分析和回歸分析的任務(wù) 研究對(duì)象:統(tǒng)計(jì)關(guān)系 相關(guān)分析旨在測(cè)度變量間線性關(guān)系的強(qiáng)弱程度。 回歸分析側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過一定的數(shù)學(xué)表達(dá)式來描述這種關(guān)系,進(jìn)而確定一個(gè)或幾個(gè)變量的變化對(duì)另一個(gè)變量的影響程度.,73,2.4 相關(guān)和回歸分析,目的 通過樣本數(shù)據(jù),研究?jī)勺兞块g線性相關(guān)程度的強(qiáng)弱。(例如:職工的年齡和收入之間的關(guān)系、工人數(shù)和管理人員之間的數(shù)量關(guān)系) 基本方法 繪制散點(diǎn)圖、計(jì)算相關(guān)系數(shù),74,2.4.1 相關(guān)系數(shù),作用: 以精確的相關(guān)系數(shù)(r)體現(xiàn)兩個(gè)變量間的線性關(guān)系程度. r:-1,+1; r=1:完全正相關(guān); r=-1:完全負(fù)相關(guān); r=0:無線性相關(guān)。 說明: 相關(guān)系數(shù)只是較好地度量了兩變量間的線性相關(guān)程度,不能描述非線性關(guān)系。 數(shù)據(jù)中存在極端值時(shí)不好。,75,2.4.2 一元線性回歸方程,一元回歸方程: Y=a+bX a為常數(shù)項(xiàng);b為Y對(duì)X回歸系數(shù),即:X每變動(dòng)一個(gè)單位所引起的Y的平均變動(dòng) 回歸方程的顯著性檢驗(yàn) (1)目的: 檢驗(yàn)自變量與因變量之間的線性關(guān)系是否顯著,是否可用線性模型來表示. (2)檢驗(yàn)方法 t檢驗(yàn) F檢驗(yàn)(一元回歸中,F檢驗(yàn)與t檢驗(yàn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論