培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析.ppt_第1頁
培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析.ppt_第2頁
培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析.ppt_第3頁
培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析.ppt_第4頁
培訓(xùn)資料--spss統(tǒng)計(jì)軟件培訓(xùn)數(shù)據(jù)分析.ppt_第5頁
已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、SPSS統(tǒng)計(jì)軟件數(shù)據(jù)分析,宿 昆 重慶市疾控慢病所 ,2020/9/11,重慶市疾控慢病所 宿昆,2,主要內(nèi)容,統(tǒng)計(jì)描述 均數(shù)比較:t檢驗(yàn)、方差分析 2 檢驗(yàn) 簡單線性回歸 二分類Logistic回歸 基于秩次的非參數(shù)檢驗(yàn),2020/9/11,重慶市疾控慢病所 宿昆,3,1.1 統(tǒng)計(jì)描述,連續(xù)變量的統(tǒng)計(jì)描述 分類變量的統(tǒng)計(jì)描述,2020/9/11,重慶市疾控慢病所 宿昆,4,1.2.1 連續(xù)變量的統(tǒng)計(jì)描述,集中趨勢:算術(shù)均數(shù)、中位數(shù)、幾何均數(shù)、眾數(shù)、調(diào)和均數(shù)等。 離散趨勢:全距、方差和標(biāo)準(zhǔn)差、百分位數(shù)、四分位數(shù)/間距、變異系數(shù)。 分布特征:對(duì)正態(tài)分布而言,偏度系數(shù)和峰度系數(shù)等。 其他趨勢:單峰

2、、雙峰、對(duì)稱、偏態(tài),2020/9/11,重慶市疾控慢病所 宿昆,5,1.2.1 連續(xù)變量的統(tǒng)計(jì)描述(續(xù)),算術(shù)均數(shù): 用于描述服從正態(tài)分布的變量值的平均水平。 中位數(shù): 用于描述服從偏態(tài)分布資料的平均水平。 幾何均數(shù): 用于描述等比或等差數(shù)列變量值的平均水平。 方差:主要用于正態(tài)分布資料; 標(biāo)準(zhǔn)差:主要用于正態(tài)分布資料; 四分位數(shù)間距:主要用于偏態(tài)分布資料(QP75P25 ); 變異系數(shù):用于度量單位不同或均數(shù)相差懸殊的資料。,2020/9/11,重慶市疾控慢病所 宿昆,6,1.2.1 連續(xù)變量的統(tǒng)計(jì)描述(續(xù)),SPSS中的相應(yīng)功能:“頻率”過程,2020/9/11,重慶市疾控慢病所 宿昆,7

3、,1.2.1 連續(xù)變量的統(tǒng)計(jì)描述(續(xù)),SPSS中的相應(yīng)功能:“描述”過程,2020/9/11,重慶市疾控慢病所 宿昆,8,1.2.1 連續(xù)變量的統(tǒng)計(jì)描述(續(xù)),SPSS中的相應(yīng)功能:“探索”過程,2020/9/11,重慶市疾控慢病所 宿昆,9,1.2.2 分類變量的統(tǒng)計(jì)描述,頻數(shù)分布情況的描述:絕對(duì)頻數(shù)、百分比 集中趨勢的描述:眾數(shù) 使用相對(duì)數(shù)進(jìn)行深入描述:比、構(gòu)成比、率 SPSS中的相應(yīng)功能:“頻率”過程、“描述”過程和“探索”過程,2020/9/11,重慶市疾控慢病所 宿昆,10,1.2 比較均值,完全隨機(jī)化設(shè)計(jì)單組計(jì)量資料的均數(shù)與總體均數(shù)比較的t檢驗(yàn) 某個(gè)小區(qū)1000個(gè)6歲男孩的身高與

4、重慶市所有6歲男孩的身高平均值的比較 配對(duì)設(shè)計(jì)兩組相關(guān)計(jì)量資料均數(shù)間比較的t檢驗(yàn) 自身配對(duì):如治療前后某項(xiàng)指標(biāo)比較。 異體配對(duì):如對(duì)兩只兔子兩種處理方法的結(jié)果比較。 完全隨機(jī)化設(shè)計(jì)兩組獨(dú)立計(jì)量資料均數(shù)間比較的t檢驗(yàn) 如男女BMI比較 完全隨機(jī)化設(shè)計(jì)多組獨(dú)立計(jì)量資料均數(shù)間比較的單因素ANOVA 如比較不同鄉(xiāng)鎮(zhèn)BMI,2020/9/11,重慶市疾控慢病所 宿昆,11,1.2 比較均值,2020/9/11,重慶市疾控慢病所 宿昆,12,1.3 2檢驗(yàn),完全隨機(jī)設(shè)計(jì)的單樣本計(jì)數(shù)資料的率/構(gòu)成比與已知總體率/構(gòu)成比比較 完全隨機(jī)設(shè)計(jì)的兩(多)獨(dú)立樣本計(jì)數(shù)資料的率(構(gòu)成比)比較 配對(duì)設(shè)計(jì)的兩組相關(guān)樣本計(jì)數(shù)

5、資料的率/構(gòu)成比比較與Kappa一致性檢驗(yàn) 完全隨機(jī)設(shè)計(jì)的分層2檢驗(yàn),2020/9/11,重慶市疾控慢病所 宿昆,13,1.4 簡單線性回歸模型,回歸的最初含義:生物學(xué)含義 英國的遺傳學(xué)家F.Galton和K.Pearson注意到一個(gè)有趣的現(xiàn)象,即父親高,兒子也高,父親矮,兒子也矮,但兒子的身高離平均水平更近些,即子代身高有向人群的平均身高回歸(regression to the mean)的趨勢,這就是“回歸”的生物學(xué)內(nèi)涵,Galton稱該現(xiàn)象為“普遍回歸法則(law of universal regression)”。這是很自然的,否則,豈不一代比一代無限制地遠(yuǎn)離平均值,導(dǎo)致身高兩級(jí)分化?

6、 回歸的現(xiàn)在含義:完全不同了,回歸分析是研究事物或現(xiàn)象之間的數(shù)量依存關(guān)系,控制/預(yù)測,2020/9/11,重慶市疾控慢病所 宿昆,14,1.4 簡單線性回歸模型(續(xù)),模型:,( 隨機(jī)誤差),2020/9/11,重慶市疾控慢病所 宿昆,15,1.4 簡單線性回歸模型(續(xù)),線性回歸分析的一般步驟 (1)確定因變量和自變量 (2)繪制散點(diǎn)圖 (3)從樣本數(shù)據(jù)出發(fā)確定變量之間的數(shù)學(xué)關(guān)系式,并對(duì)回歸方程的各個(gè)參數(shù)進(jìn)行估計(jì). (4)對(duì)回歸方程進(jìn)行各種統(tǒng)計(jì)檢驗(yàn).:回歸方程的顯著性檢驗(yàn);擬合優(yōu)度檢驗(yàn);殘差(Y的估計(jì)值與實(shí)測值的差)分析(y/殘差-x/X or ) (5)利用回歸方程進(jìn)行預(yù)測與控制;,202

7、0/9/11,重慶市疾控慢病所 宿昆,16,1.4 簡單線性回歸模型(續(xù)),2020/9/11,重慶市疾控慢病所 宿昆,17,1.5 二分類Logistic回歸,相關(guān)(correlation)與回歸(regression)簡介 在大量的醫(yī)學(xué)研究中還需要對(duì)兩個(gè)變量之間的關(guān)系進(jìn)行量化研究,一是確定兩個(gè)變量間是否有聯(lián)系及聯(lián)系的程度如何,二是定量地確定它們之間的互依關(guān)系,相關(guān)與回歸就是研究這種關(guān)系的統(tǒng)計(jì)方法。 變量間的關(guān)系 (1)函數(shù)關(guān)系(確定性關(guān)系):如:圓面積和圓半徑. (2)統(tǒng)計(jì)關(guān)系(非確定性關(guān)系):不象函數(shù)關(guān)系那樣直接,但卻普遍存在,且有強(qiáng)有弱, 如:身高與體重. (變異) 相關(guān)和回歸分析的研

8、究對(duì)象:統(tǒng)計(jì)關(guān)系,2020/9/11,重慶市疾控慢病所 宿昆,18,1.5 二分類Logistic回歸(續(xù)),Logistic回歸:應(yīng)變量為分類變量,自變量: 連續(xù)/分類變量,研究該分類變量與一組自變量之間的關(guān)系 0/1:治愈/未治愈,或患病/未患病 有序分類:治愈/好轉(zhuǎn)/未治愈 無序分類:腺癌、鱗癌、大細(xì)胞癌,2020/9/11,重慶市疾控慢病所 宿昆,19,1.5 二分類Logistic回歸(續(xù)),模型中參數(shù)的意義 0為常數(shù)項(xiàng):自變量取值全為0時(shí)的基線狀況,未必有實(shí)際意義 i為偏回歸系數(shù),代表固定其它Xj時(shí),Xi改變一個(gè)單位引起logit(P)平均值的改變量 當(dāng)其它自變量(Xj)取值保持不

9、變時(shí), Xi取值增加一個(gè)單位引起OR自然對(duì)數(shù)值的變化量,因此在使用上OR值要遠(yuǎn)比i本身更常用,2020/9/11,重慶市疾控慢病所 宿昆,20,1.5 二分類Logistic回歸,2020/9/11,重慶市疾控慢病所 宿昆,21,1.5 二分類Logistic回歸(續(xù)),啞變量 偏回歸系數(shù)表示其它自變量Xj不變,Xi每改變一個(gè)單位,所導(dǎo)致logitP的平均變化量 x為連續(xù)性/二分類變量:沒有問題 x為多分類變量:不太合適 無序多分類:民族,各族之間不存在大小問題 有序多分類:家庭收入分為高、中、低三檔,它們之間的差距無法準(zhǔn)確衡量 在以上這些情況時(shí),我們就必須將原始的多分類變量轉(zhuǎn)化為數(shù)個(gè)啞變量(Dummy Variable),,2020/9/11,重慶市疾控慢病所 宿昆,22,啞變量 每個(gè)啞變量只代表某兩個(gè)級(jí)別或若干個(gè)級(jí)別間的差異,這樣得到的回歸結(jié)果才能有明確而合理的實(shí)際意義 對(duì)于取值具有n個(gè)水平的自變量Xi,可以生成n-1個(gè)啞變量 模型中啞變量遵循“同進(jìn)同出” 的原則,1.5 二分類Logistic回歸(續(xù)),2020/9/11,重慶市疾控慢病所 宿昆,23,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論