第7章 5邏輯回歸分析講義_第1頁
第7章 5邏輯回歸分析講義_第2頁
第7章 5邏輯回歸分析講義_第3頁
第7章 5邏輯回歸分析講義_第4頁
第7章 5邏輯回歸分析講義_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、7.5 邏輯回歸分析 統(tǒng)計學(xué)上的定義和計算公式 定義:邏輯回歸分析是對定性變量的回歸分析?,F(xiàn)實中的很多現(xiàn)象可以劃分為兩種可能,或者歸結(jié)為兩種狀態(tài),這兩種狀態(tài)分別用0和1 表示。買汽車回受到家庭、收入等因素的影響,但最終的結(jié)果只能是兩個:買或不買。如果我們采用多個因素對01 表示的某種現(xiàn)象進(jìn)行因果關(guān)系解釋,就可能應(yīng)用到logistic 回歸。例如,想探討胃癌發(fā)生的危險因素,可以選擇兩組人群,一組是胃癌組,一組是非胃癌組,兩組人群肯定有不同的體征和生活方式等。這里的因變量就是是否胃癌,即“是”或“否”,為兩分類變量,自變量就可以包括很多了,例如年齡、性別、飲食習(xí)慣等。自變量既可以是連續(xù)的,也可以是

2、分類的。通過logistic回歸分析,就可以大致了解到底哪些因素是胃癌的危險因素。可用于處理定性因變量的統(tǒng)計分析方法有:判別分析(Discriminant analysis)、Probit分析、Logistic回歸分析和對數(shù)線性模型等。在社會科學(xué)中,應(yīng)用最多的是Logistic回歸分析。Logistic回歸分析根據(jù)因變量取值類別不同,又可以分為Binary Logistic回歸分析和Multi-nominal Logistic回歸分析。 Binary Logistic回歸模型中因變量只能取兩個值1和0(虛擬因變量),而Multinomial Logistic回歸模型中因變量可以取多個值。本節(jié)將

3、只討論Binary Logistic回歸,并簡稱Logistic回歸(與7.5節(jié)曲線估計中介紹的Logistic曲線模型相區(qū)別)。Logistic函數(shù)的形式為實例操作在一次關(guān)于某城鎮(zhèn)居民上下班使用交通工具的社會調(diào)查中,因變量y =1表示居民主要乘坐公共汽車上下班;y=0表示主要騎自行車上下班;自變量x1表示被調(diào)查者的年齡;x2表示被調(diào)查者的月收入;x3表示被調(diào)查者的性別(x3=1為男性,x3=0為女性)。試建立y與自變量間的Logistic回歸,數(shù)據(jù)如表所示。數(shù)據(jù)“上下班交通調(diào)查表.sav” 表:使用交通工具上下班情況(22.0版本)Step 1(22.0版本)Step 2(22.0版本)St

4、ep 3(22.0版本)結(jié)果分析:(1) 第一部分輸出結(jié)果有兩個表格,第一個表格說明所有個案(10個)都被選入作為回歸分析的個案。個案處理摘要未加權(quán)的個案a數(shù)字百分比選定的個案已包括在分析中的個案10100.0缺少個案0.0總計10100.0未選定的個案0.0總計10100.0a. 如果權(quán)重有效,那么請參見分類表了解個案總數(shù)。(22.0版本)(2) 第二個表格說明初始的因變量值(0,1)已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的0、1數(shù)值。因變量編碼原始值內(nèi)部值主要騎自行車上下班0主要乘坐公共汽車上下班1(22.0版本)(3) 迭代過程迭代歷史記錄a,b,c迭代-2 對數(shù)似然系數(shù)常量步驟 0112.222

5、-.800212.217-.847312.217-.847a. 模型中包括常量。b. 初始 -2 對數(shù)似然:12.217c. 估算在迭代號 3 終止,因為參數(shù)估算更改小于 .001 。(22.0版本)(4) Classification Table分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對于y=0,有100%的準(zhǔn)確性;對于y=1,有0%準(zhǔn)確性,因此對于所有個案總共有70%的準(zhǔn)確性。 分類表a,b觀測值預(yù)測值上下班方式百分比正確主要騎自行車上下班主要乘坐公共汽車上下班步驟 0上下班方式主要騎自行車上下班70100.0主要乘坐公共汽車上下班30.0總體百分比70.0a. 模型中包括常量

6、。b. 分界值為 .500(22.0版本)Variables in the Equation表格列出了Step 1中各個變量對應(yīng)的系數(shù),以及該變量對應(yīng)的Wald 統(tǒng)計量值和它對應(yīng)的相伴概率。從該表格中可以看出x3相伴概率最小,Wald統(tǒng)計量最大,可見該變量在模型中很重要。方程式中的變量BS.E.Wald自由度顯著性Exp(B)步驟 0常量-.847.6901.5081.220.429方程式中沒有的變量a得分自由度顯著性步驟 0變量x18.4231.004x2.6011.438x3.4761.490a. 由于冗余,未計算殘差卡方。(22.0版本)(5) Omnibus Tests of Mode

7、l Coefficients表格列出了模型系數(shù)的Omnibus Tests結(jié)果。模型系數(shù)的 Omnibus 檢驗卡方自由度顯著性步驟 1步長(T)12.2173.007塊12.2173.007模型12.2173.007(22.0版本)(6) Model Summary表給出了-2 對數(shù)似然值、Cox和Snell的R2以及Nagelkerke的R2檢驗統(tǒng)計結(jié)果。模型摘要步長(T)-2 對數(shù)似然Cox & Snell R 平方Nagelkerke R 平方1.000a.7051.000a. 估算在迭代號 20 終止,因為檢測到完美擬合。此解決方案并非唯一。(22.0版本)(7) Hosmer an

8、d Lemeshow Test表格以及Contingency Table for Hosmer and Lemeshow Test表格給出了Hosmer和Lemeshow的擬合優(yōu)度檢驗統(tǒng)計量。Hosmer 和 Lemeshow 檢驗步長(T)卡方自由度顯著性1.00071.000(22.0版本)Hosmer 和 Lemeshow 檢驗的列聯(lián)表上下班方式 = 主要騎自行車上下班上下班方式 = 主要乘坐公共汽車上下班總計觀測值期望值(E)觀測值期望值(E)步驟 1111.0000.0001211.0000.0001311.0000.0001411.0000.0001511.0000.0001611.0000.0001711.0000.000180.0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論