版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、關(guān)于回歸分析第一張,PPT共二十六頁(yè),創(chuàng)作于2022年6月例1. 考慮學(xué)生體重(因變量)與身高(自變量、定量變量)的關(guān)系時(shí),一般需要把男女學(xué)生分開(kāi)來(lái)考慮,因?yàn)檫@一關(guān)系很可能因?yàn)樾詣e的不同而不同。 這些數(shù)據(jù)儲(chǔ)存在SPSS數(shù)據(jù)文件 height.sav 中。第二張,PPT共二十六頁(yè),創(chuàng)作于2022年6月如果分別考慮男、女生的體重與身高的關(guān)系,并假設(shè)這一關(guān)系為線性的,我們得到(擬合)如下兩個(gè)簡(jiǎn)單線性回歸方程,括號(hào)內(nèi)為相應(yīng)系數(shù)估計(jì)的 p-值。女生:w0 = -12.446 + 0.422 h0, R2 = 0.214,(.547) (.002) F = 11.165(.002)男生:w1 = -37.
2、400 + 0.645 h1, R2 = 0.434,(.032) (.000) F = 42.128(.000)擬合結(jié)果表明,男、女生的身高和體重的關(guān)系是不同的。問(wèn)題是:上述身高和體重的關(guān)系在不同性別之間的差異顯著嗎?在上述結(jié)果中似乎沒(méi)有一個(gè)合適的量來(lái)回答這一問(wèn)題。第三張,PPT共二十六頁(yè),創(chuàng)作于2022年6月在回歸模型中引進(jìn)啞變量(dummy variable),我們就可以來(lái)回答上述問(wèn)題。啞變量的取值為 1 和 0 ,用來(lái)區(qū)分定性變量取某個(gè)特定值還是其它值。例1中的變量 D 就是一個(gè)啞變量,啞變量的應(yīng)用 例1的帶有啞變量的回歸模型為如下的多元線性回歸模型:(變量 Dh = Dh)w = b
3、 0 + b 1 D + b 2 h + b 3 (Dh) + e (1)對(duì)于女生,D = 0,模型(1)變?yōu)?w = b 0+ b 2 h + e; 而男生的模型則為 w = (b 0+ b 1) + (b 2 + b 3) h + e。第四張,PPT共二十六頁(yè),創(chuàng)作于2022年6月擬合得到如下的回歸方程: w = -12.446 24.954 D + 0.422 h + 0.223 Dh (.534) (.347) (.001) (.166)由擬合結(jié)果可以看出,變量 D 和 Dh 的系數(shù)均不顯著。因此可以說(shuō),性別對(duì)身高和體重關(guān)系的影響不顯著。但是,由于 b 0 不顯著,因此我們需對(duì)模型作修
4、改:w = 37.4 D + 0.346 h + 0.299 Dh (.033) (.000) (.004)此時(shí),變量 D 和 Dh 的系數(shù)均為顯著的。因此我們說(shuō),性別對(duì)身高和體重關(guān)系的影響是顯著的。第五張,PPT共二十六頁(yè),創(chuàng)作于2022年6月w = 37.4 D + 0.346 h + 0.299 Dh D=0 w = 0.346 hD=1 w = 37.4 +(0.299+ 0.346) h男生身高對(duì)體重的效應(yīng)大于女生身高對(duì)體重的效應(yīng)第六張,PPT共二十六頁(yè),創(chuàng)作于2022年6月4 二項(xiàng) Logistic回歸第七張,PPT共二十六頁(yè),創(chuàng)作于2022年6月例子在一次住房展銷會(huì)上,與房地產(chǎn)商
5、簽定購(gòu)房意向書(shū)的顧客中,在隨后3個(gè)月中,只有一部分購(gòu)買了房屋.購(gòu)買房屋的顧客記為1,沒(méi)有購(gòu)買記為0第八張,PPT共二十六頁(yè),創(chuàng)作于2022年6月一、定性因變量的回歸方程的意義 設(shè)因變量 y只是取0,1兩個(gè)值的定性變量,考慮簡(jiǎn)單線性回歸模型:由于, 是01型貝努利隨機(jī)變量,則得如下分布根據(jù)隨機(jī)變量的期望值定義,可得第九張,PPT共二十六頁(yè),創(chuàng)作于2022年6月二、定性因變量回歸的特殊問(wèn)題 1. 離散非正態(tài)誤差項(xiàng) 2. 零均值異方差性 3. 回歸方程的限制 第十張,PPT共二十六頁(yè),創(chuàng)作于2022年6月三 Logistic回歸模型 針對(duì)01型因變量產(chǎn)生的問(wèn)題,對(duì)回歸 模型應(yīng)該作兩個(gè)方面的改進(jìn)。 1
6、. 回歸函數(shù)應(yīng)該改用限制在 區(qū)間內(nèi)的 連續(xù)曲線,而不能再沿用直線回歸方程 。 2. 因變量本身只取0,1兩個(gè)離散值,不適于 直接作為回歸模型中的因變量,可以用 等于1的比例代替 本身作為因變量。第十一張,PPT共二十六頁(yè),創(chuàng)作于2022年6月Logit變換 發(fā)生比第十二張,PPT共二十六頁(yè),創(chuàng)作于2022年6月Logistic 回歸模型第十三張,PPT共二十六頁(yè),創(chuàng)作于2022年6月回歸系數(shù)的含義發(fā)生比(相對(duì)風(fēng)險(xiǎn))為當(dāng)x1增加1個(gè)單位時(shí),相對(duì)風(fēng)險(xiǎn)的比值第十四張,PPT共二十六頁(yè),創(chuàng)作于2022年6月基本操作Analyze=Regression=Binary Logistic Dependent
7、 輸入因變量Covariates 輸入自變量Method:輸入自變量篩選策略 Enter:強(qiáng)行進(jìn)入 Forward:逐步篩選 Backward:向后篩選Select:選擇一個(gè)變量作為條件變量第十五張,PPT共二十六頁(yè),創(chuàng)作于2022年6月基本操作Categorical :如果自變量是分類變量 生成虛擬變量.Categorical Covariates:指定分類變量Change Contrast:選擇參照類,最常用為indicator第十六張,PPT共二十六頁(yè),創(chuàng)作于2022年6月其他操作Option:選擇Statistics and plots:輸出統(tǒng)計(jì)量和圖 Classificaton Pl
8、ots:繪制因變量實(shí)際值與預(yù)測(cè) 分類值的關(guān)系圖 Hosmerlemeshow goodness-of-fit:輸出擬合優(yōu)度指標(biāo) Casewise listing of residuals:輸出各樣本 數(shù)據(jù)的非標(biāo)準(zhǔn)化殘差,標(biāo)準(zhǔn)化殘差 Correlations of estimates:參數(shù)估計(jì)的相關(guān)陣 Iteration history:最大似然估計(jì)的迭代過(guò)程 CI for exp(B):風(fēng)險(xiǎn)比默認(rèn)為95%置信區(qū)間第十七張,PPT共二十六頁(yè),創(chuàng)作于2022年6月其他操作Display:顯示方法Probability for Stepwise:選擇逐步回歸中 自變量進(jìn)入方程或剔除出方程的顯著性水平
9、 Classfication cutoff:設(shè)置因變量分類分界值Maximum Iterations:極大似然估計(jì)的最大 迭代次數(shù)第十八張,PPT共二十六頁(yè),創(chuàng)作于2022年6月其他操作Save:保存Predicted Values:預(yù)測(cè)值 Probabilities:因變量取1的預(yù)測(cè)概率值 Group membership:分類預(yù)測(cè)值Residuals:殘差I(lǐng)nfluence:COOK距離,杠桿值等第十九張,PPT共二十六頁(yè),創(chuàng)作于2022年6月實(shí)例分析例1: 消費(fèi)行為數(shù)據(jù),研究是否購(gòu)買與性別,年齡,收入水平的關(guān)系.性別以男為參照類,收入以低收入為參照類變量選擇分別采用(1)強(qiáng)制進(jìn)入法(2)
10、逐步回歸法 要求寫(xiě)出Logistic回歸方程,解釋回歸系數(shù)的意義第二十張,PPT共二十六頁(yè),創(chuàng)作于2022年6月逐步回歸法主要結(jié)果分析1 model summary表顯示了模型擬合優(yōu)度 方面的指標(biāo),模型擬合優(yōu)度不理想分類表顯示了各模型的錯(cuò)判矩陣, 第1個(gè)模型的總體正確率為62.4%,但對(duì)購(gòu)買 人群預(yù)測(cè)的正確率為0,第2個(gè)模型的總體正確率為60.6%, 但對(duì)購(gòu)買人群預(yù)測(cè)的正確率為提高了,第二個(gè)模型略好.3 回歸方程 LogitP=-1.11+0.504gender(1)+0.096income(1)+0.761 income(2)LogitP|(gender(1)=1)- LogitP|(gen
11、der(0)=0.504odds (gender(1)=1)/ odds (gender(1)=0)=1.656第二十一張,PPT共二十六頁(yè),創(chuàng)作于2022年6月主要結(jié)果分析LogitP=-1.11+0.504gender(1)+0.096income(1)+0.761 income(2)LogitP|(income(1)=1, income(1)=0)- LogitP |(income(1)=0, income(1)=0)=0.096odds (中等收入)/ odds (低收入)=1.101第二十二張,PPT共二十六頁(yè),創(chuàng)作于2022年6月主要結(jié)果分析說(shuō)明女性的購(gòu)買發(fā)生比是男性的1.656倍中等收入的購(gòu)買發(fā)生比是低等收入的1.101倍, 高等收入的購(gòu)買發(fā)生比 是低等收入的2.139倍結(jié)論:年齡對(duì)是否購(gòu)買該商品無(wú)影響,女性及高收入階層購(gòu)買可能性大第二十三張,PPT共二十六頁(yè),創(chuàng)作于2022年6月實(shí)例分析例2: logist2.sav:某項(xiàng)病因調(diào)查工作中,通過(guò)病例對(duì)照研究,用逐步回歸法進(jìn)行Logistic回歸分析,要求對(duì)上述主要結(jié)果作統(tǒng)計(jì)分析,寫(xiě) 出Logi
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣西旅發(fā)大健康產(chǎn)業(yè)集團(tuán)有限公司招聘16人參考考試試題及答案解析
- 2026年陜西交通職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- 2026年上海興偉學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年山東協(xié)和學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年青海柴達(dá)木職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年甘肅農(nóng)業(yè)職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考試題及答案詳細(xì)解析
- 2026年四川大學(xué)錦江學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年昆明衛(wèi)生職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- 2026年江蘇海事職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫(kù)含詳細(xì)答案解析
- 2026年石家莊郵電職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- x探傷安全管理制度
- 財(cái)政分局對(duì)賬管理制度
- 噴水機(jī)車間管理制度
- 云師大附中 2026 屆高三高考適應(yīng)性月考(一)-地理試卷(含答案)
- 高中數(shù)學(xué)北師大版講義(必修二)第05講1.5正弦函數(shù)、余弦函數(shù)的圖象與性質(zhì)再認(rèn)識(shí)3種常見(jiàn)考法歸類(學(xué)生版+解析)
- 商業(yè)銀行反洗錢風(fēng)險(xiǎn)管理自評(píng)估制度研究
- 2025年度法院拍賣合同模板:法院拍賣拍賣保證金退還合同
- 海關(guān)特殊監(jiān)管區(qū)域?qū)n}政策法規(guī)匯編 2025
- 《浙江省城市體檢工作技術(shù)導(dǎo)則(試行)》
- 人教統(tǒng)編版(部編版)小學(xué)科學(xué)教材目錄
- DB34∕T 1555-2011 存量房交易計(jì)稅價(jià)格評(píng)估技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論