版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
多元回歸分析數(shù)據(jù)分析的重要方法揭示多個變量之間的復(fù)雜關(guān)系課程目標掌握基本理論理解多元回歸分析的核心概念和數(shù)學(xué)基礎(chǔ)學(xué)習(xí)分析方法能夠構(gòu)建、評估和改進多元回歸模型培養(yǎng)應(yīng)用能力多元回歸分析的定義研究方法探索一個因變量與多個自變量之間關(guān)系的統(tǒng)計技術(shù)數(shù)學(xué)模型Y=β?+β?X?+β?X?+...+β?X?+ε預(yù)測工具利用多個變量共同預(yù)測目標變量的值多元回歸分析的應(yīng)用領(lǐng)域經(jīng)濟金融預(yù)測經(jīng)濟增長、股票價格、通貨膨脹率醫(yī)學(xué)研究分析疾病風(fēng)險因素、藥物療效評估市場營銷確定影響銷售額的關(guān)鍵因素工業(yè)生產(chǎn)優(yōu)化生產(chǎn)參數(shù)、質(zhì)量控制多元回歸分析與簡單線性回歸的區(qū)別簡單線性回歸僅包含一個自變量Y=β?+β?X+ε只考慮單一影響因素多元回歸分析包含多個自變量Y=β?+β?X?+β?X?+...+β?X?+ε綜合考慮多種影響因素多元回歸模型的基本形式線性函數(shù)關(guān)系Y=β?+β?X?+β?X?+...+β?X?+ε參數(shù)含義β?是截距項,β?是各自變量系數(shù)誤差項ε表示隨機誤差項多元回歸模型的假設(shè)條件1線性關(guān)系因變量與自變量之間存在線性關(guān)系2誤差項獨立各觀測值的誤差項相互獨立3同方差性誤差項具有相同方差4正態(tài)分布誤差項服從正態(tài)分布自變量的選擇原則理論相關(guān)性變量應(yīng)與研究主題有理論聯(lián)系統(tǒng)計顯著性變量應(yīng)對模型有統(tǒng)計顯著貢獻數(shù)據(jù)可獲得性變量數(shù)據(jù)應(yīng)易于獲取且可靠多重共線性問題定義自變量之間存在高度相關(guān)性后果回歸系數(shù)估計不穩(wěn)定,方差增大診斷相關(guān)系數(shù)矩陣,方差膨脹因子(VIF)變量之間的相關(guān)性分析強正相關(guān)弱正相關(guān)無相關(guān)弱負相關(guān)強負相關(guān)多元回歸模型的參數(shù)估計收集數(shù)據(jù)獲取因變量和自變量的觀測值建立方程構(gòu)建多元回歸方程估計參數(shù)計算β?的最優(yōu)估計值最小二乘法(OLS)原理最小化平方和殘差平方和達到最小值Σ數(shù)學(xué)表達minΣ(Y?-??)2最優(yōu)估計量得到參數(shù)的最佳線性無偏估計OLS估計量的性質(zhì)無偏性E(β?)=β,估計量的期望等于真實參數(shù)有效性在所有線性無偏估計中方差最小一致性樣本量增大時,估計量收斂于真實參數(shù)多元回歸模型的矩陣表示矩陣形式簡潔表達復(fù)雜計算Y=Xβ+εβ?=(X'X)?1X'Y多元回歸方程的解釋方程結(jié)構(gòu)?=b?+b?X?+b?X?+...+b?X?b?是截距,b?是回歸系數(shù)預(yù)測功能根據(jù)X值預(yù)測Y的期望值提供因變量與自變量關(guān)系的最佳線性擬合回歸系數(shù)的含義β?(截距)當所有自變量為0時,因變量的預(yù)期值β?(斜率)其他變量不變時,X?變動一單位導(dǎo)致Y的變化量統(tǒng)計意義描述自變量對因變量的獨立影響程度標準化回歸系數(shù)消除量綱影響不同量綱變量可直接比較影響大小β*計算方法β*?=β?×(s??/s?)比較相對重要性評估各自變量對因變量的相對影響程度偏回歸系數(shù)與簡單回歸系數(shù)的區(qū)別1簡單回歸系數(shù)僅考慮單一自變量與因變量的關(guān)系2偏回歸系數(shù)控制其他變量后的凈效應(yīng)3數(shù)值差異兩種系數(shù)通常有顯著差異多元回歸模型的擬合優(yōu)度衡量模型精確度模型解釋數(shù)據(jù)變異的能力量化指標通過R2和調(diào)整R2等統(tǒng)計量表示評估標準比較不同模型的預(yù)測準確性決定系數(shù)R2的計算與解釋回歸解釋未解釋殘差R2=回歸平方和/總平方和=1-殘差平方和/總平方和R2=0.75意味著模型解釋了75%的因變量變異調(diào)整后的R2定義考慮自變量數(shù)量的修正R2R2?=1-(1-R2)(n-1)/(n-k-1)作用懲罰不必要的自變量防止過度擬合更適合模型比較多元回歸模型的顯著性檢驗提出假設(shè)確立原假設(shè)和備擇假設(shè)計算統(tǒng)計量F統(tǒng)計量和t統(tǒng)計量評估p值與顯著性水平α比較做出決策接受或拒絕原假設(shè)F檢驗的原理與步驟假設(shè)設(shè)定H?:β?=β?=...=β?=0(模型無效)統(tǒng)計量計算F=(回歸均方/殘差均方)臨界值確定在α顯著性水平下查F分布表結(jié)論判斷若F>F臨界值,則拒絕H?t檢驗與回歸系數(shù)的顯著性檢驗每個回歸系數(shù)是否顯著不為零H?:β?=0vsH?:β?≠0t=b?/se(b?)假設(shè)檢驗的p值解釋p值定義在原假設(shè)為真時觀測到當前或更極端結(jié)果的概率決策規(guī)則p<α?xí)r拒絕原假設(shè)顯著性水平通常α取0.05或0.01多元回歸分析中的預(yù)測預(yù)測新觀測值代入新的X值計算Y的估計值預(yù)測精度受模型擬合度和樣本量影響預(yù)測公式?=b?+b?X?+b?X?+...+b?X?點預(yù)測與區(qū)間預(yù)測點預(yù)測預(yù)測Y的單一最佳估計值?=b?+b?X?+b?X?+...+b?X?區(qū)間預(yù)測提供Y的可能范圍考慮抽樣誤差和隨機誤差?±t?α/?,n-k-??×s×√[1+X?(X'X)?1X?']預(yù)測的置信區(qū)間95%常用置信度預(yù)測區(qū)間包含真實值的概率寬窄影響因素樣本量、X值位置、模型擬合度兩類區(qū)間類型均值預(yù)測區(qū)間和個體預(yù)測區(qū)間殘差分析殘差定義觀測值與預(yù)測值之差:e=Y-?分析目的檢驗回歸假設(shè)是否滿足理想特征均值為零,方差相等,相互獨立,正態(tài)分布殘差圖的繪制與解釋理想殘差圖呈隨機分布,無明顯模式非線性關(guān)系殘差呈曲線或U形分布異方差性殘差隨預(yù)測值變大或變小異方差性檢驗問題描述誤差項方差不恒定檢驗方法White檢驗、BP檢驗、殘差圖分析影響OLS估計量不再是最有效估計量解決方案變量轉(zhuǎn)換、加權(quán)最小二乘法自相關(guān)性檢驗時間殘差值Durbin-Watson檢驗是常用方法DW值接近2表示無自相關(guān)多重共線性的診斷方法相關(guān)矩陣檢查變量間相關(guān)系數(shù)過高(>0.8)表明可能存在多重共線性方差膨脹因子(VIF)VIF>10通常表示嚴重多重共線性條件指數(shù)條件指數(shù)>15表示可能存在多重共線性特征值分析特征值接近零表明存在多重共線性方差膨脹因子(VIF)VIF計算公式VIF?=1/(1-R2?)1-5中等共線性需要注意但影響不大>10嚴重共線性需要采取措施處理條件數(shù)與特征根分析1X'X矩陣計算相關(guān)矩陣的特征值2條件數(shù)最大特征值/最小特征值3判斷標準條件數(shù)>100表示嚴重多重共線性嶺回歸簡介基本原理通過添加懲罰項減小回歸系數(shù)β??????=(X'X+λI)?1X'Y特點與優(yōu)勢有效處理多重共線性犧牲無偏性換取更小的方差整體預(yù)測效果可能更好逐步回歸法開始確定候選變量集添加/移除變量根據(jù)統(tǒng)計標準進行篩選評估模型檢驗?zāi)P透倪M情況停止達到終止條件時結(jié)束向前選擇法起點從只有截距項的模型開始添加變量依次添加最顯著的變量終止條件沒有變量滿足入選標準時停止向后剔除法起點從包含所有變量的模型開始剔除變量依次剔除最不顯著的變量終止條件所有變量都顯著時停止逐步回歸的優(yōu)缺點優(yōu)點自動選擇變量減少計算量避免不必要的變量缺點可能忽略重要變量多重檢驗問題過度擬合風(fēng)險回歸系數(shù)估計有偏虛擬變量在多元回歸中的應(yīng)用定義表示分類變量的二進制變量(0或1)應(yīng)用場景性別、教育程度、地區(qū)差異等分類特征注意事項避免虛擬變量陷阱,K個類別只用K-1個虛擬變量定性變量的編碼方法編碼方法特點適用場景啞變量編碼最常用,設(shè)置參考類別一般分類變量效應(yīng)編碼比較類別與總體平均實驗設(shè)計分析對比編碼比較相鄰或特定類別有序分類變量交互項的引入與解釋定義兩個自變量乘積項,表示聯(lián)合效應(yīng)模型表示Y=β?+β?X?+β?X?+β?(X?×X?)+ε解釋一個變量的效應(yīng)依賴于另一個變量的水平多項式回歸X線性模型二次模型三次模型非線性關(guān)系的線性化處理識別非線性通過散點圖和殘差分析變量轉(zhuǎn)換對數(shù)、平方根、倒數(shù)等模型評估比較轉(zhuǎn)換前后的擬合效果對數(shù)轉(zhuǎn)換在回歸分析中的應(yīng)用1常見形式半對數(shù)模型:Y=β?+β?ln(X)+ε2雙對數(shù)模型ln(Y)=β?+β?ln(X)+ε3系數(shù)解釋彈性:X變動1%導(dǎo)致Y變動β?%加權(quán)最小二乘法適用場景異方差性問題的解決方案基本原理給不同觀測值賦予不同權(quán)重數(shù)學(xué)表達minΣw?(Y?-??)2異常值的識別與處理箱線圖識別單變量異常值散點圖識別多變量異常值殘差圖識別模型擬合異常值影響點分析杠桿值衡量觀測點在X空間中的影響力學(xué)生化殘差殘差除以其估計標準差Cook距離刪除觀測點對所有擬合值的影響Cook's距離觀測點Cook距離D>1通常被視為具有較大影響的觀測點第5個觀測點影響較大,接近臨界值DFBETAS和DFFITSDFBETAS測量刪除觀測點對回歸系數(shù)的影響|DFBETAS|>2/√n表示顯著影響DFFITS測量刪除觀測點對預(yù)測值的影響|DFFITS|>2√(k/n)表示顯著影響多元回歸分析的假設(shè)檢驗總結(jié)線性關(guān)系:散點圖、殘差圖正態(tài)性:Q-Q圖、直方圖同方差性:殘差與預(yù)測值圖獨立性:Durbin-Watson檢驗多元回歸分析在經(jīng)濟學(xué)中的應(yīng)用經(jīng)濟增長模型分析影響GDP增長的多種因素需求分析研究價格、收入、替代品對需求量的影響生產(chǎn)函數(shù)探索資本、勞動、技術(shù)等因素對產(chǎn)出的貢獻投資回報評估不同投資策略的收益率和風(fēng)險因素多元回歸分析在市場研究中的應(yīng)用1銷售預(yù)測預(yù)測產(chǎn)品銷量消費者行為分析影響購買決策的因素廣告效果評估不同營銷渠道的投資回報多元回歸分析在醫(yī)學(xué)研究中的應(yīng)用風(fēng)險因素分析研究多種因素對疾病風(fēng)險的影響藥物反應(yīng)分析患者特征對藥物療效的影響醫(yī)療成本研究影響醫(yī)療費用的因素治療效果評估不同治療方案的效果差異多元回歸分析軟件介紹SPSS用戶友好,圖形界面操作R開源免費,擴展包豐富SAS企業(yè)級應(yīng)用,處理大數(shù)據(jù)集能力強實例分析:房價預(yù)測模型模型R2=0.82,說明模型解釋了82%的房價變異實例分析:銷售額影響因素研究43%廣告投入對銷售額的貢獻比例28%
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 環(huán)境管理體系基礎(chǔ)摸底考試二答案及解析 - 詳解版(65題)
- 山西省陽泉市盂縣2025-2026學(xué)年七年級上學(xué)期期末生物學(xué)試題(無答案)
- 2025-2026學(xué)年湖南省長沙市高三第一次模擬考試試卷數(shù)學(xué)試題(人教A版)(原卷版)
- 養(yǎng)老院入住老人法律權(quán)益保護制度
- 老年終末期尿失禁的護理干預(yù)方案循證推廣
- 皮具制作工崗前技術(shù)突破考核試卷含答案
- 我國上市公司社會責(zé)任信息披露的價值相關(guān)性探究:基于理論、現(xiàn)狀與實踐的多維度分析
- 我國上市公司獨立監(jiān)事制度的困境與突破:基于公司治理視角的深度剖析
- 保健調(diào)理師崗前跨界整合考核試卷含答案
- 我國上市公司內(nèi)部控制自我評價:現(xiàn)狀、挑戰(zhàn)與優(yōu)化路徑研究
- (一模)烏魯木齊地區(qū)2026年高三年級第一次質(zhì)量監(jiān)測物理試卷(含答案)
- 江蘇省南通市如皋市創(chuàng)新班2025-2026學(xué)年高一上學(xué)期期末數(shù)學(xué)試題+答案
- 2026年年長租公寓市場分析
- 生態(tài)環(huán)境監(jiān)測數(shù)據(jù)分析報告
- 浙江省杭州市蕭山區(qū)2024-2025學(xué)年六年級上學(xué)期語文期末試卷(含答案)
- 學(xué)堂在線 雨課堂 學(xué)堂云 實繩結(jié)技術(shù) 章節(jié)測試答案
- 屋頂光伏安全專項施工方案
- 醫(yī)療器械拓展性臨床試驗管理規(guī)定(試行)YY/T-0292.1-2020《醫(yī)用診斷X射線輻射防護器具》
- 《中國古代文學(xué)通識讀本》pdf
- 罐區(qū)加溫操作規(guī)程
- 國有企業(yè)干部選拔任用工作系列表格優(yōu)質(zhì)資料
評論
0/150
提交評論