下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
作多元線性回歸分析時,自變量與因變量之間的影響關(guān)系一定是線性形式的嗎?多元線性回歸分析中的線性關(guān)系是指什么變量之間存在線性關(guān)系?答:作多元線性回歸分析時,自變量與因變量之間的影響關(guān)系不一定是線性形式。當自變量與因變量是非線性關(guān)系時可以通過某種變量代換,將其變?yōu)榫€性關(guān)系,然后再做回歸分析。多元線性回歸分析的線性關(guān)系指的是隨機變量間的關(guān)系,因變量y與回歸系數(shù)βi間存在線性關(guān)系。多元線性回歸的條件是:(1)各自變量間不存在多重共線性;(2)各自變量與殘差獨立;(3)各殘差間相互獨立并服從正態(tài)分布;(4)Y與每一自變量X有線性關(guān)系。回歸分析的基本思想與步驟基本思想:所謂回歸分析,是在掌握大量觀察數(shù)據(jù)的基礎(chǔ)上,利用數(shù)理統(tǒng)計方法建立因變量與自變量之間的回歸關(guān)系函數(shù)表達式(稱回歸方程式)。回歸分析中,當研究的因果關(guān)系只涉及因變量和一個自變量時,叫做一元回歸分析;當研究的因果關(guān)系涉及因變量和兩個或兩個以上自變量時,叫做多元回歸分析。此外,回歸分析中,又依據(jù)描述自變量與因變量之間因果關(guān)系的函數(shù)表達式是線性的還是非線性的,分為線性回歸分析和非線性回歸分析。通常線性回歸分析法是最基本的分析方法,遇到非線性回歸問題可以借助數(shù)學手段化為線性回歸問題處理。步驟:1)確定回歸方程中的解釋變量和被解釋變量。2)確定回歸模型
根據(jù)函數(shù)擬合方式,通過觀察散點圖確定應(yīng)通過哪種數(shù)學模型來描述回歸線。如果被解釋變量和解釋變量之間存在線性關(guān)系,則應(yīng)進行線性回歸分析,建立線性回歸模型;如果被解釋變量和解釋變量之間存在非線性關(guān)系,則應(yīng)進行非線性回歸分析,建立非線性回歸模型。3)建立回歸方程
根據(jù)收集到的樣本數(shù)據(jù)以及前步所確定的回歸模型,在一定的統(tǒng)計擬合準則下估計出模型中的各個參數(shù),得到一個確定的回歸方程。4)對回歸方程進行各種檢驗
由于回歸方程是在樣本數(shù)據(jù)基礎(chǔ)上得到的,回歸方程是否真實地反映了事物總體間的統(tǒng)計關(guān)系,以及回歸方程能否用于預測等都需要進行檢驗。5)利用回歸方程進行預測多重共線性問題、不良后果、解決方法多重共線性是指線性回歸模型中的自變量之間由于存在精確相關(guān)關(guān)系或高度相關(guān)關(guān)系而使模型估計失真或難以估計準確。常見的是近似的多重共線性關(guān)系,即存在不全為0的p個常數(shù)C1,C2,…,Cp使得C1Xi1+C2Xi2+…+CpXip≈0,i=1,2,…n不良后果:模型存在完全的多重共線性,則資料陣X的秩<p+1,從而無法得到回歸參數(shù)的估計量。對于近似多重共線性情況,雖有r(X)=p+1,但|XTX|≈0,從而矩陣(XTX)-1的主對角線上的元素很大,使得估計的參數(shù)向量的協(xié)方差陣的對角線上的元素也很大,導致普通最小二乘參數(shù)估計量并非有效。檢驗方法:方差擴大因子(VIF)法和特征根判定法方差擴大因子表達式為:VIFi=1/(1-Ri2),其中Ri為自變量xi對其余自變量作回歸分析的復相關(guān)系數(shù)。當VIFi很大時,表明自變量間存在多重共線性。解決方法:當發(fā)現(xiàn)自變量存在嚴重的多重共線性時,可以通過剔除一些不重要的自變量、增大樣本容量、對回歸系數(shù)做有偏估計(如采用嶺回歸法、主成分法、偏最小二乘法等)等方法來克服多重共線性。為什么要進行回歸方程的顯著性檢驗?答:對于任意給定的一組觀測數(shù)據(jù)(xi1,xi2,...,xip;yi),(i=1,2,...,n),我們都可以建立回歸方程。但實際問題很可能y與自變量x1,x2,...,xp之間根本不存在線性關(guān)系,這時建立起來的回歸方程的效果一定很差,即回歸值yi實際上不能擬合真實的值yi。即使整個回歸方程的效果是顯著的,在多元的情況下,是否每個變量都起著顯著的作用呢?因此還需要對各個回歸系數(shù)進行顯著性檢驗,對于回歸效果不顯著的自變量,我們可以從回歸方程中剔除,而只保留起重要作用的自變量,這樣可以使回歸方程更簡練。統(tǒng)計性的依據(jù)是什么?給出一個回歸方程如何做顯著性檢驗?統(tǒng)計性的依據(jù)是方差分析。對于多元線性回歸方程作顯著性檢驗就是要看自變量x1,x2,...xp從整體上對隨機變量y是否有明顯的影響,即檢驗假設(shè)H0:β1=β2=...=βp=0H1:至少有某個βi≠0,1<=i<=p如果H0被接受,則表明y與x1,x2,...xp之間不存在線性關(guān)系,為了說明如何進行檢驗,我們首先要建立方差分析表。在進行顯著性檢驗中,我們可以用F統(tǒng)計量來檢驗回歸方程的顯著性,也可以用P值法做檢驗。F統(tǒng)計量是:F=MSR/MSE=[SSR/p]/[SSE/(n-p-1)]當H0為真時,F(xiàn)~F(p,n-p-1)。給定顯著性水平α,查F分布表得臨界值F1-α(p,n-p-1),計算F的觀測值,若F0<=F1-α(p,n-p-1),則接受H0,即認為在顯著性水平α之下,認為y與x1,x2,...xp之間線性關(guān)系不顯著。利用P值法做顯著性檢驗十分方便,這里的P值是P(F>F0),定顯著性水平α,若p<α,則拒絕H0,反之接受H0。回歸系數(shù)的顯著性檢驗回歸方程通過了顯著性檢驗并不意味著每個自變量xi都對y有顯著影響。而回歸系數(shù)的顯著性檢驗的目的就是從回歸方程中剔除那些對y的影響不顯著的自變量,從而建立一個較為有效的回歸方程。如果自變量xi對y無影響,則在線性模型中,βi=0檢驗xi的影響是否顯著等價于檢驗假設(shè)H0:βi=0,H1:βi≠0對給定的顯著性水平α,當|ti|>tα/2(n-p-1)時,拒絕H0。反之,則接受H0。數(shù)據(jù)的中心化和標準化目的:解決利用回歸方程分析實際問題時遇到的諸多自變量量綱不一致的問題。數(shù)據(jù)中心化處理的幾何意義:相當于將坐標原點移至樣本中心,而坐標系的平移并不改變直線的斜率,只改變了截距。通過對殘差進行分析,可以在一定程度上回答下列問題:1)回歸函數(shù)線性假定的可行性;2)誤差項的等方差假設(shè)的合理性;3)誤差項獨立性假設(shè)的合理性;4)誤差項是否符合正態(tài)分布;5)觀測值中是否存在異常值;6)是否在模型中遺漏了某些重要的自變量。標準化回歸方程與非標準化回歸方程有何不同?在怎樣的情況下需要將變量標準化?標準化回歸方程就是將自變量因變量都標準化后的方程。在spss輸出的回歸系數(shù)中有一列是標準化的回歸系數(shù),由于都標準化了,因此標準化方程中沒有常數(shù)項了。對數(shù)據(jù)標準化,即將原始數(shù)據(jù)減去相應(yīng)變量的均數(shù)后再除以該變量的標準差,計算得到的回歸方程稱為標準化回歸方程,相應(yīng)的回歸系數(shù)為標準化回歸系數(shù)。一般情況下的回歸,并不必須標準化,直接回歸即可。在做主成分分析包括因子分析時,則必須標準化?;貧w分析和相關(guān)分析的區(qū)別和聯(lián)系相關(guān)分析和回歸分析都是對客觀事物數(shù)量依存關(guān)系的分析,均有一元和多元,線性與非線性之分,在應(yīng)用中相互結(jié)合滲透,但仍有差別,主要是:(1)相關(guān)分析主要刻畫兩類變量間線性相關(guān)的密切程度,而回歸分析則是揭示一個變量如何與其他變量相聯(lián)系,并可由回歸方程進行控制和預測(2)在相關(guān)分析中,變量y與x處于平等的地位,在回歸分析中,因變量y處于被解釋的特殊地位(3)在相關(guān)分析中所涉及的變量y與x完全是隨機變量;而在回歸分析中因變量y是隨機變量,自變量可以是隨機變量也可以是非隨機變量。一般來說,只有存在相關(guān)關(guān)系才可以進行回歸分析,相關(guān)程度越高,回歸分析的結(jié)果就越可靠?;貧w方程的基本假定?(1)回歸函數(shù)的線性假設(shè)(2)誤差項的等方差假設(shè)(3)誤差項的獨立性假設(shè)(4)誤差項的正態(tài)分布假設(shè)運用回歸分析解決問題時,回歸變量的選擇理論依據(jù)的什么?選擇回歸變量時應(yīng)注意哪些問題?(1)從擬合角度考慮,可以采用修正的復相關(guān)系數(shù)達到最大的準則準則1:修正的復相關(guān)系數(shù)Ra2達到最大。因為:Ra2=1-MSE/(SST/(n-1))從這個關(guān)系式容易看出,Ra2達到最大時,MSE達到最小。(2)從預測的角度考慮,可以采用預測平方和達到最小的準則及Cp準則準則2:預測平方和PRESSp達到最小準則3:(Cp準則)(3)從極大似然估計角度考慮,可以采用赤池信息量化準則(AIC準則)準則4:赤池信息量達到最小AIC=nln(SSEp)+2p選擇AIC值最小的回歸方程為最優(yōu)回歸方程自變量的選擇問題可以看成是應(yīng)該采用全模型還是選模型的問題全模型正確誤用選模型:全模型相應(yīng)參數(shù)為有偏估計,選模型預測也是有偏的。選模型的參數(shù)估計和預測殘差以及均方差都有較小的方差。選模型正確誤用全模型,全模型參數(shù)估計和預測是有偏估計,而全模型預測值的方差和均方差大于選模型相應(yīng)的方差。上述結(jié)論說明丟掉那些對應(yīng)變量影響不大的,或雖有影響,但難于觀測的自變量是有利的。逐步回歸方法的基本思想與步驟基本思想:有進有出。具體做法是將變量一個一個引入,引入變量的條件是通過了偏F統(tǒng)計量的檢驗,同時,每引入一個新變量后,對已入選方程的老變量進行檢測,將經(jīng)檢驗認為不顯著的變量剔除,此過程經(jīng)過若干步,直到既不能引入新變量又不能剔除老變量為止?;静襟E:(1)對于每個自變量xi(1≤i≤m),擬合m個一元線性回歸模型,若Fi1(1)>FE,則所選擇含有自變量xi1的回歸模型為當前模型,否則,沒有變量引入模型,選擇過程結(jié)束,即認為所有自變量對y的影響均不顯著。(2)在第一步的基礎(chǔ)上,再將其余的m-1個自變量分別加入此模型中,得到m-1個二元回歸方程,若若F
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 學校保安監(jiān)督管理制度(3篇)
- 孟德爾的豌豆雜交實驗(一)課件2025-2026學年高一下學期生物人教版必修2
- 2026山東濟南市歷城區(qū)屬事業(yè)單位招聘初級綜合類崗位人員備考考試試題及答案解析
- 2026北京朝陽航空工業(yè)機載低空經(jīng)濟事業(yè)部招聘參考考試題庫及答案解析
- 2026廣東廣州市越秀區(qū)流花街招聘飯?zhí)脧N師1人備考考試題庫及答案解析
- 電視機換臺游戲
- 2026青海西寧國晟新能源集團有限公司招聘1人參考考試題庫及答案解析
- 2026年度濟南市市中區(qū)事業(yè)單位公開招聘初級綜合類崗位人員(63人)備考考試題庫及答案解析
- 2026年上半年云南省殘疾人聯(lián)合會直屬事業(yè)單位招聘人員(1人)備考考試試題及答案解析
- 2026中國上市公司協(xié)會校園招聘備考考試試題及答案解析
- 腫瘤壞死因子受體相關(guān)周期性綜合征診療指南
- 中醫(yī)協(xié)定處方管理制度
- 高一數(shù)學第一學期必修一、四全冊導學案
- 2025年開封大學單招職業(yè)技能測試題庫完整
- 亞馬遜運營廣告培訓
- 中建給排水施工方案EPC項目
- 電氣工程及自動化基于PLC的皮帶集中控制系統(tǒng)設(shè)計
- 醫(yī)學教材 常見輸液反應(yīng)的處理(急性肺水腫)
- FURUNO 電子海圖 完整題庫
- 企業(yè)年會攝影拍攝合同協(xié)議范本
- 焊接質(zhì)量控制規(guī)范培訓課件
評論
0/150
提交評論