實(shí)驗(yàn)四異方差性檢驗(yàn)與處理_第1頁(yè)
實(shí)驗(yàn)四異方差性檢驗(yàn)與處理_第2頁(yè)
實(shí)驗(yàn)四異方差性檢驗(yàn)與處理_第3頁(yè)
實(shí)驗(yàn)四異方差性檢驗(yàn)與處理_第4頁(yè)
實(shí)驗(yàn)四異方差性檢驗(yàn)與處理_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、實(shí)驗(yàn)四異方差性的檢驗(yàn)及處理(2學(xué)時(shí))一、實(shí)驗(yàn)?zāi)康摹⒄莆债惙讲顧z驗(yàn)的基本方法、掌握異方差的處理方法。二、實(shí)驗(yàn)學(xué)時(shí):2學(xué)時(shí)三、實(shí)驗(yàn)要求(1)掌握用MATLAB軟件實(shí)現(xiàn)異方差的檢驗(yàn)和處理;(2)掌握異方差的檢驗(yàn)和處理的基本步驟。四、實(shí)驗(yàn)原理1、異方差檢驗(yàn)的常用方法(1)用X-Y的散點(diǎn)圖進(jìn)行判斷(e2,x)或(e2,y)的圖形(e,y咸(e,乂的圖形)iiii等級(jí)相關(guān)系數(shù)法(又稱Spearman檢驗(yàn))是一種應(yīng)用較廣的方法,既可以用于大樣本,也可與小樣本。檢驗(yàn)的三個(gè)步驟e=y-yitt向?qū)取絕對(duì)值,并把i|eI和x按遞增或遞減次序排序,ii計(jì)算Spearman系數(shù)rs,其中:r=1-s6n(n2l)寸

2、d2ii=1做等級(jí)相關(guān)系數(shù)的顯著性檢驗(yàn)。n8時(shí),反之,社t(n-2),說(shuō)明eI與X之間存在系統(tǒng)關(guān)系,、辛日”升/2ii異萬(wàn)差問(wèn)題存在帕克(Park)檢驗(yàn)帕克檢驗(yàn)常用的函數(shù)形式:若?在統(tǒng)計(jì)上是顯著的,表明存在異方差性。2、異方差性的處理方法:加權(quán)最小二乘法Vaj(u)=E(u)2=q2=f(x)c2如果在檢驗(yàn)過(guò)程中已經(jīng)知道:iiijiu則將原模型變形為:111-y=-B+二Bx+TOC o 1-5 h z HYPERLINK l bookmark27 :f(x)i:f(x)1:f(x)2li-X+uPPi該模型中:B,B,B即滿足同方差性。于是可以用OLS估計(jì)其參數(shù),得到關(guān)于參數(shù)H1川p的無(wú)偏、

3、有效估計(jì)量。五、實(shí)驗(yàn)舉例Noxynoxy1108162519.12108.2172523.53108.3182522.44108.1192523.15108.7202515.161512.3213024.27159.4223016.781511.62330279151224302610158.9253022.1112015263530.5122016273528.7132012283531.1142013293520152019.1303529.9例1、某地區(qū)居民的可支配收入x(千元)與居民消費(fèi)支出y(千元)的數(shù)據(jù)如下:若用線性模型.=化+Rx+u,研究不同收入家庭的消費(fèi)情況,試問(wèn)原數(shù)據(jù)有無(wú)異

4、i01ii方差性?如果存在異方差性,應(yīng)如何處理?解:(一)編寫(xiě)程序如下:(1)等級(jí)相關(guān)系數(shù)法(詳見(jiàn)test4_1.m文件)%用等級(jí)相關(guān)系數(shù)法來(lái)檢驗(yàn)異方差性%data,head=xlsread(test4.xlsx);x=data(:,1);%提取第一列數(shù)據(jù),即可支配收入xy=data(:,2);提取第二列數(shù)據(jù),即居民消費(fèi)支出yplot(x,y,k.);%畫(huà)x和y的散點(diǎn)圖xlabel(可支配收入x(千元)%對(duì)x軸加標(biāo)簽ylabel(居民消費(fèi)支出y(千元)%對(duì)y軸加標(biāo)簽%調(diào)用regres函數(shù)進(jìn)行一元線性回歸%xdata=ones(size(x,1),1),x;%在區(qū)矩陣最左邊加一列1,為線性回歸做

5、準(zhǔn)備b,bint,r,rint,s=regress(y,xdata);yhat=xdata*b;計(jì)算估計(jì)值y%定義元胞數(shù)組,以元胞數(shù)組形式顯示系數(shù)的估計(jì)值和估計(jì)值的95%置信區(qū)間head1=系數(shù)的估計(jì)值,估計(jì)值的95%置信下限,估計(jì)值的95%置信上限;head1;num2cell(b,bint)%定義元胞數(shù)組,以元胞數(shù)組形式顯示y的真實(shí)值,y的估計(jì)值,殘差和殘差的95%置信區(qū)間head2=y的真實(shí)值,y的估計(jì)值,殘差,殘差的95%置信下限,殘差的95%置信上限;head2;num2cell(y,yhat,r,rint)%定義元胞數(shù)組,以元胞數(shù)組形式顯示判定系數(shù),F(xiàn)統(tǒng)計(jì)量的觀測(cè)值,檢驗(yàn)的P值和誤

6、差方差的估計(jì)值head3=判定系數(shù),F統(tǒng)計(jì)量的觀測(cè)值,檢驗(yàn)的P值,誤差方差的估計(jì)值;head3;num2cell(s)%殘差分析%figure;rcoplot(r,rint)%按順序畫(huà)出各組觀測(cè)值對(duì)應(yīng)的殘差和殘差的置信區(qū)間%畫(huà)估計(jì)值yhat與殘差r的散點(diǎn)圖figure;plot(yhat,r,k.)%畫(huà)散點(diǎn)圖xlabel(估計(jì)值yhat)%對(duì)x軸加標(biāo)簽ylabel(殘差r)對(duì)y軸加標(biāo)簽%調(diào)用corr函數(shù)計(jì)算皮爾曼等級(jí)相關(guān)系數(shù)res=abs(r);%對(duì)殘差r取絕對(duì)值rs,p=corr(x,res,type,spearman)disp(其中rs為皮爾曼等級(jí)相關(guān)系數(shù),p為p值);(2)帕克(park

7、)檢驗(yàn)法(詳見(jiàn)test4_2.m文件)%用帕克(park)檢驗(yàn)法來(lái)檢驗(yàn)異方差性%data,head=xlsread(test4.xlsx);%導(dǎo)入數(shù)據(jù)x=data(:,1);y=data(:,2);%調(diào)用regstats函數(shù)進(jìn)行一元線性回歸,linear表帶有常數(shù)項(xiàng)的線性模型,r表殘差ST=regstats(y,x,linear,yhat,r,standres);scatter(x,(ST.r).A2)%畫(huà)x與殘差平方的散點(diǎn)圖xlabel(可支配收入(x)%對(duì)x軸加標(biāo)簽ylabel(殘差的平方)對(duì)y軸加標(biāo)簽%對(duì)原數(shù)據(jù)x和殘差平方rA2取對(duì)數(shù),并對(duì)log(x)和log(rA2)進(jìn)行一元線性回歸S

8、Ti=regstats(log(ST.r).八2),log(x),linear,r,beta,tstat,fstat)%輸出參數(shù)的估計(jì)值輸出回歸系數(shù)t檢驗(yàn)的P值輸出回歸模型顯著性檢驗(yàn)的P值加權(quán)最小二乘法(詳見(jiàn)test4_3.m文件)%調(diào)用robustfit函數(shù)作穩(wěn)健回歸%data,head=xlsread(test4.xlsx);%導(dǎo)入數(shù)據(jù)x=data(:,1);y=data(:,2);%調(diào)用robustfit函數(shù)作穩(wěn)健回歸,返回系數(shù)的估計(jì)值b和相關(guān)統(tǒng)計(jì)量statsb,stats=robustfit(x,y)%調(diào)用函數(shù)作穩(wěn)健回歸stats.p輸出模型檢驗(yàn)的P值%繪制殘差和權(quán)重的散點(diǎn)圖%plot

9、(stats.resid,stats.w,o)%繪制殘差和權(quán)重的散點(diǎn)圖xlabel(殘差)ylabel(權(quán)重(二)實(shí)驗(yàn)結(jié)果與分析:第一步:用OLS方法估計(jì)參數(shù),并保留殘差(1)散點(diǎn)圖圖4.1可支配收入(x)居民消費(fèi)支出(y)散點(diǎn)圖因每個(gè)可支配收入x的值,都有5個(gè)居民消費(fèi)收入y與之對(duì)應(yīng),所以上述散點(diǎn)圖呈現(xiàn)此形狀。(2)回歸模型參數(shù)估計(jì)值與顯著性檢驗(yàn)表1系數(shù)的估計(jì)值估計(jì)值的95%置信下限估計(jì)值的95%置信上限-0.5390-3.72412.64600.80910.67680.9415判定系數(shù)F統(tǒng)計(jì)量的觀測(cè)值檢驗(yàn)的P值誤差方差的估計(jì)值0.8485156.83875.4040e-139.1316由輸出

10、結(jié)果看,常數(shù)項(xiàng)和回歸系數(shù)的估計(jì)值分別為-0.539和0.8091,從而可以寫(xiě)出線性回歸方程為回歸系數(shù)的估計(jì)值的95%置信區(qū)間為0.6768,0.9415。對(duì)回歸直線進(jìn)行顯著性檢驗(yàn),原假設(shè)和對(duì)立假設(shè)分別為檢驗(yàn)的P值為,可知在顯著性水平下應(yīng)拒絕原假設(shè),可認(rèn)為y(居民消費(fèi)收入)與x(可支配收入)的線性關(guān)系是顯著的。(3)方差分析圖4.2原始數(shù)據(jù)對(duì)應(yīng)殘差圖從殘差圖可以看到有2條線段(紅色虛線)與水平線y=0沒(méi)有交點(diǎn),它對(duì)應(yīng)的觀測(cè)號(hào)為22和29,也就是說(shuō)這兩組觀測(cè)對(duì)應(yīng)的殘差的置信區(qū)間不包含0點(diǎn),可認(rèn)為這兩組觀測(cè)數(shù)據(jù)為異常數(shù)據(jù)。它們分別是(30,16.7),(35,20)。第二步:異方差性檢驗(yàn)(1)圖示法

11、圖4.3(2)等級(jí)相關(guān)系數(shù)法在y與x的OLS回歸的基礎(chǔ)上計(jì)算出殘差的絕對(duì)值,并記為res,并計(jì)算出皮爾曼等級(jí)相關(guān)系數(shù)rs=0.4860與對(duì)應(yīng)的p值為0.00650.05(*),說(shuō)明殘差r與x存在系統(tǒng)關(guān)系,即存在異方差問(wèn)題。(3)帕克(Park)檢驗(yàn)法1)散點(diǎn)圖圖4.4可支配收入與殘差平方的散點(diǎn)圖從圖4.4可知,可考慮擬合指數(shù)曲線?,F(xiàn)將其取對(duì)數(shù),即可進(jìn)行一元線性擬合。2)回歸系數(shù)與模型檢驗(yàn)做In(M2)對(duì)ln(x)回歸,得到回歸系數(shù)回歸系數(shù)t檢驗(yàn)的P值顯著性檢驗(yàn)P值=-8.49730.02950.0207=2.96790.0207表2從上表可以看出,得到的回歸模型為In,常數(shù)項(xiàng)和線性項(xiàng)的t檢驗(yàn)的

12、P值均小于0.05,說(shuō)明回歸方程中常數(shù)項(xiàng)和線性項(xiàng)均是顯著的。并且,檢驗(yàn)的P值為0.0207小于0.05,說(shuō)明整個(gè)回歸方程是顯著的,表明存在異方差性。綜上所述,通過(guò)以上3種方法的檢驗(yàn),我們得到原數(shù)據(jù)存在異方差性。第三步:用加權(quán)最小二乘法處理異方差性表3回歸系數(shù)回歸系數(shù)t檢驗(yàn)的P值=-1.60910.2375=0.88700.0000由表3得:回歸方程為,由p值可知x的回歸系數(shù)是顯著的,常數(shù)項(xiàng)未顯著,說(shuō)明其無(wú)實(shí)際意義。圖4.5殘差和權(quán)重的散點(diǎn)圖由圖4.5知:權(quán)重集中在最上方的1附近的點(diǎn)比較多,說(shuō)明穩(wěn)健性比較好六、實(shí)驗(yàn)內(nèi)容下表是我國(guó)各地區(qū)2003年FDI和GDP的數(shù)據(jù),項(xiàng)目2003年FDI(萬(wàn)美元)

13、2003GDP(億元)項(xiàng)目2003年FDI(萬(wàn)美元)2003GDPC億元)北京2191263663.10河南539037048.59天津1534732447.66湖北1568865401.71河北964057098.56湖南1018354638.73山西213612456.59廣東78229413625.87內(nèi)蒙88542150.41廣西418562735.13遼寧2824106002.54海南42125670.93吉林190592522.62重慶260832250.56黑龍江321804430.00四川412315456.32上海5468496250.81貴州45211356.11江蘇105636512460.83云南83842465.29浙江4980559395.00陜西331902398.58安徽367203972.38甘肅23421304.60福建2599035232.17青海2522390.21江西1612022830.46寧夏1743385.34山東60161712435.93新疆15341877.61若用線性模型GDP=卩+PFDI+u,研究不同地區(qū)FDI和GDP的關(guān)系,試問(wèn)原數(shù)據(jù)i01ii有無(wú)異方差性?如果存在異方差性,應(yīng)如何處理?七、思考練習(xí)某地區(qū)家庭年收入(X)和每年生活必需品綜

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論