版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第八章 虛擬變量,第一節(jié) 虛擬變量,回顧:前面各章討論的變量都是可以直接用數(shù)字計量的,即可以獲得其實際觀測值(如收入、支出、產(chǎn)量物價水平等等)。這些變量稱作數(shù)量變量。 然而,影響被解釋變量的不僅有量的因素,還有質(zhì)的因素(如性別、民族、職業(yè)、季節(jié)、政策等等),虛擬變量是用以反映質(zhì)的屬性的一個人工變量,取值為 0 或 1,通常記為 D(Dummy Variable),又可稱之為屬性變量、雙值變量、類型變量、定性變量、或二元型變量。 注意:虛擬變量D只能取0或1兩個值,即屬性之間不能運算! 對基礎類型或否定類型設 D=0 對比較類型或肯定類型設 D=1,一、虛擬變量的概念,例 如,1 男性 D =
2、0 女性 1 “文革”時期 D = 0 非“文革”時期,說 明,虛擬變量主要是用來代表質(zhì)的因素,但有些情況下也可以用來代表數(shù)量因素。 例如:在建立儲蓄函數(shù)時,“年齡”是一個重要的解釋變量。雖然“年齡”是一個數(shù)量因素,但為了方便也可以用虛擬變量表示。例如:可以把居民分為兩個年齡組: 第一組:2035歲的居民 第二組:3560歲的居民 用“1”表示第一年齡組;“0”表示第二年齡組,就可以估計年齡對儲蓄的影響。,二、虛擬變量的設置規(guī)則,1.兩個屬性的表示法 如性別有兩個屬性:用 Di 表示,即:兩個屬性引入一個變量即可!,2.多個屬性的表示法 假設學歷有四個屬性:博士、碩士、本科、本科以下等,則:,
3、為什么四個屬性只引入3個變量呢?,即:m個屬性引入(m-1)個變量即可。,3.多個因素各兩個屬性的表示法 如需要同時表示城鄉(xiāng)差別和性別差別,一般地,若有m個因素,而每個因素都只有兩個不同的屬性類型,則引入m個虛擬變量。 思考:現(xiàn)有三個定性因素,有兩個因素各有4個不同的屬性,一個因素有2個不同的屬性,應設多少個虛擬變量? (應設3+3+1=7個虛擬變量),三、虛擬變量的作用,1.可以描述和測量定性因素的影響 2.分離異常因素的影響 例如分析我國GDP的時間序列,必須考慮“文革”因素對國民經(jīng)濟的破壞性影響,剔除不可比的“文革”因素。 3.檢驗不同屬性類型對因變量的作用 例如工資模型中的文化程度、季
4、節(jié)對銷售額的影響。 4.提高模型的精度,四、虛擬變量模型,在計量經(jīng)濟模型中,把包含有虛擬變量的模型稱為 虛擬變量模型。 常用的有三種類型: (1)解釋變量中只包含虛擬變量; (2)解釋變量中既含有定量變量,又含有虛擬變 量; (3)被解釋變量本身為虛擬變量。,一、加法類型(截距變動模型),第二節(jié) 虛擬解釋變量的回歸,1、解釋變量中只有虛擬變量 如:調(diào)查某地區(qū)性別與收入之間的關系,可以用模型表示如下: Yi =+Di + ui Yi代表收入,Di為虛擬變量:,代表女性收入,代表男性與女性收入之間的差額,如研究消費水平與居民收入的關系時,還要考慮城鄉(xiāng)居民消費水平的差異,消費函數(shù)可設為: Yi=0+
5、1Di+Xi+ ui Yi 為消費水平,Xi 為居民收入,Di為虛擬變量。,2、解釋變量中既有定量變量又有虛擬變量,表示農(nóng)村居民的消費水平,表示城市居民的消費水平,假設10,可得到下圖:,Xi,Yi,0,0+1,單變量變截距模型,對模型 Yi=0+1Di+Xi+ ui 使用OLS法,可得:,對1 進行 t 檢驗,若1 0 ,則說明城市居民與農(nóng)村居民的消費水平有明顯差異。,假如還要考慮男女消費水平的差異,消費函數(shù)為: Yi =0+1D1i+2D2i+Xi+ui Yi 為消費水平,Xi 為家庭收入,D1i和D2i為虛擬變量。,表示城市男性的消費水平,表示城市女性的消費水平,表示農(nóng)村男性的消費水平,
6、表示農(nóng)村女性的消費水平,Xi,Yi,0,雙變量變截距模型,1,2,2,虛擬變量陷阱 如某些商品的銷售量有季節(jié)性,假設銷售函數(shù)為:,=1(第一季) =0(其他季),=1(第二季) =0(其他季),=1(第三季) =0(其他季),=1(第四季) =0(其他季),如果引入4個虛擬變量會出現(xiàn)什么問題呢?,可視為截距項的解釋變量,即0= 01,所以引入4個虛擬變量出現(xiàn)了完全多重共線性的問題! OLS法不能使用! 這就是虛擬變量陷阱問題!,克服虛擬變量陷阱的方法 改為引入虛擬變量:,引入虛擬變量的規(guī)則補充說明 對于具有m個屬性的虛擬變量: 若模型中含有截距項,引入 m-1個虛擬變量; 若模型中不含有截距項
7、,引入 m 個虛擬變量。,二、乘法類型(斜率變動模型),以乘法形式引入虛擬變量,是在所設定的模型中,將虛擬解釋變量與其他解釋變量相乘作為新的解釋變量,以達到調(diào)整斜率系數(shù)的目的。主要作用在于: (1)比較兩個回歸模型; (2)分析因素間的交互影響; (3)提高模型的描述精度。,1、回歸模型的比較,例如,研究改革開放前后儲蓄、收入的總量關系,分別設定模型如下:,(1)改革開放前,(2)改革開放后,其中Yt為儲蓄總額,Xt為收入總額。,分別在各自的時間區(qū)間內(nèi)作回歸,可能有如下四種結(jié)果:,表明兩個回歸模型是相同的,稱為重合回歸;,表明僅在截距上存在差異,稱為平行回歸;,表明截距相同而變化速率不同,稱為
8、共點回歸;,表明兩個回歸模型完全不同。,Xi,Yi,重合回歸,1,Xi,Yi,平行回歸,1,1,Xi,Yi,共點回歸,1,1,Xi,Yi,不同的回歸,1,1,問題:當我們分別運用樣本數(shù)據(jù)對兩個模型進行回歸后,如何界定所得結(jié)果在統(tǒng)計意義上屬于那種類型呢? 可采用乘法形式引入虛擬變量,可設定為:,其中,上式等價于模型:,(1)改革開放前,(2)改革開放后,(1)改革開放前,(2)改革開放后,分別是等價模型的截距和斜率差異,分,別稱為截距差異系數(shù)和斜率差異系數(shù)。,顯然,用1950-2004年數(shù)據(jù)估計(*)式,比分別用 1950-1977年和1978-2004年的數(shù)據(jù)估計(1)和(2)式更好。 估計結(jié)
9、果為:,(0.3319),(0.4704),(0.0163),(0.0332),t =,(-5.2733),(3.1545),(9.2270),(-3.1144),結(jié)果表明,截距和斜率差異系數(shù)在統(tǒng)計意義下 均是顯著的,說明改革開放前后不同。,從上面可以看出,以乘法形式引入虛擬變量做回歸模型的比較的優(yōu)點: (1)用一個回歸代替多個回歸,簡化過程; (2)可以對模型結(jié)構(gòu)差異做假設檢驗; (3)合并的模型增加了自由度,提高了參數(shù) 估計的精確性。 當然,也應注意合并后模型的隨機擾動項應服從基 本假定,特別是所比較的方程的方差應相同,否則 會出現(xiàn)異方差。,在多元線性回歸模型中,通過F檢驗,可以判斷各解釋
10、變量聯(lián)合對被解釋變量是否有顯著影響。那么在包含兩個定性變量的虛擬變量模型中,兩個定性變量對被解釋變量的影響也可能存在一定的交互作用,如何描述呢? 例如,研究農(nóng)副產(chǎn)品生產(chǎn)總收益與農(nóng)副產(chǎn)品生產(chǎn)投入的關系時,設定模型為,2、交互效應分析,虛擬變量以加法形式引入暗含著假設:油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)是分別獨立地影響著農(nóng)副產(chǎn)品總收益。但實際是在發(fā)展油菜籽生產(chǎn)的同時發(fā)展養(yǎng)蜂生產(chǎn),所取得的農(nóng)副產(chǎn)品總收益會高于不發(fā)展養(yǎng)蜂生產(chǎn)的情況。即它們之間存在交互作用。,其中Yi 農(nóng)副產(chǎn)品生產(chǎn)總收益,Xi為農(nóng)副產(chǎn)品生產(chǎn)總投 入,而,為了描述交互作用對被解釋變量的影響,在模型中引入虛擬變量的乘積,即,稱為交互效應系數(shù)。,其中,交互
11、效應是否存在,可借助于交互效應系數(shù)的 顯著性檢驗加以判斷。,在經(jīng)濟關系中常有這樣的情況: 當解釋變量X的值達到某一水平X*之前,與被解釋變量Y之間存在某種線性關系;當解釋變量X的值達到或超過X*之后,與被解釋變量Y的關系就會發(fā)生變化。此時,如果已知X 的轉(zhuǎn)折點X*,就可以用虛擬變量來估計每一段的斜率。這就是分段線性回歸。,3、分段線性回歸,例如:1979年以前,我國居民的消費支出呈緩慢上升的趨勢。從1979年開始,居民消費支出為快速上升趨勢。 顯然,1979年是一個轉(zhuǎn)折點,即: X*=1979 所以,可用模型描述我國居民在1955年至2009年消費支出的變動趨勢:,Yt=0 +1t +2(t-
12、 X*)Dt + ut 其中 Yt 為消費支出; t 為年份(t=1955,1956,2009);,上面模型等價于: (1)1979年以前:Yt=0 +1t +ut (2)1979年以后: Yt=0 - 2 X*+(1+2) t + ut,t (年份),E(Yi),分段回歸模型,1955,x*(1979),E(Yt)=0 +1 t,E(Yt)=0- 2X*+(1+2) t,只要檢驗2的統(tǒng)計顯著性,就可以判斷在所設定的臨界水平X*處是否存在“突變”。 可以推廣到 k 段回歸的情況,只需用 k-1個虛擬變量即可。,第三節(jié) 虛擬被解釋變量,在計量經(jīng)濟模型中,虛擬變量還可以作為被解釋變量,其作用是對某
13、一經(jīng)濟現(xiàn)象或經(jīng)濟活動作“是”與“否”的判斷與決策。在計量經(jīng)濟學中稱為“二元響應”現(xiàn)象。處理二元型響應的模型常用有線性概率模型和非線性概率模型。,一、線性概率模型,1、什么是線性概率模型 例如,假設住戶是否購買商品房主要取決于 其收入水平??紤]下列模型:,其中Xi為住戶收入,Yi為虛擬變量,表示住 戶購買商品房的情況:,(1),則Yi 是取值0或1的隨機變量,由(1)式得:,從而,假設則 P (Yi=1Xi )= pi ,則P (Yi=0Xi )= 1-pi 于是,這表明購買商品房的概率是收入的線性函數(shù), 故模型(1)稱為線性概率模型(LPM)。,由于0pi 1,所以(1)式必須滿足約束條件,2
14、、線性概率模型的估計 線性概率模型雖然在形式上與普通線性回歸 模型很相似,但由于Yi 是虛擬變量,會出現(xiàn) 與普通回歸模型不同的新問題,不能直接運 用OLS對其進行估計: (1)隨機擾動項不服從正態(tài)分布; (2)隨機擾動項具有異方差性; (3)條件0E(YiXi)1不一定成立。,因為OLS估計的無偏性、有效性與擾動項的分布無關,所以第一個問題對參數(shù)的估計不會產(chǎn)生影響。但進行參數(shù)檢驗和區(qū)間估計時,要求服從正態(tài)分布,根據(jù)中心極限定理,二項分布趨近于正態(tài)分布,所以在大樣本情況下,仍然可以進行統(tǒng)計推斷,即直接運用OLS對LPM模型進行估計,隨機擾動項的非正態(tài)性對參數(shù)的估計不會產(chǎn)生太大的影響。 對于異方差
15、性的問題,可利用第五章的方法解決:1、加權(quán)最小二乘法;2、模型的對數(shù)變換。,對于第三個問題,有兩種處理辦法:,一是當,時,認為,當,時,認為,二是選擇其他能夠滿足約束 0E(YiXi)1 的非線性模型。,二、非線性概率模型,雖然可以通過增大樣本容量忽略非正態(tài)性問題,運用WLS解決異方差問題,采取約束使事件Y發(fā)生的概率落入0-1之間,但LPM模型往往與實際經(jīng)濟意義不相符。 例如,在住戶購買商品房的例子中:,設當Xi有增量Xi時,pi有增量pi,于是,從而,上式表明Xi每增加一個單位,購買住房的概率恒等地增加2,這就是說,無論住戶的收入水平是1萬元,還是10萬元,購買住房的概率都以相同的增量增加。
16、這與現(xiàn)實情況不符,顯然低收入購買住房的概率增大。因此有必要選擇表現(xiàn)概率平均變化比較理想的模型。 主要有兩種:Logit模型和Probit模型。 這里只介紹Logit模型,1、Logit模型 Logit模型也成Logistic模型或單位對數(shù)模型,由Verhulst于1945年提出,最早被用來描述生物的生長規(guī)律(邏輯成長率),現(xiàn)已廣泛用來描述耐用消費品的銷售規(guī)律。 選擇如下的Logistic分布函數(shù)去設定二元響應計量經(jīng)濟模型:,它的圖像是一條S型曲線,有下列特征: (1)概率0pi=E(YiXi)1, 解決了條件概率有可能大于1或小于0的問題; (2)當Xi+時,pi 1,當Xi-時, pi 0,
17、 pi隨Xi變化而變化,且變化速率不是常數(shù),更加符合實際情況;,Xi,pi,0,1,1、Logit模型的估計 由于pi不僅對Xi是非線性關系,而且對1和2也是非 線性關系,不能直接用OLS估計參數(shù),必須設法轉(zhuǎn)化 為線性形式。由于,所以,比率,稱為機會比率或機會差異化,而,稱為對數(shù)單位。,從計量經(jīng)濟的角度引入隨機擾動項,記為:,如何得到1和2的估計量呢?對上式直接估計會 遇到如下困難:,(1)當 pi=0或1時,,都無意義;,(2)Li 的數(shù)據(jù)無法觀測;,(3)隨機擾動項ui 的為異方差,可以證明:,這里的Ni 是對應于Xi 的樣本數(shù)。,解決第一個困難可采用極大似然法(ML)估計參數(shù),當樣本容量
18、較大時,可采用加權(quán)最小二乘法估計; 解決第二個困難是對應于每個Xi,樣本觀測值個數(shù)Ni 較大時,利用匯總數(shù)據(jù),用相對頻率作為對pi 的估計,并用此估計對數(shù)單位Li; 解決第三個困難是通過相對頻率代替pi 去估計ui 的方差,即,再用加權(quán)最小二乘法估計參數(shù),權(quán)數(shù)wi為:,例 根據(jù)美國1961年第一季度至1977年第二季度的季度數(shù)據(jù),得到如下的咖啡需求函數(shù)的回歸方程:,t=,(-2.14),(1.23),(-3.36),(0.55),(-3.74),(-6.03),(-0.37),R2=0.80,其中:,Q人均咖啡消費量(磅) P咖啡的價格(以1967年價格為不變價格) P茶的價格(1/4磅,以1967年價格為不變價格) T時間趨勢變量(1961年第一季度為1,1977年第二季度為66) D11:第一季度;D21:第二季度;D31:第三季度。,回
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年吉林水利電力職業(yè)學院單招職業(yè)技能考試模擬測試卷附答案
- 2026年濰坊環(huán)境工程職業(yè)學院單招職業(yè)技能考試模擬測試卷及答案1套
- 2026年寧波城市職業(yè)技術學院單招職業(yè)傾向性測試題庫附答案
- 2026年娛樂測試心理考試題庫及答案1套
- 2026年山西??茊握性囶}附答案
- 2026年廣州城市職業(yè)學院單招職業(yè)技能考試模擬測試卷附答案
- 2026廣西賀州職業(yè)技術學院公開招聘教師及輔導員43人筆試備考題庫及答案解析
- 2026年心理教育期末測試題有答案
- 2025年杭州蕭山醫(yī)院醫(yī)共體總院招聘編外工作人員10人考試備考題庫附答案
- 2026福汽集團校園招聘279人筆試參考題庫及答案解析
- 2026年湖南民族職業(yè)學院單招綜合素質(zhì)筆試備考試題附答案詳解
- 全球AI應用平臺市場全景圖與趨勢洞察報告
- 2026.05.01施行的中華人民共和國漁業(yè)法(2025修訂)課件
- 維持性血液透析患者管理
- 2023-2024學年上海市閔行區(qū)四上數(shù)學期末綜合測試試題含答案
- 中鋁中州礦業(yè)有限公司禹州市方山鋁土礦礦山地質(zhì)環(huán)境保護和土地復墾方案
- 解除勞動合同證明電子版(6篇)
- 呼吸科規(guī)培疑難病例討論
- 基于PLC控制的小型鉆床機械設計
- DB11T 290-2005山區(qū)生態(tài)公益林撫育技術規(guī)程
- 開放大學(原電視大學)行政管理實務期末復習資料所有單
評論
0/150
提交評論