已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一元線性回歸模型的統(tǒng)計(jì)檢驗(yàn) 一、擬合優(yōu)度檢驗(yàn) 二、變量的顯著性檢驗(yàn) 三、參數(shù)的置信區(qū)間 回歸分析 是要通過樣本所估計(jì)的參數(shù)來代替總體的真實(shí)參數(shù),或者說是用樣本回歸線代替總體回歸線。 盡管從 統(tǒng)計(jì)性質(zhì) 上已知,如果有足夠多的重復(fù) 抽樣,參數(shù)的估計(jì)值的期望(均值)就等于其總體的參數(shù)真值,但在一次抽樣中,估計(jì)值不一定就等于該真值。 那么,在一次抽樣中,參數(shù)的估計(jì)值與真值的差異有多大,是否顯著,這就需要進(jìn)一步進(jìn)行 統(tǒng)計(jì)檢驗(yàn) 。 主要包括 擬合優(yōu)度檢驗(yàn) 、變量的 顯著性檢驗(yàn)及參數(shù)的 區(qū)間估計(jì) 。 一、擬合優(yōu)度檢驗(yàn) 擬合優(yōu)度檢驗(yàn)( : 對(duì)樣本回歸直線與樣本觀測(cè)值之間擬合程度的檢驗(yàn)。 度量擬合優(yōu)度的指標(biāo) : 判定系數(shù) ( 可決系數(shù) of 題: 采用普通最小二乘估計(jì)方法,已經(jīng)保證了模型最好地?cái)M合了樣本觀測(cè)值,為什么還要檢驗(yàn)擬合程度? 果采用不同的解釋變量來解釋被解釋變量,可能有的解釋好點(diǎn),有點(diǎn)解釋差點(diǎn)。相當(dāng)于模型的選擇方法。 1、總離差平方和的分解 已知由一組樣本觀測(cè)值( i), i=1,2, Y 10 )()( 沒有解釋的部分 被解釋了的部分 如果 i 即實(shí)際觀測(cè)值落在樣本回歸“線”上,則 擬合最好 。 可認(rèn)為, “離差” 全部來自回歸線,而與“殘差”無關(guān)。 對(duì)于所有樣本點(diǎn),則需考慮這些點(diǎn)與樣本均值離差的平方和 ,可以證明: 記 22 )( S um 22 )( S um 22 )( S 殘差平方和 ( um 的觀測(cè)值圍繞其均值的 總離差 (分解為兩部分: 一部分來自回歸線 (另一部分則來自隨機(jī)勢(shì)力 ( 在給定樣本中, 如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則 此 擬合優(yōu)度 :回歸平方和 的總離差 S 1記 22、可決系數(shù) 稱 (樣本) 可決系數(shù) /判定系數(shù) ( of 可決系數(shù) 的 取值范圍 : 0, 1 ,說明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高 。 直觀上,若 回歸顯得擬合得較好! 在實(shí)際計(jì)算可決系數(shù)時(shí),在 1 已經(jīng)估計(jì)出后 : 22212 在例 入 中, 9 0 0 2 07 4 2 5 0 0 0) 222212 注:可決系數(shù) 是一個(gè)非負(fù)的統(tǒng)計(jì)量。它也是隨著抽樣的不同而不同。為此,對(duì)可決系數(shù)的統(tǒng)計(jì)可靠性也應(yīng)進(jìn)行檢驗(yàn),這將在第 3章中進(jìn)行。但是實(shí)際計(jì)算有可能為負(fù)值,這是由于計(jì)算的問題,通常要求有常數(shù)項(xiàng),可以保證非負(fù) ! 可決系數(shù)為負(fù)的原因 見 2004, . of 20 to a ) of of y - of y On SS is 2 be is SS is is SS is a of y (in b! 可決系數(shù)為負(fù)的原因 見 2004, . 如果沒有常數(shù)項(xiàng),那么( 的一式不存在,即估計(jì)的殘差和不一定等于 0。從而不能保證第 41頁中 從而無法保證 樣 就有可能小于 0。 T S 120 ii 可決系數(shù)只是說明列入模型的所有解釋變量對(duì) 因變量的聯(lián)合的影響程度,不說明模型中每個(gè) 解釋變量的影響程度(在多元中) 回歸的主要目的如果是經(jīng)濟(jì)結(jié)構(gòu)分析,不能只 追求高的可決系數(shù),而是要得到總體回歸系數(shù) 可信的估計(jì)量,可決系數(shù)高并不表示每個(gè)回歸 系數(shù)都可信任 如果建模的目的只是為了預(yù)測(cè)因變量值,不是 為了正確估計(jì)回歸系數(shù),一般可考慮有較高的 可決系數(shù),一般來說時(shí)間系列的很高, 可決系數(shù)與相關(guān)系數(shù)的關(guān)系( 1) ( 1)聯(lián)系 數(shù)值上,可決系數(shù)等于應(yīng)變量與解釋變量之間簡(jiǎn)單相關(guān)系數(shù)的平方 : 2 2 2 2 2222 2 2 2 2222()()( ) ( )i i i i ii i i x x y y x 可決系數(shù)與相關(guān)系數(shù)的關(guān)系( 2) 可決系數(shù) 相關(guān)系數(shù) 就模型而言 就兩個(gè)變量而言 說明解釋變量對(duì)應(yīng)變量的解釋程度 度量?jī)蓚€(gè)變量線性依存程度。 度量不對(duì)稱的因果關(guān)系 度量不含因果關(guān)系的對(duì)稱相關(guān)關(guān)系 取值: 0,1 取值: 1,1 ( 2)區(qū)別 二、變量的顯著性檢驗(yàn) 回歸分析 是要判斷 解釋變量 解釋變量 在 一元線性模型 中,就是要判斷 具有顯著的線性性影響。這就需要進(jìn)行 變量的顯著性檢驗(yàn)。 變量的顯著性檢驗(yàn)所應(yīng)用的方法是數(shù)理統(tǒng)計(jì)學(xué)中的 假設(shè)檢驗(yàn) 。 計(jì)量經(jīng)計(jì)學(xué)中 ,主要是針對(duì)變量的參數(shù)真值是否為零來進(jìn)行顯著性檢驗(yàn)的。 1、假設(shè)檢驗(yàn) 所謂 假設(shè)檢驗(yàn) , 就是事先對(duì)總體參數(shù)或總體分布形式作出一個(gè)假設(shè),然后利用樣本信息來判斷原假設(shè)是否合理,即判斷樣本信息與原假設(shè)是否有顯著差異,從而決定是否接受或否定原假設(shè) 。 假設(shè)檢驗(yàn)采用的邏輯推理方法是反證法。 先假定原假設(shè)正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。 判斷結(jié)果合理與否,是基于“小概率事件不易發(fā)生”這一原理的 2、變量的顯著性檢驗(yàn) ),( 2211 )2(1112211 檢驗(yàn)步驟: ( 1)對(duì)總體參數(shù)提出假設(shè) 1=0, 10 ( 2)以原假設(shè) 由樣本計(jì)算其值 11( 3)給定顯著性水平 ,查 臨界值 t /2(4) 比較,判斷 若 |t| t /2(則拒絕 接受 若 |t| t /2(則拒絕 接受 現(xiàn)在常用 么是 對(duì)于一元線性回歸方程中的 0,可構(gòu)造如下 )2(0022200 在上述 收入 中,首先計(jì)算 2的估計(jì)值 13402210 0 4 2 1 2 5 0 0 0/1 3 4 0 2 221 2 5 0 0 010/5 3 6 5 0 0 0 01 3 4 0 2 2220 ii 2 3000 = t (8)=明 家庭可支配收入在 95%的置信度下顯著,即是消費(fèi)支出的主要解釋變量; |明在 95%的置信度下 , 無法拒絕截距項(xiàng)為零的假設(shè) 。 3、置信區(qū)間 前面,我們討論了參數(shù)的點(diǎn)估計(jì) . 它是用樣本算得的一個(gè)值去估計(jì)未知參數(shù) . 但是,點(diǎn)估計(jì)值僅僅是未知參數(shù)的一個(gè)近似值,它沒有反映出這個(gè)近似值的誤差范圍,使用起來把握不大 稱 參數(shù)真值的區(qū)間估計(jì) )正好彌補(bǔ)了點(diǎn)估計(jì)的這個(gè)缺陷 . 譬如,在估計(jì)湖中魚數(shù)的問題中,若我們根據(jù)一個(gè)實(shí)際樣本,得到魚數(shù) N 的極大似然估計(jì)為 1000條 . 若我們能給出一個(gè)區(qū)間,在此區(qū)間內(nèi)我們合理地相信 N 的真值位于其中 . 這樣對(duì)魚數(shù)的估計(jì)就有把握多了 . 實(shí)際上, 000條,也可能小于 1000條 . 也就是說,我們希望確定一個(gè)區(qū)間,使我們能以比較高的 可靠程度 相信它包含真參數(shù)值 . 湖中魚數(shù)的真值 這里所說的“ 可靠程度 ”是用概率來度量的 , 稱為 置信度 或 置信水平 . 習(xí)慣上把置信水平記作 1 ,這里 是一個(gè) 很小的正數(shù) . 一、 置信區(qū)間定義 滿足 設(shè) 是 一個(gè)待估參數(shù),給定 ,02, 則稱區(qū)間 是 的置信水平(置信度 )為 的置信區(qū)間 . 1和 分別稱為置信下限和置信上限 . 若由樣本 1P 12( , , , ) X X X12( , , , ) X X X() ( , ) 找一個(gè)區(qū)間使得要估計(jì)的參數(shù)以 1 置信水平的大小是根據(jù)實(shí)際需要選定的 . 置信區(qū)間 . 稱區(qū)間 為 的 1置信水平為 的 ( , ) 例如,通常可取置信水平 = 1根據(jù)一個(gè)實(shí)際樣本,由給定的置信水平,我 小的區(qū)間 ,使 們求出一個(gè)盡可能 ( , ) 1P 這里有兩個(gè)要求 : 可見, 對(duì)參數(shù) 作區(qū)間估計(jì),就是要設(shè)法找出兩個(gè) 只依賴于樣本的界限 (構(gòu)造統(tǒng)計(jì)量 ). 一旦有了樣本,就把 估計(jì)在區(qū)間 內(nèi) . 12( , , , ) X X X12( , , , ) X X X() ( , ) 可靠度與精度是一對(duì)矛盾,一般是 在保證可靠度的條件下盡可能提高 精度 . 1. 要求 以很大的可能被包含在區(qū)間 內(nèi),就是說,概率 要盡可能大 . 即要求估計(jì)盡量可靠 . ( , ) P 2. 估計(jì)的精度要盡可能的高 . 如要求區(qū)間長(zhǎng)度 盡可能短,或能體現(xiàn)該要求的其它準(zhǔn)則 . 可見,確定區(qū)間估計(jì)很關(guān)鍵的是要尋找一個(gè) 待估參數(shù) 和估計(jì)量 T 的函數(shù) U(T, ), 且 U(T, ) 的分布為已知 , 不依賴于任何未知參數(shù) . 而這與總體分布有關(guān),所以, 總體分布的形式是 否已知,是怎樣的類型,至關(guān)重要 . 假設(shè)檢驗(yàn) 可以通過一次抽樣的結(jié)果檢驗(yàn)總體參數(shù)可能的假設(shè)值的范圍(如是否為零),但它并沒有指出在一次抽樣中樣本參數(shù)值到底離總體參數(shù)的真值有多 “ 近 ” 。 要判斷樣本參數(shù)的估計(jì)值在多大程度上可以“ 近似 ” 地替代總體參數(shù)的真值,往往需要通過構(gòu)造一個(gè)以樣本參數(shù)的估計(jì)值為中心的 “ 區(qū)間 ” ,來考察它以多大的可能性(概率)包含著真實(shí)的參數(shù)值。這種方法就是參數(shù)檢驗(yàn)的 置信區(qū)間估計(jì) 。 1)( 存 在 這 樣 一 個(gè) 區(qū) 間 , 稱之為 置 信 區(qū) 間( ; 1-稱為 置信系數(shù) ( 置信度 )( , 稱為 顯著性水平 ( of ; 置信區(qū)間的端點(diǎn)稱為 置信限( 或 臨界值 ( 。 一元線性模型中 , i (i=1, 2) 的置信區(qū)間 : 在變量的顯著性檢驗(yàn)中已經(jīng)知道: )2( 意味著,如果給定置信度( 1-) ,從分布表中查得自由度為 (臨界值,那么 t/2, t/2)的概率是 (1- )。表示為: P t t t( ) 2 21即 P ) 2 21P t s t si i ii i( ) 2 21于是得到 :(1-)的置信度下 , ( , ) i it s t si i 2 2在上述 收入 中,如果給定 =表得: 3 5 ()2( 0 0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年室內(nèi)裝修材料供應(yīng)合同協(xié)議
- 2026年飛機(jī)動(dòng)力系統(tǒng)維修合同
- 2026年皮具上光修復(fù)合同
- 個(gè)人之間貨物運(yùn)輸合同協(xié)議
- 磚砌體承包合同
- 協(xié)管培訓(xùn)課件
- 佛山育嬰師培訓(xùn)課件
- 2025-2031年中國(guó)鄰氟苯胺行業(yè)市場(chǎng)全景評(píng)估及投資潛力研判報(bào)告
- 2025 小學(xué)一年級(jí)數(shù)學(xué)下冊(cè)復(fù)習(xí)課(全冊(cè)知識(shí)框架)課件
- 2025 小學(xué)一年級(jí)數(shù)學(xué)下冊(cè)位置(上下前后)新授課件
- 海姆立克急救課件 (完整版)
- 2025年互聯(lián)網(wǎng)營(yíng)銷游戲化營(yíng)銷案例解析可行性研究報(bào)告
- DB31∕T 1048-2020“上海品牌”認(rèn)證通 用要求
- 《交易心理分析》中文
- 病理性賭博的識(shí)別和干預(yù)
- 醫(yī)院成本管控模式的創(chuàng)新與案例分析
- 2026屆高三語文聯(lián)考作文題目導(dǎo)寫分析及范文:當(dāng)語言與真實(shí)經(jīng)驗(yàn)脫鉤
- 2025醫(yī)療健康紙質(zhì)行業(yè)市場(chǎng)深度記錄系統(tǒng)與文件研究評(píng)估報(bào)告
- 政務(wù)大模型發(fā)展研究報(bào)告(2025年)
- 2025年國(guó)家開放大學(xué)《馬克思主義基本原理》期末考試參考題庫及答案解析
- 空管面試高分技巧
評(píng)論
0/150
提交評(píng)論