線性回歸模型的有偏估計(jì)_第1頁
線性回歸模型的有偏估計(jì)_第2頁
線性回歸模型的有偏估計(jì)_第3頁
線性回歸模型的有偏估計(jì)_第4頁
線性回歸模型的有偏估計(jì)_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

線性回歸模型的有偏估計(jì)第一頁,共六十二頁,編輯于2023年,星期三為什么要復(fù)習(xí)數(shù)理統(tǒng)計(jì)學(xué)數(shù)理統(tǒng)計(jì)學(xué)是計(jì)量經(jīng)濟(jì)學(xué)的基礎(chǔ),它為計(jì)量經(jīng)濟(jì)學(xué)提供了唯一而有效的方法。數(shù)理統(tǒng)計(jì)較難,而且許多同學(xué)對于數(shù)學(xué)公式與數(shù)學(xué)符號(hào)的健忘,提醒我們有必要在展開計(jì)量經(jīng)濟(jì)學(xué)討論之前,對本課程中經(jīng)常使用到的數(shù)理統(tǒng)計(jì)學(xué)基本內(nèi)容事先進(jìn)行一些溫習(xí)和回顧。第二頁,共六十二頁,編輯于2023年,星期三主要內(nèi)容第一節(jié)基本概念第二節(jié)對總體的描述——隨機(jī)變量的數(shù)字特征第三節(jié)對樣本的描述——樣本分布的數(shù)字特征第四節(jié)隨機(jī)變量的分布——總體和樣本的連接點(diǎn)第五節(jié)通過樣本,估計(jì)總體(一)——估計(jì)量的特征第六節(jié)通過樣本,估計(jì)總體(二)——估計(jì)方法第七節(jié)通過樣本,估計(jì)總體(三)——假設(shè)檢驗(yàn)

第三頁,共六十二頁,編輯于2023年,星期三第一節(jié)基本概念總體和個(gè)體樣本和樣本容量隨機(jī)變量統(tǒng)計(jì)量隨機(jī)變量的分布函數(shù)和分布密度函數(shù)第四頁,共六十二頁,編輯于2023年,星期三1.1總體(集合)、個(gè)體(構(gòu)成集合的元素)、樣本和樣本容量研究對象的全體稱為總體或母體,組成總體的每個(gè)基本單位稱為個(gè)體??傮w中抽出若干個(gè)個(gè)體組成的集體稱為樣本。樣本中包含的個(gè)體的個(gè)數(shù)稱為樣本的容量,又稱為樣本的大小。

注意:抽樣是按隨機(jī)原則選取的,即總體中每個(gè)個(gè)體有同樣的機(jī)會(huì)被選入樣本。第五頁,共六十二頁,編輯于2023年,星期三1.2隨機(jī)變量根據(jù)概率不同而取不同數(shù)值的變量稱為隨機(jī)變量(RandomVariable)。一個(gè)隨機(jī)變量具有下列特性:可以取許多不同的數(shù)值,取這些數(shù)值的概率為p,第六頁,共六十二頁,編輯于2023年,星期三總體、隨機(jī)變量、樣本間的聯(lián)系樣本就是一個(gè)隨機(jī)變量,所謂“樣本容量為n的樣本”就是n個(gè)相互獨(dú)立且與總體有相同分布的隨機(jī)變量X1,……,Xn。每一次具體抽樣所得的數(shù)據(jù),就是n元隨機(jī)變量的一個(gè)觀察值,記為(x1,……,xn)。樣本是總體的一部分??傮w一般是未知的,一般要通過樣本才能部分地推知總體的情況。第七頁,共六十二頁,編輯于2023年,星期三1.3統(tǒng)計(jì)量設(shè)(x1,x2,……,xn)為一組樣本觀察值,函數(shù)y=f(x1,x2,……,xn

)若不含有未知參數(shù),則稱為統(tǒng)計(jì)量。統(tǒng)計(jì)量一般是連續(xù)函數(shù)。由于樣本是隨機(jī)變量,因而它的函數(shù)y也是隨機(jī)變量,所以,統(tǒng)計(jì)量也是隨機(jī)變量。統(tǒng)計(jì)量一般用它來提取由樣本帶來的總體信息。第八頁,共六十二頁,編輯于2023年,星期三1.4隨機(jī)變量的分布函數(shù)定義若X為一隨機(jī)變量,對任意實(shí)數(shù)x,稱

F(x)=P(Xx)為隨機(jī)變量X的分布函數(shù)。第九頁,共六十二頁,編輯于2023年,星期三連續(xù)型隨機(jī)變量的分布密度定義:對于任何實(shí)數(shù)x,如果隨機(jī)變量X的分布函數(shù)F(x)可以寫成第十頁,共六十二頁,編輯于2023年,星期三分布密度函數(shù)的性質(zhì):概率密度函數(shù)的大小能夠反映X在x附近取值的概率的大小,從而比分布函數(shù)更直觀。第十一頁,共六十二頁,編輯于2023年,星期三舉例:正態(tài)分布X~N(u,)x2x2f(x)F(x)x1x1XX第十二頁,共六十二頁,編輯于2023年,星期三第二節(jié)對總體的描述

——隨機(jī)變量的數(shù)字特征2.1、數(shù)學(xué)期望2.2、方差2.3、數(shù)學(xué)期望與方差的圖示第十三頁,共六十二頁,編輯于2023年,星期三2.1.1數(shù)學(xué)期望:一個(gè)加權(quán)平均值數(shù)學(xué)期望描述隨機(jī)變量(總體)的一般水平。定義2.1離散型隨機(jī)變量數(shù)學(xué)期望的定義:定義2.2連續(xù)型隨機(jī)變量數(shù)學(xué)期望的定義變量X的取值x1x2……xn相應(yīng)概率Pp1p2……pn第十四頁,共六十二頁,編輯于2023年,星期三2.1.2數(shù)學(xué)期望的性質(zhì)(1)如果a、b為常數(shù),則E(aX+b)=aE(X)+b(2)如果X、Y為兩個(gè)隨機(jī)變量,則E(X+Y)=E(X)+E(Y)(3)如果g(x)和f(x)分別為X的兩個(gè)函數(shù),則E[g(X)+f(X)]=E[g(X)]+E[f(X)](4)如果X、Y是兩個(gè)獨(dú)立的隨機(jī)變量,則E(X.Y)=E(X).E(Y)第十五頁,共六十二頁,編輯于2023年,星期三2.2.1方差的定義定義離均差如果隨機(jī)變量X的數(shù)學(xué)期望E(X)存在,稱[X-E(X)]為隨機(jī)變量X的離均差。顯然,隨機(jī)變量離均差的數(shù)學(xué)期望是0,即E[X-E(X)]=0定義方差、標(biāo)準(zhǔn)差隨機(jī)變量離均差平方的數(shù)學(xué)期望叫隨機(jī)變量的方差,記作Var(x)或D(x)。方差的算術(shù)平方根叫標(biāo)準(zhǔn)差。第十六頁,共六十二頁,編輯于2023年,星期三2.2.2方差的意義(1)離均差和方差都是用來描述離散程度的,即描述X對于它的期望的偏離程度,這種偏差越大,表明變量的取值越分散。(2)一般情況下,我們采用方差來描述離散程度。因?yàn)殡x均差的和為0,無法體現(xiàn)隨機(jī)變量的總離散程度。方差中由于有平方,從而消除了正負(fù)號(hào)的影響,并易于加總。第十七頁,共六十二頁,編輯于2023年,星期三2.2.3方差的性質(zhì)(1)Var(c)=0(2)Var(c+x)=Var(x)(3)Var(cx)=c2Var(x)(4)x,y為相互獨(dú)立的隨機(jī)變量,則Var(x+y)=Var(x)+Var(y)=Var(x-y)(5)Var(x)=E(x2)-(E(x))2第十八頁,共六十二頁,編輯于2023年,星期三數(shù)學(xué)期望與方差的圖示數(shù)學(xué)期望描述隨機(jī)變量的集中程度,方差描述隨機(jī)變量的分散程度。1.方差同、期望變大2.期望同、方差變小51055第十九頁,共六十二頁,編輯于2023年,星期三第三節(jié)對樣本的描述

——樣本分布的數(shù)字特征一、樣本均值:二、樣本方差、樣本標(biāo)準(zhǔn)差第二十頁,共六十二頁,編輯于2023年,星期三第四節(jié)隨機(jī)變量的分布

——總體和樣本的連接點(diǎn)4.1幾種重要的分布4.2分布:總體和樣本之間的連接點(diǎn)

學(xué)習(xí)的重點(diǎn)應(yīng)放在確定X服從什么分布,和各種分布的聯(lián)系上。第二十一頁,共六十二頁,編輯于2023年,星期三4.1幾種重要的分布4.1.1正態(tài)分布4.1.2卡方分布4.1.3t分布4.1.4F分布4.1.5臨界值點(diǎn)第二十二頁,共六十二頁,編輯于2023年,星期三4.1.1正態(tài)分布定義正態(tài)分布的定義定理正態(tài)分布的數(shù)學(xué)期望和方差第二十三頁,共六十二頁,編輯于2023年,星期三正態(tài)分布圖示x2x2f(x)F(x)x1x1XX第二十四頁,共六十二頁,編輯于2023年,星期三正態(tài)分布的標(biāo)準(zhǔn)化定義標(biāo)準(zhǔn)正態(tài)分布定理正態(tài)分布標(biāo)準(zhǔn)化第二十五頁,共六十二頁,編輯于2023年,星期三關(guān)于正態(tài)分布的和第二十六頁,共六十二頁,編輯于2023年,星期三4.1.22分布2分布的定義N=7N=11概率xN為自由度第二十七頁,共六十二頁,編輯于2023年,星期三定理2分布的和仍然服從2分布第二十八頁,共六十二頁,編輯于2023年,星期三4.1.3t分布t分布的定義概率密度x標(biāo)準(zhǔn)正態(tài)分布t-分布0第二十九頁,共六十二頁,編輯于2023年,星期三4.1.4F分布F分布的定義x概率密度第三十頁,共六十二頁,編輯于2023年,星期三4.1.5臨界值點(diǎn):(1)標(biāo)準(zhǔn)正態(tài)分布、t分布臨界值點(diǎn)(雙側(cè))/2/21-類似:第三十一頁,共六十二頁,編輯于2023年,星期三臨界值點(diǎn):(2)卡方分布(雙側(cè))、F分布(單側(cè))臨界值點(diǎn)x概率密度1-/2/21-x第三十二頁,共六十二頁,編輯于2023年,星期三4.2分布:總體和樣本之間的連接點(diǎn)第三十三頁,共六十二頁,編輯于2023年,星期三第五節(jié)

通過樣本,估計(jì)總體(一)

——估計(jì)量的特征無偏性有效性兼顧無偏和有效:最小均方誤一致性大樣本下,具一致性的估計(jì)量具“無偏”和“有效”特性。第三十四頁,共六十二頁,編輯于2023年,星期三5.1無偏性定義的真值的真值有偏無偏第三十五頁,共六十二頁,編輯于2023年,星期三5.2有效性定義第三十六頁,共六十二頁,編輯于2023年,星期三形象感覺無偏性和有效性:重慶長安廠4支比賽用槍的抽樣結(jié)果準(zhǔn)而不精又精又準(zhǔn)精而不準(zhǔn)不精不準(zhǔn)一次射擊就是一次抽樣。試問:哪些是無偏估計(jì)?哪些是有偏估計(jì)?哪些是有效估計(jì)?第三十七頁,共六十二頁,編輯于2023年,星期三偏差與方差的權(quán)衡:最小均方誤有偏,方差極小無偏,方差極大第三十八頁,共六十二頁,編輯于2023年,星期三5.3一致性的定義第三十九頁,共六十二頁,編輯于2023年,星期三n增大時(shí),一致估計(jì)量的“無偏”“有效”特性N小N大N極大的真值。第四十頁,共六十二頁,編輯于2023年,星期三第六節(jié)

通過樣本,估計(jì)總體(二)

——估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)區(qū)間估計(jì)的概念、步驟應(yīng)用:對總體期望的區(qū)間估計(jì)

1、已知方差,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)正態(tài)總體一般總體大樣本下

2、方差未知,對數(shù)學(xué)期望E進(jìn)行區(qū)間估計(jì)大樣本下/小樣本下第四十一頁,共六十二頁,編輯于2023年,星期三6.1區(qū)間估計(jì)的概念所謂區(qū)間估計(jì)就是以一定的可靠性給出被估計(jì)參數(shù)的一個(gè)可能的取值范圍。具體作法是找出兩個(gè)統(tǒng)計(jì)量1(x1,…,xn)與2(x1,…,xn),使P(1<<2)=1-(1,2)稱為置信區(qū)間,1-稱為置信系數(shù)(置信度),稱為冒險(xiǎn)率(測不準(zhǔn)的概率)或者顯著水平,一般取5%或1%。第四十二頁,共六十二頁,編輯于2023年,星期三對區(qū)間估計(jì)的形象比喻我們經(jīng)常說某甲的成績“大概80分左右”,可以看成一個(gè)區(qū)間估計(jì)。(某甲的成績?yōu)楸还烙?jì)的參數(shù))P(1<<2)=大概的準(zhǔn)確程度(1-)

如:P(75<<85)=95%=1-5%“大概80分左右”冒險(xiǎn)率(也叫顯著水平)下限上限置信系數(shù)1-第四十三頁,共六十二頁,編輯于2023年,星期三6.2區(qū)間估計(jì)的步驟:

1)找一個(gè)含有該參數(shù)的統(tǒng)計(jì)量;2)構(gòu)造一個(gè)概率為的事件;3)通過該事件解出該參數(shù)的區(qū)間估計(jì).第四十四頁,共六十二頁,編輯于2023年,星期三6.3已知方差,對總體期望值E=的區(qū)間估計(jì)(1)正態(tài)總體;(2)一般總體,大樣本下。第四十五頁,共六十二頁,編輯于2023年,星期三(1)正態(tài)總體,方差已知,估計(jì)均值u第四十六頁,共六十二頁,編輯于2023年,星期三/2/21-圖示如下第四十七頁,共六十二頁,編輯于2023年,星期三(2)一般總體,方差已知,大樣本下數(shù)學(xué)期望E的區(qū)間估計(jì)中心極限定理指出,無論是否為正態(tài)總體,當(dāng)樣本容量相當(dāng)大時(shí),有樣本平均數(shù)漸進(jìn)地服從正態(tài)分布。在n>=30時(shí),近似地,樣本平均數(shù)

N(,2/n)。所以,對于大樣本仍可以按正態(tài)總體進(jìn)行均值的區(qū)間估計(jì)。第四十八頁,共六十二頁,編輯于2023年,星期三6.4方差未知,正態(tài)總體,對數(shù)學(xué)期望E=u的區(qū)間估計(jì)(1)大樣本下根據(jù)中心極限定理,Var()可以用代替,所以仍按已知方差正態(tài)分布的方法進(jìn)行的置信區(qū)間估計(jì)。第四十九頁,共六十二頁,編輯于2023年,星期三(2)小樣本下第五十頁,共六十二頁,編輯于2023年,星期三區(qū)間估計(jì),統(tǒng)計(jì)量的選擇小結(jié)第五十一頁,共六十二頁,編輯于2023年,星期三第七節(jié)通過樣本,估計(jì)總體(三)

——假設(shè)檢驗(yàn)基本概念:假設(shè)檢驗(yàn),原假設(shè)/備擇假設(shè)小概率事件原理在假設(shè)檢驗(yàn)中的應(yīng)用置信水平假設(shè)檢驗(yàn)的步驟應(yīng)用:正態(tài)總體期望的假設(shè)檢驗(yàn)(方差已知/方差未知)(t檢驗(yàn)等)方差的假設(shè)檢驗(yàn)第五十二頁,共六十二頁,編輯于2023年,星期三7.1假設(shè)檢驗(yàn)的概念定義:稱對任何一個(gè)隨機(jī)變量未知的分布類型或參數(shù)的假設(shè)為統(tǒng)計(jì)假設(shè),簡稱假設(shè)。檢驗(yàn)該假設(shè)是否正確稱為假設(shè)檢驗(yàn)。在統(tǒng)計(jì)假設(shè),如

H0:p=0.5(稱為原假設(shè))

H1:p0.5(稱為備擇假設(shè))

第五十三頁,共六十二頁,編輯于2023年,星期三7.2“小概率原理”在假設(shè)檢驗(yàn)中的應(yīng)用數(shù)理統(tǒng)計(jì)學(xué)中的“小概率原理”認(rèn)為:概率很小的事件在一次抽樣試驗(yàn)中幾乎是不可能發(fā)生的。在H0成立的條件下,統(tǒng)計(jì)量落在拒絕域?yàn)橐粋€(gè)小概率事件,因此,在一次抽樣試驗(yàn)中,依據(jù)小概率原理,是不會(huì)發(fā)生的。要是小概率事件(“統(tǒng)計(jì)量落在拒絕域”)居然發(fā)生了。那么,只能是提出的假設(shè)H0發(fā)生了錯(cuò)誤,所以必須拒絕H0。第五十四頁,共六十二頁,編輯于2023年,星期三顯著性水平是小概率事件發(fā)生的概率;在假設(shè)檢驗(yàn)中也稱為置信水平。第五十五頁,共六十二頁,編輯于2023年,星期三7.3假設(shè)檢驗(yàn)的步驟:Step1:分析問題,提出原假設(shè)和備擇假設(shè);Step2:選擇和計(jì)算統(tǒng)計(jì)量U:在原假設(shè)成立時(shí),U的分布已知;含有要檢驗(yàn)的參數(shù);各個(gè)參數(shù)應(yīng)該都是已知的、可求的。Step3:構(gòu)造小概率事件:Step4:判斷小概率事件是否發(fā)生:Step5:下結(jié)論:若小概率事件發(fā)生,拒絕原假設(shè)H0;選擇備擇假設(shè)H1。否則,原假設(shè)成立。第五十六頁,共六十二頁,編輯于2023年,星期三假設(shè)檢驗(yàn)的具體操作步驟

(以正態(tài)總體、已知方差,檢驗(yàn)均值u為例)1、提出零假設(shè)H0:=0

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論