版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第二章計量經(jīng)濟分析的統(tǒng)計學基礎
第一節(jié)概率和概率分布第二節(jié)統(tǒng)計推斷第三節(jié)參數(shù)估計第四節(jié)假設檢驗第一節(jié)概率和概率分布一、描述性統(tǒng)計量1.均值
測量一個變量典型取值的統(tǒng)計量稱為集中趨勢測度,最常用的集中趨勢測度是均值(mean)。變量X的均值為
2.方差和標準差
測量一個變量所有數(shù)據(jù)值的離散程度的統(tǒng)計量稱為離散測度,最常用的離散測度是方差
(variance)及其正平方根,稱為標準差
(standarddeviation),它們的定義為
二、概率的概念1.隨機試驗和事件
隨機試驗是導致至少兩種可能結果的過程,并且在此過程中將出現(xiàn)何種結果是不確定的。
一個隨機試驗的所有可能結果的集合稱為樣本空間或總體,樣本空間的每個成員稱為一個樣本點。
事件是樣本空間的子集。如果兩個事件中一個事件的發(fā)生排除了另一個事件的發(fā)生,則稱它們是互不相容事件或互斥事件。如果若干個事件包羅了一個試驗的所有可能的結果,則這些事件稱為完備事件。2.總體和樣本
給定的一組觀測值通常被視為從某個更大的總體中抽取的一個樣本。
總體可以是有限的,也可以是無限的。有限總體可能很大,如全國14億人口;也可能很小,如一個班學生的綜合測評成績。為了計算的方便,大總體有時可假定為無限總體。
樣本是總體的一部分。之所以需要抽取樣本,是因為在有些情況下,當分析某個變量的特征時,涉及的總體容量太大,甚至是無限總體,以至不可能對整個總體進行檢查,或者這樣做耗費太大,從而只能使用觀測樣本。2.總體和樣本
通常假定樣本能夠反映要研究的總體特征,因此可以依據(jù)樣本來推斷總體。由于在某種程度上樣本是總體的代表,因此這種推斷有一定的合理性。
例如,為研究所有北京人的平均收入,很顯然需要全體北京人(總體)的數(shù)據(jù)??墒牵占總€人的收入數(shù)據(jù)是一件很困難的事。在實踐中,我們可以抽取一個由5000人組成的隨機樣本,然后計算這5000人的平均收入,將其作為北京人的真實平均收入的估計值。
4.概率的性質(zhì)(1)0≤P(A)≤1對所有A成立。
P(A)=0表明事件A不會發(fā)生;
P(A)=1表明事件A必定發(fā)生。一般情況下,概率值在0
1之間。(2)若A,B,C,…是完備事件集,則
P(A+B+C+…)=1其中A+B+C的含義是A或B或C,等等。(3)若A,B,C,…是互不相容事件,則
P(A+B+C+…)=P(A)+P(B)+P(C)+…三、隨機變量和概率分布1.隨機變量
可以在一個特定數(shù)集中按一定概率取值的變量稱為隨機變量。只能取某些離數(shù)值的稱為離散隨機變量,如擲骰子所得點數(shù)(1,2,3,4,5,6)??梢匀∫粋€有限(或無限)區(qū)間所有值的稱為連續(xù)隨機變量,如零件的直徑。
隨機變量通常用大寫字母X,Y,Z來表示,它們所取的值用小寫字母x,y,z等表示。2.隨機變量的概率分布和概率密度函數(shù)
一個隨機變量取給定值或?qū)儆谝唤o定值集的概率所確定的函數(shù)稱為該隨機變量的概率分布。
概率分布反映的是隨機變量所有可能取值的概率的分配方式。一旦與所有可能結果相聯(lián)系的概率被確定,則概率分布即完全被確定。(1)離散隨機變量的概率分布
設X為取相異值x1,x2,…,xn,…的離散隨機變量,則函數(shù)
四、概率分布的特征最常用的兩個概率分布的概括性測度是期望值和方差。
2.期望的性質(zhì)(1)若b為常數(shù),則E(b)=b
(2)設X1,X2,…,Xn為隨機變量,a1,a2,…an和b為常數(shù),則
E(a1X1+a2X2+…+anXn+b)=a1E(X1)+a2E(X2)+…+anE(Xn)+b
(3)若X和Y為獨立隨機變量,則
E(XY)=E(X)E(Y)
4.方差的性質(zhì)(1)Var(X)=E[(X-μ)2]=E(X2)-μ2;(2)
常數(shù)的方差為0;(3)若a和b為常數(shù),則 Var(aX+b)=a2Var(X)
(4)
若X和Y為獨立隨機變量,則 Var(X+Y)=Var(X)+Var(Y)5.
協(xié)方差若X和Y為兩隨機變量,均值分別為μx和μy,則兩變量的協(xié)方差定義為 Cov(X,Y)=E[(X-μx)(Y-μy)]若X和Y為獨立隨機變量,則Cov(X,Y)=0。
7.相關變量的方差設X和Y是兩個隨機變量,則Var(X+Y)=Var(X)+Var(Y)+2Cov(X,Y)Var(X-Y)=Var(X)+Var(Y)-2Cov(X,Y)8.樣本均值、方差、協(xié)方差和相關系數(shù)
與上述總體特征(參數(shù))相對應的是樣本統(tǒng)計量,如樣本均值,樣本方差,樣本協(xié)方差和樣本相關系數(shù)。它們均可由樣本數(shù)據(jù)(樣本觀測值)計算得出,計算方法在本節(jié)第一段中已做介紹,這里不再重復。五、
幾個重要的理論概率分布
1.正態(tài)分布圖2-1正態(tài)分布正態(tài)分布有以下性質(zhì):(1)關于其均值的對稱性,如圖2.1所示。(2)正態(tài)曲線下大約68%的面積位于μ±
之間,大約95%的面積位于μ±2
之間,大約99.7%的面積位于μ±3
之間,如圖2.1所示。1.正態(tài)分布(3)正態(tài)分布完全被它的兩個參數(shù)μ和
2所描述,也就是說,一旦這兩個參數(shù)被給定,則我們就可以用正態(tài)分布的PDF求出X位于某一區(qū)間之內(nèi)的概率。
事實上,我們用不著實際去算,因為這些概率值可以從專門編制的正態(tài)分布表中查到。任何統(tǒng)計學或計量經(jīng)濟學教科書后面都附有正態(tài)分布表以及我們下面要介紹的t分布表、F分布表。1.正態(tài)分布
圖2-2
χ2分布
圖2-3
t分布t分布的性質(zhì);(1)t分布與正態(tài)分布一樣,是對稱的,但比正態(tài)分布要平一些。如圖2.3所示。df值充分大時,t分布近似于正態(tài)分布。df值趨向無窮大時,t分布就是標準正態(tài)分布。(2)t分布的均值為0,其方差為k/(k-2)。
圖2.4F分布第二節(jié)統(tǒng)計推斷一、
統(tǒng)計推斷的一般問題
具體說來,我們希望在以下兩個方面運用樣本信息。(1)檢驗關于總體參數(shù)的假設;(2)作出這些參數(shù)可能值的推斷。
這兩方面的應用,是統(tǒng)計推斷一般問題的兩個分支,即假設檢驗和參數(shù)估計。
隨機樣本是統(tǒng)計推斷的基礎。也就是說,進行假設檢驗和參數(shù)估計所使用的樣本必須是隨機樣本。因此,下文中所提到的樣本均指隨機樣本。
統(tǒng)計推斷的基本問題:一是判斷手中的樣本是否可能取自具有確定參數(shù)的某類總體,即從樣本信息來檢驗關于總體的假設,這是假設檢驗的問題。另一方面,給定樣本,總體諸參數(shù)的可能值是什么?也就是如何從樣本值估計總體參數(shù),這是參數(shù)估計的問題。二、
抽樣分布
抽樣誤差
由于樣本是總體的一部分,在大多數(shù)情況下,僅僅是從總體中抽取的極小部分,因而不能指望它是總體的一個精確的復制品。若某樣本均值恰好等于對應的總體均值,那也純粹是一種巧合。
隨機樣本的樣本值(統(tǒng)計量)與總體值(參數(shù))之間的差異稱為抽樣誤差。抽樣誤差是在樣本的選取中偶然因素作用的結果。
三、
均值的抽樣分布
定理
中心極限定理
第三節(jié)參數(shù)估計
參數(shù)估計要解決的問題是由樣本值來估計總體參數(shù)。例如,我們可能希望知道北京市某日西瓜的平均零售價格,對所有的西瓜銷售點進行全面統(tǒng)計即便行得通,費用也太大??尚械姆椒ㄊ请S機選取若干個銷售點進行調(diào)查,得到有關西瓜價格的一個樣本,然后計算樣本的平均價格,作為全市西瓜平均零售價格總體參數(shù)的估計值。
這種利用樣本數(shù)據(jù)來估計未知的總體參數(shù)的方法稱為參數(shù)估計。估計問題可分為兩類:點估計和區(qū)間估計。一、
點估計
2.點估計量的統(tǒng)計性質(zhì)
估計量和估計值相比,估計量更重要,這是因為好的估計量通常會產(chǎn)生比較接近總體參數(shù)真值的估計值,而與具體的樣本無關。估計量的統(tǒng)計性質(zhì)可分成兩類:小樣本性質(zhì)和大樣本性質(zhì)(漸近性質(zhì))。
我們不能保證無偏估計量產(chǎn)生的每一個估計值都優(yōu)于有偏估計量產(chǎn)生的估計值,但無偏性仍是一個很有用的性質(zhì),因為從無偏分布中抽取的一個估計值比起從那些不以總體真值為中心的分布中抽取的估計值有更大可能靠近總體真值。
圖2-6有效性
(2)大樣本性質(zhì)
在小樣本的情況下,一個估計量不滿足某些小樣本性質(zhì),但隨著樣本容量無限增大,該估計量就具有一些令人滿意的統(tǒng)計性質(zhì),這些性質(zhì)稱為大樣本性質(zhì)或漸近性質(zhì)。
一、
區(qū)間估計
點估計量的主要缺點是,它們僅為我們提供一個單值作為未知總體參數(shù)的估計值。由于這個估計值依賴于抽樣分布的樣本容量N,因而它未必接近總體真值。因此,在某些實際估計問題中,建立一個我們可以預期未知參數(shù)將按某種置信度位于其中的區(qū)間似乎更有意義,這種方法稱為區(qū)間估計。
第四節(jié)假設檢驗一、
假設檢驗的邏輯核心思想:小概率事件原理在假設成立的前提下,計算當前樣本結果出現(xiàn)的概率。如果該概率非常?。ㄐ「怕适录瑒t懷疑原假設的正確性,從而拒絕它。二、
假設檢驗的步驟和方法例2.1即軸的直徑問題。某廠批量生產(chǎn)一種直徑為100毫米的軸,隨機抽取一個16根軸的樣本,計算出平均直徑(樣本均值)為110毫米,方差為100,要檢驗的是生產(chǎn)線是否出了問題。換句話說,我們要檢驗總體均值是不是100毫米。1.建立關于總體的原假設和備擇假設
假設檢驗的第一步是建立要檢驗的假設。
假設檢驗涉及到在兩個相互矛盾的假設之間進行選擇,一個是原假設(nullhypohesis)用H0表示;另一人是備擇假設(alternativehypostasis),用Ha或H1表示。
下面是關于車軸總體均值的原假設和備擇假設:
原假設H0:μ=100
備擇假設Ha:μ≠100
以上述形式給出的這種類型的檢驗稱為雙側檢驗。若備擇假設的形式變?yōu)棣?gt;100或μ<100,則稱為單側檢驗。
3.檢驗原假設,得出關于原假設是否合理的結論
計算出檢驗統(tǒng)計量在原假設成立情況下的值,下一步就是根據(jù)是否出現(xiàn)小概率事件的原則進行判別。
在進行判別之前,需要確定一個標準,什么情況下拒絕原假設,什么情況下接受原假設。本節(jié)開頭我們曾提到的5%的臨界水平,或稱為5%的顯著性水平,就是一個這樣的標準。其含義是如果我們上一步計算的t統(tǒng)計量的值出現(xiàn)的概率小于5%,則拒絕原假設,否則接受原假設。3.檢驗原假設,得出關于原假設是否合理的結論
顯著性水平用
表示。顯著性水平
=5%定下來以后,我們可以通過附錄中的t表查出臨界的t值tc,然后將上一步計算出的t值與臨界的t值相比較,若|t|>tc,則拒絕原假設Ho,如下圖所示。圖2-7
接受域和拒絕域3.檢驗原假設,得出關于原假設是否合理的結論
在例子中,從t值表中可查出,對于α=0.05和自由度為16-1=15的t臨界值tc=2.13,我們有
|t|=4>tc=2.13
因此,拒絕原假設H0,樣本數(shù)據(jù)不支持總體均值為100的假設,可能是生產(chǎn)線出了問題。三、
統(tǒng)計假設的單側檢驗
三、
統(tǒng)計假設的單側檢驗
圖2-8
單側檢驗三、
統(tǒng)計假設的單側檢驗在我們的例子中,如果采用單側檢驗:
H0:μ=100
H1:μ>100則根據(jù)α=0.05,df=15查t值表,得臨界值為tc=1.75,由于t=4>tc=1.75,結論仍是拒絕原假設H0,而接受備擇假設μ>100。四、
兩種類型的錯誤
四、
兩種類型的錯誤
如果情況果真如此,則拒絕原假設,就是拒絕了正確的原假設,這類的錯誤稱為第Ⅰ類錯誤。與此類似,若原假設是錯誤的,但被接受了,這種錯誤稱為第Ⅱ類錯誤。
在設計統(tǒng)計檢驗時,重要的是要確定這兩類錯誤產(chǎn)生的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年綠色供應鏈協(xié)同管理實務
- 2026年會員日促銷方案策劃指南
- 2026福建福州軟件職業(yè)技術學院招聘19人備考題庫附答案詳解
- 2026西藏山南加查縣文旅局公益性崗位的招聘1人備考題庫及答案詳解參考
- 計算機自然語言處理應用手冊
- 職業(yè)噪聲心血管疾病的綜合干預策略優(yōu)化
- 職業(yè)噪聲與心血管疾病環(huán)境暴露評估技術
- 客戶活動年終總結范文(3篇)
- 職業(yè)健康檔案電子化數(shù)據(jù)在職業(yè)病科研中的應用
- 職業(yè)健康促進醫(yī)療成本控制策略
- 2026年無錫工藝職業(yè)技術學院單招綜合素質(zhì)考試題庫帶答案解析
- 數(shù)字孿生方案
- 【低空經(jīng)濟】無人機AI巡檢系統(tǒng)設計方案
- 2025年公務員多省聯(lián)考《申論》題(陜西A卷)及參考答案
- 向規(guī)范要50分規(guī)范答題主題班會-課件
- cie1931年標準色度觀測者的光譜色品坐標
- per200軟件petrel2009中文版教程
- SB/T 10595-2011清潔行業(yè)經(jīng)營服務規(guī)范
- JJF 1078-2002光學測角比較儀校準規(guī)范
- 新鄉(xiāng)市興華煤礦盡職調(diào)查報告
- GB 1886.215-2016食品安全國家標準食品添加劑白油(又名液體石蠟)
評論
0/150
提交評論