版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二章 回歸分析概述回歸分析是尋求隱藏在隨機現(xiàn)象中的統(tǒng)計規(guī)律的理論和方法,是經(jīng)濟計量學(xué)的最基本的方法論基礎(chǔ)。討論回歸模型在經(jīng)典假設(shè)條件下的參數(shù)估計、假設(shè)檢驗和估計量的統(tǒng)計性質(zhì),以及經(jīng)典假設(shè)不完全滿足條件下,有關(guān)問題的處理是理論經(jīng)濟計量學(xué)的任務(wù)。為了對回歸分析理論和方法有一個全面深入的理解,本章先對回歸分析的基本概念和性質(zhì)予以介紹,在以后各章順次展開以上問題的討論。第一節(jié) 回歸分析的性質(zhì)一、“回歸”一詞的現(xiàn)代含義回歸一詞最早是生物統(tǒng)計學(xué)家高爾頓(Francis Galton)引入的。高爾頓在對人類身高之類的遺傳特性的研究中,發(fā)現(xiàn)了他稱之為“向平均回歸”的現(xiàn)象。雖然客觀上存在一種趨勢,即父母高,子
2、女也高;父母矮,子女也矮,但是給定父母的身高,子女的平均身高卻有 “回歸”到全體人口的平均身高的傾向。也就是說,盡管父母雙親都異常高或異常矮,而子女的身高卻有趨向人口總體平均身高的趨勢。高爾頓的普通回歸定律也被另一位統(tǒng)計學(xué)家皮爾遜(Karl Pearson)證實。高爾頓的興趣在于發(fā)現(xiàn)人口的身高為什么有一種穩(wěn)定性。這是“回歸”一詞的初始含義。 然而,對“回歸”一詞的現(xiàn)代解釋卻與初始含義有很大不同,其現(xiàn)代含義是回歸分析研究一個被解釋變量對另一個或多個解釋變量的變量依存關(guān)系,其用意在于通過后者(在重復(fù)抽樣中)的已知或設(shè)定值,去估計或預(yù)測前者的(總體)均值。 比如,對于父母身高與子女身高的關(guān)系研究,人
3、們會發(fā)現(xiàn),對于設(shè)定的每一個父輩的身高,都有一個兒輩的假想人口總體的身高分布與之對應(yīng),隨著父輩身高的增加,兒輩的平均身高也增加。若把這種父輩身高與兒輩平均身高的一一對應(yīng)關(guān)系繪制在平面坐標(biāo)圖上,可以得到一條直線,這條直線就叫做回歸線,它表明兒輩的平均身高如何隨父輩的身高變化。從現(xiàn)代回歸的觀點出發(fā),人們關(guān)心的是給定父輩的身高情況下,如何發(fā)現(xiàn)兒輩平均身高的變化。也就是說,人們關(guān)心的是一旦知道了父輩的身高,如何估計預(yù)測兒輩的平均身高。 經(jīng)濟學(xué)家可以利用回歸分析研究個人消費支出對其實際可支配收入的依從關(guān)系。通過回歸分析可估計邊際消費傾向(MPC),而邊際消費傾向說明人們每增加一個單位的實際可支配收入而引起
4、的消費支出的平均變化。農(nóng)業(yè)經(jīng)濟學(xué)家可利用回歸分析研究農(nóng)作物收成對施肥量,降雨量,氣溫等的依賴關(guān)系。這種分析能使他用給定的解釋變量的信息預(yù)測或預(yù)報農(nóng)作物的平均收成。勞動經(jīng)濟學(xué)家利用回歸分析研究貨幣工資變化率對失業(yè)率的依存關(guān)系,著名的菲利普斯曲線就是研究這一依存關(guān)系的成果,勞動經(jīng)濟學(xué)家經(jīng)常利用這一曲線預(yù)測在給定的某個失業(yè)率下貨幣工資的平均變化。由于工資的增長會引起物價的上漲,因此通過這一曲線還可以研究通貨膨脹、關(guān)于經(jīng)濟擴張過程方面的問題。 由貨幣銀行學(xué)的知識可知,若其它條件不變,通貨膨脹率愈高,人們愿意以貨幣形式保存的收入比例越低。對這種關(guān)系作回歸分析,使金融學(xué)家能夠預(yù)測在各種通貨膨脹率下人們愿意
5、以貨幣形式保存的平均收入比例。 公司的經(jīng)理想了解人們對公司產(chǎn)品的需求與廣告費開支的關(guān)系。對其進行回歸分析在很大程度上有助于計算相對于廣告費支出的需求彈性,這有助于公司經(jīng)理制定“最優(yōu)”的廣告費預(yù)算。我們能提供關(guān)于一個變量依賴于另一個或多個變量的大量事例。現(xiàn)代回歸分析的主要任務(wù),就是用來研究這種變量之間的依從關(guān)系的。二、統(tǒng)計關(guān)系與確定關(guān)系 在經(jīng)典物理學(xué)中研究的變量之間的關(guān)系是函數(shù)關(guān)系或確定性依賴關(guān)系。從上述例子可以看出,回歸分析中研究的變量之間的關(guān)系都不是函數(shù)關(guān)系或確定性依賴關(guān)系,而是一種所謂的統(tǒng)計依從關(guān)系。在變量之間的統(tǒng)計關(guān)系中,人們主要處理的是隨機變量,也就是具有概率分布的變量。但是在函數(shù)或確
6、定性依賴關(guān)系中,人們處理的變量是非隨機的。統(tǒng)計關(guān)系雖然沒有函數(shù)關(guān)系準(zhǔn)確,但是它的存在比后者更為廣泛,而且非常有用。因為客觀社會經(jīng)濟現(xiàn)象中存在的大量統(tǒng)計關(guān)系可表示成確定性部分和隨機性部分之和,這種統(tǒng)計關(guān)系的表示是回歸分析的基礎(chǔ)。例如農(nóng)作物收成對施肥量、降雨量、氣溫的依賴關(guān)系是統(tǒng)計性質(zhì)的。其意義在于:這些解釋變量固然重要,但并不能使農(nóng)業(yè)經(jīng)濟學(xué)家準(zhǔn)確預(yù)測作物的收成。一方面,除了上述解釋變量外,還有其他影響收成的因素(變量)存在,由于種種原因難于一一識別和測量;另一方面,對這些已考慮的解釋變量的測量存在誤差。因此,無論我們考慮多少個解釋變量,都無法完全解釋農(nóng)作物收成這個應(yīng)變量。它的一些“內(nèi)生的”或隨機
7、的變異是注定存在的。 但是在確定性現(xiàn)象中,人們利用函數(shù)的形式研究表示這樣一類變量的依賴關(guān)系。比如,牛頓的引力定律可表示為,其中為引力,和為兩個粒子的質(zhì)量,為距離,而為比例常數(shù)。其物理意義說明:宇宙間的每個粒子吸引著另一個粒子,其引力與它們的質(zhì)量乘積成正比,而與它們之間的距離的平方成反比。在物理學(xué)中,這類確定性現(xiàn)象的例子很多。如歐姆定律、波依耳的氣體定律、克奇霍夫的電流定律和牛頓的運動定律等等。統(tǒng)計關(guān)系與確定性關(guān)系有區(qū)別,但也有聯(lián)系。比方說,在牛頓的引力定律中,若的測量有誤差,則原來的確定性關(guān)系就變成了一個統(tǒng)計關(guān)系。這時,引力只能按給定的(還有、和)近似地加以預(yù)測,于是變量之間的關(guān)系由函數(shù)關(guān)系變
8、為統(tǒng)計關(guān)系,變量變成了一個隨機變量。三、回歸與因果關(guān)系 回歸分析研究大量的一個變量對一個或一些變量的依賴關(guān)系,但是它本身并不揭示和說明這些變量之間是否存在因果關(guān)系。對于這些變量代表的事物之間是否存在因果關(guān)系,要由研究這些事物的實質(zhì)性科學(xué)來揭示,因果關(guān)系的理念,必須來自統(tǒng)計學(xué)之外。回歸分析可對實質(zhì)性科學(xué)揭示的因果關(guān)系給予實證。比如父輩身高與兒輩身高一例中,我們沒有任何統(tǒng)計上的理由可以認為父輩身高不依賴于兒輩身高,人們之所以把兒輩身高作為依賴于父輩身高的被解釋變量,是出于非統(tǒng)計上的考慮,常識告訴我們不能把這種關(guān)系顛倒過來。若從統(tǒng)計的角度,把兒輩身高作為解釋變量而把父輩身高作為被解釋變量進行回歸,可
9、能得到一個很強的統(tǒng)計關(guān)系式,但不能由此得到一個合乎邏輯的解釋,更不能得出兒輩的高矮是父輩高矮的原因的荒謬結(jié)論。也就是說,從邏輯上看,統(tǒng)計關(guān)系式本身不說明任何因果關(guān)系。事物之間的因果關(guān)系,必須依賴先驗的或理論上的思考或揭示。四、回歸分析與相關(guān)分析 以測度兩個變量之間的線性關(guān)聯(lián)程度為其主要目的的相關(guān)分析,雖然與回歸分析具有密切的關(guān)聯(lián),然而在概念上卻迥然不同。第3章中我們將要討論的相關(guān)系數(shù)就是用來測度變量(線性)相關(guān)程度的指標(biāo)。在現(xiàn)實中,也許我們對家庭的消費支出與家庭的可支配收入,農(nóng)作物的收獲率與降雨量,產(chǎn)品的產(chǎn)出量與勞動和資本的投入量,人的身高與體重,學(xué)生的統(tǒng)計學(xué)成績與數(shù)學(xué)成績,吸煙的時間與肺癌的
10、發(fā)病率等等之間的相關(guān)性感興趣,計算它們的相關(guān)系數(shù),進行相關(guān)分析。但在回歸分析中,我們對這種度量并無太大的興趣,感興趣的是根據(jù)其它變量的設(shè)定值來估計或預(yù)測某一變量的平均值。比如,也許人們想知道是否能依據(jù)一個家庭的可支配收入去預(yù)測具有相同可支配收入家庭的平均消費支出。 回歸分析和相關(guān)分析之間存在一些基本的區(qū)別。在回歸分析中,被解釋變量與解釋變量的處理方法上存在不對稱性。被解釋變量是隨機變量,具有概率分布,而解釋變量則是非隨機的,在重復(fù)抽樣中取固定值。但在相關(guān)分析中,我們對稱地對待任何(兩個)變量;兩個變量都被看作是隨機的,沒有被解釋變量與解釋變量的區(qū)分,大部分相關(guān)理論都建立在變量的隨機性假定上。而
11、回歸理論大部分都以下述假定為條件:即被解釋變量是隨機的,而解釋變量是非隨機的。所以,同樣兩個變量,根據(jù)理論分析,可以擬合兩個意義不同的回歸方程,但只能計算一個相關(guān)系數(shù)。比如我們可以擬合以人的身高為被解釋變量,以人的體重為解釋變量的回歸模型;也可以反過來以人的體重作為被解釋變量,而以人的身高作為解釋變量的回歸模型,但人的身高和體重之間只可計算一個相關(guān)系數(shù)。相關(guān)分析與回歸分析之間也存在一些基本的聯(lián)系。一般在回歸分析之前,要對涉及的變量進行相關(guān)分析(定性的、定量的分析),確定有相關(guān)關(guān)系時,才進一步作回歸分析。因此可以說相關(guān)分析是回歸分析的前提,回歸分析是相關(guān)分析的深化。第二節(jié) 回歸分析的基本概念一、
12、總體回歸線 上一節(jié)指出,回歸分析就是要根據(jù)解釋變量的已知或給定值,去估計或預(yù)測被解釋變量的(總體)均值。為了弄清楚其實質(zhì)含義,考慮下面的例子。例 假想一個人口總體由100戶家庭組成。若我們要研究家庭人均月消費支出與人均月可支配收入之間的關(guān)系,也就是說,知道了家庭的人均月可支配收入,預(yù)測其人均月消費支出的(總體)平均水平。表2.1給出了人為的數(shù)據(jù),將100戶家庭按照其人均可支配收入大小從小到大劃分為10個組,每組只給出人均可支配收入的組中值。表2.1 假想總體月家庭人均可支配收入和消費支出 單位:元月家庭人均可支配收入500100015002000250030003500400045005000
13、月家庭人均消費支出460590802108613571564200124012768305246265791111981498171221062509293132794696609901245153017792263260030103387475729103713351684193023472698310534144848271100137717551951240027923112349848889211341405180020002445282331893547490941122615711846219025002867320136584969871325178719262223257829
14、48331237499891419183219642310258730743434143618442001253126673168209026122731212527342871合計382472721138014680215762553629496278802806227584Y的條件均值E(Y|X)47880811381468179821282458278831183448 表2.1應(yīng)做如下的解釋:對應(yīng)于每個縱列的給定組中值收入水平,都有一個消費支出的總體分布,也就是說,它給出了以的給定值為條件的的總體條件分布。比如,對應(yīng)于每月1000元的人均可支配收入,具有9戶家庭的月人均消費支出(590
15、元,657元,989元)構(gòu)成的總體條件分布。同時我們也容易算出給定X的的條件概率。例如,當(dāng)1000,得到這些消費支出中任一個的條件概率均為1/9。用符號表示為等等。同理,等等。 對于的每一條件概率分布,我們都能算出它們的條件均值或條件期望值(conditional expected values) ,記做。例如,等等。實際上我們根據(jù)表2.1的數(shù)據(jù)可繪制圖2.1的散點圖,觀察此散點圖可以發(fā)現(xiàn),雖然每個個別家庭的人均消費支出都有變異,但圖2.1依然清楚地表明隨著收入的增加,消費支出平均說來也在增加,也就是說的條件均值隨的增加而增加。若將圖中粗圓點代表的的各個條件均值連起來,可以看出,這些條件均值落
16、在一條有正斜率的直線上。這條直線稱為總體回歸曲線(population regression curve),簡稱為總體回歸線(population regression line, PRL)。它表示對的回歸。 圖2.1 不同收入水平下消費支出的條件分布及其總體回歸線在幾何意義上,總體回歸曲線就是當(dāng)解釋變量取給定值時被解釋變量的條件均值或期望值的軌跡。它表明對每一值都有值的一個總體(假定服從正態(tài)分布)和一個相應(yīng)的條件均值。而總體回歸曲線(或直線)就是通過這些條件均值的連線。二、總體回歸函數(shù) 由圖2.1可以清楚地看出,每一條件均值都是的一個函數(shù),即有: ()其中表示解釋變量的某個函數(shù)(在我們的人為
17、例子中,是的一個線性函數(shù))。式()被稱為總體回歸函數(shù)(population regression function, PRF)或簡稱為總體回歸(PR)。它僅僅表明在給定下的(總體)分布均值與有函數(shù)關(guān)系。換句話說,它表明的均值或平均響應(yīng)是怎樣隨X而變化的。 函數(shù)采取什么形式是一個十分重要的問題。因為在實際情況中我們一般無法得到全部總體的觀測值來做分析研究。因此,PRF的形式設(shè)定是一個經(jīng)驗方面的問題。或許經(jīng)濟理論會有所提示,但理論的提出需經(jīng)過實證檢驗。例如,根據(jù)經(jīng)濟理論分析,可以認為人們的消費支出與可支配收入有線性關(guān)系,作為一個初次逼近或一個暫行的假設(shè),可以設(shè)定PRF 是的線性函數(shù),其形式為 ()
18、其中和未知,然而是固定的參數(shù),稱為回歸系數(shù)(regressive coefficients),稱為截距(intercept),稱為斜率系數(shù)(slope coefficient)。式()稱為線性總體回歸函數(shù)或簡稱線性總體回歸,有時也稱為線性總體回歸模型。 但是,如果我們把人均食品消費支出與人均可支配收入的關(guān)系也設(shè)定為線性回歸函數(shù),可能就不符合恩格爾定律的描述,還需要經(jīng)驗的幫助和實證的檢驗。 在回歸分析中,我們的興趣在于估計像式()那樣的PRF,也就是說,根據(jù)和的樣本觀測值估計未知的參數(shù)和。該問題將在第3章展開討論。三、“線性”一詞的含義描述統(tǒng)計關(guān)系的回歸模型在數(shù)學(xué)形式上有線性和非線性之分。但是,
19、在回歸分析中,“線性”一詞的含義可作兩種解釋。對線性的第一種解釋也許是更“自然”的解釋是,的條件期望是的線性函數(shù)。比如說,如同式()那樣的形式。從幾何意義上說,這時回歸曲線是一條直線。按照這種解釋,諸如,等,就不是線性函數(shù)。對于線性的第2種解釋是,的條件期望是諸參數(shù)的線性函數(shù);它可以是也可以不是變量的線性函數(shù)。對于這種解釋,和都是線性回歸模型,而則不是,后者(對參數(shù)而言)是非線性回歸模型的一個例子。在兩種線性的解釋中,對于我們即將展開討論的回歸理論來說,主要考慮的是對參數(shù)為線性的情形,也就是說,從現(xiàn)在起,“線性”回歸一詞總是指對參數(shù)為線性的一種回歸,即參數(shù)總是以它的一次方出現(xiàn)。對解釋變量則可以
20、是也可以不是線性的。劃分的標(biāo)準(zhǔn)是回歸模型的條件期望關(guān)于參數(shù)的導(dǎo)數(shù)是否與參數(shù)有關(guān),即期望函數(shù)關(guān)于參數(shù)的一階導(dǎo)函數(shù)是否仍然是參數(shù)的函數(shù)。若不是,則稱該回歸模型是線性回歸函數(shù),若是,則稱為非線性回歸函數(shù)。 四、總體回歸函數(shù)的隨機設(shè)定1、PRF的隨機設(shè)定 由表2.1和圖2.1清楚地看出,隨著人均可支配收入的增加,家庭人均消費支出平均地說也增加。然而對于每一個家庭來說卻并非如此,某些個別家庭的人均消費支出卻沒有隨人均可支配收入的增加而增加。例如,從表2.1可以觀察出,對應(yīng)于每月2500元的收入水平,有一戶家庭的消費支出是1357元,不僅少于每月收入僅為2000元家庭的平均消費支出1468元,而且比該收入
21、水平的大部分家庭的消費支出都少。但是我們必須看出,每月人均可支配收入2500元的家庭的平均消費支出比每月人均可支配收入2000元的家庭的平均消費支出多330元。那么,個別家庭的消費支出與給定收入水平之間有什么關(guān)系呢? 由圖2.1可以看出,給定收入水平的個別家庭的消費支出聚集在收入為的所有家庭的平均消費支出(條件期望值)的周圍。因此,我們可以把個別的表示成它的條件期望值加上它與條件期望值的離差的和,即有: ()其中離差是一個不可觀測的可正可負的隨機變量,因此我們又把它稱為隨機干擾(stochastic disturbance)或隨機誤差(stochastic error)項。 式()中右邊第一項
22、代表相同收入水平的所有家庭的平均消費支出,這部分稱為確定性或系統(tǒng)性成分;第二項稱為隨機或非系統(tǒng)成分,假定它是所有可能影響Y的但又未能包含到回歸模型中的被忽略變量的替代(surrogate)或代理(proxy)變量。 假定是的線性函數(shù),如式(),方程(2.2.3)可寫為: ()方程式()表示,一個家庭的消費支出,線性地依賴于它的收入另加隨機干擾項。如果對式(2.2.3)的兩邊取條件期望,就得出: ()因為就是,所以由式()推出: ()由此可見,如果,則式()與式(2.2.4)等價。但式(2.2.4)有其優(yōu)點,即它清楚地表示,除收入外,還有影響消費支出的其他變量。我們不能單憑回歸模型中含有的(一個
23、或多個)變量就能完全解釋個別家庭的消費支出。2、隨機干擾項的意義我們?yōu)槭裁匆鸦貧w模型構(gòu)造成式()那樣的形式,不把所有的解釋變量引進模型中,構(gòu)造一個含有盡可能多的解釋變量的回歸模型,而把從模型中省略下來而又集體地影響著Y的全部變量用隨機干擾項作為代替?隨機干擾項的意義何在?可能的解釋是多方面的。(1)理論的不完備性。在構(gòu)造回歸模型時,即便有決定Y的行為理論的指導(dǎo),但由于人們認識的局限性,理論常常是不完備的。對于有些影響因素或者沒有認識到或者有所認識但不確定。因此不妨用作為模型所排除或忽略的全部變量的代替變量。(2)數(shù)據(jù)的缺失。在構(gòu)造回歸模型時,有些重要的變量被認識到了但由于不可觀測或其他原因不
24、得不被省略掉。在經(jīng)驗研究中,得不到想要的數(shù)據(jù)是司空見慣的事。比如,從經(jīng)濟原理來講,除收入外,家庭財富也是影響家庭消費支出的重要變量,但是家庭財富的數(shù)據(jù)往往難以獲得。因此,我們不得不把家庭財富這個變量用隨機誤差項來代替。 (3)周邊變量的聯(lián)合效應(yīng)的隨機化處理。比如在我們的消費收入例子中,除了核心變量收入外,影響家庭消費支出的還有諸如家庭人口數(shù),戶主的性別,宗教信仰,受教育程度等也影響消費支出。但相對于核心變量收入,它們對消費支出的影響是微小的,所以稱為周邊變量。這些周邊變量的全部合起來的影響是如此之小,充其量是一種非系統(tǒng)的或隨機的影響。從實際以及成本上考慮,把它們引入模型是不劃算的。所以把它們的
25、聯(lián)合效應(yīng)當(dāng)作一個隨機變量歸入隨機干擾項中來處理。 (4)人類行為的內(nèi)在隨機性。即使模型中包含了所有的有關(guān)變量,在個別的中仍難免有一些“內(nèi)在”的隨機性,比如家庭主婦在購物時經(jīng)常要受到情緒和購物環(huán)境的影響,隨機干擾項也許能很好地反映這種隨機性。 (5)變量的測量誤差。在搜集和整理變量數(shù)據(jù)過程中會存在測量誤差,這種真實值與觀測值之間的誤差是客觀存在的。這時干擾項又可用來代表測量誤差。 (6)節(jié)省性原則。如果我們能用盡可能少的重要解釋變量就基本解釋了被解釋變量的行為,那么我們?yōu)槭裁匆岷唵味髲?fù)雜呢?把大量不重要的解釋變量歸入隨機誤差項就體現(xiàn)了這種節(jié)省性原則。 (7)模型關(guān)系式設(shè)定不正確。即使我們能在
26、理論的指導(dǎo)下正確地選擇變量,并且能夠獲得這些變量的數(shù)據(jù),但是我們常常不知道被解釋變量與解釋變量之間的真實函數(shù)關(guān)系式。在雙變量模型中,人們或許能從樣本的散點圖來判斷總體的函數(shù)形式,而在多變量回歸模型中,這種多維空間的散點圖的形式是難以描述和想象的,要決定適當(dāng)?shù)暮瘮?shù)形式也是不容易的。五、系統(tǒng)誤差與隨機誤差 在回歸分析中區(qū)分系統(tǒng)性誤差和隨機性誤差是十分重要的。因為在回歸模型及其估計中若只存在隨機誤差,則在大量重復(fù)觀測或試驗時其平均趨勢會穩(wěn)定在回歸模型的期望函數(shù)上,從而說明該模型的設(shè)定是正確的;若在回歸模型及其估計中含有系統(tǒng)誤差,則在大量重復(fù)的觀測或試驗中其平均趨勢不會穩(wěn)定在回歸模型的期望函數(shù)上,說明
27、模型設(shè)定有錯誤。 系統(tǒng)性誤差是由系統(tǒng)因素產(chǎn)生的誤差。所謂系統(tǒng)因素是指哪些對被解釋變量作用較顯著,作用方向穩(wěn)定,重復(fù)觀測或試驗也不可能相互抵消的因素。一般來說,應(yīng)把系統(tǒng)因素盡可能作為解釋變量引入模型,而不應(yīng)將其歸入隨機誤差項。 隨機誤差則是指由隨機因素形成的誤差。所謂隨機因素,是指哪些對被解釋變量的作用不明顯,其作用方向不穩(wěn)定(時正時負),在重復(fù)觀測或試驗中,正負作用可以互相抵消的因素。隨機因素應(yīng)盡可能歸入隨機誤差項。六、樣本回歸函數(shù) 直到現(xiàn)在,我們討論的問題一直局限在與固定X值相對應(yīng)的Y值的總體上,但在大多數(shù)的實際問題中,我們并不掌握總體的信息,我們僅有對應(yīng)于某些固定X的Y值的一個樣本,我們必
28、須面對抽樣的問題?,F(xiàn)實的任務(wù)就是要用樣本的信息估計PRF。如果我們并不知道表2.1中的總體數(shù)據(jù),我們僅有的信息是從表2.1總體數(shù)據(jù)中抽出的一個隨機樣本。表2.2列出從表2.1總體中抽出的兩個隨機樣本資料。表2.2 表2.1總體的兩個隨機樣本 單位:元X值Y值樣本1樣本25004624881000941729150010371325200011981787250017551926300017792223350025872731400027922948450031893010500032793414現(xiàn)在的問題是我們能用表2.2中的一個隨機樣本提供的信息估計PRF嗎?由于抽樣誤差的存在,我們未必能“
29、準(zhǔn)確”估計PRF。為說明這一點,我們利用表2.2的樣本數(shù)據(jù)可以得出圖2.2表示的兩個散點圖。在散點圖中分別畫兩條線以盡可能好地擬合這些散點,由和分別表示的這兩條直線就稱作樣本回歸線(sample regressive line)。那么這兩條回歸線中的哪一條代表“真實”的總體回歸線呢?在“真實”總體并不知曉的情況下,我們不可能有絕對的把握說兩條樣本回歸線的哪一條可以更好地代表真實的總體回歸線。由于抽樣的原因,它們最多也不過是真實PRL的一個逼近。一般來說,從N個不同的樣本,會得到N個不同的樣本回歸線。 圖2.2 兩個不同樣本的回歸線類似于總體回歸線有一個總體回歸函數(shù)PRF相對應(yīng),每一個樣本回歸線也有一個相對應(yīng)的樣本回歸函數(shù)(sample regressive function, SRF)。類似于()式,樣本回歸函數(shù)關(guān)系式可表示為: ()其中為的估計量,和分別為和的估計量。 估計量(estimator)又稱(樣本)統(tǒng)計量(statistic),指的是一個規(guī)則或公式或方法,它告訴人們?nèi)绾卫玫玫降臉颖拘畔⑷ス烙嬁傮w參數(shù)。根據(jù)樣本信息估計計算的估計量的具體數(shù)值稱作估計值(estimate)。 如同PRF可以表示成式()和式(2.2.4)兩種等價的形式一樣,我們也可以把SRF
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 外賣店里衛(wèi)生管理制度
- 衛(wèi)生院鍋驢房管理制度
- 宿舍衛(wèi)生及考核制度
- 社群運營獎懲制度
- 招自媒體運營兼職工資制度
- 學(xué)校衛(wèi)生評比標(biāo)準(zhǔn)制度
- 中心校會計財務(wù)制度
- 衛(wèi)生職稱制度
- 衛(wèi)生打掃輪值制度
- 洗碗衛(wèi)生制度
- 紅外線桑拿毯行業(yè)跨境出海項目商業(yè)計劃書
- 2025安徽職高單招試題及答案
- 《文獻檢索與科技論文寫作入門》課件(共八章)
- 2025至2030鑄鐵產(chǎn)業(yè)行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 機電設(shè)備安裝工程中電梯系統(tǒng)全生命周期質(zhì)量管控體系
- 碎石樁施工技術(shù)
- 2025年政府采購和招標(biāo)法考試試題及答案
- 2025中考九年級語文《標(biāo)點符號》復(fù)習(xí)練習(xí)題
- 智能化建筑機器人施工方案和技術(shù)措施
- 征兵體檢外科標(biāo)準(zhǔn)
- 4輸變電工程施工質(zhì)量驗收統(tǒng)一表式(電纜工程電氣專業(yè))-2024年版
評論
0/150
提交評論