《回歸分析的基本思想及其初步應用》 優(yōu)秀_第1頁
《回歸分析的基本思想及其初步應用》 優(yōu)秀_第2頁
《回歸分析的基本思想及其初步應用》 優(yōu)秀_第3頁
《回歸分析的基本思想及其初步應用》 優(yōu)秀_第4頁
《回歸分析的基本思想及其初步應用》 優(yōu)秀_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

回歸分析的基本思想及其初步應用回歸分析的步驟畫散點圖求回歸直線方程用回歸直線方程進行預報函數(shù)關系是一種確定性關系相關關系是一種非確定性關系回歸分析是對具有相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.稱為樣本點的中心對于一組具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)回歸方程的最小二乘估計公式截距斜率≥0例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如下表編號12345678身高/cm165165157170175165155170體重/kg4857505464614358求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重.畫散點圖求回歸直線方程用回歸直線方程進行預報解取身高為自變量x,真實體重為因變量y作散點圖可用線性回歸方程刻畫它們之間的關系根據(jù)公式可得回歸方程為所以,對于身高172cm的女大學生,由回歸方程可以得到預報其體重如何描述線性相關關系的強弱?r>0時,表明兩個變量正相關;r<0時,表明兩個變量負相關.相關系數(shù)r衡量兩個變量間線性相關關系的方法r的絕對值越接近1,表面兩個變量的線性相關性越強;r的絕對值越接近0,表面兩個變量之間幾乎不存在線性相關關系.當r>0.75時認為兩個變量有很強的線性相關關系身高172cm的女大學生體重一定是60.316kg嗎?原因是什么?樣本點散布在某一條直線附近用y=bx+a+e表示身高和體重的關系y=bx+a+ea和b為模型的未知參數(shù)e是y與隨機誤差,

E(e)=0,D(e)=2>02越小線性回歸模型隨機誤差e產(chǎn)生隨機誤差e的原因是什么?一個人的體重值除了受身高的影響外,飲食運動還有度量誤差線性模型只是近似模型怎樣研究隨機誤差?如何衡量預報的精度?隨機變量數(shù)字特征均值反映隨機變量取值平均水平方差反映隨機變量集中于均值程度因E(e)=0殘差殘差平方和根據(jù)截距和斜率的估計公式,建立回歸方程對于樣本點相應的隨機誤差為衡量回歸方程的預報精度;其越小,預報精度越高.殘差分析根據(jù)散點圖來粗略判斷它們是否線性相關,是否可以用線性回歸模型來擬合數(shù)據(jù)通過殘差來判斷模型按慣例的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù).編號12345678身高/cm165165157170175165155170體重/kg4857505464614358殘差_-6.3732.6272.419-4.6181.1376.627-2.8830.382女大學生身高體重原始數(shù)據(jù)和相應的殘差數(shù)據(jù)表利用圖形分析如殘差比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適.帶狀區(qū)域?qū)挾仍秸?模型擬合精度越高,回歸方程的預報精度超高.利用相關指數(shù)R2來刻畫回歸的效果R2越接近于1,表示回歸的效果越好R2取值越大,表示殘差平方和越小,模型的擬合效果越好.用身高預報體重時,需要注意下列問題:回歸方程只適用于我們所研究的樣本總體.所建立的回歸方程一般都有時間性.樣本取值的范圍分影響回歸方程的適用范圍.不能期望回歸方程得到的預報值就是預報變量的精確值.而是可能取值的平均值建立回歸模型的基本步驟確定研究對象,明確哪個變量是解釋變量,哪個變量是預報變量;畫出確定好的解釋變量和預報變量的散點圖,觀察它們之間的關系;由經(jīng)驗確定回歸方程的類型;按一定規(guī)則估計回歸方程中的參數(shù);得出結(jié)果后分析殘差圖是否有異常,若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適.例2一只紅鈴蟲的產(chǎn)卵數(shù)y各溫度x有關.現(xiàn)收集了7組觀測數(shù)據(jù)列于下表中,試建立y與x之間的回歸方程.溫度x/℃21232527293235產(chǎn)卵數(shù)y/個711212466115325解作出散點圖令z=lny樣本點分布在直線z=bx+a(a=lnc1,b=c2)建立y和x的非線性回歸方程x21232527293235z1.9462.3983.0453.1784.1904.7455.784變換后的樣本數(shù)據(jù)及其散點圖得到線性回歸方程為紅鈴蟲的產(chǎn)卵數(shù)對溫度的非線性回歸方程為令t=x2,得y與x之間的非線性回歸方程t44152962572984110241225y711212466115325紅鈴蟲的產(chǎn)卵數(shù)和對應的溫度的平方的數(shù)據(jù)表及散點圖不宜有二次曲線來擬合x21232527293235y7112124661153250.518-0.1671.760-9.1498.889-14.15332.92847.69319.397-5.835-41.003-40.107-58.26877.965利用殘差來分析y關于x的二次回歸方程兩方程的殘差對應的殘差表比較兩個模型的殘差平和的大小來判斷模型的擬合效果.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論