回歸分析的基本思想及其初步應(yīng)用(H)_第1頁
回歸分析的基本思想及其初步應(yīng)用(H)_第2頁
回歸分析的基本思想及其初步應(yīng)用(H)_第3頁
回歸分析的基本思想及其初步應(yīng)用(H)_第4頁
回歸分析的基本思想及其初步應(yīng)用(H)_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1.1 回歸分析的基本思想 及其初步應(yīng)用溫故知新研究兩個(gè)變量的相關(guān)關(guān)系:非確定的關(guān)系確定的函數(shù)關(guān)系我們把這種隨機(jī)性的非確定的關(guān)系稱為相關(guān)關(guān)系相關(guān)關(guān)系正相關(guān):兩個(gè)變量總體變化趨勢一致負(fù)相關(guān):兩個(gè)變量總體變化趨勢相反對具有相關(guān)關(guān)系的兩個(gè)變量進(jìn)行統(tǒng)計(jì)分析的方法叫回歸分析。變量定量變量分類變量回歸分析獨(dú)立性檢驗(yàn) 比數(shù)學(xué)3中“回歸”增加的內(nèi)容數(shù)學(xué)統(tǒng)計(jì)畫散點(diǎn)圖求回歸直線方程 ybxa用回歸直線方程解決應(yīng)用問題選修-統(tǒng)計(jì)案例引入線性回歸模型: ybxae了解模型中隨機(jī)誤差項(xiàng)e產(chǎn)生的原因了解相關(guān)指數(shù) R2 和模型擬合的效果之間的關(guān)系了解殘差圖的作用利用線性回歸模型解決一類非線性回歸問題正確理解分析方法與結(jié)果一

2、、回歸直線方程:2.回歸直線過樣本點(diǎn)的中心1、用最小二乘法所求直線方程 叫做回歸直線方程;其中稱為樣本點(diǎn)的中心。例1、某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表所示.編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)女大學(xué)生的身高(x)預(yù)報(bào)體重(y)的回歸方程,并預(yù)報(bào)一名身高為172cm的女大學(xué)生的體重.根據(jù)最小二乘法估計(jì) 和 于是有相關(guān)系數(shù) 1.計(jì)算公式2相關(guān)系數(shù)的性質(zhì)(1)|r|1r正相關(guān);負(fù)相關(guān)(2)|r|越接近于1,相關(guān)程度越大;|r|越接近于0,相關(guān)程度越小散點(diǎn)圖:3、從散點(diǎn)圖還看到,樣本點(diǎn)散布在某

3、一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a簡單描述它們關(guān)系。 我們可以用下面的線性回歸模型來表示:y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機(jī)誤差。 線性回歸模型y=bx+a+e增加了隨機(jī)誤差項(xiàng)e,因變量y的值由自變量x和隨機(jī)誤差項(xiàng)e共同確定,即自變量x只能解析部分y的變化。 在統(tǒng)計(jì)中,我們也把自變量x稱為解釋變量,因變量y為預(yù)報(bào)變量。思考:產(chǎn)生隨機(jī)誤差項(xiàng)e的原因是什么?隨機(jī)誤差e的來源(可以推廣到一般):1、忽略了其它因素的影響:影響身高 y 的因素不只是體重 x,可能還包括遺傳基因、飲食習(xí)慣、生長環(huán)境等因素;2、用線性回歸模型近似真實(shí)模型所引起的誤差;3

4、、身高 y 的觀測誤差。 以上三項(xiàng)誤差越小,說明我們的回歸模型的擬合效果越好。殘差數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異 稱為相應(yīng)于點(diǎn)(xi,yi ) 的殘差。例:編號為6的女大學(xué)生,計(jì)算隨機(jī)誤差的效應(yīng)(殘差)表1-4列出了女大學(xué)生身高和體重的原始數(shù)據(jù)以及相應(yīng)的殘差數(shù)據(jù)。殘差分析與殘差圖的定義: 我們可以通過殘差 來判斷模型擬合的效果,判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),這方面的分析工作稱為殘差分析。編號12345678身高165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.38

5、2 我們可以利用圖形來分析殘差特性,作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號,或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為殘差圖。相關(guān)系數(shù) 1.計(jì)算公式2相關(guān)系數(shù)的性質(zhì)(1)|r|1r正相關(guān);負(fù)相關(guān)(2)|r|越接近于1,相關(guān)程度越大;|r|越接近于0,相關(guān)程度越小我們可以用相關(guān)指數(shù)R2來刻畫回歸的效果,其計(jì)算公式是顯然,R2的值越大,說明殘差平方和越小,也就是說模型擬合效果越好。R2越接近1,表示回歸的效果越好(因?yàn)镽2越接近1,表示解析變量和預(yù)報(bào)變量的線性相關(guān)性越強(qiáng))。 如果某組數(shù)據(jù)可能采取幾種不同回歸方程進(jìn)行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數(shù)據(jù)的模型。用身高預(yù)報(bào)體重時(shí),需要注意下列問題:1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時(shí)間性;3、樣本采集的范圍會影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值。事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值。一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個(gè)變量是解析變量,哪個(gè)變量是預(yù)報(bào)變量。(2)畫出確定好的解析變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等)。(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程y=bx+a).(4)按一定

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論