高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修_第1頁
高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修_第2頁
高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修_第3頁
高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修_第4頁
高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

高中數(shù)學(xué)統(tǒng)計案例回歸分析的基本思想及初步應(yīng)用三新人教A版選修第1頁/共24頁復(fù)習(xí)回顧1、線性回歸模型:y=bx+a+e(其中a和b為模型的未知參數(shù),e稱為隨機誤差)。2、數(shù)據(jù)點和它在回歸直線上相應(yīng)位置的差異是隨機誤差的效應(yīng),稱為殘差。3、對每名女大學(xué)生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學(xué)符號表示為:稱為殘差平方和,它代表了隨機誤差的效應(yīng)。

4、我們可以用相關(guān)指數(shù)R2來刻畫回歸的效果,其計算公式是:

注:R21,說明回歸方程擬合的越好;

R20,說明回歸方程擬合的越差。第2頁/共24頁6.建立回歸模型的基本步驟1)確定解釋變量x和預(yù)報變量y;2)畫出散點圖;3)確定回歸方程類型;4)求出回歸方程;5)利用相關(guān)指數(shù)或殘差進行分析.5.回歸分析的一般方法:1).利用散點圖觀察兩個變量是否線性相關(guān)2).利用殘差來判斷模型擬合的效果(殘差分析)利用殘差圖來分析數(shù)據(jù),對可疑數(shù)據(jù)(殘差較大的數(shù)據(jù))進行重新調(diào)查,有錯誤就更正,然后重新利用回歸模型擬合,如果沒有錯誤,則需要找其他原因。第3頁/共24頁練習(xí);關(guān)于x與y有如下數(shù)據(jù):

有如下的兩個線性模型:(1);(2)試比較哪一個擬合效果更好。x24568y3040605070第4頁/共24頁例2:一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān)?,F(xiàn)收集了7組觀測數(shù)據(jù)列于表中:(1)試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程;并預(yù)測溫度為

28oC時產(chǎn)卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?溫度xoC21232527293235產(chǎn)卵數(shù)y/個711212466115325問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第5頁/共24頁例2:一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關(guān)?,F(xiàn)收集了7組觀測數(shù)據(jù)列于表中,試建立y與x之間的回歸方程

解:作散點圖;從散點圖中可以看出產(chǎn)卵數(shù)和溫度之間的關(guān)系并不能用線性回歸模型來很好地近似。這些散點更像是集中在一條指數(shù)曲線或二次曲線的附近。問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第6頁/共24頁選變量

解:選取氣溫為解釋變量x,產(chǎn)卵數(shù)為預(yù)報變量y。畫散點圖假設(shè)線性回歸方程為:?=bx+a選模型分析和預(yù)測當(dāng)x=28時,y=19.87×28-463.73≈93估計參數(shù)由計算器得:線性回歸方程為y=19.87x-463.73

相關(guān)指數(shù)R2=r2≈0.8642=0.7464所以,一次函數(shù)模型中溫度解釋了74.64%的產(chǎn)卵數(shù)變化。050100150200250300350036912151821242730333639當(dāng)x=28時,y=19.87×28-463.73≈93方法一:一元函數(shù)模型問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第7頁/共24頁奇怪?思考:93>66?模型不好?問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第8頁/共24頁

y=c1

x2+c2

變換y=c1

t+c2

非線性關(guān)系線性關(guān)系問題1選用y=c1x2+c2

,還是y=c1x2+cx+c2

?問題3

產(chǎn)卵數(shù)氣溫問題2如何求c1、c2?令t=x2方法二,二元函數(shù)模型問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第9頁/共24頁平方變換:令t=x2,產(chǎn)卵數(shù)y和溫度x之間二次函數(shù)模型y=bx2+a就轉(zhuǎn)化為產(chǎn)卵數(shù)y和溫度的平方t之間線性回歸模型y=bt+a溫度21232527293235溫度的平方t44152962572984110241225產(chǎn)卵數(shù)y/個711212466115325作散點圖,并由計算器得:y和t之間的線性回歸方程為y=0.367t-202.54,相關(guān)指數(shù)R2=r2≈0.8962=0.802將t=x2代入線性回歸方程得:

y=0.367x2-202.54當(dāng)x=28時,y=0.367×282-202.54≈85,且R2=0.802,所以,二次函數(shù)模型中溫度解釋了80.2%的產(chǎn)卵數(shù)變化。t問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第10頁/共24頁問題2

變換y=bx+a非線性關(guān)系線性關(guān)系問題1如何選取指數(shù)函數(shù)的底?產(chǎn)卵數(shù)氣溫兩邊取對數(shù)問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)方法三:指數(shù)函數(shù)模型第11頁/共24頁溫度xoC21232527293235z=lgy0.851.041.321.381.822.062.51產(chǎn)卵數(shù)y/個711212466115325xz當(dāng)x=28oC時,y≈44,指數(shù)回歸模型中溫度解釋了98%的產(chǎn)卵數(shù)的變化由計算器得:z關(guān)于x的線性回歸方程為z=0.272x-3.849,相關(guān)指數(shù)R2=r2≈0.99252=0.98

對數(shù)變換:在中兩邊取自然對數(shù)得令,則就轉(zhuǎn)換為z=bx+a問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)第12頁/共24頁函數(shù)模型相關(guān)指數(shù)R2線性回歸模型0.7464二次函數(shù)模型0.802指數(shù)函數(shù)模型0.98(1)由上表顯而易見,指數(shù)函數(shù)模型最好!問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)思考:最好的模型是哪個?

產(chǎn)卵數(shù)氣溫產(chǎn)卵數(shù)氣溫線性模型二次函數(shù)模型指數(shù)函數(shù)模型第13頁/共24頁則回歸方程的殘差計算公式分別為:(2)另外由計算可得:x21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.000-40.104-58.26577.968問題四:若兩個變量呈現(xiàn)非線性回歸關(guān)系,如何解決?(分析例2)故指數(shù)函數(shù)模型的擬合效果比二次函數(shù)的模擬效果好.第14頁/共24頁解:令則z=bx+a,(a=lnc1,b=c2),列出變換后數(shù)據(jù)表并畫出x與z的散點圖x和z之間的關(guān)系可以用線性回歸模型來擬合x21232527293235z1.9462.3983.0453.1784.194.7455.784第15頁/共24頁

注:應(yīng)用統(tǒng)計方法解決實際問題需要注意的問題:對于同樣的數(shù)據(jù),有不同的統(tǒng)計方法進行分析,我們要用最有效的方法分析數(shù)據(jù)?!梢岳弥庇^(散點圖和殘差圖)、相關(guān)指數(shù)來確定哪一個模型的擬合效果更好。如本例中現(xiàn)在有三個不同的回歸模型可供選擇來擬合紅鈴蟲的產(chǎn)卵數(shù)與溫度數(shù)據(jù),他們分別是:我們可以利用直觀(散點圖和殘差圖)、相關(guān)指數(shù)來確定哪一個模型的擬合效果更好。第16頁/共24頁小結(jié):1.對于給定的樣本點兩個含有未知參數(shù)的模型:其中a和b都是未知參數(shù)。用殘差法對擬合效果比較的步驟為:(1)分別建立對應(yīng)于兩個模型的回歸方程與其中和分別是參數(shù)a和b的估計值;(2)分別計算兩個回歸方程的殘差平方和(3)對兩個回歸方程的殘差平方和比大小,殘差平方和越小的擬合效果越好,殘差平方和越大的擬合效果越差。注:當(dāng)回歸方程不是形如y=bx+a時,我們稱之為非線性回歸方程.第17頁/共24頁2.在散點圖中,若樣本點沒有分布在某個帶狀區(qū)域內(nèi),則兩個變量不呈現(xiàn)線性相關(guān)關(guān)系,所以不能直接利用線性回歸方程來建立兩個變量之間的關(guān)系.所以需要設(shè)非線性回歸方程,進而通過一系列轉(zhuǎn)化,將其轉(zhuǎn)化為線性回歸模型區(qū)解決。用線性回歸模型解決非線性相關(guān)問題思路:

(1)對數(shù)型非線性模型通過兩邊取對數(shù)可以轉(zhuǎn)化為線性模型。(2)二次函數(shù)型非線性模型通過兩邊設(shè)元法可以轉(zhuǎn)化為線性模型。小結(jié):進而利用線性回歸模型建立了y和x之間的非線性回歸方程.令z=lny,則變換后樣本點應(yīng)該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.如本例中,根據(jù)已有的函數(shù)知識,可以發(fā)現(xiàn)樣本點分布在某一條指數(shù)函數(shù)曲線的周圍,其中c1和c2是待定參數(shù).第18頁/共24頁例1在一段時間內(nèi),某中商品的價格x元和需求量Y件之間的一組數(shù)據(jù)為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753解:第19頁/共24頁例1在一段時間內(nèi),某中商品的價格x元和需求量Y件之間的一組數(shù)據(jù)為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753解:列出殘差表為0.994因而,擬合效果較好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.4第20頁/共24頁練習(xí)假設(shè)關(guān)于某設(shè)備的使用年限x和所支出的維修費用y(萬元),有如下的統(tǒng)計資料。使用年限x23456維修費用y2.23.85.56.57.0若由資料知,y對x呈線性相關(guān)關(guān)系。試求:(1)線性回歸方程的回歸系數(shù);(2)求殘差平方和;(3)求相關(guān)系數(shù);(4)估計使用年限為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論