版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
3.1回歸分析的基本思想及其初步應用(一)高二數(shù)學選修2-32023/2/1數(shù)學3——統(tǒng)計內(nèi)容畫散點圖了解最小二乘法的思想求回歸直線方程
y=bx+a用回歸直線方程解決應用問題2023/2/1問題1:正方形的面積y與正方形的邊長x之間的函數(shù)關系是y=x2確定性關系問題2:某水田水稻產(chǎn)量y與施肥量x之間是否有一個確定性的關系?復習變量之間的兩種關系自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關系叫做相關關系。2023/2/1
現(xiàn)實生活中存在著大量的相關關系。
如:人的身高與年齡;產(chǎn)品的成本與生產(chǎn)數(shù)量;商品的銷售額與廣告費;家庭的支出與收入。等等探索:水稻產(chǎn)量y與施肥量x之間大致有何規(guī)律?2023/2/11020304050500450400350300·······發(fā)現(xiàn):圖中各點,大致分布在某條直線附近。探索2:在這些點附近可畫直線不止一條,哪條直線最能代表x與y之間的關系呢?xy散點圖施化肥量水稻產(chǎn)量施化肥量x15202530354045水稻產(chǎn)量y3303453654054454504552023/2/1稱為樣本點的中心,線性回歸直線一定過樣本中心。2、對兩個變量進行的線性分析叫做線性回歸分析。1、所求直線方程叫做回歸直線方程;相應的直線叫做回歸直線。2023/2/1求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為,即為所求的回歸直線方程。2023/2/1例1、觀察兩相關量得如下數(shù)據(jù):x-1-2-3-4-553421y-9-7-5-3-115379求兩變量間的回歸方程.解:列表:i12345678910xi-1-2-3-4-553421yi-9-7-5-3-115379xiyi91415125515121492023/2/1所求回歸直線方程為2023/2/1例題
從某大學中隨機選出8名女大學生,其身高和體重數(shù)據(jù)如下表:編號12345678身高165165157170175165155170體重4857505464614359
求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。2023/2/1分析:由于問題中要求根據(jù)身高預報體重,因此選取身高為自變量,體重為因變量.2.回歸方程:1.散點圖;2023/2/1
探究:身高為172cm的女大學生的體重一定是60.316kg嗎?如果不是,你能解析一下原因嗎?
答:身高為172cm的女大學生的體重不一定是60.316kg,但一般可以認為她的體重接近于60.316kg。2023/2/1例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。案例1:女大學生的身高與體重解:1、選取身高為自變量x,體重為因變量y,作散點圖:2、由散點圖知道身高和體重有比較好的線性相關關系,因此可以用線性回歸方程刻畫它們之間的關系。3、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a描述它們關系。2023/2/1在線性回歸模型(4)中,隨機誤差e的方差越小。2s由于樣本點不在同一條直線上,只是散布在某一條直線附近,所以身高與體重的關系可用線性回歸模型:y=bx+a+e,
……
(3)來表示,其中a和b為模型的未知參數(shù),e是y與bx+a之間的誤差.通常e為隨機變量,稱為隨機誤差(randomerror),即e稱為隨機誤差.它的均值E(e)=0,方差D(e)=σ2.這樣線性回歸模型的完整表達式為:2023/2/1思考:產(chǎn)生隨機誤差項e的原因是什么?隨機誤差e的來源(可以推廣到一般):1、忽略了其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高y的觀測誤差。
以上三項誤差越小,說明我們的回歸模型的擬合效果越好。2023/2/1探究3:在線性回歸模型中,e是用bx+a預報真實值y的隨機誤差,它是一個不可觀測的量,那么怎樣研究隨機誤差呢?是真實值與估計值的差!2023/2/1思考:如何發(fā)現(xiàn)數(shù)據(jù)中的錯誤?如何衡量模型的擬合效果?2023/2/12023/2/12023/2/12023/2/1例2、在一段時間內(nèi),某中商品的價格x元和需求量Y件之間的一組數(shù)據(jù)為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753解:2023/2/1例2、在一段時間內(nèi),某中商品的價格x元和需求量Y件之間的一組數(shù)據(jù)為:求出Y對的回歸直線方程,并說明擬合效果的好壞。價格x1416182022需求量Y1210753列出殘差表為0.994因而,擬合效果較好。00.3-0.4-0.10.24.62.6-0.4-2.4-4.42023/2/1即在實際應用中應該盡量選擇R2大的回歸模型.2023/2/1案例
一只紅鈴蟲的產(chǎn)卵數(shù)y和溫度x有關。現(xiàn)收集了7組觀測數(shù)據(jù)列于表中:(1)試建立產(chǎn)卵數(shù)y與溫度x之間的回歸方程;并預測溫度為28oC時產(chǎn)卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產(chǎn)卵數(shù)的變化?溫度xoC21232527293235產(chǎn)卵數(shù)y/個711212466115325非線性回歸問題2023/2/1選模型由計算器得:線性回歸方程為y=19.87x-463.73
相關指數(shù)R2=r2≈0.8642=0.7464估計參數(shù)解:選取氣溫為解釋變量x,產(chǎn)卵數(shù)為預報變量y。選變量所以,一次函數(shù)模型中溫度解釋了74.64%的產(chǎn)卵數(shù)變化。探索新知畫散點圖050100150200250300350036912151821242730333639方案1分析和預測當x=28時,y=19.87×28-463.73≈93一元線性模型假設線性回歸方程為
:2023/2/1奇怪?93>66?模型不好?2023/2/1
y=bx2+a變換y=bt+a非線性關系線性關系方案2問題1選用y=bx2+a,還是y=bx2+cx+a?問題3
產(chǎn)卵數(shù)氣溫問題2如何求a、b?合作探究
t=x2二次函數(shù)模型2023/2/1方案2解答平方變換:令t=x2,產(chǎn)卵數(shù)y和溫度x之間二次函數(shù)模型y=bx2+a就轉(zhuǎn)化為產(chǎn)卵數(shù)y和溫度的平方t之間線性回歸模型y=bt+a溫度21232527293235溫度的平方t44152962572984110241225產(chǎn)卵數(shù)y/個711212466115325作散點圖,并由計算器得:y和t之間的線性回歸方程為y=0.367t-202.543,相關指數(shù)R2=0.802將t=x2代入線性回歸方程得:
y=0.367x2-202.543當x=28時,y=0.367×282-202.54≈85,且R2=0.802,所以,二次函數(shù)模型中溫度解釋了80.2%的產(chǎn)卵數(shù)變化。t2023/2/1問題2變換y=bx+a非線性關系線性關系問題1如何選取指數(shù)函數(shù)的底?產(chǎn)卵數(shù)氣溫指數(shù)函數(shù)模型方案3合作探究對數(shù)2023/2/1方案3解答溫度xoC21232527293235z=lny1.9462.3983.0453.1784.1904.7455.784產(chǎn)卵數(shù)y/個711212466115325xz當x=28oC時,y≈44,指數(shù)回歸模型中溫度解釋了98.5%的產(chǎn)卵數(shù)的變化由計算器得:z關于x的線性回歸方程為
對數(shù)變換:在中兩邊取常用對數(shù)得令,則就轉(zhuǎn)換為z=bx+a.相關指數(shù)R2=0.982023/2/1最好的模型是哪個?產(chǎn)卵數(shù)氣溫產(chǎn)卵數(shù)氣溫線性模型二次函數(shù)模型指數(shù)函數(shù)模型2023/2/1比一比函數(shù)模型相關指數(shù)R2線性回歸模型0.7464二次函數(shù)模型0.80指數(shù)函數(shù)模型0.98最好的模型是哪個?2023/2/1回歸分析(二)則回歸方程的殘差計算公式分別為:由計算可得:x21232527293235y7112124661153250.557-0.1011.875-8.9509.230-13.38134.67547.69619.400-5.832-41.00-40.104-58.26577.968因此模型(1)的擬合效果遠遠優(yōu)于模型(2)。2023/2/1用身高預報體重時,需要注意下列問題:1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時間性;3、樣本采集的范圍會影響回歸方程的適用范圍;4、不能期望回歸方程得到的預報值就是預報變量的精確值。事實上,它是預報變量的可能取值的平均值?!@些問題也適用于其他問題。涉及到統(tǒng)計的一些思想:模型適用的總體;模型的時間性;樣本的取值范圍對模型的影響;模型預報結果的正確理解。小結2023/2/1一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預報變量。(2)畫出確定好的解析變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等)。(3)由經(jīng)驗確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關系,則選用線性回歸方程y=bx+a).(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法)。(5)得出結果后分析殘差圖是否有異常(個別數(shù)據(jù)對應殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性,等等),過存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等。2023/2/1什么是回歸分析?
(內(nèi)容)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學關系式對這些關系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關系式,根據(jù)一個或幾個變量的取值來預測或控制另
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學三年級(車輛工程)車輛零部件設計試題及答案
- 2025年高職木業(yè)產(chǎn)品設計與制造(木材制品設計)試題及答案
- 2025年中職彗星探測技術(彗星探測)模擬試題
- 2025-2026年二年級綜合實踐(生活體驗)下學期期中單元
- 2025年高職護理倫理學(倫理基礎)試題及答案
- 2025年中職現(xiàn)代物流(物流條碼技術)試題及答案
- 2025年安全生產(chǎn)培訓試題及答案
- 深度解析(2026)《GBT 18268.26-2010測量、控制和實驗室用的電設備 電磁兼容性要求 第26部分:特殊要求 體外診斷(IVD)醫(yī)療設備》
- 深度解析(2026)《GBT 17983-2000帶斷屑槽可轉(zhuǎn)位刀片近似切屑控制區(qū)的分類和代號》
- 深度解析(2026)《GBT 17980.38-2000農(nóng)藥 田間藥效試驗準則(一) 殺線蟲劑防治根部線蟲病》
- 兩棲及爬行動物多樣性保護-洞察及研究
- 香港的勞動合同范本
- 學堂在線 海權與制海權 結業(yè)考試答案
- 一例脊髓損傷患者個案護理匯報
- 思想道德與法治智慧樹知到期末考試答案章節(jié)答案2024年山東農(nóng)業(yè)大學
- 村衛(wèi)生室業(yè)務指導計劃
- 神經(jīng)遞質(zhì)乙酰膽堿的發(fā)現(xiàn)
- 醫(yī)院布草洗滌服務方案(技術方案)
- 游戲:看表情符號猜成語PPT
- 手術室醫(yī)療廢物的管理
- 普通機床主傳動系統(tǒng)的設計課程設計說明書
評論
0/150
提交評論