版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
人教A版高中數(shù)學(xué)選修1-2多思、創(chuàng)新、融合.回歸分析的基本思想.通過對必修的學(xué)習(xí),我們知道,變量之間存在關(guān)系時,有兩種關(guān)系:確定性關(guān)系非確定性關(guān)系函數(shù)關(guān)系相關(guān)關(guān)系函數(shù)關(guān)系是非常明確的關(guān)系,相關(guān)關(guān)系卻是一種變化的,通過《數(shù)學(xué)3》的學(xué)習(xí)我們知道,回歸分析(regressionanalysis)是相關(guān)關(guān)系的一種分析方法,它是對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析一般步驟為:.散點圖求回歸方程利用回歸方程預(yù)報下面我們通過實際案例。進(jìn)一步學(xué)習(xí)回歸分析的基本思想及其應(yīng)用.例1.從某大學(xué)中隨機(jī)選取8名女大學(xué)生。其身高和體重數(shù)據(jù)如表所示:編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)一名大學(xué)生的身高預(yù)報她的體重的回歸方程,并預(yù)報一名172cm的女大學(xué)生的體重。.解利用前面的知識我們首先作身高x和體重y的散點圖:.從圖可以看出,樣本點的分布有比較好的線性關(guān)系,因此可以用線性回歸來刻畫它們之間的關(guān)系.會求它們的方程嗎?事實上,從散點圖可以看出,樣本點并不是分布在這條直線上,而是分布在它的兩邊,所以嚴(yán)格來說:y=bx+a不是真正的表示它們之間的關(guān)系,這時我們把身高和體重的關(guān)系做一下調(diào)整來模擬回歸關(guān)系:Y=bx+a+e其中a和b為模型的未知參數(shù),e稱為隨機(jī)誤差如何產(chǎn)生的?.身高X(cm)體重y(kg)飲食習(xí)慣運動習(xí)慣質(zhì)量誤差.線性回歸模型y=bx+a+e與我們了的一次函數(shù)模型不同之處在于多了一個隨機(jī)誤差e,y的值有它們一起決定解釋變量x預(yù)報變量y隨機(jī)誤差e如何估計a,b,e?.1.a,b的估計:a,b的估計和最小二乘法估計一樣其中稱為樣本的中心.2.e的估計y=0.849x-85.712通過《數(shù)學(xué)3》的學(xué)習(xí)我們知道,它們之間是正相關(guān)的,我們用它們的相關(guān)系數(shù)r來衡量它們之間的相關(guān)性的強(qiáng)弱.在上面的例子中我們假設(shè)體重與身高沒有關(guān)系即:體重都為:則,她們身高-體重的散點圖應(yīng)該在一條水平直線上:.事實上,并非如此,它們和45.5之間存在差別,這時我們就引入隨機(jī)誤差,利用隨機(jī)誤差和解釋變量共同來預(yù)報變量y把所有的這種效應(yīng)利用總體偏差平方和合并成一個數(shù)總體偏差平方和解釋變量隨機(jī)誤差??.我們現(xiàn)在要弄清楚這個總的效應(yīng)中,有多少來自解釋變量,有多少來自隨機(jī)誤差,即:哪一個效應(yīng)起決定性作用?怎樣去刻畫每個效應(yīng)呢?根據(jù)我們在《數(shù)學(xué)3》總的知識,我們知道:每個點與回歸方程的差異我們可以用來表示,記作:(殘差(residual))它剛好可以表示隨機(jī)誤差的效應(yīng)。為什么說可以用殘差來.為了回歸的準(zhǔn)確和計算的方便我們引入殘差平方和(residualsumofsquares)它代表隨機(jī)誤差的效應(yīng)求出了隨機(jī)誤差的效應(yīng)后,我們就比較容易得到解釋變量的效應(yīng)了。同學(xué)們知道怎樣求嗎?解釋變量的效應(yīng)=總體偏差平方和-殘差平方和回歸平方和(regressionsunofsquares).你會計算上面的總體偏差平方和、殘差平方和、回歸平方和嗎?354128.361225.639.有了這些評估效應(yīng)的方法,我們就可以利用它們來刻畫總體效應(yīng),事實上,為了將我們的計算簡化,我們又引入相關(guān)指數(shù)R2來刻畫回歸的效果:殘差平方和總體偏差平方和顯然,當(dāng)R2的值越大,說明殘差所占的比例越小,回歸效果約好;反之,回歸效果越差。一般的,當(dāng)R2越接近于1,說明解釋變量和預(yù)報變量之間的相關(guān)性越強(qiáng),如果同一個問題,采用不同的回歸方法分析,我們可以通過選擇R2大的來作為回歸模型.一般方法:1.利用散點圖觀察兩個變量是否線性相關(guān)2.利用殘差來判斷模型擬合的效果(殘差分析)利用殘差圖來分析數(shù)據(jù),對可疑數(shù)據(jù)(殘差較大的數(shù)據(jù))進(jìn)行重新調(diào)查,有錯誤就更正,然后重新利用回歸模型擬合,如果沒有錯誤,則需要找其他原因。.殘差圖:編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382問題數(shù)據(jù)越窄越好.說明1.回歸方程只適合對所研究總體的估計2.回歸方程是對數(shù)據(jù)的模擬,數(shù)據(jù)的改變,可能會導(dǎo)致回歸方程的變化3.不同的回歸樣本數(shù)據(jù),有不同的回歸方程,也適合不同的回歸總體,4.回歸方程是預(yù)報變量的平均值,而不是精確值5.回歸的好壞可以由相關(guān)指數(shù)來評價.建立回歸方程的一般步驟:1.確定變量2.制作散點圖,觀察是否相關(guān)3.確定回歸方程的類型(線性回歸、指數(shù)回歸、對數(shù)回歸等)4.利用公式確定回歸參數(shù)5.利用殘差分析回歸是否合理或模型是否合適.例2一只紅蛉蟲的產(chǎn)卵數(shù)y與溫度x有關(guān),現(xiàn)收集了7組數(shù)據(jù),請建立y與x建德回歸方程溫度x/℃21232527293235產(chǎn)卵數(shù)y/個711212466115325解1.制作散點圖.2.觀察模擬樣本點不能直接利用線性回歸,根據(jù)我們的函數(shù)知識,它應(yīng)該是一個指數(shù)模型:y=c1ec2x其中c1c2為參數(shù)或二次函數(shù)模型,根據(jù)對數(shù)回歸知識我們知道:令z=lny將其變換到樣本點的分布直線z=a+bxx21232527293235z1.9462.3983.0453.1784.1904.7455.784z=0272x-3.843會求著條直線嗎?則:y=e0.272x-3.843.2.我們認(rèn)為樣本點集中在某二次函數(shù)y=c3x2+c4附近,c3c4為參數(shù),則,令t=x2則:y=c5t+c6其中c5c6為參數(shù)t44152962572984110241225y711212466115325y=0.367t-202.54不適合利用線性回歸為什么這樣說?.4.殘差分析:X21232527293235合計(殘差平方和)R2Y711212466115329e(1)0.518-0.1671.760-9.1498.889-14.15332.9281450.6730.98e(2)47.69319.397
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025廣西梧州市龍圩區(qū)招(補(bǔ))錄公益性崗位人員11人考試筆試參考題庫附答案解析
- 2026云南昆明市石林彝族自治縣兵役登記暨征兵筆試考試備考試題及答案解析
- 2026中國社會科學(xué)雜志社總編室(研究室)招聘5人考試筆試模擬試題及答案解析
- 2025下半年四川涼山州西昌市教育系統(tǒng)考核引進(jìn)教師98人考試筆試模擬試題及答案解析
- 2026年江蘇省衛(wèi)生健康委員會所屬事業(yè)單位公開招聘工作人員807人考試筆試備考試題及答案解析
- 2026年濰坊市教育局所屬學(xué)校急需緊缺人才及部屬公費師范生公開招聘(22名)考試筆試模擬試題及答案解析
- 四川省自貢市2024-2025學(xué)年六年級上冊期末考試語文試卷(含答案)
- 國際項目防雷電安全預(yù)案
- 2026年抖音考試題庫含答案(模擬題)
- 2026年心理咨詢師之心理咨詢師二級技能考試題庫含答案【鞏固】
- GB/T 30341-2025機(jī)動車駕駛員培訓(xùn)教練場技術(shù)要求
- 2025年黑龍江省哈爾濱市中考數(shù)學(xué)真題含解析
- 2026年湖南現(xiàn)代物流職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫附答案
- 河北省2025年職業(yè)院校嵌入式系統(tǒng)應(yīng)用開發(fā)賽項(高職組)技能大賽參考試題庫(含答案)
- 2025譯林版新教材初中英語八年級上冊單詞表(復(fù)習(xí)必背)
- 2025年70歲老年人換新本駕駛證需考三力測試題及答案
- 企業(yè)微信基礎(chǔ)知識培訓(xùn)
- 《房間空氣調(diào)節(jié)器室內(nèi)熱舒適性評價方法》
- 2025秋期版國開電大本科《管理英語3》一平臺綜合測試形考任務(wù)在線形考試題及答案
- 電解鋁安全環(huán)保知識培訓(xùn)課件
- 線性代數(shù)期末考試試題及答案
評論
0/150
提交評論