第三章 統(tǒng)計(jì)案例 1《回歸分析》課時(shí)1_第1頁(yè)
第三章 統(tǒng)計(jì)案例 1《回歸分析》課時(shí)1_第2頁(yè)
第三章 統(tǒng)計(jì)案例 1《回歸分析》課時(shí)1_第3頁(yè)
第三章 統(tǒng)計(jì)案例 1《回歸分析》課時(shí)1_第4頁(yè)
第三章 統(tǒng)計(jì)案例 1《回歸分析》課時(shí)1_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、3.1 回歸分析的基本思想 及其初步應(yīng)用 (第一課時(shí)),1通過(guò)典型案例的探究,進(jìn)一步了解回歸分析的基本思想、方法及其初步應(yīng)用 2讓學(xué)生經(jīng)歷數(shù)據(jù)處理的過(guò)程,培養(yǎng)他們對(duì)數(shù)據(jù)的直觀感覺,體會(huì)統(tǒng)計(jì)方法的特點(diǎn),認(rèn)識(shí)統(tǒng)計(jì)方法的應(yīng)用,通過(guò)使用轉(zhuǎn)化后的數(shù)據(jù),求相關(guān)指數(shù),運(yùn)用相關(guān)指數(shù)進(jìn)行數(shù)據(jù)分析、處理的方法 3從實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足,激發(fā)好奇心,求知欲,通過(guò)尋求有效的數(shù)據(jù)處理方法,開拓學(xué)生的思路,培養(yǎng)學(xué)生的探索精神和轉(zhuǎn)化能力,通過(guò)案例的分析使學(xué)生了解回歸分析在實(shí)際生活中的應(yīng)用,增強(qiáng)數(shù)學(xué)取之生活,用于生活的意識(shí),提高學(xué)習(xí)興趣,本節(jié)課通過(guò)必修3熟悉有例題回顧線性相關(guān)關(guān)系知識(shí),通過(guò)實(shí)際問(wèn)題中發(fā)現(xiàn)已有知識(shí)的不足

2、,引出隨機(jī)誤差、殘差、殘差分析的概念,進(jìn)而運(yùn)用殘差來(lái)進(jìn)行數(shù)據(jù)分析,通過(guò)例題講解掌握用殘差分析判斷線性回歸模型的擬合效果。掌握建立回歸模型的步驟。 本節(jié)內(nèi)容學(xué)生內(nèi)容不易掌握,通過(guò)知識(shí)整理與比較引導(dǎo)學(xué)生進(jìn)行區(qū)分、理解。通過(guò)對(duì)典型案例的探究,練習(xí)進(jìn)行鞏固了解回歸分析的基本思想方法和初步應(yīng)用,從某大學(xué)中隨機(jī)選取8名女大學(xué)生,其身高和體重?cái)?shù)據(jù)如下表所示: 怎樣根據(jù)一名女大學(xué)生的身高預(yù)報(bào)她的體重,并預(yù)報(bào)一名身高為172 cm的女大學(xué)生的體重?,根據(jù)必修3 2.3變量相關(guān)關(guān)系解決這個(gè)問(wèn)題的方法: 1.先判斷是兩個(gè)變量是否具有線性相關(guān)關(guān)系 (1)作散點(diǎn)圖,如圖所示(見課本P82:圖3.1-1),2.根據(jù)線性回

3、歸的系數(shù)公式,求回歸直線方程 0.849x-85.712,3.由線性回歸方程可以估計(jì)其位置值為 60.316(千克)左右。,具有較好的線性相關(guān)關(guān)系,性質(zhì):回歸直線一定過(guò)樣本中心點(diǎn).,(2)計(jì)算相關(guān)系數(shù),這些點(diǎn)并不都在同一條直線上,上述直線并不能精確地反映x與y之間的關(guān)系,y 的值不能完全由x 確定,它們之間是統(tǒng)計(jì)相關(guān)關(guān)系,y 的實(shí)際值與估計(jì)值之間存在著誤差,因此,在統(tǒng)計(jì)學(xué)中設(shè)它們的線性回歸模型為:,其中a,b為模型的未知參數(shù),e為y與bx+a之間的誤差,稱它為隨機(jī)誤差,它是隨機(jī)變量。且,線性回歸模型完整表達(dá)式為,x稱為 變量,y稱為 變量.,解釋,預(yù)報(bào),線性回歸模型中隨機(jī)誤差的主要來(lái)源: 線性

4、回歸模型中的預(yù)報(bào)值 與真實(shí)情況y引起的誤差; 觀測(cè)與計(jì)算(用 代替b a)產(chǎn)生的誤差; 省略了一些因素的影響(如生活習(xí)慣等)產(chǎn)生的誤差.,在線性回歸模型中,e為用bx+a的預(yù)報(bào)真實(shí)值y的隨機(jī)誤差,它是一個(gè)不可觀測(cè)的量,那么應(yīng)該怎樣研究隨機(jī)誤差?,稱相應(yīng)于點(diǎn) 的殘差,坐標(biāo)縱軸為殘差變量,橫軸可以有不同的選擇; 若模型選擇的正確,殘差圖中的點(diǎn)應(yīng)該分布在以橫軸為中心的帶形區(qū)域; 對(duì)于遠(yuǎn)離橫軸的點(diǎn),要特別注意。,身高與體重殘差圖,殘差的作用,1.通過(guò)殘差表或殘差圖發(fā)現(xiàn)原始數(shù)據(jù)中的可疑數(shù)據(jù),通過(guò)殘差 來(lái)判斷模型擬合的效果這種分析工作稱為殘差分析.,通過(guò)殘差表或殘差圖判斷模型擬合的效果是直觀判斷,如何精確

5、判斷模型擬合的效果?,引入?yún)?shù)R2,來(lái)精確該畫模型擬合效果,對(duì)于己獲取的樣本數(shù)據(jù),在上式子中 是定值, 越小,即殘差平方和越小,R2越大,說(shuō)明模型擬合效果越好。,引入例中參數(shù)R2計(jì)算得約為0.64說(shuō)明女大學(xué)生體重差異有百分之六十四是由身高引起的.,知識(shí)點(diǎn) 線性回歸分析 1.對(duì)線性回歸模型的三點(diǎn)說(shuō)明 (1)非確定性關(guān)系:線性回歸模型y=bx+a+e與確定性函數(shù)y=bx+a相比,它表示y與x之間是統(tǒng)計(jì)相關(guān)關(guān)系(非確定性關(guān)系),其中的隨機(jī)誤差e提供了選擇模型的準(zhǔn)則以及在模型合理的情況下探求最佳估計(jì)值a,b的工具.,(2)線性回歸方程 中 , 的意義是:以 為基數(shù),x每增加1個(gè)單位,y相應(yīng)地平均增加

6、個(gè)單位. (3)線性回歸模型中隨機(jī)誤差的主要來(lái)源 線性回歸模型與真實(shí)情況引起的誤差; 觀測(cè)與計(jì)算產(chǎn)生的誤差; 省略了一些因素的影響產(chǎn)生的誤差.,2.線性回歸模型的模擬效果 (1)殘差圖法:觀察殘差圖,如果殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說(shuō)明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說(shuō)明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高.,(2)殘差的平方和法:一般情況下,比較兩個(gè)模型的殘差比較困難(某些樣本點(diǎn)上一個(gè)模型的殘差的絕對(duì)值比另一個(gè)模型的小,而另一些樣本點(diǎn)的情況則相反),故通過(guò)比較兩個(gè)模型的殘差的平方和的大小來(lái)判斷模型的擬合效果.殘差平方和越小的模型,擬合的效果越好. (3)R2法:R

7、2的值越大,說(shuō)明殘差平方和越小,也就是說(shuō)模型擬合的效果越好.,3.相關(guān)系數(shù)與R2 (1)R2是相關(guān)系數(shù)的平方,其變化范圍為0,1,而相關(guān)系數(shù)的變化范圍為-1,1. (2)相關(guān)系數(shù)可較好地反映變量的相關(guān)性及正相關(guān)或負(fù)相關(guān),而R2反映了回歸模型擬合數(shù)據(jù)的效果. (3)當(dāng)|r|接近于1時(shí)說(shuō)明兩變量的相關(guān)性較強(qiáng),當(dāng)|r|接近于0時(shí)說(shuō)明兩變量的相關(guān)性較弱,而當(dāng)R2接近于1時(shí),說(shuō)明線性回歸方程的擬合效果較好.,【微思考】 (1)殘差與我們平時(shí)說(shuō)的誤差是一回事兒?jiǎn)? 提示:這兩個(gè)概念在某程度上具有很大的相似性,都是衡量不確定性的指標(biāo),二者的區(qū)別是:誤差與測(cè)量有關(guān),誤差可以衡量測(cè)量的準(zhǔn)確性,誤差越大表示測(cè)量越

8、不準(zhǔn)確;殘差與預(yù)測(cè)有關(guān),殘差大小可以衡量預(yù)測(cè)的準(zhǔn)確性,殘差越大表示預(yù)測(cè)越不準(zhǔn)確.,(2)R2與原來(lái)學(xué)過(guò)的相關(guān)系數(shù)r有區(qū)別嗎? 提示:它們都是刻畫兩個(gè)變量之間的的相關(guān)關(guān)系的,區(qū)別是R2表示解釋變量對(duì)預(yù)報(bào)變量變化的貢獻(xiàn)率,其表達(dá)式為R2=1- ; 相關(guān)系數(shù)r是檢驗(yàn)兩個(gè)變量相關(guān)性的強(qiáng)弱程度, 其表達(dá)式為,建立回歸模型的基本步驟 (1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量 (2)畫出確定好的解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等) (3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程) (4)按一定規(guī)則(如最小二乘法)估計(jì)回歸

9、方程中的參數(shù) (5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對(duì)應(yīng)殘差過(guò)大,或殘差呈現(xiàn)不隨機(jī)的規(guī)律性等)若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等,為研究重量x(單位:克)對(duì)彈簧長(zhǎng)度y(單位:厘米)的影響,對(duì)不同重量的6個(gè)物體進(jìn)行測(cè)量,數(shù)據(jù)如下表所示:,(1)作出散點(diǎn)圖并求線性回歸方程; (2)求出R2; (3)進(jìn)行殘差分析,作殘差分析時(shí),一般從以下幾個(gè)方面予以說(shuō)明:(1)散點(diǎn)圖;(2)相關(guān)指數(shù);(3)殘差圖中的異常點(diǎn)和樣本點(diǎn)的帶狀分布區(qū)域的寬窄,解答 (1)散點(diǎn)圖如圖,(3)由殘差表中的數(shù)值可以看出第3個(gè)樣本點(diǎn)的殘差比較大,需要確認(rèn)在采集這個(gè)數(shù)據(jù)的時(shí)候是否有人為的錯(cuò)誤,如果有的話,需要

10、糾正數(shù)據(jù),重新建立回歸模型;由表中數(shù)據(jù)可以看出殘差點(diǎn)比較均勻地落在不超過(guò)0.15的狹窄的水平帶狀區(qū)域中,說(shuō)明選用的線性回歸模型的精度較高,由以上分析可知,彈簧長(zhǎng)度與拉力成線性關(guān)系 規(guī)律方法當(dāng)資料點(diǎn)較少時(shí),也可以利用殘差表進(jìn)行殘差分析,注意計(jì)算數(shù)據(jù)要認(rèn)真細(xì)心,殘差分析要全面,1.判一判(正確的打“”,錯(cuò)誤的打“”) (1)殘差平方和越小,線性回歸方程擬合效果越好.() (2)在畫兩個(gè)變量的散點(diǎn)圖時(shí),預(yù)報(bào)變量在x軸上,解釋變量在y軸上.() (3)R2越接近于1,線性回歸方程的擬合效果越好.(),2.做一做(請(qǐng)把正確的答案寫在橫線上) (1)從散點(diǎn)圖上看,點(diǎn)散布在從左下角到右上角的區(qū)域內(nèi),兩個(gè)變量的這種相關(guān)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論