回歸分析與協(xié)方差分析_第1頁
回歸分析與協(xié)方差分析_第2頁
回歸分析與協(xié)方差分析_第3頁
回歸分析與協(xié)方差分析_第4頁
回歸分析與協(xié)方差分析_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、回歸分析與協(xié)方差分析第1頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二內(nèi)容9.1 一元線性回歸 第2頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二學(xué)習(xí)目標(biāo)散點(diǎn)圖, 回歸系數(shù), 正規(guī)方程, 經(jīng)驗(yàn)回歸方程;回歸平方和,剩余平方和,相關(guān)系數(shù), 顯著性檢驗(yàn).第3頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二不確定關(guān)系人的身高體重農(nóng)作物的單位面積產(chǎn)量施肥量 9.1 一元線性回歸 1. 一元線性回歸的基本概念第4頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 線性模型例 為了研究彈簧懸掛不同重量(單位:克力)x時(shí)長度(單位:厘米)y的關(guān)系。通過試驗(yàn)得到一組數(shù)據(jù)。重量

2、xi 5 10 15 20 25 30 長度yj 7.25 8.12 8.95 9.90 10.90 11.80把這些數(shù)據(jù)點(diǎn)(xi, yj )畫在xoy坐標(biāo)系中,圖形稱為散點(diǎn)圖。第5頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二*L散點(diǎn)圖記L為第6頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二進(jìn)行n次獨(dú)立試驗(yàn),測得數(shù)據(jù)如下:第7頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二我們的問題是,如何根據(jù)這些觀測值用“最佳的”形式來表達(dá)變量Y與X之間的相關(guān)關(guān)系? 一般而言,在變量x取值以后,若Y所取的值服從N (+x,2)分布,當(dāng)、及2未知時(shí),根據(jù)樣本(x1,Y1),(x2

3、,Y2),(xn,Yn)的觀測值(x1,y1),(x2,y2),(xn,yn) 對未知參數(shù)、及2所作的估計(jì)與檢驗(yàn)稱為一元線性回歸分析,而稱為截距,稱為回歸系數(shù), E(Y)+x 稱為回歸方程。第8頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二由回歸方程可以推出 根據(jù)樣本及其觀測值可以得到、及2的估計(jì)量及估計(jì)值 得到回歸方程的估計(jì)式或經(jīng)驗(yàn)回歸方程 第9頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二最常用的是最小二乘法,即求出 第10頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二的值最小,所求出的a稱為經(jīng)驗(yàn)截距,簡稱為截距,b稱為經(jīng)驗(yàn)回歸系數(shù),簡稱為回歸系數(shù),而 第11

4、頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二2. 總體中未知參數(shù)的估計(jì) 根據(jù)最小二乘法的要求由 第12頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二得到一元線性回歸的正規(guī)方程組第13頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二并求出第14頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二建立一元線性回歸方程的具體步驟: 第15頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二(3)計(jì)算b和a,寫出一元線性回歸方程。 與上述a和b相對應(yīng)的Q的數(shù)值又記作SSE,稱為剩余平方和。將a、b和SSE以及 和 看作是統(tǒng)計(jì)量,它們的表達(dá)式分別為 第16頁,共50

5、頁,2022年,5月20日,9點(diǎn)24分,星期二 這些統(tǒng)計(jì)量之間以及它們與總體參數(shù)之間有以下的內(nèi)在聯(lián)系:第17頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二第18頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 為提高a的估計(jì)精度,最理想的選擇是使 0,其絕對值越小越好; 為提高b的估計(jì)精度,應(yīng)該使lxx 取較大的數(shù)值,x1、x2、xn越分散越好; 觀測值的個(gè)數(shù)n不能太小。 第19頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 3. 線性回歸方程的顯著性檢驗(yàn) 因此,必須對回歸方程的擬合情況或效果作顯著性檢驗(yàn)。其理論基礎(chǔ)就是總平方和的分解,即第20頁,共50頁,2022

6、年,5月20日,9點(diǎn)24分,星期二第21頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二第22頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二表示n個(gè)y1、y2、yn與之間的差異,當(dāng)各個(gè)yi已知時(shí),它是一個(gè)定值,稱為總平方和,記作SST。 第23頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二通過回歸已經(jīng)達(dá)到了最小值,稱為剩余平方和,記作SSE。 稱為回歸平方和,記作SSR。 第24頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 因此,SSTSSE+SSR。 如果SSR的數(shù)值較大,SSE的數(shù)值便比較小,說明回歸的效果好;如果SSR的數(shù)值較小,SSE的數(shù)值便比較

7、大,說明回歸的效果差。 第25頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二第26頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二第27頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 如果|r|較大,SSE的數(shù)值便比較小,說明回歸的效果好或者說x與Y的線性關(guān)系密切;如果|r|較小,SSE的數(shù)值便比較大,說明回歸的效果差或者說x與Y的線性關(guān)系不密切;因此稱r為x與Y的觀測值的相關(guān)系數(shù)。 又由r及回歸系數(shù)的計(jì)算公式 第28頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 可以推出:r0時(shí)b0,x增加時(shí)Y的觀測值呈增加的趨勢;r0時(shí)b0時(shí)稱x與Y正相關(guān),r0時(shí)稱x

8、與Y負(fù)相關(guān)。 綜上所述,如果設(shè)H0為0,也就是假設(shè)x與Y不是線性關(guān)系,則可以用以下三種實(shí)質(zhì)相同的方法檢驗(yàn)線性回歸方程的顯著性,且當(dāng)檢驗(yàn)的結(jié)果顯著時(shí)x與Y的線性關(guān)系顯著,回歸方程可供應(yīng)用;當(dāng)檢驗(yàn)的結(jié)果不顯著時(shí)x與Y的線性關(guān)系不顯著,回歸方程不可應(yīng)用。 第29頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 F檢驗(yàn)法: 當(dāng)H0為真時(shí), 且SSR與SSE相互獨(dú)立;因此,當(dāng)H0為真時(shí), 當(dāng)FF1-(1,n-2)時(shí)應(yīng)該放棄原假設(shè)H0。第30頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二(2)t檢驗(yàn)法: 當(dāng)H0為真時(shí), 當(dāng)|t|t1-0.5(n-2)時(shí)應(yīng)該放棄原假設(shè)H0。 第31頁,共5

9、0頁,2022年,5月20日,9點(diǎn)24分,星期二(3)r檢驗(yàn)法:根據(jù)x與Y的觀測值的相關(guān)系數(shù) 可以推出當(dāng)H0為真時(shí),第32頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二當(dāng)FF1-(1,n-2)或|r|r(n-2)時(shí)應(yīng)該放棄原假設(shè)H0,式中的 可由r檢驗(yàn)用表中查出。 因此,r常常用來表示x與Y的線性關(guān)系在x與Y的全部關(guān)系中所占的百分比,又稱為x與Y的觀測值的決定系數(shù)。第33頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 4. 利用回歸方程進(jìn)行點(diǎn)預(yù)測和區(qū)間預(yù)測 若線性回歸作顯著性檢驗(yàn)的結(jié)果是放棄H0,也就是放棄回歸系數(shù)0的假設(shè),便可以利用回歸方程進(jìn)行點(diǎn)預(yù)測和區(qū)間預(yù)測,這是人們關(guān)

10、注線性回歸的主要原因之一。 當(dāng)xx0時(shí), Y0的觀測值y0的點(diǎn)預(yù)測是無偏的。 第34頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 當(dāng)xx0時(shí),用適合不等式PY0(G,H)1-的統(tǒng)計(jì)量G和H所確定的隨機(jī)區(qū)間(G,H)預(yù)測Y0的取值范圍稱為區(qū)間預(yù)測,而(G,H)稱為Y0的1-預(yù)測區(qū)間。 若Y0與樣本中的各Yi相互獨(dú)立,則根據(jù)ZY0-(a+bx0)服從正態(tài)分布,E(Z)0, Z與SSE相互獨(dú)立,第35頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二可以導(dǎo)出 因此,Y0的1-預(yù)測區(qū)間為 a+bx0(x0), 第36頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二例1.1吸附

11、方程某種物質(zhì)在不同溫度下可以吸附另一種物質(zhì),如果溫度x(單位:)與吸附重量Y(單位:mg)的觀測值如下表所示: 溫度x1.5 1.8 2.4 3.0 3.5 3.9 4.4 4.8 5.0 重量y4.8 5.7 7.0 8.3 10.9 12.4 13.1 13.6 15.3 試求線性回歸方程并用三種方法作顯著性檢驗(yàn),若x02,求Y0的0.95預(yù)測區(qū)間。 解:根據(jù)上述觀測值得到n9, 第37頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二第38頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二所求的線性回歸方程為 第39頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二顯著

12、性檢驗(yàn)方法 F檢驗(yàn)法:SSTlyy114.516, SSRblxy112.485,SSESST-blxy2.031,n-27,F(xiàn)0.99(1,7)12.2, 所以回歸方程極顯著; 第40頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 t檢驗(yàn)法: 所以回歸方程極顯著; 第41頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二(3) r檢驗(yàn)法: 所以回歸方程極顯著. 第42頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二Y0的0.95預(yù)測區(qū)間為(4.09,8.15)。 這說明當(dāng)溫度為2時(shí),應(yīng)該預(yù)測吸附另一種物質(zhì)的重量在4.09至8.15之間,并且預(yù)測100次將有95次是正確

13、的。第43頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二 例1.2植物保護(hù)一些夏季害蟲的盛發(fā)期與春季溫度有關(guān),現(xiàn)有1956-1964年間3月下旬至4月中旬旬平均溫度的累計(jì)數(shù)x和一代三化螟蛾盛發(fā)期Y(以5月10日為0)的觀測值如下: 溫度x 35.5 34.1 31.7 40.3 36.8 40.2 31.7 39.2 44.2盛發(fā)期y 12 16 9 2 7 3 13 9 -1試求線性回歸方程并用三種方法作顯著性檢驗(yàn),若x040,求Y0的0.95預(yù)測區(qū)間。第44頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二解:根據(jù)上述觀測值得到n9, 第45頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二所求的線性回歸方程為 第46頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期二顯著性檢驗(yàn)方法 F檢驗(yàn)法:SSTlyy249.5556,SSRblxy174.8886,SSESST-blxy74.6670,n-27,F(xiàn)0.99(1,7)12.2, 所以回歸方程極顯著; 第47頁,共50頁,2022年,5月20日,9點(diǎn)24分,星期

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論