整理excel一元及多元線性回歸實(shí)例_第1頁(yè)
整理excel一元及多元線性回歸實(shí)例_第2頁(yè)
整理excel一元及多元線性回歸實(shí)例_第3頁(yè)
整理excel一元及多元線性回歸實(shí)例_第4頁(yè)
整理excel一元及多元線性回歸實(shí)例_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余6頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、精品文檔野外實(shí)習(xí)資料的數(shù)理統(tǒng)計(jì)分析一元線性回歸分析一元回歸處理的是兩個(gè)變量之間的關(guān)系,即兩個(gè)變量X和Y之間如果存在一定的關(guān)系,則通過(guò)觀測(cè)所得數(shù)據(jù),找出兩者之間的關(guān)系式。如果兩個(gè)變量的關(guān)系大致是線性的,那就是一元線性回歸問(wèn)題。對(duì)兩個(gè)現(xiàn)象X和Y進(jìn)行觀察或?qū)嶒?yàn),得到兩組數(shù)值:X1,X2,,Xn和Y1,Y2,,Yn,假如要找出一個(gè)函數(shù)Y=f(X),使它在X=X1,X2,Xn寸的數(shù)值f(X1),f(X2),f(X觀察值Y1,Y2,Yn趨于接近。在一個(gè)平面直角坐標(biāo)XOY中找出(X1,Y1),(X2,Y2),,(Xn,Yn)各點(diǎn),將其各點(diǎn)分布狀況進(jìn)行察看,即可以清楚地看出其各點(diǎn)分布狀況接近一條直線。對(duì)于這種

2、線性關(guān)系,可以用數(shù)學(xué)公式表不:Y=a+bX這條直線所表示的關(guān)系,叫做變量Y對(duì)X的回歸直線,也叫Y對(duì)X的回歸方程。其中a為常數(shù),b為Y對(duì)于X的回歸系數(shù)。對(duì)于任何具有線性關(guān)系的兩組變量Y與X,只要求解出a與b的值,即可以寫(xiě)出回歸方程。計(jì)算a與b值的公式為:精品文檔精品文檔a=Y-bX式中:X為變量X的均值,Xi為第i個(gè)自變量的樣本值,Y為因變量的均值,Yi為第i個(gè)因變量Y的樣本值。n為樣本數(shù)。當(dāng)前一般計(jì)算機(jī)的MicrosoftExcel中都有現(xiàn)成的回歸程序,只要將所獲得的數(shù)據(jù)錄入就可自動(dòng)得到回歸方程。得到的回歸方程是否有意義,其相關(guān)的程度有多大,可以根據(jù)相關(guān)系數(shù)的大小來(lái)決定。通常用r來(lái)表示兩個(gè)變量

3、X和Y之間的直線相關(guān)程度,r為X和Y的相關(guān)系數(shù)。r值的絕對(duì)值越大,兩個(gè)變量之間的相關(guān)程度就越高。當(dāng)r為正值時(shí),叫做正相關(guān),r為負(fù)值時(shí)叫做負(fù)相關(guān)。r的計(jì)算公式如下:,因一0(3-Z)/r/因-幻藝儲(chǔ)-加式中各符號(hào)的意義同上。在求得了回歸方程與兩個(gè)變量之間的相關(guān)系數(shù)后,可以利用F檢驗(yàn)法、t檢驗(yàn)法或r檢驗(yàn)法來(lái)檢驗(yàn)兩個(gè)變量是否顯著相關(guān)。具體的檢驗(yàn)方法在后面介紹。精品文檔精品文檔2 .多元線性回歸分析一元回歸研究的是一個(gè)自變量和一個(gè)因變量的各種關(guān)系。但是客觀事物的變化往往受到多種因素的影響,即使其中有一個(gè)因素起著主導(dǎo)作用,但其它因素的作用也是不可忽視的。因此,我們還需要研究多種變量的關(guān)系,這種多個(gè)變量之

4、間的關(guān)系就叫做多元回歸問(wèn)題。例如,水稻的產(chǎn)量不僅與生長(zhǎng)期內(nèi)的雨量有關(guān),而且與溫度也有關(guān)系。所以尋求水稻的產(chǎn)量不僅與生長(zhǎng)期內(nèi)的雨量之間的相互關(guān)系,就是多元回歸問(wèn)題。如果假設(shè)自變量為X1,X2,,Xm,因變量為Y,而且因變量與自變量之間是線性的關(guān)系,則因變量Y與自變量為X1,X2,,Xm的多元線性回歸方程為:Y=a+b1X1+b2X2+bmXm式中:a,b1,b2,bm為常數(shù)。因此,只要能夠求出a,b1,b2,,bm這些常數(shù),就可以得到因變量Y與自變量為X1,X2,,Xm之間的多元回歸方程。具體的算法比較簡(jiǎn)單,但很煩瑣。這里不再敘述。求解多元回歸的計(jì)算機(jī)程序很多,只要將自變量的數(shù)據(jù)以及與其相對(duì)應(yīng)的

5、因變量的數(shù)據(jù)輸入計(jì)算機(jī)程序中,立刻就可以求出a,b1,b2,,bm各常數(shù)的值,從而可以獲得因變量Y與自變量為X1,X2,,Xm的多元線性回歸方程。精品文檔精品文檔例如,設(shè)已知因變量Y的自變量X1,X2,X3,共得18組數(shù)據(jù),并已知Y對(duì)Xi存在著線性關(guān)系,求其回歸方程。樣品X1X2X3Y10.4531586420.4231636033.119377140.6341576154.724595461.7651237779.444468110.193831117911.62917393112511012.6581110.937111761223.146114961323.150134771421.64

6、47393精品文檔精品文檔1523936143541726.8582021681829.95112499通過(guò)求解,得至Ua=41.6516b1=1.7410b2=-0.0062b3=0.1553所以,回歸方程為Y=41.6516+1.7410X1-0.0062X2+0.1553X3通常可采用單相關(guān)系數(shù)、偏相關(guān)系數(shù)和復(fù)相關(guān)系數(shù)來(lái)說(shuō)明這三個(gè)自變量與因變量之間是否有明顯的線性關(guān)系以及它們之間相關(guān)的程度如何。單相關(guān)系數(shù)是指在不考慮其他因素影響的條件下,所求兩個(gè)變量之間的相關(guān)系數(shù)。用rX1X2、rYX1和rYX2分別表示X1和X2、Y和X1以及Y與X2之間的單相關(guān)系數(shù)。偏相關(guān)系

7、數(shù)是指在這三個(gè)變量中,將其中一個(gè)變量保持常數(shù)時(shí),其他兩個(gè)變量之間的相關(guān)系數(shù)。用rYX1X2和rYX2X1分別表示X2為常數(shù)時(shí),Y與X1的偏相關(guān)系數(shù)和X1為常數(shù)時(shí),Y與X2的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)可以用單相關(guān)系數(shù)求得。當(dāng)這三個(gè)變量中,同時(shí)考慮兩個(gè)變量對(duì)另一個(gè)變量相關(guān)系數(shù)時(shí),叫做復(fù)相關(guān)系數(shù)。用r(X1X2)Y表示X1和X2、兩個(gè)自變量對(duì)于Y的復(fù)相關(guān)系數(shù)。3 .方差分析精品文檔精品文檔方差分析法是分析多組平均數(shù)之間差異顯著性時(shí)常用的一種統(tǒng)計(jì)方法。方差(或均方)是一個(gè)表示變異程度的量,它是離均差的平方和與自由度之商。在一項(xiàng)實(shí)驗(yàn)或調(diào)查中往往存在著許多造成生物形狀變異的因素,這些因素有比較重要的,也有較次

8、要的。分析時(shí)主要是把平方和與自由度按不同的變異起因分解為若干部分,從而構(gòu)成來(lái)自不同起因的方差。利用它來(lái)檢驗(yàn)各組平均數(shù)之間差異的顯著性。在正態(tài)總體及方差相同的基本假定下,我們將利用方差比給出F分布的檢驗(yàn)統(tǒng)計(jì)量。因此這種方法稱(chēng)為方差分析法。方差分析是分析和處理試驗(yàn)或觀測(cè)數(shù)據(jù)的主要方法之一。它首先被應(yīng)用于農(nóng)業(yè)試驗(yàn),目前它在農(nóng)業(yè)、工業(yè)、生物、醫(yī)學(xué)等各部門(mén)有著廣泛的應(yīng)用。方差分析的方法往往與試驗(yàn)設(shè)計(jì)的方式緊密地聯(lián)系在一起。對(duì)于從不同試驗(yàn)設(shè)計(jì)中得出觀測(cè)資料,進(jìn)行方差分析時(shí)將有不同的計(jì)算方法,類(lèi)型繁多,但其基本原理卻大同小異。在這里將結(jié)合一個(gè)較簡(jiǎn)單的例子介紹方差分析的數(shù)學(xué)模型和基本方法,以便于讀者對(duì)方差分析

9、的方法有一個(gè)大致的了解。在實(shí)驗(yàn)設(shè)計(jì)的基礎(chǔ)上,分組試驗(yàn),如分為a組,每組作b個(gè)水平的試驗(yàn),共得到a>b個(gè)數(shù)據(jù)。然后,算出組平均值和總平均值,組內(nèi)和組間的離差平方和,組內(nèi)和組間方差,作F檢驗(yàn)。F=組間方差/組內(nèi)方差精品文檔精品文檔假設(shè)HO:(11=2=(1b,表水各水平的均值相等。當(dāng)F<Fa時(shí),HO:真;當(dāng)F>F對(duì),HO:假。試驗(yàn)中必不可少地會(huì)產(chǎn)生誤差。誤差有兩種:條件誤差和試驗(yàn)誤差。前者是由試驗(yàn)條件不同而引起的系統(tǒng)性誤差,后者是在相同試驗(yàn)條件下引起的隨機(jī)誤差。例如,把四種不同的飼料分別喂給4組小雞,每組5只,它們的增重情況如下:組別增重(Xij)1554942215226111

10、230896334297819592416913716885153試問(wèn)四組小雞在平均增重量方面有沒(méi)有明顯的差別?通過(guò)計(jì)算,得到組內(nèi)和組間方差分別為719.2和8706.3,因此,F(xiàn)=8706.3/719.2=12.1對(duì)于給定的顯著性水平%將有臨界值F%,當(dāng)=0.01時(shí),F(xiàn)0.01(3,16)=5.3,其中3與16是自由度。所以F=12.1>5.3=F0.01(3,16)精品文檔精品文檔故,否定各種飼料效果一致的假設(shè),可以認(rèn)為四種飼料的效果有極明顯的差別。目前現(xiàn)成的計(jì)算機(jī)方差分析計(jì)算程序很多,如SPASS、SAS軟件等,將數(shù)據(jù)輸入后,都可以直接計(jì)算,并按要求輸出結(jié)果。上述例子是單因素的方差

11、分析,比較簡(jiǎn)單。對(duì)于多因素的方差分析,由于比較復(fù)雜,這里就不再敘述了。4. T檢驗(yàn)生物學(xué)中所遇到的絕大多數(shù)問(wèn)題,總體標(biāo)準(zhǔn)差)都是未知的。在(7未知時(shí),平均數(shù)的顯著性檢驗(yàn)有兩種解決方法。其一是根據(jù)以往的經(jīng)驗(yàn)或從類(lèi)似的工作中估計(jì)出一個(gè)(T值,用這個(gè)(T做底僉驗(yàn)。使用估計(jì)的(T做檢驗(yàn)并不是很可靠的。因此在實(shí)際工作中,一般不用這種方法而廣泛使用t檢驗(yàn)。對(duì)于一個(gè)正態(tài)分布總體,若。未知?jiǎng)t夕服從n-1自由度的t分布,因此,在"未知時(shí)可以用t檢驗(yàn)做平均數(shù)的顯著性檢驗(yàn)。t檢驗(yàn)的零假設(shè)H0為:=0備擇假設(shè)有以下三種情況:(1)HA:p>jO若已知w不可能小于感(2)HA:w<w,0若已知w不

12、可能大于wQ(3)HA:p?也庖括w>w和w<p0精品文檔精品文檔三種備擇假設(shè)的拒絕域?yàn)椋?1) t>t%;(2)t<-ta(3)t>t的/或表示為t>t處側(cè))。其中口為給定的顯著性水平。t檢驗(yàn)的統(tǒng)計(jì)量為:t=(了-uO/(s/n"2)例如,已知玉米單交種群?jiǎn)?05的平均穗重w0=30加,噴藥后,隨機(jī)抽取9個(gè)果穗,其穗重為分別:308、305、311、298、315、300、321、294、320克。問(wèn)噴藥后與噴藥前的果穗重差異是否顯著?根據(jù)上面介紹的基本程序:已知玉米穗重是服從正態(tài)分布的隨機(jī)變量,0未知。(2)假設(shè):H0:w=p0=300HA0=

13、300由于問(wèn)題要求檢驗(yàn)的是果穗重差異是否顯著工并沒(méi)有明確穗重一定增加或一定減少,所以備擇假設(shè)為HA:0(3)顯著性水平:根據(jù)實(shí)驗(yàn)的要求(差異是否顯著")規(guī)定=0.05(4)統(tǒng)計(jì)量的值:由于"未知需使用t檢驗(yàn)。t=(九pQ/(s/n1精品文檔精品文檔t=(308-3000)/(9.62/91/2)=2.4911(5)建立的拒絕域H0:因HA:林不廝球是雙側(cè)檢驗(yàn)。當(dāng)t>t0.05(雙側(cè))時(shí)拒絕H0,%=0.05寸,經(jīng)查表t8,0.05(雙側(cè))=2.306。I(6)結(jié)論:因t=2.49>t8,0.05(雙側(cè))=2.306,所以結(jié)論是拒絕H0,接受HA。即噴藥前后果穗重

14、的差異是顯著的。5. F檢驗(yàn)t檢驗(yàn)屬于單個(gè)樣本的顯著性檢驗(yàn),即在樣本統(tǒng)計(jì)量與零假設(shè)所提出的總體參量之間做比較。這種檢驗(yàn)需要我們事先能夠提出合理的參量假設(shè)值和對(duì)參量有某種意義的備擇值。然而,在實(shí)際工作中,很難提出這樣的假設(shè)值及備擇值。因此,限制了這種方法在實(shí)際工作中的應(yīng)用。為了避免上述問(wèn)題的出現(xiàn),在實(shí)際應(yīng)用時(shí),常常選擇兩個(gè)樣本,一個(gè)作為處理,一個(gè)作為對(duì)照。在這兩個(gè)樣本之間做比較。判斷它們之間是否存在足夠顯著的差異。當(dāng)它們之間的差異不能用偶然性解釋時(shí),則認(rèn)為它們之間存在足夠顯著的差異,這兩個(gè)樣本來(lái)自?xún)蓚€(gè)不同的總體。而F檢驗(yàn)是關(guān)于兩個(gè)方差的檢驗(yàn),所以常用F檢驗(yàn)來(lái)解決上述問(wèn)題。F檢驗(yàn)的程序概述如下:精品文檔精品文檔(1)假定從兩個(gè)正態(tài)總體中,獨(dú)立地抽取含量分別為n1和n2的兩個(gè)隨機(jī)樣本,計(jì)算出s12和s22??傮w平均數(shù)wl和可以相等也可以不相等。(2)零假設(shè)H0為:(t1=(t2備擇假設(shè)有以下三種情況:(1)HA:。1>明2若已知不可能小于6%(2)HA:(t1<o;2若已知(H不可能大于6%(3)HA:61?d2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論