9簡單相關回歸分析.ppt_第1頁
9簡單相關回歸分析.ppt_第2頁
9簡單相關回歸分析.ppt_第3頁
9簡單相關回歸分析.ppt_第4頁
9簡單相關回歸分析.ppt_第5頁
已閱讀5頁,還剩57頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第八章線性相關和回歸分析,第一節(jié)回歸和相關分析的概念,第二節(jié)線性相關回歸方案設計,第三節(jié)線性回歸分析和第四節(jié)線性相關分析。引言:本章從一個變量研究兩個或兩個以上的變量,因為在實際的生產實踐和科學實驗中往往有一個以上的變量需要研究。例如,要研究溫度和作物發(fā)育進程之間的關系,有兩個變量:溫度和發(fā)育進程;為了研究每畝穗數(shù)、每穗粒數(shù)與畝產量的關系,有三個變量:穗數(shù)、粒數(shù)和產量。函數(shù)關系(確定性關系)有精確的數(shù)學表達式。線性回歸分析。單變量回歸分析。變量之間的關系。因果曲線回歸分析(回歸分析)。多元線性回歸分析。統(tǒng)計關系。多元非線性回歸分析(不確定關系)。簡單相關分析。線性相關分析。相關分析。多重相關分

2、析。偏相關分析。1.相關和回歸分析的定義。函數(shù)關系和統(tǒng)計關系函數(shù)關系:變量之間存在完全確定的關系,可以用精確的數(shù)學表達式來表示。統(tǒng)計關系:變量之間沒有完全確定的關系,不能用精確的數(shù)學公式來表示。受誤差影響的變量之間的關系稱為統(tǒng)計關系。第一節(jié)是回歸和相關分析的概念,因果關系:如果兩個變量之間的關系具有因果關系(結果)。相關性:如果它呈現(xiàn)一個共同的變化,那么這兩個變量之間就存在相關性?;貧w分析:基于計算回歸方程的統(tǒng)計分析方法。x,單株生物產量和水稻產量散點圖,x,每平方米小穗數(shù)和結實率散點圖,x,最高葉面積指數(shù)和畝產量散點圖,2。相關分析研究兩個或兩個以上變量的相關程度和性質,即研究兩種變量。兩個

3、變量的變化趨勢是否一致或相反,以及一致和相反的程度。兩個變量之間線性關系的相關分析稱為線性相關或簡單相關;分析多變量之間的線性關系,單變量和多變量之間的線性相關稱為復相關分析(多元相關分析);當其他變量保持不變時,兩個變量之間的線性相關被稱為偏相關分析。3.回歸分析研究一個變量受另一個或幾個變量的影響程度,揭示變量之間的聯(lián)系形式,建立回歸方程,用回歸方程控制或預測自變量或因變量。自變量和因變量的回歸分析稱為單變量回歸分析。多元獨立變量和一個因變量的回歸分析稱為多元回歸分析。單變量回歸分析可分為線性回歸和曲線回歸;多元回歸分析可以分為多元線性回歸和多元非線性回歸。相關分析和回歸分析的區(qū)別相關分析

4、的任務是確定兩個變量之間是否存在相關性,以及相關性的方向和接近程度。回歸分析的任務是找出因變量對自變量的依賴關系和依賴程度的表達式。相關分析不需要確定兩個變量中的哪一個是自變量,哪一個是因變量,但是回歸分析必須區(qū)分因變量和自變量。在相關分析中,兩個變量是相等的,改變它們的位置不會影響相關系數(shù)的值。在回歸分析中,兩個獨立的回歸方程可以為兩個因果變量解出。在相關分析中,兩個變量都可以是隨機的,而在回歸分析中,因變量X是隨機的,而因變量Y不是隨機的。2.相關回歸分析中應注意的問題。1.相關和回歸僅用作幫助相關理解和解釋的工具。變量之間是否存在相關性,在什么條件下等。必須由每個學科本身決定。不相關的數(shù)

5、據(jù)不能隨機放在一起進行相關回歸分析。2.由于自然界中各種事物之間的相互聯(lián)系和制約,一個事物的變化通常會受到許多其他事物的影響。因此,如果我們只研究事物Y和X之間的關系,我們就需要盡可能地嚴格控制其他事物;否則,相關和回歸分析可能會導致完全錯誤的結果。3.為了提高相關和回歸分析的準確性,兩個變量的觀測值對應該盡可能多,通常至少有5對觀測值,最好的數(shù)對是10-30對,X變量的取值范圍應該盡可能寬。相關和回歸的類型可分為:1 .根據(jù)研究變量的數(shù)量進行簡單相關回歸和多重相關回歸。前者指研究兩個變量之間的關系;后者是指對兩個或多個變量之間關系的研究。2.根據(jù)變量之間的關系圖,它可以分為線性和非線性相關回

6、歸。相關和回歸的異同:(以兩個變量為例)相同:兩者都研究兩個變量之間的關系。區(qū)別如下:第2節(jié),線性響應試驗方案設計,和第1節(jié),等長間隔試驗方案設計。等距意味著測試因子X的值是根據(jù)等差值設計的。例如,研究了葡萄扦插苗的高度與扦插后天數(shù)的關系;中間砧長和矮化效應。在研究中,采用天數(shù)和中間砧木長度的算法,便于研究和分析試驗結果。這種方法一般適用于線性相關和回歸研究。第二,等比區(qū)間測試方案設計,所謂等比是指測試因子x的值是根據(jù)相同的比值設計的。一般來說,它適用于實驗效果與實驗因素之間呈對數(shù)或指數(shù)關系的實驗設計研究。例如,葉面噴施B9與蘋果新梢生長的關系;1000、2000、4000、ck .3。優(yōu)化方

7、法區(qū)間測試方案設計(0.618法)。所謂優(yōu)化方法區(qū)間測試方案設計以測試因子的上限和下限為兩個端點,上限和下限的乘積乘以0.618作為水平區(qū)間,從兩端向中間擴展。眾所周知,開花前10天葉面噴施15%多效唑可提高巨峰葡萄的坐果率,有效范圍為500-1200PPM,此時,1200-500=700700 * 0.618=423.6;設計處理濃度為500 423.6=923.6;1200-423.6=776.4加500;1200;0,設計了五個治療點。即0.618方法設計。該優(yōu)化方法適用于試驗效果與因素呈二次曲線反應的試驗方案設計,該設計的中心目的是尋找試驗中的最佳處理值(極值點)。但是,在使用這種測試

8、設計方案時,首先要對測試內容有一個基本的了解,也就是要知道有效使用區(qū)間(上限和下限),才能正確使用。第三部分是線性回歸。一、線性回歸方程的建立方法。第一步:繪制散點圖,找出相應的線段類型;2.確定線段類型,找出相應的數(shù)學計算公式;3.通過數(shù)學運算計算回歸系數(shù)和回歸截距;4.寫出回歸方程。對于線性回歸,只有當線段類型顯示線性趨勢時,才能將其視為直線。此時,相應的數(shù)學公式為,根據(jù)X,該公式讀作Y的回歸方程。在該公式中,X和Y是實際觀測值,b稱為回歸系數(shù),它是指當X增加一個單位時,Y將增加(b0)或減少(b0)的單位數(shù),也稱為斜率,a稱為回歸截距。表示根據(jù)x的值計算的y的估計值。(2)線性回歸方程(

9、3)回歸系數(shù)和回歸截距的計算(3) Re根據(jù)最小二乘法原理,甲、乙應使回歸估計值與觀測值的偏差平方和最小,即:2?;貧w系數(shù)和回歸截距的計算;1.回歸系數(shù)和回歸截距的計算應使Q最小,并根據(jù)微積分中的極值原理,使Q對A和B的一階偏導數(shù)等于0,即:即求解上述方程:2。線性回歸與回歸標準誤差的偏離度表示回歸線與測點之間的偏離度,即回歸估計值的實際觀測值Y的偏離度,因此我們用偏離標準誤差來表示回歸方程的偏離度。回歸方程的驗證將被代入方程得到:否則,方程是錯誤的。3.回歸線的繪制回歸線的繪制從理論上講,直線可以通過連接任意兩點來繪制。然而,由于部分回歸的存在,這是一條真正的回歸線,必須通過連接兩點來繪制,

10、因為這兩點是直線上最具代表性的點。1。線性回歸的變異源;3.線性回歸的顯著性檢驗;總變異數(shù)SSy來自回歸SSe回歸SSR、2?;貧w關系F的顯著性檢驗:檢驗X和Y之間是否存在回歸關系,我們需要進行假設檢驗,首先提出其無效假設:=0,替代假設:0。在無效假設條件下,回歸均方差與回歸均方差之比服從F分布,因此可以用以下公式進行計算和檢驗。3?;貧w系數(shù)的顯著性檢驗回歸系數(shù)的顯著性檢驗采用T檢驗,也可以檢驗X和y之間是否存在線性關系。回歸系數(shù)顯著性檢驗的無效假設和替代假設分別為0和0。,4,回歸關系與回歸系數(shù)顯著性之間的關系,對于線性相關和回歸的顯著性檢驗,有一個t2=F的關系,因為大方差的自由度等于1

11、;因此,回歸系數(shù)、回歸關系、相關系數(shù)和相關顯著性檢驗本質上是一回事,所以在具體應用中只進行一次檢驗,其他不再檢驗,差異顯著性檢驗只是方法上的差異。第四部分是線性相關。首先,測量相關度的基本公式有一個二元總體,n對觀測值是:如果正相關,大值和大值將在一起;小價值和小價值結合在一起;如果負相關;那么大值和小值在一起;小值和大值在一起;在這兩個變量的數(shù)據(jù)中,變量是最有代表性的觀測值;就變量而言,它是最具代表性的觀測值;每個變量值的變化程度可以用偏離平均值來表示:如果偏離平均值除以變量的標準差,就可以得到一個沒有任何單位的純數(shù);即通過將這些純相關系數(shù)對的乘積之和除以自由度得到的商。也就是說,在進一步整

12、理公式后,相關系數(shù)的取值范圍是-1-1,1。相關系數(shù)和決定系數(shù),以及1。如果相關系數(shù)(x,y)總體上不相關,則落在象限、和中的點是均勻分散的,因此正負相互抵消,即=0。當(x,y)作為一個整體正相關時,象限中的點一定比象限中的多,所以它一定是正的。同時,落入象限的點數(shù)比例越大,正值越大。當(x,y)作為一個整體呈負相關時,落在象限中的點一定比落在象限中的點多,所以它一定是負的;落入象限的點的比例越大,這個負值的絕對值就越大。2,相關系數(shù)的計算,甜櫻桃雜交苗蜜腺大小與果實重量相關系數(shù)的計算:X 1 . 61 . 61 . 81 . 9222 . 12 . 22 . 3 2 . 4y 33 . 2

13、3 . 63 . 744 . 24 . 44 . 555 . 1輸入X數(shù)據(jù)為:輸入Y數(shù)據(jù)為:輸入XY數(shù)據(jù)為: for r=0.98。最后,根據(jù)結果,Df=n-2和自變量的數(shù)量可以在R表中找到:值0.0與線性回歸關系的顯著性檢驗一樣,t檢驗和f檢驗可以用來檢驗相關系數(shù)r,的顯著性。相關系數(shù)的顯著性檢驗,相關系數(shù)R的顯著性檢驗的臨界值見附表,相關系數(shù)R的顯著性檢驗可采用查表法直接進行。具體方法是根據(jù)自由度n-2檢查臨界R值。如果|r|,相關系數(shù)r不顯著;如果|r|,相關系數(shù)r是顯著的,并且在r的右上方標記“* ”;如果|r|,相關系數(shù)r極顯著,r的右上方標“* *”。f檢驗公式如下:4。相關性的顯

14、著性檢驗;5.相關系數(shù)和決定系數(shù)的應用:r2,相關系數(shù)的平方,稱為決定系數(shù),用來解釋x(或y變量)可以解釋的y變量(或x變量)的變異比例。相關系數(shù)的顯著性有時不同于相關程度。例如,在一個小樣本中,需要一個大的R值才能達到顯著水平,并且相關程度與相關顯著性一致,這在生產中具有重要意義;然而,對于大樣本,較小的R值也可以達到顯著水平,但實際上相關程度不高,如:df=50,0.05=0.276,df=100,0.05=0.195,df=1000,0.05=0.062。在兩個變量的相關回歸研究中,相關系數(shù)的T檢驗、回歸系數(shù)和回歸關系的假設檢驗,6。線性相關和回歸的關系。1.r和B都使用某些值來表示兩個

15、變量之間的相關性;兩者的變異性質和方向是完全一致的。2.r只能根據(jù)數(shù)值的大小來判斷兩類變量之間的相關性;b是根據(jù)數(shù)值得到回歸方程,從而根據(jù)自變量的變化推測因變量靈敏度的變化規(guī)律;r的值總是在-1和1之間,而b的值變化很大??傊?,如果相關回歸只研究兩類變量之間的關系,那么回歸關系的顯著性、回歸系數(shù)的顯著性和相關系數(shù)的顯著性是完全一致的,因為大方差的自由度等于1,所以在實際應用中,只有一個是顯著的,其他的都是顯著的。然而,在科學研究中,雖然有一些研究內容是相互關聯(lián)的,但必然存在回歸關系,因此有必要對具體問題逐一進行分析。4.線性相關和回歸的關系;4.非線性回歸。我們之前研究過線性相關和回歸。然而,

16、在生產和科學研究中,有許多研究的現(xiàn)象不是線性的,而是曲線相關和回歸的,如實際生長發(fā)育動態(tài)、新梢生長動態(tài)等。而且,有不同的類型,所以我們必須對曲線相關和回歸進行具體的研究。1。多項式曲線(1)y=BX(2)y=BX CX2(3)y=BX CX2 DX3,2,指數(shù)曲線,3,對數(shù)曲線,4,倒數(shù)曲線,為雙曲線。當b0時,曲線從上到下,如圖7-18a所示。當b0時,曲線從下到上顯示;5.有漸近線的s形曲線。使用電子表格進行曲線回歸分析。1.在表格中輸入數(shù)據(jù)。2.選擇數(shù)據(jù),選擇“標準類型”和“XY散點圖”。3.單擊“下一步”和“完成”。顯示圖形表格中會出現(xiàn)一個圖形。4.右鍵單擊“曲線上的一點”,選擇“添加趨勢線”。5.確定曲線類型,選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論