版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第六講 相關(guān),變量間的關(guān)系有兩類: 一類是變量間存在著完全確定性的關(guān)系,可以用精確的數(shù)學表達式來表示。 如長方形的面積(S)與長(a)和寬(b)的關(guān)系可以表達為:S=ab。它們之間的關(guān)系是確定性的,只要知道了其中兩個變量的值就可以精確地計算出另一個變量的值,這類變量間的關(guān)系稱為函數(shù)關(guān)系。,另一類是變量間不存在完全的確定性關(guān)系,不能用精確的數(shù)學公式來表示。 如黃牛的體長與體重的關(guān)系;仔豬初生重與斷奶重的關(guān)系;豬瘦肉率與背膘厚度、眼肌面積、胴體長等的關(guān)系等等,這些變量間都存在著十分密切的關(guān)系,但不能由一個或幾個變量的值精確地求出另一個變量的值。像這樣一類關(guān)系在生物界中是大量存在的,統(tǒng)計學中把這些變
2、量間的關(guān)系稱為相關(guān)關(guān)系,把存在相關(guān)關(guān)系的變量稱為相關(guān)變量。,相關(guān)變量間的關(guān)系一般分為兩種: 一種是因果關(guān)系,即一個變量的變化受另一個或幾個變量的影響。如仔豬的生長速度受遺傳特性、營養(yǎng)水平、飼養(yǎng)管理條件等因素的影響,子代的體高受親本體高的影響; 另一種是平行關(guān)系,它們互為因果或共同受到另外因素的影響。如黃牛的體長和胸圍之間的關(guān)系,豬的背膘厚度和眼肌面積之間的關(guān)系等都屬于平行關(guān)系。,統(tǒng)計學上采用回歸分析 (regression analysis)研究呈因果關(guān)系的相關(guān)變量間的關(guān)系。表示原因的變量稱為自變量,表示結(jié)果的變量稱為依變量。 研究“一因一果”,即一個自變量與一個依變量的回歸分析稱為一元回歸分
3、析; 研究“多因一果”,即多個自變量與一個依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。,統(tǒng)計學上采用相關(guān)分析 ( correlation analysis)研究呈平行關(guān)系的相關(guān)變量之間的關(guān)系。 對兩個變量間的直線關(guān)系進行相關(guān)分析稱為簡單相關(guān)分析(也叫直線相關(guān)分析); 對多個變量進行相關(guān)分析時,研究一個變量與多個變量間的線性相關(guān)稱為復相關(guān)分析;研究其余變量保持不變的情況下兩個變量間的線性相關(guān)稱為偏相關(guān)分析。,直線相關(guān)與直線回歸 直線相關(guān)與直線回歸分析,是研究涉及連續(xù)型正態(tài)隨機變量的兩個連續(xù)型變量
4、(x,y)間的線性關(guān)系的統(tǒng)計方法。 數(shù)理統(tǒng)計理論要求:作直線相關(guān)分析的雙隨機變量(x,y),應(yīng) 服從二維正態(tài)分布;兩個變量不分主次、地位平等。例如對身高與 體重間的關(guān)系的研究。作直線回歸分析的雙變量(x,y)中,一個為 正態(tài)分布隨機變量,即因(依)變量;另一個為可觀測非隨機變量, 即自變量,兩個變量地位不再平等。例如對植株高度(因變量)隨 生長周數(shù)(自變量)的變化規(guī)律的研究,植株高度為正態(tài)隨機變量, 生長周數(shù)為可觀測非隨機變量。 實際應(yīng)用時,對雙變量樣本資料(xi,yi),i=1,n,只要x、y中 有一個是正態(tài)分布隨機變量,一般都可同時作直線相關(guān)和直線回歸分 析,對上述理論上的要求一般不作嚴格
5、限制。,一、直線相關(guān)的散點圖(Scatter)分析 直線相關(guān)分析中的樣本,是平面上的n個點(xi,yi),i=1,n,它們在平面上的典型散布情況散點圖有以下幾種:,第一節(jié) 直線相關(guān) correlation analysis,二、直線相關(guān)的定量分析 (一)直線相關(guān)系數(shù)(總體記為,樣本記為r) 樣本直線相關(guān)系數(shù): 其中Lxy稱為離均差乘積和。 可以證明:-1r1。 由下圖易知,Lxy的符號代表了相關(guān)的性質(zhì): Lxy0為正相關(guān);Lxy大小可初步反映相關(guān)的密切程度。,Lxy0,Lxy小 Lxy0,Lxy大,但直接用Lxy描述直線相關(guān)關(guān)系,會受到樣本容量n大小的影響,還會受變量x、y的單位制及其變異大小
6、的影響,因此引入直線相關(guān)系數(shù) 就解決了這些問題。r可以客觀描述x,y之間的直線關(guān)聯(lián)的性質(zhì)和密切程度。 結(jié)合散點圖及r的取值情況,當r0時,稱為正相關(guān);當r0時,稱為負相關(guān);當r=0時,稱為零相關(guān);當r=1時,稱為完全正相關(guān);當r=-1時,稱為完全負相關(guān)。,(二)直線相關(guān)關(guān)系即直線相關(guān)系數(shù)的檢驗 假設(shè)H0:=0 即總體直線相關(guān)系數(shù)為零,亦即總體內(nèi)x與y之間無直線相關(guān)關(guān)系。 方法一. 查 r 表法,由 r 與界值 r比較,自由度 df = n-2。 若r 0.05,尚不能認為總體直線相關(guān)系數(shù)不為零,即尚不能認為總體內(nèi) x 與 y 存在直線相關(guān)關(guān)系; 若r r,n-2(0. 05), P0. 05,
7、則認為總體直線相關(guān)系數(shù)不為零,即總體內(nèi) x 與 y 之間存在直線相關(guān)關(guān)系。 方法二. 由 t = (r-) / (1-r) / (n-2) 與界值 t 比較,自由度df =n-2。比較結(jié)果及結(jié)論與方法一類似,只需將r換為t 即可。 方法一與方法二具有完全等價性,即檢驗結(jié)論、P值恒一致。 實際中只需選擇其一即可。,三、直線相關(guān)分析實例 例6. 1 某品種水稻由播種至齊穗的天數(shù)x與其間的總積溫y(日度) 數(shù)據(jù)如下表。試做相關(guān)分析。,先做散點圖如下,可見有直線相關(guān)趨勢。,再求直線相關(guān)系數(shù) 對可能存在的直線相關(guān)關(guān)系進行檢驗: 假設(shè)H0:=0, df = 9 2 = 7,r r0. 001,7, P0.
8、 001 結(jié)論:某水稻品種由播種至齊穗的天數(shù)與其間的總積溫之間有正直線相關(guān)關(guān)系。,例6.2 計算10只綿羊的胸圍(cm)和體重(kg) 的相關(guān)系數(shù)。 表 10只綿羊胸圍和體重資料,R=0.847 Sig=0.0020.01,為研究m個定量指標變量(x1,x2,xm)間的關(guān)聯(lián)情況,通常要對 n 個研究對象觀測 m 組數(shù)據(jù)(x1i, x2i,, xmi),i=1,2,n(一般 n 應(yīng)遠大于 m ),且諸 xi 應(yīng)滿足正態(tài)分布等條件。然后對這 m組數(shù)據(jù)做多元線性相關(guān)分析。 一、簡單相關(guān)分析 對諸 xi 計算兩兩間的直線相關(guān)系數(shù)rij(也稱零級相關(guān)系數(shù)),可粗略反映各變量之間的關(guān)聯(lián)情況。,第二節(jié) 多元
9、線性相關(guān)分析,二、偏相關(guān)分析 計算偏相關(guān)系數(shù) rij,表示在扣除其它變量的影響后 xi 與 xj 之間的直線相關(guān)系數(shù),表示被扣除影響的其它變量的下標。在這里偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)相比,更能真實反映xi、xj間的關(guān)聯(lián)情況。 偏相關(guān)系數(shù)的計算公式為: rij = - CijCiiCjj 式中,Cij、Cii、Cjj為(x1, x2, , xm )的相關(guān)矩陣r的逆矩陣r-1中的元素。 對偏相關(guān)系數(shù)也可進行檢驗,方法是由獨立自變量個數(shù)=m -1,剩余自由度=nm1查專用相關(guān)系數(shù)檢驗表,可得 r0. 05 , r0. 01 。 若rij 0.05, 不能認為 xi 、xj 之間存在偏相關(guān)關(guān)系; 若ri
10、j r,0.05, P0. 05, 說明 xi、xj 之間存在偏相關(guān)關(guān)系。,例6. 3 隨機抽測 29 名兒童的血中微量元素鈣、鎂、錳、鐵、銅及血紅蛋白含量,數(shù)據(jù)如下表。試求 相關(guān)系數(shù)。,簡單相關(guān)分析:,鈣 鎂 鐵 錳 銅 血紅蛋白 1 . 538 . 300 . 148 . 625 . 097 . 538 1 . 635 -. 121 . 582 . 569 . 300 . 635 1 -. 271 . 265 . 863 . 148 -. 121 -. 271 1 . 294 -. 323 . 635 . 582 . 265 . 294 1 . 248 . 097 . 569 . 863
11、-. 323 . 248 1,r =,鈣 鎂 鐵 錳 銅 血紅 蛋白,2. 267 -. 608 -1. 355 . 067 -1. 118 1. 595 -. 608 2. 683 -. 814 . 344 -. 964 -. 415 -1. 355 -. 8145 . 337 -. 143 1. 016 -4. 311 . 067 . 344 -. 143 1. 394 -. 753 . 558 -1. 118 -. 964 1. 016 -. 753 2. 479 -1. 078 1. 595 - 4. 15 -4. 311 . 558 -1. 078 5. 250,r 1 =(Cij)
12、=,偏相關(guān)系數(shù) r= r鈣鎂= -C12C11C22 = -(- 0. 608) 2. 267 2. 683 = 0. 2465 r3 = r鈣鐵= -C13C11C33 = -(- 1. 355) 2. 267 5. 337 = 0. 3895 全部偏相關(guān)系數(shù)(矩陣)為: 注意到,偏相關(guān)系數(shù)與簡單相關(guān)系數(shù)不僅在數(shù)值上,而且在符號 上均可能不同,例如簡單相關(guān)系數(shù) r鐵銅 = 0. 265,而偏相關(guān)系數(shù) r鐵銅=-0. 279。由于在多變量問題中,簡單相關(guān)系數(shù)住往不能反映變 量間的真實關(guān)系,甚至可能得出錯誤結(jié)論,因此,應(yīng)用中應(yīng)以偏相關(guān) 系數(shù)為準。偏相關(guān)系數(shù)的檢驗從略。,1、計量資料的(Spear
13、man)等級相關(guān)分析 例6. 4 某 7 個地區(qū)居民中單純性甲狀腺腫患病率 x (%) 與當?shù)厥澄铩?飲水中含碘量 y 數(shù)據(jù)如表。試做(Spearman)等級相關(guān)分析。,三、 秩相關(guān)(等級相關(guān))分析,假設(shè)H0:甲狀腺腫患病率與食物、飲水中含 碘量間無等級相關(guān)關(guān)系。 分別對 x、y 編秩號,相同數(shù)值編平均秩 號。求各對數(shù)據(jù)(xi , yi)(i=1,2,n,n為數(shù)據(jù) 對子數(shù))的秩號差d。 計算Spearman 等級相關(guān)系數(shù) rs: rs=1 - 6d/n(n-1),可以證明 -1 rs1, 當 r s0時稱正等級相關(guān)。 查專用統(tǒng)計表可得界值rs,n, 若rs 0. 05,不能拒絕H0; 若rs
14、rs,n(0. 05), P0. 05,拒絕H0。 本例rs=1-6(-6)+(-4)+(-2)+1+1+4+6/7(7-1)= - 0. 964 查表得rs,0. 05,7=0. 786,因rsrs,0. 05,7, P0. 05, 結(jié)論:甲狀腺腫患病率與食物、飲水中含碘量間存在負等級相關(guān)關(guān)系。,可以證明 1 rk1, 當 rk 0 時稱正等級相關(guān)。 查專用統(tǒng)計表可得界值 rk,n 。 若rk 0. 05,不能拒絕 H0; 若rk rk,n , 0. 05, P0. 05,拒絕 H0。 本例 rk=234/10(10-1)/21= 0. 511 查表得 rk,0. 05,10= 0. 467
15、,因rk rk,0. 05,10, P 0. 05,結(jié)論: 該地肝癌死亡率與某食物中黃曲霉素相對含量間有正等級相關(guān)關(guān)系。,2、計量資料的(Kendall)等級相關(guān)分析 例6. 5 某地10個鄉(xiāng)的肝癌死亡率y(1/10萬)與某食物中黃曲霉素相對含 量x的數(shù)據(jù)如下表。試做(Kendall)等級相關(guān)分析。,假設(shè)H0:肝癌死亡率與某食物黃曲霉素相對含 量間無等級相關(guān)關(guān)系。 先按 x (或 y) 從小到大對樣品 (xi , yi)( I =1,2, , n ,n為數(shù)據(jù)對子數(shù))排序。 再對y (或 x) 編秩號,相同數(shù)值編平均秩號。 從頭計算大于現(xiàn)秩號的秩號個數(shù)Si,并求 合計S =Si 。 計算Kend
16、all等級相關(guān)系數(shù) rk: rk=2S / n (n1)/2 1,1 0. 7 21. 5 3 7 2 1. 0 18. 9 2 7 3 1. 7 14. 4 1 7 4 3. 7 46. 5 7 3 5 4. 0 27. 3 4 5 6 5. 1 64. 6 9 1 7 5. 5 46. 3 6 2 8 5. 7 34. 2 5 2 9 5. 9 77.6 10 0 10 10. 0 55. 1 8 0,鄉(xiāng) 黃曲霉 肝癌死 秩號 大于現(xiàn)秩號 號 素含量x 亡率y 秩號個數(shù)Si,合計 S=34,3、含等級指標資料的等級相關(guān)分析 例6. 6 12名急性白血病患兒的血小板計數(shù)x與出血狀況等級 y 數(shù) 據(jù)如下表。試做等級相關(guān)分析。,這里以Spearman法為例進行分析, Kendall法與之相仿。需先將等級指標 數(shù)量化。 假設(shè)H0:血小板計數(shù)與出血狀況 無等級相關(guān)關(guān)系。 分別對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 車輛通行費收費員班組協(xié)作水平考核試卷含答案
- 鋼琴及鍵盤樂器制作工操作規(guī)范能力考核試卷含答案
- 光纜護套工成果考核試卷含答案
- 2025年天津市和平區(qū)教育系統(tǒng)事業(yè)單位招聘教師真題
- 船舶甲板設(shè)備操作工安全生產(chǎn)規(guī)范知識考核試卷含答案
- 插花花藝師常識能力考核試卷含答案
- 汽輪機裝配調(diào)試工崗前理論實踐考核試卷含答案
- 礦井軌道工達標能力考核試卷含答案
- 羽毛球拍制作工安全宣貫測試考核試卷含答案
- 網(wǎng)商沖突解決考核試卷含答案
- 新食品零售運營管理辦法
- 強制性產(chǎn)品認證實施規(guī)則 低壓電器 低壓元器件(CNCA-C03-02:2024)
- 氫能源煉鋼可行性研究報告
- 種子公司企業(yè)管理制度
- 口腔門診急救藥箱配置與管理規(guī)范
- 2025至2030中國日本清酒行業(yè)市場發(fā)展現(xiàn)狀及發(fā)展前景與投資報告
- T/CECS 10169-2021埋地用聚乙烯(PE)高筋纏繞增強結(jié)構(gòu)壁管材
- openEuler系統(tǒng)管理與服務(wù)器配置 課件 第9章DNS服務(wù)器
- 供銷集團考試試題及答案
- 《并購后的整合與管理》課件
- 高一期中歷史試卷及答案
評論
0/150
提交評論