相關(guān)與回歸_第1頁(yè)
相關(guān)與回歸_第2頁(yè)
相關(guān)與回歸_第3頁(yè)
相關(guān)與回歸_第4頁(yè)
相關(guān)與回歸_第5頁(yè)
已閱讀5頁(yè),還剩36頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

直線相關(guān)與回歸 中山大學(xué)公共衛(wèi)生學(xué)院 醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系 林愛華 主要內(nèi)容 直線相關(guān) 等級(jí)相關(guān) 直線回歸 直線相關(guān)與回歸的區(qū)別與聯(lián)系 前面我們討論了對(duì) 單個(gè)變量 的統(tǒng)計(jì)分析方法 , 著重于比較該單個(gè)變量的組間差別 。 醫(yī)學(xué)研究中常需分析變量間的關(guān)系 , 如血壓與年齡 。 相關(guān) (與回歸 (研究?jī)蓚€(gè)或多個(gè)隨機(jī)變量之間相互關(guān)系的重要的統(tǒng)計(jì)分析方法,應(yīng)用廣泛。 相關(guān) 是研究隨機(jī)變量之間相互聯(lián)系的密切程度和方向 。 回歸 是研究隨機(jī)變量之間的數(shù)量依存關(guān)系 。 本章介紹 兩個(gè)變量 間的 直線回歸與相關(guān),及等級(jí)相關(guān) 。 第一節(jié) 直線相關(guān) 一 、 直線相關(guān)的概念: 當(dāng)兩指標(biāo)間不獨(dú)立則為相關(guān) , 即某一指標(biāo)的取值與另一指標(biāo)的取值多少有關(guān) 。 探討兩個(gè)正態(tài)分布的隨機(jī)變量有無直線關(guān)系時(shí) , 統(tǒng)計(jì)學(xué)中用一個(gè)統(tǒng)計(jì)量描述直線相關(guān)的密切程度和方向 ,這個(gè)統(tǒng)計(jì)量稱 相關(guān)系數(shù) , 記為 r。 相關(guān)系數(shù)的絕對(duì)值必然在 0到 1之間 , 即: 11 例:體重與肺活量 , 胸圍與肺活量 相關(guān)系數(shù)的符號(hào)表示相關(guān)的方向, 例:身高與體重,年齡與鈣的吸收量 從研究總體隨機(jī)抽取 每個(gè)對(duì)象觀察 兩項(xiàng)指標(biāo) , 或者從已經(jīng)配成對(duì)子的研究總體中隨機(jī)抽取 每對(duì)對(duì)象觀察同一指標(biāo) 。 要求: 獨(dú)立隨機(jī)的成對(duì)樣本 , 并且 X 和 這樣的研究所獲得的資料就可以做直線相關(guān)分析 。 二 . 相關(guān)分析的 資料來源 : 1 2 名 糖尿病患者的空腹血糖 ( m m o l / L ) 及胰島素 ( m U / L ) 測(cè)定值 編 號(hào) 1 2 3 4 5 6 7 8 9 10 11 12 胰島素 10 1 1 . 2 1 4 . 0 1 5 . 2 1 6 . 2 1 8 . 4 1 8 . 7 1 9 . 2 1 9 . 8 2 2 . 0 2 3 . 1 2 5 . 0 血糖 1 3 . 3 2 1 0 . 8 2 1 2 . 0 4 1 2 . 2 1 1 1 . 1 9 . 4 9 1 1 . 5 4 9 . 0 5 7 . 8 8 1 0 . 1 6 8 . 3 8 7 . 7 1 例 12醫(yī)生隨機(jī)抽查了 12名糖尿病患者的空腹血糖及胰島素值,數(shù)據(jù)見下表,試做相關(guān)分析。 三、 直線相關(guān)的統(tǒng)計(jì)描述 : 1 散點(diǎn)圖 : 考察相關(guān)性最簡(jiǎn)單而直觀的辦法是散點(diǎn)圖 。 以兩條互相垂直的座標(biāo)軸分別表示兩個(gè)變量 , 便構(gòu)成一幅散點(diǎn)圖 。 本資料繪制成散點(diǎn)圖( 下 : 圖1212名 糖尿病患者血糖與胰島素散點(diǎn)圖567891011121314155 10 15 20 25 30胰島素(m U / L )血糖()2. 相關(guān)系數(shù)的計(jì)算 : Y()XX(r 22 (分子決定正負(fù)號(hào) ) n 2 1 3 . 1X 1 2 3 . 7 0Y 2 4 0 1 2 . 5 5X 2 1 3 1 1 . 8 7Y 2 1 2 2 . 4 02 2 8 . 2 5 3 6 . 7 3 7 4 . 3 1代入公式,得 7 4 . 3 10 . 8 1 1 52 2 8 . 2 5 3 6 . 7 3 Y 根據(jù)例 12點(diǎn)圖已觀察兩變量之間有直線趨勢(shì),現(xiàn)計(jì)算相關(guān)系數(shù)。 四 相關(guān)系數(shù)的假設(shè)檢驗(yàn) : 常用方法有 t 檢驗(yàn)和查表法。 (一) t 檢驗(yàn): 1. 檢驗(yàn)假設(shè): =0 0 = 2102 n/自由度為 2 n 1 2128 1 定 =120, 查 0)= 本例的 = 0) , P 按 =絕 接受 認(rèn)為糖尿病患者血糖和胰島素之間存在負(fù)的直線相關(guān)關(guān)系。 根據(jù)自由度 , 查相關(guān)系數(shù) 查出 ),若 r ) , 則認(rèn)為 P不拒絕 若 r ) , 則認(rèn)為 P拒絕 接受 本例 =120,查 0)=0)= r =3) , P 0,,則 P 3) , P =絕 接受 認(rèn)為糖尿病患者血糖和胰島素之間存在負(fù)的直線回歸關(guān)系。 10212 四、 回歸方程的應(yīng)用 : 1. 描述兩個(gè)變量之間的數(shù)量依存關(guān)系 。 2. 利用回歸方程進(jìn)行預(yù)測(cè) :由 的值 。 3. 利用回歸方程進(jìn)行控制 :由 的取值范圍 。 已知空氣氮氧化物 (Y )的污染與汽車流量(X )的回歸關(guān)系 , 當(dāng)確定 控制 第四節(jié) 直線相關(guān)與回歸分析的關(guān)系 資料上 : 相關(guān)要求 為隨機(jī)變量,且 服從正態(tài)分布 (雙變量正態(tài)分布 )。 回歸要求 從正態(tài)分布; 型回歸。 為隨機(jī)變量,均服從正態(tài)分布;稱 型回歸。 一、直線回歸與相關(guān)的區(qū)別和聯(lián)系: 應(yīng)用上 : 說明變量間的依存變化關(guān)系用回歸;說明變量間的相互變化關(guān)系用相關(guān)。 總回2222. 聯(lián)系 : (1)同一組資料, r與 (2)同一樣本, (3)用回歸解釋相關(guān) 。 ( 二、應(yīng)用相關(guān)與回歸分析時(shí)應(yīng)注意的問題: 1 要求應(yīng)變量 通常自變量 2. 進(jìn)行相關(guān)與回歸分析時(shí)要有實(shí)際意義 。 3. 相關(guān)關(guān)系不一定是因果關(guān)系,也可能僅是表面上的伴隨關(guān)系。 4. 不能只根據(jù)相關(guān)系數(shù)絕對(duì)值的大小來推斷兩事物現(xiàn)象之間有無相關(guān)以及相關(guān)的密切程度,而必須進(jìn)行相關(guān)系數(shù)的假設(shè)檢驗(yàn)。 5. 不要把相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義誤解為兩事物或現(xiàn)象相關(guān)的密切程度。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論