版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、直線相關(guān)與回歸 中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系林愛華第1頁,共41頁。主要內(nèi)容 直線相關(guān) 等級(jí)相關(guān) 直線回歸 直線相關(guān)與回歸的區(qū)別與聯(lián)系第2頁,共41頁。 前面我們討論了對(duì)單個(gè)變量的統(tǒng)計(jì)分析方法,著重于比較該單個(gè)變量的組間差別。 醫(yī)學(xué)研究中常需分析變量間的關(guān)系,如血壓與年齡。相關(guān)(correlation) 與回歸(regression)是研究?jī)蓚€(gè)或多個(gè)隨機(jī)變量之間相互關(guān)系的重要的統(tǒng)計(jì)分析方法,應(yīng)用廣泛。第3頁,共41頁。 相關(guān)是研究隨機(jī)變量之間相互聯(lián)系的密切程度和方向。 回歸是研究隨機(jī)變量之間的數(shù)量依存關(guān)系。本章介紹兩個(gè)變量間的直線回歸與相關(guān),及等級(jí)相關(guān)。第4頁,共41頁。第一節(jié) 直
2、線相關(guān) 一、直線相關(guān)的概念: 當(dāng)兩指標(biāo)間不獨(dú)立則為相關(guān),即某一指標(biāo)的取值與另一指標(biāo)的取值多少有關(guān)。探討兩個(gè)正態(tài)分布的隨機(jī)變量有無直線關(guān)系時(shí),統(tǒng)計(jì)學(xué)中用一個(gè)統(tǒng)計(jì)量描述直線相關(guān)的密切程度和方向,這個(gè)統(tǒng)計(jì)量稱相關(guān)系數(shù),記為r。 相關(guān)系數(shù)的絕對(duì)值必然在0到1之間,即: 第5頁,共41頁。相關(guān)系數(shù)的大小表示相關(guān)的密切程度,例:體重與肺活量,胸圍與肺活量相關(guān)系數(shù)的符號(hào)表示相關(guān)的方向, 例:身高與體重,年齡與鈣的吸收量第6頁,共41頁。第7頁,共41頁。 從研究總體隨機(jī)抽取n個(gè)對(duì)象,每個(gè)對(duì)象觀察X和Y兩項(xiàng)指標(biāo),或者從已經(jīng)配成對(duì)子的研究總體中隨機(jī)抽取n對(duì)對(duì)象,每對(duì)對(duì)象觀察同一指標(biāo)。要求:獨(dú)立隨機(jī)的成對(duì)樣本,并
3、且X 和Y來自正態(tài)總體,這樣的研究所獲得的資料就可以做直線相關(guān)分析。二. 相關(guān)分析的資料來源:第8頁,共41頁。例12-1 某醫(yī)生隨機(jī)抽查了12名糖尿病患者的空腹血糖及胰島素值,數(shù)據(jù)見下表,試做相關(guān)分析。第9頁,共41頁。三、直線相關(guān)的統(tǒng)計(jì)描述: 1散點(diǎn)圖: 考察相關(guān)性最簡(jiǎn)單而直觀的辦法是散點(diǎn)圖。以兩條互相垂直的座標(biāo)軸分別表示兩個(gè)變量,n對(duì)觀察值對(duì)應(yīng)于座標(biāo)平面的n個(gè)點(diǎn),便構(gòu)成一幅散點(diǎn)圖。 本資料繪制成散點(diǎn)圖(Scatter plot)如下: 第10頁,共41頁。第11頁,共41頁。2. 相關(guān)系數(shù)的計(jì)算: (分子決定正負(fù)號(hào)) 第12頁,共41頁。本例,代入公式,得根據(jù)例12-1的資料,散點(diǎn)圖已觀
4、察兩變量之間有直線趨勢(shì),現(xiàn)計(jì)算相關(guān)系數(shù)。第13頁,共41頁。四相關(guān)系數(shù)的假設(shè)檢驗(yàn):常用方法有t 檢驗(yàn)和查表法。 (一) t 檢驗(yàn):1.檢驗(yàn)假設(shè):H0:=0 H1:0 =0.05 Sr為相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤自由度為 2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量:第14頁,共41頁。3確定P值和判斷結(jié)果: =12-2=10, 查t值表t0.01(10)=3.169, 本例的tr=4.392 t0.01(10) , P0.01, 按=0.05的水準(zhǔn),拒絕H0,接受H1, 認(rèn)為糖尿病患者血糖和胰島素之間存在負(fù)的直線相關(guān)關(guān)系。 第15頁,共41頁。 根據(jù)自由度,查相關(guān)系數(shù)r界值表,查出r0.05(),若r r0.05() ,則認(rèn)為
5、P0.05,不拒絕H0。 若r r0.05() , 則認(rèn)為P0.05,拒絕H0,接受H1。 本例=12-2=10,查r界值表,r0.05(10)=0.576,r0.01(10)=0.708, r =0.8115 r0.01(13) , P rs(10,0.02) ,則P t0.01(13) ,P0.01,按=0.05水準(zhǔn),拒絕H0 ,接受H1,認(rèn)為糖尿病患者血糖和胰島素之間存在負(fù)的直線回歸關(guān)系。 第35頁,共41頁。四、 回歸方程的應(yīng)用: 1. 描述兩個(gè)變量之間的數(shù)量依存關(guān)系。 2. 利用回歸方程進(jìn)行預(yù)測(cè):由X預(yù)測(cè)Y的值。 3. 利用回歸方程進(jìn)行控制:由Y值控制X的取值范圍。 已知空氣氮氧化物
6、(Y )的污染與汽車流量(X )的回歸關(guān)系,當(dāng)確定Y的標(biāo)準(zhǔn)后,控制X的值。 第36頁,共41頁。第四節(jié) 直線相關(guān)與回歸分析的關(guān)系1.區(qū)別:資料上: 相關(guān)要求X與Y為隨機(jī)變量,且X和Y服從正態(tài)分布(雙變量正態(tài)分布)?;貧w要求Y為隨機(jī)變量,服從正態(tài)分布;X可人為取值,稱型回歸。X與Y為隨機(jī)變量,均服從正態(tài)分布;稱型回歸。 一、直線回歸與相關(guān)的區(qū)別和聯(lián)系:第37頁,共41頁。應(yīng)用上: 說明變量間的依存變化關(guān)系用回歸;說明變量間的相互變化關(guān)系用相關(guān)。2. 聯(lián)系: (1)同一組資料,r與b正負(fù)號(hào)一致。 (2)同一樣本,tr =tb 。 (3)用回歸解釋相關(guān)。(r2為確定系數(shù)。)第38頁,共41頁。二、應(yīng)用相關(guān)與回歸分析時(shí)應(yīng)注意的問題: 1要求應(yīng)變量Y服從正態(tài)分布,通常自變量X為可以精確測(cè)量或嚴(yán)格控制的因素。 2. 進(jìn)行相關(guān)與回歸分析時(shí)要有實(shí)際意義。 3. 相關(guān)關(guān)系不一定是因果關(guān)系,也可能僅是表面上的伴隨關(guān)系。 4. 不能只根據(jù)相關(guān)系數(shù)絕對(duì)值的大小來推斷兩事物現(xiàn)象之間有無相關(guān)以及相關(guān)的密切程度,而必須進(jìn)行相關(guān)系數(shù)的假設(shè)檢驗(yàn)。第39頁,共41頁。5. 不要把相關(guān)系數(shù)有統(tǒng)計(jì)學(xué)意義誤解為兩事物或現(xiàn)象相關(guān)的密切程度。6回歸方程一般只適用于自變量X實(shí)測(cè)數(shù)據(jù)的范圍內(nèi),不能隨意外推。7進(jìn)行回歸和相關(guān)分析之前,最好先繪制
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年陜西國防工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- 2026年青海交通職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫含詳細(xì)答案解析
- 2026年安徽揚(yáng)子職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026廣東湛江市旅游投資集團(tuán)有限公司招聘1人考試重點(diǎn)題庫及答案解析
- 2026年湘潭醫(yī)衛(wèi)職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫含詳細(xì)答案解析
- 2026年吐魯番職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試參考題庫含詳細(xì)答案解析
- 2026年滁州城市職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 2026年西南財(cái)經(jīng)大學(xué)天府學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫含詳細(xì)答案解析
- 2026年贛州職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試備考題庫及答案詳細(xì)解析
- 2026年河北石油職業(yè)技術(shù)大學(xué)單招綜合素質(zhì)筆試備考試題含詳細(xì)答案解析
- 公司雙選工作方案
- 村財(cái)務(wù)管理制度
- 腸梗阻的診斷和治療方案
- 急性心力衰竭中國指南(2022-2024)解讀
- T-SXCAS 015-2023 全固廢低碳膠凝材料應(yīng)用技術(shù)標(biāo)準(zhǔn)
- 《冠心病》課件(完整版)
- 醫(yī)師師承關(guān)系合同范例
- 汽車電器DFMEA-空調(diào)冷暖裝置
- 中注協(xié)財(cái)務(wù)報(bào)表審計(jì)工作底稿(第二版)全文
- 內(nèi)蒙古呼和浩特市2024屆中考數(shù)學(xué)模擬精編試卷含解析
- 班后會(huì)記錄表
評(píng)論
0/150
提交評(píng)論