版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第七章 簡單相關與回歸,衛(wèi)生統(tǒng)計學教研室,2020/8/7,2020/8/7,直線相關:又稱簡單相關(simple correlation),用于描述兩個變量之間的線性相關程度。 經(jīng)典相關分析要求X與Y都是隨機變量,而且服從雙變量正態(tài)分布。 相關關系的統(tǒng)計量使人們對變量間的相關關系是否成立、相關的性質和強弱等有了量化依據(jù)。,一、線性相關( linear correlation ),相關系數(shù)(correlation coefficient),又稱積差相關系數(shù)或 Pearson 相關系數(shù)(軟件中常用此名稱)以及spearman相關系數(shù); 定量描述線性相關程度的一個常用指標,說明相關的密切程度和方向
2、。,2020/8/7,線性相關( linear correlation ),計算公式,相關系數(shù)的特點: 相關系數(shù)r是表示兩個隨機變量之間直線相關強度和方向的統(tǒng)計量,是一個無量綱的數(shù)值,取值范圍-1 r 1; r的正負值表示兩變量之間直線相關的方向,即 r0為正相關,r0為負相關,r=0為零相關;r與回歸系數(shù)b的符號相同; r的絕對值大小表示兩變量之間直線相關的密切程度,r 越接近于1,說明密切程度越高,r越接近于0,說明密切程度越低。,2020/8/7,線性相關( linear correlation ),相關系數(shù)的假設檢驗:,r0原因: 由于抽樣誤差引起,=0 存在相關關系, 0 檢驗方法:
3、 直接查表法(r界值表), t 檢驗;,2020/8/7,公式,Sr- 相關系數(shù)的標準誤,線性相關( linear correlation ),二、線性回歸(linear regression),定義 用直線方程表達X(自變量,independent variable) 和Y(應變量, dependent variables)之間的數(shù)量關系。 是Y(實測值)的預測值(predictive value),b是直 線的斜率,即X每變化一單位,Y相應的變化b個單位。a為截距,即X為0時Y值的大小。,2020/8/7,二、線性回歸(linear regression),直線回歸的前提假設(LINE)
4、線性 Linearity 反應變量均數(shù) 與X間呈線性關系:Y|X= + X 獨立 Independence每一觀察值之間彼此獨立 正態(tài) Normality 對于任何給定的 X:Y均服從正態(tài)分布 等方差 Equal variance 對于任何X值,隨機變量Y的標準差 Y|X相等,2020/8/7,線性回歸(linear regression),回歸直線的建立主要是基于最小二乘法(least-squares ,LS),即各實測點與擬合直線之間縱向距離的平方和最小。 線性回歸的主要運用:統(tǒng)計預測與統(tǒng)計控制 統(tǒng)計預測:給定X值,估計Y; 統(tǒng)計控制(逆估計):要求Y在一定范圍內波動,可通過X的取值來實現(xiàn)
5、。,2020/8/7,二、線性回歸(linear regression),注意: 做直線回歸之前,先做散點圖,是確定兩變量之間是否有關系的最簡單的好方法。 回歸系數(shù)(b)的假設檢驗 判斷直線回歸方程是否成立,需要檢驗總體回歸系數(shù)是否為0。 方法一:t檢驗 兩種方法等價, 方法二:F檢驗 只有當 0,才能認為直線回歸方程成立(具有統(tǒng)計學意義)。,2020/8/7,2020/8/7,1. 資料:,相關 X、Y均為隨機變量,且服從雙變量正態(tài)分布,回歸 Y為正態(tài)隨機變量,X為固定的非隨機變量,2.意義與應用:,回歸 反映兩變量間的依存關系,相關 反映兩變量間的相互關系,3.回歸系數(shù)與原度量單位有關,而
6、相關系數(shù)無關,區(qū)別,三、相關與回歸的區(qū)別和聯(lián)系,2020/8/7,聯(lián)系,相關與回歸的區(qū)別和聯(lián)系,1. 根據(jù)分析目的選擇變量及統(tǒng)計方法,2020/8/7,直線相關用于說明兩變量之間直線關系的方向和密切程 度,X與Y 沒有主次之分 直線回歸則進一步用于定量刻畫應變量Y 對自變量X 在數(shù) 值上的依存關系,其中應變量的定奪主要依專業(yè)要求而定, 可以考慮把易于精確測量的變量作為X,另一個隨機變量作Y 例如用身高估計體表面積 兩個變量的選擇一定要結合專業(yè)背景,不能把毫無關聯(lián)的兩 種現(xiàn)象勉強作回歸或相關分析,四、相關與回歸應用的注意事項,2. 進行相關、回歸分析前應繪制散點圖第一步,2020/8/7,散點圖
7、可考察兩變量是否有直線趨勢 可發(fā)現(xiàn)異常點(outlier),散點圖對異常點的識別與處理需要從專業(yè)知識和現(xiàn)有數(shù)據(jù)兩方面來考慮,結果可能是現(xiàn)有回歸模型的假設錯誤需要改變模型形式,也可能是抽樣誤差造成的一次偶然結果甚至過失誤差。需要認真核對原始數(shù)據(jù)并檢查其產(chǎn)生過程認定是過失誤差,或者通過重復測定確定是抽樣誤差造成的偶然結果,才可以謹慎地剔除或采用其它估計方法。,相關與回歸應用的注意事項,3. 資料的要求,2020/8/7,直線相關分析要求 X與Y 服從雙變量正態(tài)分布 直線回歸要求至少對于每個 X 相應的 Y 要服從正態(tài)分 布,X可以是服從正態(tài)分布的隨機變量也可以是能精確 測量和嚴格控制的非隨機變量
8、對于雙變量正態(tài)分布資料,根據(jù)研究目的可選擇由 X 估計 Y 或者由 Y 估計 X ,一般情況下兩個回歸方程不 相同,相關與回歸應用的注意事項,4. 結果解釋及正確應用,2020/8/7,反應兩變量關系密切程度或數(shù)量上影響大小的統(tǒng)計量 應該是回歸系數(shù)或相關系數(shù)的絕對值,而不是假設檢 驗的P值 P值越小只能說越有理由認為變量間的直線關系存在, 而不能說關系越密切或越“顯著” 不能任意“外延”;直線回歸用于預測時,其適用范圍一般不應超出樣本中自變量的取值范圍,相關與回歸應用的注意事項,例題(相關與回歸),例題7.1 在某克山病區(qū)測量12名健康兒童頭發(fā)中的硒含量與血液中的硒含量,其結果如表1所示。問兒
9、童頭發(fā)中的硒含量與血液中的硒含量是否相關,是否能求出以血液中的硒含量為因變量的回歸方程。,2020/8/7,相關SPSS操作步驟,2020/8/7,一、 繪制散點圖,二、對X/Y變量做正態(tài)性檢驗,三、相關spss步驟,有線性趨勢,X/Y變量均成正態(tài)分布,1.相關SPSS操作步驟,散點圖結果 有線性趨勢,2020/8/7,正態(tài)性檢驗結果 發(fā)硒值(X)、血硒值(Y)的P0.05,均成正態(tài)分布。,1.相關SPSS操作步驟,相關過程步 Analyze Correlate Bivariate Correlations,2020/8/7,等級相關系數(shù) 非參數(shù)方法,積矩相關系數(shù) 參數(shù)方法,Kendalls
10、相關系數(shù):用于反映分類變量一致性的指標, 只能在兩個變量均為有序分類時使用。,1.相關SPSS結果,2020/8/7,結果解釋: 相關系數(shù)r=0.880,雙側Pearson檢驗p0.001,有統(tǒng)計學意義,可認為血硒值與發(fā)硒值呈正相關關系。,問題: 是否能求出以血液中的硒含量為因變量的回歸方程?,2020/8/7,2、回歸SPSS操作,回歸過程步 正態(tài)性、散點圖 Analyze Regression Linear,2020/8/7,2、回歸SPSS操作,2020/8/7,檢驗殘差序列是否存在相關關系,2、回歸SPSS結果,結果解釋 相關系數(shù)R=0.880,R2=0.774,表示血硒值(因變量)的變異中77.4%可由發(fā)硒值(自變量)來解釋,說明血硒值的變化能較好的運用發(fā)硒值的變化來解釋。,2020/8/7,2、回歸SPSS結果,結果解釋 經(jīng)F檢驗,F(xiàn)=34.156,P0.001,差
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026屆河南省濮陽市臺前一高數(shù)學高二上期末學業(yè)水平測試模擬試題含解析
- 內鄉(xiāng)介紹教學課件
- 烘焙培訓機構的管理制度(3篇)
- 美術功能室管理制度小學(3篇)
- 轉運司機的閉環(huán)管理制度(3篇)
- 采樣儀器維護和管理制度(3篇)
- 中學學生社團活動成果展示制度
- 養(yǎng)老院消毒隔離制度
- 企業(yè)企業(yè)文化與團隊建設制度
- 2026湖南邵陽市邵東市人才引進62人參考題庫附答案
- 各品牌挖掘機挖斗連接尺寸數(shù)據(jù)
- 四川省成都市八年級上學期物理期末考試試卷及答案
- 中醫(yī)學的刮痧療法課件
- 國際象棋的規(guī)則和走法
- GB/T 38697-2020塊菌(松露)鮮品質量等級規(guī)格
- 三菱FX3U系列PLC編程技術與應用-第二章課件
- RoHS培訓資料課件
- 蒙古酒文化課件
- 《傭金協(xié)議》word版
- 協(xié)調控制系統(tǒng)
- 消防報警系統(tǒng)線路設計檢查和安裝質量檢查記錄
評論
0/150
提交評論