版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第九章雙變量回歸與相關單變量univariate 計量資料第一節(jié)直線回歸一、 直線回歸的概念散點圖scatterplot自變量independentvariable X應變量dependentvariable Y直線回歸linearregression簡單回歸simpleregression 直線回歸方程linearregressionequationY=a+bX經(jīng)驗回歸方程,樣本回歸方程回歸方程的預測值predictedvaluea常數(shù)項constantterm 是回歸直線在Y軸上的截距intercept 當X取值為0時相應Y的均數(shù)估計值。b回歸系數(shù)coefficientofregression 是直線的斜率slope 當X變化一個單位時Y的平均改變的估計值。b>0時直線從左下方走向右上方,Y隨X的增大而增大b<0時直線從左上方走向右下方,Y隨X的增大而減小b=0時直線與X軸平行,Y與X無直線關系二、 直線回歸方程的求法殘差residual剩余值 “最小二乘”leastsumofsquaresLxy為X與Y的離均差交叉乘積和,離均差積和三、 直線回歸中的統(tǒng)計推斷(一) 回歸方程的假設檢驗1、 方差分析SS總=SS回+SS殘 V總=V回+V殘, V總=n-1, V回=1, V殘=n-2 F=【SS回/SS回】/【SS殘/V殘】=MS回/MS殘2、 t檢驗(二) 總體回歸系數(shù)B的可信區(qū)間(三) 利用回歸方程進行估計和預測1、 總體均數(shù)的可信區(qū)間2、 個體Y值得預測區(qū)間第二節(jié)直線相關一、 直線相關的概念直線相關linearcorrelation簡單相關simplecorrelation 散點圖 雙變量正態(tài)分布資料比variatenormaldistribution正相關positivecorrelation 兩變量X、Y同時下革算大或減小,變化趨勢是同向的負相關negativecorrelation X、Y間呈反向變化完全正相關perfectpositivecorrelation 在一條直線上,X、Y是同向變化完全負相關perfectnegativecorrelation 在同一直線上,X、Y呈反向變化零相關zerocorrelation 兩變量間沒有直線相關關系二、 相關系數(shù)的意義與計算相關系數(shù)correlationcoefficientPeason積差相關系數(shù)coefficientofproductmomentcorrelationr表示樣本相關系數(shù),p表示總體相關系數(shù)相關系數(shù)沒有單位,其值為-1《r《1r值為正 正相關r值為負 負相關r絕對值等于1——完全相關r=0 零相關三、 相關系數(shù)的統(tǒng)計推斷(一) 相關系數(shù)的假設檢驗(二) 總體相關系數(shù)的可信區(qū)間四、決定系數(shù)coefficientofdetermination 回歸平方與總平方和之比五、 直線回歸于相關應用的注意事項1、 根據(jù)分析目的選擇變量及統(tǒng)計方法2、 進行相關、回歸分析前應繪制散點圖3、 用殘差圖考察數(shù)據(jù)是否符合模型假設條件4、 結果的解釋及正確應用第三節(jié)秩相關秩相關rankcorrelation等級相關——是用雙變量等級數(shù)據(jù)作直線相關分析,對原變量分布不作要求,屬于非參數(shù)統(tǒng)計方法。1、 不服從雙變量正態(tài)分布二而不宜作積差相關分析 原始數(shù)據(jù)的基本統(tǒng)計描述,直觀的散點圖2、 總體分布型未知3、 原始數(shù)據(jù)是用等級表示一、 Spearman秩相關二、 相同秩較多時Rs的校正第九章雙變量回歸與相關單變量資料散點圖變量間關系問題:1、 依存關系:應變量Y隨自變量X變化而變化——回歸分析2、 互依關系:應變量Y與自變量X間的彼此關系——相關分析第一節(jié)直線回歸兩變量的散點圖回歸一一兩個變量或多個變量之間某種數(shù)量依存關系直線回歸用直線方程來描述兩變量間的回歸關系一一直線回歸方程Y=a+bX直線回歸模型的四個假設1、線性linearity 反應變量均數(shù)與X間呈直線關系2、獨立independenc 個觀察值之間彼此獨立3、正態(tài)normality 對于任何給定的XY服從正態(tài)分布4、標準差相等equalstandarddeviation 對于任何X值,隨機變量Y的標準差相等直線回歸方程:Y=a+bXa常數(shù)項,回歸直線在Y軸上的截距intercept 其統(tǒng)計意義是當X=0時相應的均數(shù)估計值b斜率slope,回歸系數(shù)regressioncoefficient 當X變化一個單位時Y的平均改變的估計值(b個單位)b>0,Y隨X的增大而增大(減少而減少)——斜上b<0,Y隨X的增大而減少(減少而增大)——斜下b=0,Y與X無直線關系IbI越大,表示Y隨X變化越快,直線越陡峭。二、直線回歸方程的求法回歸系數(shù)與截距的計算殘差剩余值一一最小二乘法原理1、 繪制散點圖2、 計算X、Y、Lxx、Lyy、Lxy3、 求回歸系數(shù)b和截距a4、 列出回歸方程三、直線回歸中的統(tǒng)計推斷(一) 回歸方程的假設檢驗1、 方差分析法SS總=、,回+SS殘F=MS回/MS殘2、t檢驗 t=F平方根(二) 總體回歸系數(shù)的可信區(qū)間(三) 利用回歸方程進行估計與預測1、 總體均數(shù)的可信區(qū)間2、 個體Y值的預測區(qū)間第二節(jié)直線相關linearcorrelation一、 直線相關的概念直線相關分析:描述兩變量間是否有直線關系以及直線關系的方向和密切程度的分析方法。條件:兩變量X、Y都來自正態(tài)分布的隨機變量散點呈橢圓形分布一一XY同時增減一一正相關 XY此增彼減一一負相關散點在同一條直線上一XY變化趨勢相同——完全正相關 不同一一完全負相關XY變化互不影響或無直線相關關系 零相關二、 相關系數(shù)的意義與計算直線相關系數(shù)pearson積差相關系數(shù)一說明具有直線關系的兩變量間相關的密切程度與相關方向的指標r樣本相關系數(shù),p總體相關系數(shù)r無單位,-1《r《1r值為正——正相關r一負——負相關IrI=1 完全相關IrI=0 零相關步驟:1、繪制散點圖2、計算樣本相關系數(shù)r的大小與樣本量有關特別n=2,當兩個點的連線不平行于橫軸和縱軸時,r=1或r=-1樣本相關系數(shù)大小不能直接評價兩個變量之間的相關性三、 相關系數(shù)的統(tǒng)計推斷(一) 相關系數(shù)的假設檢驗1、 t檢驗2、 查表法(二) 總體相關系數(shù)的可信區(qū)間 正態(tài)分布四、 決定系數(shù)coefficientofdeterminationR=SS回/SS總對直線回歸的擬合優(yōu)度檢驗等價于對總體回歸系數(shù)的假設檢驗五、 直線回歸與應用相關的注意事項1、 根據(jù)分析目的選擇變量及統(tǒng)計方法2、 進行相關、回歸分析前應繪制散點圖3、 用殘差圖考察數(shù)據(jù)是否符合模型的假設條件4、結果的解釋及正確應用直線相關與回歸的區(qū)別與聯(lián)系區(qū)1、資料要求不同別直線回歸要求應變量Y服從正態(tài)分布,X可以是精確測量和嚴格控制的變量,一般稱為I型回歸;直線相關要求兩個變量XY服從雙變量正態(tài)分布,這種資料若要進行回歸分析稱為II型回歸。2、 應用情況不同直線回歸說明兩變量間依存變化的數(shù)量關系,直線相關則是說明兩變量的相關關系3、 r與b有區(qū)別(1) 、取值范圍不同(2) 意義不同:r說明具有直線關系的兩個變量間關系的密切程度與相關方向;b表示X每改變一個單位Y平均改變b個單位。(3) 回歸系數(shù)與原度量單位有關,二相關系數(shù)無單位聯(lián)1、r與b正負號一致系r為正時,b也為正,表示兩變量是正相關,是同向變化?!?, 負, 負相一反向變化2、r與b的假設檢驗等價對同一組資料若同時進行r與b的假設檢驗,可得到相同的t值;可用r的假設檢驗代替b的假設檢驗3、 II型回歸4、 可用回歸解釋相關決定系數(shù):即相關系數(shù)的平方,是回歸平方和與總的離均差平方和之比,反映應變量Y的總變異中可用回歸關系解釋的部分。越接近于"表明利用回歸方程進行預測越有意義第三節(jié)等級相關Spearman等級相關Rs等級相關系數(shù):說明2個變量相關關系的密切程度與相關方向的等級相一秩相 種非參數(shù)統(tǒng)計方法適用于:1、 雙變量來自非正態(tài)總體2、 總體分布未知3、 數(shù)據(jù)一端或兩端不確定的資料(開放型資料)4、 等級資料n《50 查rs界值表n>50 u檢驗第九章雙變量回歸與相關醫(yī)學統(tǒng)計學工作的步驟(內容):1、 設計2、 收集資料:準確、完整、及時3、 整理資料:系統(tǒng)化、條理化4、 分析資料(1)統(tǒng)計描述一一變量的特征;集中趨勢、離散趨勢(2)統(tǒng)計描述 參數(shù)估計(樣本統(tǒng)計量/總體參數(shù)) 假設檢驗(比較樣本之間統(tǒng)計量的差別;不同樣本是否屬于同一總體)共同特點:研究的變量是單一的客觀事物之間是相互聯(lián)系的,僅對變量進行單獨的研究是不夠的。兩個變量的關系是確定的、絕對穩(wěn)定的,可以用數(shù)學函數(shù)式表述一一兩個變量的關系是非確定的,表現(xiàn)為隨機性的一種趨勢。1、 依存關系一一因變量隨自變量而定一一回歸分析2、 相關關系一一因變量與自變量共變一一相關分析第一節(jié)直線回歸一、 直線回歸概念一一用來分析兩變量呈直線依存關系的統(tǒng)計方法 要求因變量資料呈正態(tài)分布Y=a+bX二、 直線回歸方程的求法殘差 最小二乘法三、 回歸直線的繪制四、 直線回歸的統(tǒng)計推斷由于抽樣誤差的存在,即使從回歸系數(shù)B=0的XY總體中隨機抽樣,所得到的樣本回歸系數(shù)b也不一定=0.因此需要對B是否為0作假設檢驗。(一)Lyy的分析——SS總=SS回+SS剩SS總是Y的總變異,即未考慮影響因素時Y的變異SS回反映由于X與Y的回歸關系而引起的Y的變異部分SS剩反映X對Y的線性影響之夕卜的一切因素引起的Y的變異部分,即考慮回歸之后Y真正的隨機誤差。自由度:V總=n-1,V回=1,V剩=n-2(二) 方差分析一一F=MS回/MS剩(三) t檢驗 t2=F(四) 直線回歸方程的應用1、 利用回歸方程分析兩變量的依存關系2、 利用回歸方程進行預測3、 利用回歸方程進行統(tǒng)計控制第二節(jié)直線相關一、 直線相關的概念一一用來分析兩變量呈直線型相關關系的統(tǒng)計方法一一要求兩變量資料都呈正態(tài)分布二、 根據(jù)散點圖的分布——正相關、負相關、完全正相關、完全負相關、無相關(0相關)、非線性相關三、 相關系數(shù)的計算及意義r無單位,-1《r《1r>0 正相關r<0 負相關r=0 零相關
IrI=1完全相關IrI=1完全相關同一組資料,相關系數(shù)r與回歸系數(shù)b的符號相同四、 相關系數(shù)的假設檢驗r不等于0原因:p=0由于抽樣誤差引起;p不等于0,存在相關關系1、 t檢驗2、 查r界值表五、 決定系數(shù)——在總平方和中回歸平方和所占的比重。——其值大小反映了回歸貢獻的相對程度——也就是Y的總變異中回歸關系所能解釋的百分比。1、 回歸平方和的大小決定了相關系數(shù)r絕對值的大小,回歸平方和越接近總平方和,則r絕對值越接近1,說明相關的實際效果越好。2、 利用決定系數(shù)還可對回歸或相關作假設檢驗。F值與回歸系數(shù)的方差分析的F值一致,F(xiàn)與回歸系數(shù)、相關系數(shù)的t檢驗的t2相等。第三節(jié)直線相關與直線回歸的關系一、進行回歸和相關分析時的注意事項(1) 做回歸分析和相關分析時一定要有實際意義。 內在聯(lián)系;Y正態(tài)分布;X正態(tài)分布、能精確測量和嚴格控制的非隨機變量。(2) 在進行回歸和相關分析前,應繪制散點圖。 模型基本假設;異常點(3)直線回歸方程用于預測時應盡量避免不合理的外延雙變量小樣本的直線回歸方程經(jīng)t檢驗只能推斷總體兩變量間有無直線關系,二不能推斷相關的密切程度,要推斷相關的密切程度樣本含量必須很大。對結果應有正確解釋。反映兩變量間數(shù)量上影響大小的統(tǒng)計量應該是回歸系數(shù)的絕對值,而不是假設檢驗的P值。P值越小只能說越有理由認為變量間的直線關系存在,而不能說關系越密切或越“顯著氣相關關系不一定是因果關系,也可能是伴隨關系,有相關關系不能證明事物間確有內在聯(lián)系。二、回歸和相關的區(qū)別1、 資料要求不同回歸要求因變量Y服從正態(tài)分布,X是可以精確測量和嚴格?控制的變量,一般稱為I型回歸。相關要求兩個變量X、Y服從雙變量正態(tài)分布,這種資料若進行回歸分析稱為II型回歸。2、 應用情況不同回歸用于表述兩變量間的依存關系,是單向的。相關用于表述兩變量間的相關關系,是雙向的。3、 相關系數(shù)和回歸系數(shù)的絕對值大小無直接關系-1《r《1,r無單位-&&<b<&&,b有單位三、回歸與相關
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 寧蕪鐵路擴能改造工程(220千伏牧板2588線、220千伏東板2589線塔桿線遷移項目)環(huán)境影響報告表
- 流程培訓課件
- 流水線培訓教學課件
- 活性炭培訓教學課件
- 活動執(zhí)行安全培訓
- 2026年英文詞匯與語法高階運用題集
- 2026年旅游規(guī)劃與實施實操測驗
- 2026年法學考研法理學重點知識專項突破題集
- 2026年軟件工程師高級水平測試題集
- 2026年英語能力提升托??荚嚹M題及答案解析
- 標準化在企業(yè)知識管理和學習中的應用
- 高中思政課考試分析報告
- 發(fā)展?jié)h語中級閱讀教學設計
- 《異丙腎上腺素》課件
- 本質安全設計及其實施
- 超聲引導下椎管內麻醉
- 包裝秤說明書(8804C2)
- 中小學教師職業(yè)道德考核辦法
- 大門圍墻施工組織設計方案
- 濟青高速現(xiàn)澆箱梁施工質量控制QC成果
- 管道對接施工方案正式版
評論
0/150
提交評論