版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第九章雙變量回歸與相關(guān)單變量univariate 計量資料第一節(jié)直線回歸一、 直線回歸的概念散點圖scatterplot自變量independentvariable X應(yīng)變量dependentvariable Y直線回歸linearregression簡單回歸simpleregression 直線回歸方程linearregressionequationY=a+bX經(jīng)驗回歸方程,樣本回歸方程回歸方程的預(yù)測值predictedvaluea常數(shù)項constantterm 是回歸直線在Y軸上的截距intercept 當(dāng)X取值為0時相應(yīng)Y的均數(shù)估計值。b回歸系數(shù)coefficientofregression 是直線的斜率slope 當(dāng)X變化一個單位時Y的平均改變的估計值。b>0時直線從左下方走向右上方,Y隨X的增大而增大b<0時直線從左上方走向右下方,Y隨X的增大而減小b=0時直線與X軸平行,Y與X無直線關(guān)系二、 直線回歸方程的求法殘差residual剩余值 “最小二乘”leastsumofsquaresLxy為X與Y的離均差交叉乘積和,離均差積和三、 直線回歸中的統(tǒng)計推斷(一) 回歸方程的假設(shè)檢驗1、 方差分析SS總=SS回+SS殘 V總=V回+V殘, V總=n-1, V回=1, V殘=n-2 F=【SS回/SS回】/【SS殘/V殘】=MS回/MS殘2、 t檢驗(二) 總體回歸系數(shù)B的可信區(qū)間(三) 利用回歸方程進行估計和預(yù)測1、 總體均數(shù)的可信區(qū)間2、 個體Y值得預(yù)測區(qū)間第二節(jié)直線相關(guān)一、 直線相關(guān)的概念直線相關(guān)linearcorrelation簡單相關(guān)simplecorrelation 散點圖 雙變量正態(tài)分布資料比variatenormaldistribution正相關(guān)positivecorrelation 兩變量X、Y同時下革算大或減小,變化趨勢是同向的負相關(guān)negativecorrelation X、Y間呈反向變化完全正相關(guān)perfectpositivecorrelation 在一條直線上,X、Y是同向變化完全負相關(guān)perfectnegativecorrelation 在同一直線上,X、Y呈反向變化零相關(guān)zerocorrelation 兩變量間沒有直線相關(guān)關(guān)系二、 相關(guān)系數(shù)的意義與計算相關(guān)系數(shù)correlationcoefficientPeason積差相關(guān)系數(shù)coefficientofproductmomentcorrelationr表示樣本相關(guān)系數(shù),p表示總體相關(guān)系數(shù)相關(guān)系數(shù)沒有單位,其值為-1《r《1r值為正 正相關(guān)r值為負 負相關(guān)r絕對值等于1——完全相關(guān)r=0 零相關(guān)三、 相關(guān)系數(shù)的統(tǒng)計推斷(一) 相關(guān)系數(shù)的假設(shè)檢驗(二) 總體相關(guān)系數(shù)的可信區(qū)間四、決定系數(shù)coefficientofdetermination 回歸平方與總平方和之比五、 直線回歸于相關(guān)應(yīng)用的注意事項1、 根據(jù)分析目的選擇變量及統(tǒng)計方法2、 進行相關(guān)、回歸分析前應(yīng)繪制散點圖3、 用殘差圖考察數(shù)據(jù)是否符合模型假設(shè)條件4、 結(jié)果的解釋及正確應(yīng)用第三節(jié)秩相關(guān)秩相關(guān)rankcorrelation等級相關(guān)——是用雙變量等級數(shù)據(jù)作直線相關(guān)分析,對原變量分布不作要求,屬于非參數(shù)統(tǒng)計方法。1、 不服從雙變量正態(tài)分布二而不宜作積差相關(guān)分析 原始數(shù)據(jù)的基本統(tǒng)計描述,直觀的散點圖2、 總體分布型未知3、 原始數(shù)據(jù)是用等級表示一、 Spearman秩相關(guān)二、 相同秩較多時Rs的校正第九章雙變量回歸與相關(guān)單變量資料散點圖變量間關(guān)系問題:1、 依存關(guān)系:應(yīng)變量Y隨自變量X變化而變化——回歸分析2、 互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系——相關(guān)分析第一節(jié)直線回歸兩變量的散點圖回歸一一兩個變量或多個變量之間某種數(shù)量依存關(guān)系直線回歸用直線方程來描述兩變量間的回歸關(guān)系一一直線回歸方程Y=a+bX直線回歸模型的四個假設(shè)1、線性linearity 反應(yīng)變量均數(shù)與X間呈直線關(guān)系2、獨立independenc 個觀察值之間彼此獨立3、正態(tài)normality 對于任何給定的XY服從正態(tài)分布4、標(biāo)準(zhǔn)差相等equalstandarddeviation 對于任何X值,隨機變量Y的標(biāo)準(zhǔn)差相等直線回歸方程:Y=a+bXa常數(shù)項,回歸直線在Y軸上的截距intercept 其統(tǒng)計意義是當(dāng)X=0時相應(yīng)的均數(shù)估計值b斜率slope,回歸系數(shù)regressioncoefficient 當(dāng)X變化一個單位時Y的平均改變的估計值(b個單位)b>0,Y隨X的增大而增大(減少而減少)——斜上b<0,Y隨X的增大而減少(減少而增大)——斜下b=0,Y與X無直線關(guān)系IbI越大,表示Y隨X變化越快,直線越陡峭。二、直線回歸方程的求法回歸系數(shù)與截距的計算殘差剩余值一一最小二乘法原理1、 繪制散點圖2、 計算X、Y、Lxx、Lyy、Lxy3、 求回歸系數(shù)b和截距a4、 列出回歸方程三、直線回歸中的統(tǒng)計推斷(一) 回歸方程的假設(shè)檢驗1、 方差分析法SS總=、,回+SS殘F=MS回/MS殘2、t檢驗 t=F平方根(二) 總體回歸系數(shù)的可信區(qū)間(三) 利用回歸方程進行估計與預(yù)測1、 總體均數(shù)的可信區(qū)間2、 個體Y值的預(yù)測區(qū)間第二節(jié)直線相關(guān)linearcorrelation一、 直線相關(guān)的概念直線相關(guān)分析:描述兩變量間是否有直線關(guān)系以及直線關(guān)系的方向和密切程度的分析方法。條件:兩變量X、Y都來自正態(tài)分布的隨機變量散點呈橢圓形分布一一XY同時增減一一正相關(guān) XY此增彼減一一負相關(guān)散點在同一條直線上一XY變化趨勢相同——完全正相關(guān) 不同一一完全負相關(guān)XY變化互不影響或無直線相關(guān)關(guān)系 零相關(guān)二、 相關(guān)系數(shù)的意義與計算直線相關(guān)系數(shù)pearson積差相關(guān)系數(shù)一說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向的指標(biāo)r樣本相關(guān)系數(shù),p總體相關(guān)系數(shù)r無單位,-1《r《1r值為正——正相關(guān)r一負——負相關(guān)IrI=1 完全相關(guān)IrI=0 零相關(guān)步驟:1、繪制散點圖2、計算樣本相關(guān)系數(shù)r的大小與樣本量有關(guān)特別n=2,當(dāng)兩個點的連線不平行于橫軸和縱軸時,r=1或r=-1樣本相關(guān)系數(shù)大小不能直接評價兩個變量之間的相關(guān)性三、 相關(guān)系數(shù)的統(tǒng)計推斷(一) 相關(guān)系數(shù)的假設(shè)檢驗1、 t檢驗2、 查表法(二) 總體相關(guān)系數(shù)的可信區(qū)間 正態(tài)分布四、 決定系數(shù)coefficientofdeterminationR=SS回/SS總對直線回歸的擬合優(yōu)度檢驗等價于對總體回歸系數(shù)的假設(shè)檢驗五、 直線回歸與應(yīng)用相關(guān)的注意事項1、 根據(jù)分析目的選擇變量及統(tǒng)計方法2、 進行相關(guān)、回歸分析前應(yīng)繪制散點圖3、 用殘差圖考察數(shù)據(jù)是否符合模型的假設(shè)條件4、結(jié)果的解釋及正確應(yīng)用直線相關(guān)與回歸的區(qū)別與聯(lián)系區(qū)1、資料要求不同別直線回歸要求應(yīng)變量Y服從正態(tài)分布,X可以是精確測量和嚴(yán)格控制的變量,一般稱為I型回歸;直線相關(guān)要求兩個變量XY服從雙變量正態(tài)分布,這種資料若要進行回歸分析稱為II型回歸。2、 應(yīng)用情況不同直線回歸說明兩變量間依存變化的數(shù)量關(guān)系,直線相關(guān)則是說明兩變量的相關(guān)關(guān)系3、 r與b有區(qū)別(1) 、取值范圍不同(2) 意義不同:r說明具有直線關(guān)系的兩個變量間關(guān)系的密切程度與相關(guān)方向;b表示X每改變一個單位Y平均改變b個單位。(3) 回歸系數(shù)與原度量單位有關(guān),二相關(guān)系數(shù)無單位聯(lián)1、r與b正負號一致系r為正時,b也為正,表示兩變量是正相關(guān),是同向變化?!摚?負, 負相一反向變化2、r與b的假設(shè)檢驗等價對同一組資料若同時進行r與b的假設(shè)檢驗,可得到相同的t值;可用r的假設(shè)檢驗代替b的假設(shè)檢驗3、 II型回歸4、 可用回歸解釋相關(guān)決定系數(shù):即相關(guān)系數(shù)的平方,是回歸平方和與總的離均差平方和之比,反映應(yīng)變量Y的總變異中可用回歸關(guān)系解釋的部分。越接近于"表明利用回歸方程進行預(yù)測越有意義第三節(jié)等級相關(guān)Spearman等級相關(guān)Rs等級相關(guān)系數(shù):說明2個變量相關(guān)關(guān)系的密切程度與相關(guān)方向的等級相一秩相 種非參數(shù)統(tǒng)計方法適用于:1、 雙變量來自非正態(tài)總體2、 總體分布未知3、 數(shù)據(jù)一端或兩端不確定的資料(開放型資料)4、 等級資料n《50 查rs界值表n>50 u檢驗第九章雙變量回歸與相關(guān)醫(yī)學(xué)統(tǒng)計學(xué)工作的步驟(內(nèi)容):1、 設(shè)計2、 收集資料:準(zhǔn)確、完整、及時3、 整理資料:系統(tǒng)化、條理化4、 分析資料(1)統(tǒng)計描述一一變量的特征;集中趨勢、離散趨勢(2)統(tǒng)計描述 參數(shù)估計(樣本統(tǒng)計量/總體參數(shù)) 假設(shè)檢驗(比較樣本之間統(tǒng)計量的差別;不同樣本是否屬于同一總體)共同特點:研究的變量是單一的客觀事物之間是相互聯(lián)系的,僅對變量進行單獨的研究是不夠的。兩個變量的關(guān)系是確定的、絕對穩(wěn)定的,可以用數(shù)學(xué)函數(shù)式表述一一兩個變量的關(guān)系是非確定的,表現(xiàn)為隨機性的一種趨勢。1、 依存關(guān)系一一因變量隨自變量而定一一回歸分析2、 相關(guān)關(guān)系一一因變量與自變量共變一一相關(guān)分析第一節(jié)直線回歸一、 直線回歸概念一一用來分析兩變量呈直線依存關(guān)系的統(tǒng)計方法 要求因變量資料呈正態(tài)分布Y=a+bX二、 直線回歸方程的求法殘差 最小二乘法三、 回歸直線的繪制四、 直線回歸的統(tǒng)計推斷由于抽樣誤差的存在,即使從回歸系數(shù)B=0的XY總體中隨機抽樣,所得到的樣本回歸系數(shù)b也不一定=0.因此需要對B是否為0作假設(shè)檢驗。(一)Lyy的分析——SS總=SS回+SS剩SS總是Y的總變異,即未考慮影響因素時Y的變異SS回反映由于X與Y的回歸關(guān)系而引起的Y的變異部分SS剩反映X對Y的線性影響之夕卜的一切因素引起的Y的變異部分,即考慮回歸之后Y真正的隨機誤差。自由度:V總=n-1,V回=1,V剩=n-2(二) 方差分析一一F=MS回/MS剩(三) t檢驗 t2=F(四) 直線回歸方程的應(yīng)用1、 利用回歸方程分析兩變量的依存關(guān)系2、 利用回歸方程進行預(yù)測3、 利用回歸方程進行統(tǒng)計控制第二節(jié)直線相關(guān)一、 直線相關(guān)的概念一一用來分析兩變量呈直線型相關(guān)關(guān)系的統(tǒng)計方法一一要求兩變量資料都呈正態(tài)分布二、 根據(jù)散點圖的分布——正相關(guān)、負相關(guān)、完全正相關(guān)、完全負相關(guān)、無相關(guān)(0相關(guān))、非線性相關(guān)三、 相關(guān)系數(shù)的計算及意義r無單位,-1《r《1r>0 正相關(guān)r<0 負相關(guān)r=0 零相關(guān)
IrI=1完全相關(guān)IrI=1完全相關(guān)同一組資料,相關(guān)系數(shù)r與回歸系數(shù)b的符號相同四、 相關(guān)系數(shù)的假設(shè)檢驗r不等于0原因:p=0由于抽樣誤差引起;p不等于0,存在相關(guān)關(guān)系1、 t檢驗2、 查r界值表五、 決定系數(shù)——在總平方和中回歸平方和所占的比重?!渲荡笮》从沉嘶貧w貢獻的相對程度——也就是Y的總變異中回歸關(guān)系所能解釋的百分比。1、 回歸平方和的大小決定了相關(guān)系數(shù)r絕對值的大小,回歸平方和越接近總平方和,則r絕對值越接近1,說明相關(guān)的實際效果越好。2、 利用決定系數(shù)還可對回歸或相關(guān)作假設(shè)檢驗。F值與回歸系數(shù)的方差分析的F值一致,F(xiàn)與回歸系數(shù)、相關(guān)系數(shù)的t檢驗的t2相等。第三節(jié)直線相關(guān)與直線回歸的關(guān)系一、進行回歸和相關(guān)分析時的注意事項(1) 做回歸分析和相關(guān)分析時一定要有實際意義。 內(nèi)在聯(lián)系;Y正態(tài)分布;X正態(tài)分布、能精確測量和嚴(yán)格控制的非隨機變量。(2) 在進行回歸和相關(guān)分析前,應(yīng)繪制散點圖。 模型基本假設(shè);異常點(3)直線回歸方程用于預(yù)測時應(yīng)盡量避免不合理的外延雙變量小樣本的直線回歸方程經(jīng)t檢驗只能推斷總體兩變量間有無直線關(guān)系,二不能推斷相關(guān)的密切程度,要推斷相關(guān)的密切程度樣本含量必須很大。對結(jié)果應(yīng)有正確解釋。反映兩變量間數(shù)量上影響大小的統(tǒng)計量應(yīng)該是回歸系數(shù)的絕對值,而不是假設(shè)檢驗的P值。P值越小只能說越有理由認(rèn)為變量間的直線關(guān)系存在,而不能說關(guān)系越密切或越“顯著氣相關(guān)關(guān)系不一定是因果關(guān)系,也可能是伴隨關(guān)系,有相關(guān)關(guān)系不能證明事物間確有內(nèi)在聯(lián)系。二、回歸和相關(guān)的區(qū)別1、 資料要求不同回歸要求因變量Y服從正態(tài)分布,X是可以精確測量和嚴(yán)格?控制的變量,一般稱為I型回歸。相關(guān)要求兩個變量X、Y服從雙變量正態(tài)分布,這種資料若進行回歸分析稱為II型回歸。2、 應(yīng)用情況不同回歸用于表述兩變量間的依存關(guān)系,是單向的。相關(guān)用于表述兩變量間的相關(guān)關(guān)系,是雙向的。3、 相關(guān)系數(shù)和回歸系數(shù)的絕對值大小無直接關(guān)系-1《r《1,r無單位-&&<b<&&,b有單位三、回歸與相關(guān)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肱骨骨折護理題庫及答案
- 護理實習(xí)生與老年人溝通能力的現(xiàn)狀及影響因素分析-基于云南省某三甲醫(yī)院的橫斷面調(diào)查
- 2025年海南省公需課學(xué)習(xí)-養(yǎng)殖水域灘涂規(guī)劃編制工作規(guī)范
- 2025年營養(yǎng)周飲食健康知識競賽題庫及答案(共220題)
- 2025年八大特殊作業(yè)安全生產(chǎn)知識考試判斷題及答案(共80題)
- 2025年糧食作物生產(chǎn)試卷及答案
- 中學(xué)地理押題題庫及答案
- 照明節(jié)能維護合同范本
- 2025年部隊文字考試題庫及答案
- 2025年陜西榆林中考試題及答案
- 【MOOC】影視鑒賞-揚州大學(xué) 中國大學(xué)慕課MOOC答案
- 南京信息工程大學(xué)《數(shù)學(xué)分析(3)》2022-2023學(xué)年第一學(xué)期期末試卷
- 瀝青混凝土心墻碾壓石渣壩施工方案
- 裝載機鏟斗的設(shè)計
- 中國民俗文化概說(山東聯(lián)盟)智慧樹知到答案2024年青島理工大學(xué)
- 基礎(chǔ)有機化學(xué)實驗智慧樹知到期末考試答案章節(jié)答案2024年浙江大學(xué)
- 2024年北京市人力資源市場薪酬狀況白皮書
- 數(shù)字孿生智慧水利整體規(guī)劃建設(shè)方案
- 業(yè)委會換屆問卷調(diào)查表
- 慕課《如何寫好科研論文》期末考試答案
- 幼兒園中班安全教育《這些東西能吃嗎》
評論
0/150
提交評論