已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
吉林大學公共衛(wèi)生學院,1,醫(yī) 學 統 計 學,主講人 劉欣,流行病與衛(wèi)生統計學教研室,吉林大學公共衛(wèi)生學院,2,第十三章 直線相關與回歸,吉林大學公共衛(wèi)生學院,3,第一節(jié) 直線相關,一、直線相關的概念,直線相關(linear correlation)是描述兩個變量間互依關系的一種統計分析方法。此法又稱簡單相關(simple correlation)。此法通過直線相關系數(linear correlation coefficient)描述兩個變量直線關系的大小和方向。此法要求兩個變量服從雙變量正態(tài)分布。,吉林大學公共衛(wèi)生學院,4,相關系數又稱積差相關系數,也稱Pearson相關系數,用r 表示。它是說明具有直線關系的兩個變量間,相關關系的密切程度和相關方向的指標。用r 的大小表示密切程度,用r 的正負表示相關方向。其計算公式為:,吉林大學公共衛(wèi)生學院,5,圖13-7a 相關系數含義圖,吉林大學公共衛(wèi)生學院,6,圖13-7b 相關系數含義圖,吉林大學公共衛(wèi)生學院,7,公式(13-1),相關系數無單位,其取值范圍為1r1。r 值為正表示正相關,為負表示負相關,為零表示零相關。r = 1為完全正相關,r = 1為完全負相關。,二、直線相關系數的計算,吉林大學公共衛(wèi)生學院,8,吉林大學公共衛(wèi)生學院,9,例 研究者為探討女性的年齡與收縮壓的關系,收集了某地12名婦女的年齡與收縮壓數據見下表13-1的(2)、(3)。根據婦女年齡與收縮壓的數據計算二者的相關系數。,1. 先根據原始數據繪制散點圖,大致判斷兩變量之間是否有直線趨勢。 本例的散點圖見圖13-1,可見年齡與收縮壓呈直線趨勢,故可進行直線相關分析。,吉林大學公共衛(wèi)生學院,10,吉林大學公共衛(wèi)生學院,11,吉林大學公共衛(wèi)生學院,12,2. 計算相關系數。由前面計算可知: lXX=1550.7,lYY=44.04,lXY=233.7,代入公式(13-1)得相關系數為:,三、直線相關系數的假設檢驗,前面所求相關系數r 是樣本相關系數,它實為總體相關系數 的估計值。我們知道即使X、Y的總體相關系數為零,由于抽樣誤差的存在,樣,吉林大學公共衛(wèi)生學院,13,本相關系數r 也不一定為零。因此需要對相關系數r 進行假設檢驗,以此推斷X、Y是否存在直線相關關系。常用t 檢驗,其檢驗統計量公式如下:,公式(13-3),式中Sr 為樣本相關系數的標準誤,自由度=n2。,例 就例1求得的r 值,檢驗婦女年齡與收縮壓間是否存在直線相關關系。,吉林大學公共衛(wèi)生學院,14,H0: = 0 即年齡與收縮壓之間無直線相關關系,H1: 0 即年齡與收縮壓之間有直線相關關系, 檢驗假設,= 0.05, 計算檢驗統計量 本例n = 12, r = 0.8943, 代入公式(12-3)求t 。,吉林大學公共衛(wèi)生學院,15,由=0.05,=n2=122=10,查t 界值表 得t ,=t 0.05,10=2.228,今求得t=6.322.228, 則P0.05,按=0.05水準拒絕H0,可認為婦女 年齡與收縮壓之間有直線相關關系。, 確定P值和作出推斷結論,吉林大學公共衛(wèi)生學院,16,一、直線回歸的概念,直線回歸(linear regression)是描述兩個變量間依存數量關系的一種統計分析方法。此法又稱簡單回歸(simple regression)。此法通過直線回歸方程(linear regression equation)描述一個變量Y常稱為應變量(dependent variable)依存另一個變量X常稱為自變量(independent variable),第二節(jié) 直線回歸,吉林大學公共衛(wèi)生學院,17,變化的數量關系。由此方程可確定一條回歸直線。,二、直線回歸方程的求法,線性回歸方程的表達式為,公式(13-4),式中X為自變量, 為應變量Y的估計值,a 為回歸直線在Y軸上的截距(intercept),b為回歸系數(regression coefficient),也即回歸直線的斜率(slope)。根據數學上的最小二乘法的原理計算a和b 。計算公式如下:,吉林大學公共衛(wèi)生學院,18,公式(13-5),式中l(wèi)XX 和lXY分別表示離均差平方和與離均差積和。,公式(13-6),例1 某研究者為探討女性的年齡與收縮壓的關系,收集了某地12名婦女的年齡與收縮壓數據見下表13-1的(2)、(3)。試求年齡與收縮壓的直線回歸方程。,最小二乘法原理的含義是保證各實測點至直線的縱向距離的平方和最小 。,吉林大學公共衛(wèi)生學院,19,吉林大學公共衛(wèi)生學院,20,1. 先根據原始數據繪制散點圖(scatter plot),大致判斷兩變量之間是否有直線趨勢。 本例的散點圖見下圖13-1,可見年齡與收縮壓呈直線趨勢,故可進行直線回歸分析。,吉林大學公共衛(wèi)生學院,21,2. 計算X、Y、X2、Y2、XY 見表13-1中的(2)(6)合計項。,X=628,Y=224.4,X2=34416,Y2 =4240.3,XY=11977.3,3. 計算 和lXX 、lYY、lXY,吉林大學公共衛(wèi)生學院,22,4. 求回歸系數b和截距a 按公式(12-5)求回歸系數b,求截距a。,5. 列直線回歸方程,為了直觀分析或實際需要,可按求出的直線回歸方程作圖。在X的實測全距范圍內任取相距較遠且易讀數的兩個X值,代入方程得到兩個Y值,吉林大學公共衛(wèi)生學院,23,以直線連接兩點即得回歸直線。本例可取X1=42,得Y1=17.14;取X2=72,得Y2=21.66。連接兩點即得本資料的回歸直線。見下圖13-1a。,吉林大學公共衛(wèi)生學院,24,三、回歸系數的假設檢驗,我們知道即使X、Y的總體回歸系數為零, 由于抽樣誤差的存在,樣本回歸系數b 也不一定為零。因此需要對回歸系數進行假設檢驗,以此推斷X、Y是否存在直線關系??捎梅讲罘治龌騮 檢驗。,吉林大學公共衛(wèi)生學院,25,檢驗統計量t的計算公式為:,t 檢驗,公式(13-7),例3 對例1求得的回歸系數進行t 檢驗。,t 檢驗的步驟如下:,式中Sb 為樣本回歸系數的標準誤 。,吉林大學公共衛(wèi)生學院,26,H0: = 0 即年齡與收縮壓之間無直線關系,H1: 0 即年齡與收縮壓之間有直線關系,= 0.05,前已算得lXX=1550.7,lYY=44.04,lXY=233.7, b=0.1507, 代入公式得,吉林大學公共衛(wèi)生學院,27,由=0.05,=n2=122=10,查t 界值表 得t ,=t 0.05,10=2.228,今求得t=6.322.228, 則P0.05,按=0.05水準拒絕H0,可認為年齡 與收縮壓之間有直線關系。,吉林大學公共衛(wèi)生學院,28,四、直線回歸方程的應用,1. 描述兩變量間的數量依存關系 2. 利用回歸方程進行預測 3. 利用回歸方程進行統計控制,吉林大學公共衛(wèi)生學院,29,五、應用回歸分析時應注意的問題,1.兩變量作直線回歸分析時,要求應變量Y服從正態(tài)分布,通常自變量X為可以精確測量或嚴格控制的因素。 2.作回歸分析時要有實際意義,不能把毫無關聯的兩事物或現象進行回歸分析。 3.在進行回歸分析前,應繪制散點圖。 4.回歸方程適用范圍一般以自變量X實際取值范圍為限,不能任意外推。,吉林大學公共衛(wèi)生學院,30,第三節(jié) 直線相關與回歸的區(qū)別和聯系,吉林大學公共衛(wèi)生學院,31,回歸與相關是兩個既有區(qū)別又有聯系的統計分析方法,若研究目的是想定量地描述兩個變量間的依存關系,常用來由一個變量的數值去推算另一個變量的數值,則應作回歸分析;若目的是想定量地描述兩個變量間互依關系的密切程度和方向,則應作相關分析。, 區(qū)別,1. 資料要求不同 回歸要求應變量Y 服從正態(tài)分布,X 是可精確測量或嚴格控制的變量,一般稱I 型回歸。相關要求兩個變量服從雙變量正,吉林大學公共衛(wèi)生學院,32,態(tài)分布,此時若作回歸分析,稱II 型回歸。,2. 在應用上不同 回歸用來描述兩個變量間的依存關系,相關用來描述兩個變量間的互依關系。, 聯系,1. 符號相同 對一組數據若同時計算r 與b , 它們的正負號相同。 r 為正說明兩個變量間的相互關系是同向變化的;b 為正說明X 增(減)一個單位,Y 平均增(減) b 個單位。,吉林大學公共衛(wèi)生學院,33,2. 假設檢驗等價 對同一樣本,樣本回歸系數b 的t 檢驗與樣本相關系數r 的t 檢驗的t 值相等,即tb = tr 。由于b 的假設檢驗較繁,故在實際應用中常用r 的t 檢驗代替。,3. 用回歸解釋相關 r 的平方稱為決定系數 ( coefficient of determination),吉林大學公共衛(wèi)生學院,34,接近1,則回歸效果越好。,上式說明當SS總固定不變時,回歸平方和SS回的大小決定了r2 的大小。SS回越接近SS總,則r2 越,吉林大學公共衛(wèi)生學院,35,第十四章 統計表與統計圖,統計表與統計圖是統計描述的重要方法,是對比、分析事物的重要工具。 在科技報告或論文中,常把統計數據或統計指標用表格的形式列出,稱為統計表(statistical table),它常用來集中、濃縮、簡潔地概括說明某類被研究事物,代替冗長、單調的文字敘述,并能夠鮮明、清晰地表達該事物,便于進一步比較和計算。,吉林大學公共衛(wèi)生學院,36,第一節(jié) 統計表,統計圖(statistical chart)是用點的位置、線段的升降、直條的長短或面積的大小等形式表達統計資料的一種方法,它可以把資料的變化趨勢、分布特征、數據之間的關聯等,以形象直觀的方式表現出來。統計圖容易理解,能醒目地給讀者留下深刻印象。缺點是不能精確地表達數字的大小,故常與統計表一同使用,以達到相輔相成的效果。,吉林大學公共衛(wèi)生學院,37,一、統計表的基本結構,統計表主要由標題、表線、標目和數字組成。其結構如下圖所示:,標題,表號,縱標目,橫標目,數字,合計,頂線,分隔線,合計線,底線,吉林大學公共衛(wèi)生學院,38,統計表分為簡單統計表和復合統計表兩種。以下是論文和科技報告中常見的統計表的式樣,其中表1是簡單表,表2、表3和表4是復合表。,二、統計表的種類,吉林大學公共衛(wèi)生學院,39,吉林大學公共衛(wèi)生學院,40,吉林大學公共衛(wèi)生學院,41,三、編制統計表的注意事項,制作統計表總的原則:重點突出,簡單實用;邏輯合理,條理清晰。即一個統計表最好只包含一個中心內容,不要面面俱到;縱、橫標目的安排既要符合專業(yè)要求,又要邏輯分明。,針對統計表的各組成部分,具體的制表基本要求如下:, 標題,用簡明扼要的文字說明表的中心內容;必要,吉林大學公共衛(wèi)生學院,42,時寫明時間和地點;標題寫在表體的上端中部。注意標題不要過長,也不要太簡略,更不要不寫。, 表號,一般標于標題的前部,與標題以空格相隔;若文中有多個表,以數字編號表示,如“表1”、“表2”、“表12-1”、“表5.4”等;若文中只有一個表,用“附表”表示。, 表線,表線有頂線、分隔線、合計線、底線等;頂,吉林大學公共衛(wèi)生學院,43,線和底線一般用粗線,其余用細線;表線只能用橫線,不能用豎線,也不能用斜線;表線不宜過多。最基本的統計表一般為三線表、四線表。, 縱標目,常用精煉的文字或術語寫明各項指標或某種分類;位于表的上部;有單位的指標要注明單位,如“體重(kg)”、“死亡率(%)”等;縱標目上可以再列總標目,二者用一短線分隔。注意標目不宜過多;縱標目不宜劃分過多層次。,吉林大學公共衛(wèi)生學院,44, 橫標目,常為被研究或要說明的事物名稱;位于表的左中部;橫標目上部常列事物的性質或類別,如“類型”、“年份”、“組別”等;橫標目下部可列合計項;合計與橫標目之間一般不用短線分隔。, 數字,表內數字一律采用阿拉伯數字;同一指標的數字應該數位對齊,小數位數要一致;數字不標明單位;表內不宜有空項。如遇數據缺失、不詳,吉林大學公共衛(wèi)生學院,45,或未記錄時,可用“”表示,不該有數字處可用“”表示。數字是“0”均填“0”。數字應位于所屬縱標目的正下方,橫標目的右側同一行;合計數字與分數據之間可用短線分隔。, 備注,當表中有某個對象需附加或特殊說明時,可先在該對象的右上角用“*”或其它特殊符號標示,再在表的底線下面左側用該符號引導寫出具體內容。,吉林大學公共衛(wèi)生學院,46,統計圖是用點的位置、線段的升降、直條的長短或面積的大小等形式表達統計資料的一種方法,它可以把資料的變化趨勢、分布特征、數據之間的關聯等,以形象直觀的方式表現出來。統計圖容易理解,能醒目地給讀者留下深刻印象。常用的統計圖有條圖、百分條圖、圓圖、線圖、半對數線圖、散點圖、直方圖、統計地圖等。,第二節(jié) 統計圖,吉林大學公共衛(wèi)生學院,47,一、繪制統計圖的基本要求,統計圖與統計表不同,統計表沒有固定的模式,需要根據分析目的和資料特點去設計和制作,靈活性強;而統計圖有固定的類型和模式,需要按每種統計圖的要求去繪制,但在制作每種統計圖時,要注意以下幾項基本要求:,1. 按資料的性質和分析目的選用適當的統計圖 統計圖選擇的不合理將達不到分析的目的,可能會得到與預期目的相反的效果。掌握和熟悉 每種統計圖的特點有利于正確選擇合理的統計圖。,吉林大學公共衛(wèi)生學院,48,2. 每個統計圖要有標題 用簡明扼要的文字說明圖的中心內容,必要時寫明時間和地點;標題常寫在圖體的下端中部。,3. 縱、橫標目分別代表分析指標和分析事物有單位的標目要注明單位,標目常寫在坐標軸的外側中部。,4. 條圖、線圖、半對數線圖、散點圖、直方圖都有縱、橫坐標軸 坐標軸要注明尺度,縱軸尺度自下而上,橫軸尺度自左而右,數量都從小到大,并等距標明。條圖與直方圖的縱坐標必須從0開始,并標明0點。統計圖的縱、橫軸比例一,吉林大學公共衛(wèi)生學院,49, 條圖,條圖(bar chart) 用等寬直條的長短來表示相,般為5:7,即黃金分割(golden section)的近似值(0.6180339)。,5. 比較不同事物時,應選用不同的圖案或顏色區(qū)別表示,并附圖例(legend)說明 圖例放置的位置以不影響圖的主要內容為前提,可放在圖的空隙處。,二、常用的統計圖,吉林大學公共衛(wèi)生學院,50,互獨立的各指標的數值大小。有單式和復式條圖兩種。單式條圖的樣例見圖14-1 ,圖14-10;復式條圖的樣例見圖14-2 ,圖14-11。,吉林大學公共衛(wèi)生學院,51,吉林大學公共衛(wèi)生學院,52,資料來源見表14-1。,吉林大學公共衛(wèi)生學院,53,資料來源見表14-10。,吉林大學公共衛(wèi)生學院,54,吉林大學公共衛(wèi)生學院,55,資料來源見表14-3。,吉林大學公共衛(wèi)生學院,56,資料來源見表14-11。,吉林大學公共衛(wèi)生學院,57,互獨立的各指標的數值大小。有單式和復式條圖兩種。單式條圖的樣例見圖14-1 ,圖14-10;復式條圖的樣例見圖14-2 ,圖14-11。,條圖的繪制方法如下:, 一般以橫軸為基線,表示被研究的事物, 縱軸表示研究指標。也可顛倒設置,樣例見圖14-10a 。, 表示指標數值的坐標尺度必須從0開始, 一般為等間距,中間不能折斷,否則會改變各直 條長短的比例,使人產生錯覺(見圖14-12)。,吉林大學公共衛(wèi)生學院,58,吉林大學公共衛(wèi)生學院,59,圖14-12 條圖的縱軸尺度起點必須為0示意圖,吉林大學公共衛(wèi)生學院,60, 百分條圖,百分條圖(percent bar chart) 用一個長條的面, 各直條間寬度應相等,間隙寬度也應一 致,一般與直條的寬度相同或為直條寬度的一半。, 為了便于對比,一般將被比較的指標按 大小順序排列。, 復式條圖每組內的直條間不留間隙,各 直條應以不同的圖案或顏色區(qū)別表示,并附圖例 說明。,吉林大學公共衛(wèi)生學院,61,積代表事物的全部,條內分段的面積代表事物的構成比。有單式和復式百分條圖兩種。單式百分條圖的樣例見圖14-3;復式百分條圖的樣例見圖14-13 ,圖14-14。,百分條圖的繪制方法如下:, 先繪制一個標尺,一般以橫軸為標尺, 尺度必須從0到100標記。, 繪制一直條,長度必須與標尺一致,寬 度可任意,全長代表全部構成。, 以各自構成比的大小劃分各自條寬。,吉林大學公共衛(wèi)生學院,62,吉林大學公共衛(wèi)生學院,63,資料來源見表14-4。,吉林大學公共衛(wèi)生學院,64,資料來源見表14-13。,吉林大學公共衛(wèi)生學院,65,吉林大學公共衛(wèi)生學院,66,資料來源見表14-14。,吉林大學公共衛(wèi)生學院,67, 圓圖, 各條段需用不同的圖案或顏色區(qū)分,并 附圖例說明。,圓圖(pie chart) 用圓的面積代表事物的全部, 用各扇形的面積代表事物的構成比。有單式和復 式圓圖兩種。單式圓圖的樣例見圖14-4;復式圓圖的樣例見圖14-15 。,圓圖的繪制方法如下:, 先繪制一個圓形,1%相當于3.6,每個 構成比乘以3.6即得該構成比應占的圓心角度數。,吉林大學公共衛(wèi)生學院,68,吉林大學公共衛(wèi)生學院,69,圖14-15 2001年某地流動人口與本地人口的經濟狀況構成(%),吉林大學公共衛(wèi)生學院,70, 將每個構成比換算成圓心角度數,利用 量角器繪制出各個構成比的扇形面積。, 扇面一般以9點或12點位置作始點,順時 針排列。, 各扇面需用不同的圖案或顏色區(qū)分,并 附圖例說明。, 線圖,線圖(line chart) 用線段的升降表示事物在時間上的變化趨勢, 或某現象隨另一現象變動的情況。適用于連續(xù)型資料。有單式和復式線圖兩種.,吉林大學公共衛(wèi)生學院,71,復式線圖的樣例見圖14-5 ,圖14-16 ,圖14-17 。,線圖的繪制方法如下:, 先建立一個坐標系,一般以橫軸表示時 間,縱軸表示率或數值大小。, 根據每個時間點的指標大小確定點的位 置,用短線連接各點即成。一般不把折線繪制成 平滑的曲線。, 復式線圖需用不同的圖案或顏色區(qū)分, 并附圖例說明。,吉林大學公共衛(wèi)生學院,72,吉林大學公共衛(wèi)生學院,73,資料來源見表14-5。,吉林大學公共衛(wèi)生學院,74,吉林大學公共衛(wèi)生學院,75,資料來源見表14-14。,吉林大學公共衛(wèi)生學院,76,吉林大學公共衛(wèi)生學院,77,資料來源見表14-17。,吉林大學公共衛(wèi)生學院,78, 半對數線圖,半對數線圖(semi-logarithmic linear chart) 用于表示事物的發(fā)展速度。線圖的縱、橫軸都為算術尺度,半對數線圖的縱軸為對數尺度,橫軸為算術尺度。適用于比較兩組相差懸殊的數據比較變化速度。樣例見圖14-7 ,圖14-18 。,半對數線圖的繪制方法如下:, 在半對數坐標紙上按線圖繪制方法即可。, 對于普通坐標紙,需先將數據轉化為對 數,再按線圖繪制方法即可。,吉林大學公共衛(wèi)生學院,79,吉林大學公共衛(wèi)生學院,80,資料來源見表14-6。,吉林大學公共衛(wèi)生學院,81,吉林大學公共衛(wèi)生學院,82,資料來源見表14-18。,吉林大學公共衛(wèi)生學院,83,線圖與半對數線圖各自反映數據變化的角度不同,線圖體現數據之間的絕對差,半對數線圖體現數據之間的對數差。為對比二者,現將同一資料分別用線圖與半對數線圖繪制,見附圖1、附圖2、和附圖3。,吉林大學公共衛(wèi)生學院,84,附圖1,吉林大學公共衛(wèi)生學院,85,附圖2,吉林大學公共衛(wèi)生學院,86,附圖3,吉林大學公共衛(wèi)生學院,87, 散點圖,線圖與半對數線圖各自反映數據變化的角度不同,線圖體現數據之間的絕對差,半對數線圖體現數據之間的對數差。為對比二者,現將同一資料分別用線圖與半對數線圖繪制,見附圖1、附圖2、和附圖3。,散點圖(scatter plot) 用點的密集程度和變化趨勢表示兩種現象之間的相互關系。適用于雙變量資料。散點圖的樣例見圖14-8 。,散點圖的繪制方法與線圖相同,只是點與點,吉林大學公共衛(wèi)生學院,88,吉林大學公共衛(wèi)生學院,89,之間不用連線即可。, 直方圖,直方圖(histogram) 用各矩形的高度或面積代表各組段的頻數或頻率,各矩形的面積總和為總頻數或100%,用以表示連續(xù)型資料的頻數分布情況。適用于連續(xù)型的頻數分布表資料。橫軸表示
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 苗木補栽合同范本
- 蜜蜂托養(yǎng)協議書
- 視頻征集協議書
- 認籌車位協議書
- 設備抵對協議書
- 設備配套協議書
- 訴前保全協議書
- 試車協議書范本
- 托管醫(yī)院合同范本
- 弟弟蓋房協議書
- 投資者關系部經理筆試題及解析
- 《當代廣播電視概論(第3版)》全套教學課件
- 防水補漏合同協議
- 中華人民共和國史期末復習
- 加油站安全現狀評價匯報
- 信陽師范大學《倫理學》2021-2022學年第一學期期末試卷
- 小學2024年秋季學生1530安全教育記錄表(全學期)
- 中國普通食物營養(yǎng)成分表(修正版)
- ISO15614-1 2017 金屬材料焊接工藝規(guī)程及評定(中文版)
- 低壓線路的安裝、運行及維護
- 表-柴油的理化性質及危險特性
評論
0/150
提交評論