統(tǒng)計學教程:相關與回歸.ppt_第1頁
統(tǒng)計學教程:相關與回歸.ppt_第2頁
統(tǒng)計學教程:相關與回歸.ppt_第3頁
統(tǒng)計學教程:相關與回歸.ppt_第4頁
統(tǒng)計學教程:相關與回歸.ppt_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、關聯和回歸,第九回,王曉莉,基本內容,關聯和回歸,3,醫(yī)學上,身高和體重,父親身高和兒子身高,體溫和脈搏,產前檢查和嬰兒體重,乙肝病毒和乙肝等多種現象之間有關聯。 在這些有關系的現象中,它們之間的聯系程度和性質也各不相同。 相關與回歸、4、變量之間的關系:乙肝病毒感染是前因,得到乙肝是結果,乙肝病毒與乙肝之間存在因果關系的現象之間因果關系不明確,但并不能說伴隨關系如丈夫身高與妻子身高之間存在因果關系。相關和回歸、5、相關和回歸用于研究和解釋兩個變量之間的相互關系。相關與回歸、6、主要內容、第一節(jié)直線相關第二節(jié)直線回歸第三節(jié)注意事項、第一節(jié)直線相關、一、相關的類型二、相關系數的校正公式相關系數的

2、假設檢驗三、直線相關的意義、為了研究父子與成年兒子的身高的關系,皮爾遜將1078對父子的身高進行了測量的1078對數字x上的數字表示父親的身高,y上的數字表示兒子的身高1078個點形成圖案是散點圖。 收集一些數據以確定相關和回歸、9、散點圖和相關變量之間的關系。 這些數據成對,然后用笛卡爾坐標系描述這些點。 此點集稱為散點圖。相關的類型、正相關負相關完全正相關完全負相關被稱為零相關,關于相關系數、樣本的相關系數,用r表示的r的值在-1和1之間的r的絕對值越接近1,兩變量的相關度越強,r的絕對值越接近0,兩變量的相關度越弱的正相關此時,在一個變量增加,另一個變量也增加的負相關的情況下,r值在-1

3、到0之間,一個變量增加,另一個變量減少。相關系數修正公式,產科醫(yī)生發(fā)現孕婦尿中雌三醇含量與產兒體重有關,因此認為通過測定被產婦尿中雌三醇含量,可以預測出產體重,預防低出生體重。 為此,收集31例產婦24小時尿液,測定其中雌三醇含量,并記錄產兒的體重。 尿中雌三醇含量與產兒體重的相關系數是多少?是正相關還是負相關? 分析問題:總體樣品、目的、變量、關系,產婦尿母三醇含量與產體重的關系,x=534 y=99.2 x2=9876 y2=324.8 xy=1750 n=31,關系與回歸問題:產婦尿中母三醇含量與產兒體重之間呈正相關,相關為什么? 修正結果表明,31例產婦尿中雌三醇含量與產兒體重之間程度

4、呈正相關,相關系數為r0.61。 相關和回歸,18,相關系數假設檢驗,上例相關系數r為0.61,說明31例樣品中雌三醇含量與出生體重之間存在相關關系。 然而,這31個示例是整體上的一個樣本,使得產生的相關系數中有采樣誤差。 因為如果總體相關系數()為0,則由采樣誤差從總體提取出的31個實例可能不等于零。 這是對r進行假設檢查,判斷r不等于零是取樣誤差引起的,還是兩個變量之間確實存在相關關系。 選擇相關和回歸、19、相關系數的假設檢查、常用t檢查、統(tǒng)一校正量t的校正公式如下:=n-2、相關和回歸、20,1.h0:=0h1: 02.=0. 053 . 接受還是什么? 可以認為產婦24小時以內的尿中

5、雌三醇濃度與產兒體重之間存在正相關關系。直線關聯的意思,確實是在有關聯的前提下(? 什么? 的雙曲馀弦值。 r的絕對值越大,表示兩個變量之間的關聯度越強時,就知道一個變量有助于預測另一個變量。r的絕對值越小,兩個變量之間的關系就越弱,一個變量的信息對于推測另一個變量的值就越不起作用。 一般來說,樣本量大,對r進行假設檢查,在有統(tǒng)一校正學意義的情況下,如果r的絕對值大于0.7,則表示兩個變量高的相關性的r的絕對值大于0.4,如果在0.7以下,則表示兩個變量間的中等程度的相關性的r的絕對值大于0.2 雌三醇含量與產兒體重有關:如果知道產婦的尿雌三醇含量,能否推測產兒的體重?能夠預測的體重在哪個范圍

6、內? 必須用直線回歸的方法來解決這個。 第二節(jié)直線回歸,一,回歸方程式二,回歸系數三,回歸系數假設檢驗四,直線回歸的應用,一個人的樂趣不是因為他擁有的東西多,而是因為他關心的東西少,在休息,相關和回歸,24,一,回歸方程式二,回歸系數三個變量之間直線在這種情況下,它們的變化可以由函數方程表示,將其稱為函數關系,并且將其關系表達式稱為函數方程。 由于相關和回歸、26,其它因素的干擾,許多二變量之間的關系不是嚴格的函數關系,而是不能用函數方程式來反映。 為了與二變量間的函數方程式區(qū)別開來,把這個關系式叫做直線回歸方程式,把這個關系叫做直線回歸。 相關和回歸,27,線性回歸用于解釋一個變量如何依賴于

7、另一個變量,以找到一個變量隨另一個變量變化的線性方程為使命,這個線性方程被稱為線性回歸方程。相關和回歸、28、回歸式、a、bX、=、式中的是根據自變量x推定的應變量y的推定值,a是回歸直線在y軸上的截距,即X=0時的y值,b是樣本的回歸系數,即回歸直線的斜率,x變動1個單位時,y平均為b 如果a、b已知,則代入上式可以求出直線回歸式。 根據相關和回歸、29、y、相關和回歸、30、回歸系數、上例的數據,求出產婦尿中雌三醇含量與出生體重的回歸式。 根據相關系數的校正計算,可以根據我們求出的兩者的關系的回歸式、相關和回歸、32、回歸直線的圖、求出的回歸式,在自變量x的實測范圍內任意取2個值,在代入式

8、中,求出對應的2個y值,在這2個數據中對應的2 這兩點可以用來確保繪圖繪制正確。 相關和回歸,34,=2.15 0.061X,一定能說明雌三醇和產兒體重之間存在回歸關系嗎?相關和回歸,35,和直線相關一樣,直線回歸方程式也是根據樣本數據進行修正,同樣存在采樣誤差的問題。 因此,必須假設檢查樣本的回歸系數b,并確定b是否是從整個零回歸系數中提取的。 為了判斷取樣誤差的影響,有必要對回歸系數進行假說檢查。 整體回歸系數一般用表示。采用相關和回歸、36、t檢驗方法,其中Sy.x是從各觀察值y到回歸直線的距離的標準偏差,表示去除x的影響后的y的變異程度,回歸系數的假設檢驗,H0:=0 H1:0=0.0

9、5校正量:校正t=4=31-2=29,=2.045用修正概率值P: P0.05推論:在0.05檢查水平上拒絕H0,認為接受H1產婦24小時尿中雌三醇含量與產體重之間存在直線回歸關系。、相關和回歸、39、直線回歸的應用、描述兩變量間的依存關系:通過回歸系數的假設檢驗,如果認為兩變量間有直線回歸關系,則可以用直線回歸來描述。 基于回歸式的預測:將自變量代入回歸式,根據變量進行估計,由此能夠求出應變量的變動范圍。 例如,將某產婦的尿雌三醇濃度代入回歸式,通過使用區(qū)間推定的方法,可知生產時的生產時的體重范圍。 用回歸公式進行統(tǒng)一控制:空氣質量和汽車數量、相關和回歸、40、第三節(jié)應用時的注意事項、一、注

10、意事項二、相關和回歸的區(qū)別三、相關和回歸、相關和回歸、41、應用直線相關和回歸的注意事項,1、在實際意義上進行相關回歸分析是實際的尋求孩子和小樹的相關關系是沒有意義的,從孩子的身高推測小樹的高度更加慌張。 2 .相關關系相關關系不一定是因果關系,也許是伴隨關系,但不能證明事物之間有內在的關系。 例如,發(fā)現對于學校的孩子,鞋子的大小和閱讀技能有很強的相關關系。 但是,學習新詞不是擴大腳步,而是關系到第三要因年齡。 孩子長大后,閱讀能力提高,長大后也不能穿原來的鞋子。相關和回歸、42、3 .可以利用散布圖對性質不明的2組數據首先制作散布圖,在用圖觀察它們的關系的有無、關系的密切度、正的相關還是負的

11、相關之后,進行相關回歸分析。 4 .變量范圍的相關分析和回歸公式只能適用于樣本的原始數據范圍內,但是不能提取該范圍,得到兩變量的相關關系和原始的回歸關系。相關與回歸、43、相關與回歸的區(qū)別、1 .意義:相關反映兩個變量的相互關系,即兩個變量中任一個變化引起另一個變化,是一個雙向變化的關系。 回歸反映了兩個變量的依賴關系,一個變量的變化引起另一個變量的變化,是單方面的關系。 2 .應用:研究兩個變量相互關系的相關分析。 為了研究兩個變量的依存關系,使用了回歸分析。 3 .研究性質:相關描述兩個變量之間的關系,看兩個變量是否相關,關系是否密切,關系的性質是什么,正相關還是負相關。 已知回歸定量地描

12、述兩個變量,研究兩個變量的數量關系,一個變量值可以預測另一個變量值,可以得到定量的結果。 4 .相關系數r和回歸系數b :r和b的絕對值反映的含義不同。 r的絕對值越大,散布圖中的點越有成為一直線的傾向,兩變量的關系越密切,表示相關度越高。 b的絕對值越大表示回歸直線越陡峭,x變化1個單位表示y的平均變化越大。 反之亦然。 相關和回歸的聯系,1 .可以進行關系回歸分析的變量之間存在相關關系。 因此,可以對兩組新數據制作散布圖,求出它們的相關系數,對具有相關關系的變量進行回歸分析,求出回歸式。 2. r和b的符號一致:當r為正時,b也為正,表示兩變量為正的相關,為同向變化。 當r為負時,b也為負,表示兩變量為負的相關,是反變化。 r與b的假設檢驗結果一致:可以用r的顯性檢驗代替b的顯性檢驗。相關和回歸,4

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論