第八章相關性課件_第1頁
第八章相關性課件_第2頁
第八章相關性課件_第3頁
第八章相關性課件_第4頁
第八章相關性課件_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第八章相關性第八章相關性18.1引言前面我們研究了描述單一隨機變量的統(tǒng)計方法。這些描述統(tǒng)計量使我們能夠研究一種特定的分布,解釋在這種分布下的某一得分。這些描述統(tǒng)計量代表了所有統(tǒng)計方法的基礎。但同時它們又存在著局限性,因為我們不能運用它們研究兩個或多個隨機變量之間的關系。所以我們要運用關聯性研究來觀察兩個隨機變量是否依照系統(tǒng)的方式單獨變化或者共同變化。如果我們發(fā)現兩個隨機變量之間存在著相關性,就能利用這一信息來描述甚至很可能做到預測未來的行為和事件。8.1引言前面我們研究了描述單一隨機變量的統(tǒng)計方法。28.2相關性的概念相關性是一個非常強而有效地檢驗兩個或更多變量之間關系的統(tǒng)計量。它可以回答許多關于兩變量之間關系的自然屬性的有趣問題。8.2相關性的概念相關性是一個非常強而有效地檢驗兩個3首先相關系數告訴我們相關性的方向。相關系數可以是正值也可以是負值。正值說明隨機變量之間是正相關關系;負值說明是負相關關系。一個正相關(positivecorrelation)的數據集合就是一個隨機變量的較大值對應另一個隨機變量的較大值,一個隨機變量的較小值對應另一個隨機變量的較小值。一個數據集合可能是負相關(negativecorrelation)的,那意味著X隨機變量數值增加,Y隨機變量有減少的趨勢。首先相關系數告訴我們相關性的方向。相關系數可以是正值也可以是4r=1.00表示一個嚴格的正相關關系;X隨機變量增加與Y隨機變量的增加嚴格匹配。相對比,r=-1.00表示一個嚴格的負相關;較小的X值與較大的Y值相聯系,X增加Y減小。注意到相關性與1.00或-1.00越接近,越多數據點落在一條直線上。當計算相關系數時,我們希望一條直線能夠最好地表達這些數據,這條直線表示的是線性關系(linerrelationship)。r=1.00表示一個嚴格的正相關關系;X隨機變量增加與Y隨機5相關性分析也使我們能夠檢驗兩個隨機變量相互聯系的程度。相關系數可以從0到1.00。0說明兩個隨機變量之間沒有任何關系;1.00說明存在可能的最強的關系。取值與1.00越接近,相關關系也就越強。取值為0.85,0.90或者0.96說明相關關系越來越強。取值與0越接近,相關關系也越弱。取值為0.26,0.15與0.07就是弱相關系數的例子。相關性分析也使我們能夠檢驗兩個隨機變量相互聯系的程度。相關系6無論關系強弱,相關系數的取值都可能是正是負。當相關性r=0.9時,我們可以總結為兩個隨機變量之間存在強的正相關關系。當r=-0.9時,仍然可以總結為存在強的相關關系,不過是負相關關系。當r=0時,兩個隨機變量之間不存在系統(tǒng)的關系。無論關系強弱,相關系數的取值都可能是正是負。當相關性r=0.7雖然相關性是一個有用的統(tǒng)計量,但它本身并不能讓我們推斷出兩個隨機變量間的因果關系。在關聯性研究中,研究者并不能直接控制任一個隨機變量。因此,說相關系數是描述兩個隨機變量在多大程度上相關更加合適。要假設存在因果關系,自變量與依賴它的隨機變量必須相關且數據必須來源于真實實驗。雖然相關性是一個有用的統(tǒng)計量,但它本身并不能讓我們推斷出兩個88.3其他相關系數相關系數有很多種。選擇不同的相關系數依賴于以下幾個因素:(1)表達每一個隨機變量時度量尺度的不同類型;(2)潛在分布的屬性(連續(xù)或者離散);(3)分布取值的特點(線性或者非線性)8.3其他相關系數相關系數有很多種。選擇不同的相關系9定類數據:phi系數,biserialr順序數據:tetrachoric,Spearmanr區(qū)間或比率數據:Kendall’stau,Pearsonr,多元R定類數據:phi系數,biserialr10無論你使用哪一種相關性技術,它們都擁有相同的基本特點:1.兩個或多個度量的集合都獲得于相同的個體(或事件),或者是基于在相同基礎上成對匹配的個體。2.相關性可以在r=-1.00到r=1.00之間取值。兩個極端值表示隨機變量間的嚴格關系,r=0.00表示不存在線性關系。3.一個較大的相關關系本身并不意味著隨機變量間存在因果關系。無論你使用哪一種相關性技術,它們都擁有相同的基本特點:118.4計算Pearson乘積矩相關系數Pearsonr與z值一個正的較大值的Pearsonr說明每一個個體或者事件在兩個隨機變量上獲得大約相等的z值。換句話說,每一個個體的數值在X和Y的分布中大致位于相同的位置。在嚴格的正相關關系中(r=1.00),兩個隨機變量中每個個體獲得精確相同的z值。相似地,在嚴格的負相關關系中,兩個隨機變量中每個個體獲得精確相同的z值,但是符號相反。8.4計算Pearson乘積矩相關系數Pearson12Pearson相關系數r(Pearsonr):Pearson乘積矩相關系數r,表示個體或事件在兩個分布中占據相同相對位置的程度。Pearson相關系數r(Pearsonr):Pears13雖然用z值公式來定義r是一種有效的方法,但在實際應用中卻并不可行。想象一下當N等于25或者更大時的巨大計算量情況,這在行為研究中是經常碰到的。你需要為每一個數計算z值,然后計算z值的交叉乘積和,再除以數據對數。當介紹標準差與方差時,我們提到有兩個公式可以被用來計算相同的統(tǒng)計量。計算式對于計算一個統(tǒng)計量是非常好的,但它對理解這個統(tǒng)計量的含義作用不大。定義式對于理解一個統(tǒng)計量的邏輯是非常有用的,但對于實際的計算價值較小。r的z值公式就是后一種,它幫助我們理解怎樣思考相關系數,但是不要用它來計算r。一種更加有用且省時的計算r的方法就是RawScore公式,現在我們來看看。雖然用z值公式來定義r是一種有效的方法,但在實際應用中卻并不148.5Pearson乘積矩相關系數:概念的由來弗朗西斯·高爾頓(FrancisGalton)在19世紀末創(chuàng)立了相關性的概念。雖然高爾頓首先想到“相關性”這一指標的概念,但是數學家卡爾·皮爾遜(KarlPearson)創(chuàng)立了以自己名字命名的統(tǒng)計量的數學方法。8.5Pearson乘積矩相關系數:概念的由來弗朗西斯·高158.6解釋相關系數相關系數的大小與符號首先要問的問題就是兩個隨機變量是否相互聯系,它們以何種方式相互聯系。第二個要問的問題就是相關系數的數值大小。有很多種方法可以用來判斷相關系數的數值大小。第一種方法是按照大多數行為科學研究的一般準則??贫鳎–ohen,1998)建議,相關系數可以被劃分為“小”、“中”、“大”。8.6解釋相關系數相關系數的大小與符號16另一種解釋相關系數的方法是將它的值平方。相關系數的平方r^2被稱為決定系數(coefficientofdetermination)。決定系數告訴我們一個隨機變量的方差有多少百分比可以被另一個隨機變量解釋。另一種解釋相關系數的方法是將它的值平方。相關系數的平方r^217一種理解決定系數的方法時可以用圖來表示不同的相關關系。圓圈代表隨機變量X和Y,當X和Y的相關關系為0時,兩個圓圈沒有重疊。當相關系數的值不斷增加時,重疊區(qū)域逐漸增加。兩個隨機變量的決定系數用兩個圓圈的重疊區(qū)域大小來表示。一種理解決定系數的方法時可以用圖來表示不同的相關關系。圓圈代18現在仍有一些基本的問題還沒有提到和解決?!笆裁唇凶鯴與Y之間有好的相關關系?”“怎樣才能知道相關系數是否顯著?”這是兩個非常不同的問題。第一個問題與相關系數的重要性有關。當研究者們提及相關系數的重要性時,他們是想說明相關系數幫助他們更好地理解復雜的現象。相關系數的重要性依賴于研究的種類。一個相關系數值0.2也許對一位研究者來說非常重要,但對另一位來說不值一提,這完全依賴于數據被解釋的條件。現在仍有一些基本的問題還沒有提到和解決。“什么叫做X與Y之間198.7需要注意的幾點當解釋相關系數時,有一些地方需要注意。有一些很重要的因素會導致相關系數人為地很高或者很低。這些極端值的相關性有時被稱為假性相關(spuriouscorrelation),因為它們并不代表隨機變量間真實的關系,也可能是一些容易引起混淆的因素造成的結果。有時候一個相關系數可能很小或者接近零。一些研究者假設研究中一個很小的相關系數意味著兩個隨機變量之間關系微弱或者沒有關系。8.7需要注意的幾點當解釋相關系數時,有一些地方需要20兩個隨機變量之間缺乏明顯的相關性可以有很多原因來解釋。同樣很多情況可以導致兩個隨機變量有極強的相關性,雖然這與它們真實的關系是無關的。一位優(yōu)秀的研究者將試圖在做出任何關于相關系數含義的結論前,為這些不一樣的解釋尋找原因。下面列舉一些會導致假性相關的原因。兩個隨機變量之間缺乏明顯的相關性可以有很多原因來解釋。同樣很21隨機變量之間缺乏線性關系截斷的區(qū)域樣本容量離群點多總體極值因果關系隨機變量之間缺乏線性關系228.8相關性是可靠性的一種度量

心理學研究中一個非常重要的概念就是可靠性(reliability)??煽啃灾敢环N度量方法能夠產生相同結果的這種一致性。一種測試如果在標準化條件下進行得到一致的結果,就說它是可靠的??煽啃越洺S孟嚓P系數來評估。8.8相關性是可靠性的一種度量

心理學研究中一個非常23不要混淆可靠性與有效性的概念。有效性是一種度量手段多大程度上能夠達到預先的目的。如果一項測試希望度量拼寫能力,那么需要提供一種較好的評估該能力的手段。如果它是一種解決詞匯問題能力的有效度量,就不能用測度閱讀能力來代替。有效性和可靠性相似,也可以用相關系數來評估。一次測試中的數據與它的測度數據相關或者與另一測試相關。如果這種相關關系較強,測試就被認為是有效的。不要混淆可靠性與有效性的概念。有效性是一種度量手段多大程度上248.9相關性矩陣有時候我們相信并沒有被證實的事情。例如,我們有這樣的觀念,一個體重超重的兒童必然會成為一個體重超重的成年人。家長們擔心他們的肥胖小寶貝會變成肥胖青少年。一些肥胖的青少年擔心他們的一生都將是這樣的情形。但是這樣認為有經驗根據嗎?事實是怎樣的?關聯性研究經常為證實或者否定這種普遍概念提供證據。你是怎樣認為的?兒童時的體重是否為你一生體重的一個可靠指標?8.9相關性矩陣有時候我們相信并沒有被證實的事情。例25研究者使用一種叫做BodyMassIndex(BMI)的方法研究這個有關一生體重的問題。這個指標考慮到體重相對于身高的關系。出于我們的目的,我們可以將它認為是肥胖程度的一種度量。一組測試者被跟蹤調查40年,他們的體重在不同時間被采集——兒童,青少年,18歲,30歲和40歲。這些不同時間收集到的數據彼此相互關聯。研究者使用一種叫做BodyMassIndex(BMI268.10定序尺度變量與rs度量結果是一個順序數據。雖然能從排序數據中得到Pearsonr,我們還有另外一種乘積矩系數叫做Spearmanr,rs,或者叫做等級相關系數(rankcorrelationcoefficient)。等級數據的相關系數降低了獲取相關系數的計算工作。Spearmanr對于數據中一方是順序數據而另一方是順序數據或者區(qū)間/比例數據的情況非常合適。在數據偏度較大時,Spearmanr也是相關性的一種較好

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論