下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、5.4 相關(guān)分析,一、相關(guān)分析的概念與相關(guān)分析過程 (一)相關(guān)分析 相關(guān)分析是研究不同變量間密切程度的一種十分常用的統(tǒng)計方法。相關(guān)系數(shù)是描述兩個變量間的線性關(guān)系程度和方向的統(tǒng)計量。 相關(guān)系數(shù)通常用r表示,它沒有單位,其值在 -1+1之間。 r等于+1或 -l時,其中一個變量記為Y可以確切地用另一變量記為X的線性函數(shù)來表示。 r的絕對值越接近1,則變量X、Y間線性相關(guān)的程度就越大。 若變量Y隨著變量X的增、減而增、減,即兩變量變化的方向一致,則這種相關(guān)稱為正相關(guān),r大于零; 若變量Y隨著變量X的增加而減少,變化方向相反,則稱為負相關(guān),r小于零;若r等于零,則可認為變量X、Y不是線性相關(guān)。,由于我
2、們通常是通過抽樣方法,利用樣本研究總體的特性。但是由實際情況抽樣而得到的數(shù)據(jù)總存在抽樣誤差,即樣本中兩變量間相關(guān)系數(shù)不為0,不能說明總體中兩個變量間的相關(guān)系數(shù)不是0,同樣,樣本中兩變量間相關(guān)系數(shù)不為0,也不能保證實際中這兩個變量相關(guān),因此相關(guān)分析必須通過檢驗。 檢驗的假設(shè)是:總體中兩個變量間的相關(guān)系數(shù)為0。 SPSS的相關(guān)分析過程給出該假設(shè)成立的概率。一般的,我們給出假設(shè)成立概率p的域值為,當概率p小于時,則拒絕原假設(shè),認為原假設(shè)不成立;否則不能拒絕原假設(shè)。另外,在SPSS的相關(guān)分析過程的輸出中還給出相關(guān)系數(shù)的值。 偏相關(guān)分析是相關(guān)分析中的重要部分,它主要用在當控制了一個或幾個變量的影響下兩變
3、量間的相關(guān)性。 例如,可以控制體重影響作用,對人的身高與肺活量進行偏相關(guān)分析。,(二) 相關(guān)分析的功能和應(yīng)用 相關(guān)關(guān)系多種多樣,歸納起來有六種類型: 1強正相關(guān)關(guān)系,其特點是一變量X增加,導(dǎo)致另一變量Y明顯增加,說明X是影響Y的主要因素。 2弱正相關(guān)關(guān)系,其特點是一變量X增加,也導(dǎo)致另一變量Y增加,但不明顯,說明X是影響Y的因素,但不是唯一因素。 3強負相關(guān)關(guān)系,其特點是X增加,導(dǎo)致Y明顯減少,說明X是影響Y的主要因素。 4弱負相關(guān)關(guān)系,其特點是一變量X增加,也導(dǎo)致另一變量Y減少,但不明顯,說明X是影響Y的因素,但不是唯一因素。 5非線性相關(guān)關(guān)系,其特點是X,Y之間雖然沒有通常所指的那種線性關(guān)
4、系,卻存在著某種非線性關(guān)系,說明X仍是影響Y的因素。 6不相關(guān)關(guān)系,其特點是X,Y之間不存在相關(guān)關(guān)系,說明X不是影響Y的因素。,(三) 相關(guān)分析的SPSS過程 在“分析”下拉菜單的“相關(guān)”命令項具有三個相關(guān)分析功能與命令。它們分別是“雙變量”、“偏相關(guān)”和“距離”,對應(yīng)于相關(guān)分析、偏相關(guān)分析和距離分析。 1雙變量:計算指定的兩個變量間的相關(guān)系數(shù),可以選擇Pearson相關(guān)(積差相關(guān))、Spearman等級相關(guān)和Kendall相關(guān),同時對相關(guān)系數(shù)進行假設(shè)檢驗??蛇x擇進行單尾或雙尾檢驗,給出相關(guān)系數(shù)為0的概率。當資料不服從雙變量正態(tài)分布或總體分布型未知,或原始數(shù)據(jù)是用等級表示時,宜用Spearma
5、n或Kendall相關(guān)。 2偏相關(guān):計算兩個變量間再控制了其他變量影響下的相關(guān)系數(shù),即偏相關(guān)系數(shù)可以進行單尾或雙尾檢驗,檢驗的假設(shè)是:偏相關(guān)系數(shù)為0,然后給出偏相關(guān)系數(shù)為0的概率。還可以計算其它描述統(tǒng)計量。 3、距離:對變量和觀測量值進行相似性或不相似性測度。,二、兩個變量的相關(guān)分析“雙變量” 1、二元變量相關(guān)分析的功能和應(yīng)用 二元變量的相關(guān)分析研究的是兩個變量之間的相關(guān)關(guān)系,這種關(guān)系稱為單相關(guān),即這種相關(guān)關(guān)系只涉及一個自變量和一個因變量. 三個或三個以上變量之間的相關(guān)關(guān)系稱為復(fù)相關(guān),這種相關(guān)涉及到一個因變量與兩個以上的自變量。例如,同時研究畝產(chǎn)量與降雨量、施肥量、種植密度之間的關(guān)系就是復(fù)相關(guān)
6、關(guān)系。在實際工作中,如果存在多個自變量與一個因變量的關(guān)系,可以抓住其中最主要的因素,研究其相關(guān)關(guān)系,或?qū)?fù)相關(guān)化為單相關(guān)問題進行研究。 調(diào)用“雙變量”過程命令時允許同時輸入兩個變量或兩個以上變量,但系統(tǒng)輸出的是變量間兩兩相關(guān)的相關(guān)系數(shù)。,2、二元變量相關(guān)分析的應(yīng)用示例 下面用一個例題來說明二元變量的相關(guān)分析。 例5-4-1盡管采取了時速限制及改進路面等措施,公路死亡人數(shù)仍在年復(fù)一年的上升。某安全負責(zé)人相信速度與事故數(shù)有聯(lián)系,并從12個州搜集到如下資料,數(shù)據(jù)如下表所示。(e5-4-1) 表5-4-1 公路平均速度X與公路死亡增長百分比Y數(shù)據(jù)表,操作步驟: 分析 相關(guān) 雙變量 (1)主對話框中的選
7、擇項,分析方法選擇項: Pearson相關(guān)復(fù)選項,皮爾遜相關(guān),積差相關(guān),計算連續(xù)變量或是等間距測度的變量間的相關(guān)分析。 Kendalls tau-b復(fù)選項,肯德爾b,等級相關(guān),計算分類變量間的秩相關(guān)。 Spearman復(fù)選項,等級相關(guān),計算斯皮爾曼相關(guān)。 對于非等間距測度的連續(xù)變量,因為分布不明可以使用等級相關(guān)分析,也可以使用 Pearson相關(guān)分析;對于完全等級的離散變量必須使用等級相關(guān)分析相關(guān)性。當資料不服從雙變量正態(tài)分布或總體分布型未知,或原始數(shù)據(jù)是用等級表示時,宜用Spearman或 Kendall相關(guān)。,選擇顯著性檢驗類型: 雙尾檢驗:當事先不知道相關(guān)方向(正相關(guān)還是負相關(guān))時選擇此
8、項。 單尾檢驗:如果事先知道相關(guān)方向可以選擇此項。 “標記顯著性相關(guān)”復(fù)選項:如果選中此項,輸出結(jié)果中在相關(guān)系數(shù)數(shù)值右上方使用“”表示顯著水平為5;用“”表示其顯著水平為1。,(2)“選項”對話框中的選擇項:,統(tǒng)計量選擇項: 均值與標準差 叉積偏差和 缺失值處理方法選擇項: 按對排除個案,僅剔除正在參與計算的兩個變量值是缺失值的觀測量。這樣在多元相關(guān)分析中或多對兩兩相關(guān)分析中,有可能相關(guān)系數(shù)矩陣中的相關(guān)系數(shù)是根據(jù)不同數(shù)量的觀測量計算出來的。 按列表排除個案,剔除在主對話框中“變量”矩形框中列出的變量帶有缺失值的所有觀測量。這樣計算出來的相關(guān)系數(shù)矩陣,每個相關(guān)系數(shù)都是依據(jù)相同數(shù)量的觀測量計算出來
9、的。,(3)輸出結(jié)果和解釋結(jié)果 (1)第一行中的數(shù)值是行變量與列變量的相關(guān)系數(shù)矩陣。行、列變量相同的相關(guān)系數(shù)自然為l。 (2)第二行中的數(shù)值是相關(guān)系數(shù)為零的假設(shè)成立的概率。 (3)第三行中的數(shù)值是參與該相關(guān)系數(shù)計算的觀測量數(shù)目 對計算結(jié)果的解釋主要是考察 0假設(shè)檢驗是否成立。當 P小于 1或 5時(相關(guān)系數(shù)數(shù)值上方使用“*”表示顯著水平為5%;用“*”表示其顯著水平為1),則應(yīng)拒絕相關(guān)系數(shù)為0的假設(shè),可以認為兩個變量之間是相關(guān)的。,例5-4-2 某地一年級12名女大學(xué)生的體重(kg)X與肺活量(l)Y如下表,試計算肺活量與體重的相關(guān)系數(shù),并檢驗兩者間是否有直線相關(guān)關(guān)系。(e5-4-2) 體重
10、42 42 46 46 46 50 50 50 52 52 58 58 肺活量 2.55 2.20 2.75 2.40 2.80 2.81 3.40 3.10 3.46 2.85 3.50 3.00,例5-4-3某地在作肝癌病因研究時,調(diào)查了10個鄉(xiāng)肝癌死亡率(1/10萬,用X表示)與某種食物中的黃曲霉毒素的相對含量有關(guān)(用Y表示),數(shù)據(jù)見下表(e5-4-3) ,試作等級相關(guān)分析。(Spearman相關(guān)分析),對以上結(jié)果的解釋是,Spearman等級相關(guān)系數(shù)為0.745,P=0.013,相關(guān)具有統(tǒng)計學(xué)意義,故可以認為黃曲霉毒素相對含量與肝癌死亡率間存在正相關(guān),雖然不是很強的正相關(guān)。,下面再給出
11、使用Kendall相關(guān)方法的例題,它適用于有序數(shù)據(jù)或不滿足正態(tài)分布的數(shù)據(jù)。 例5-4-4為研究平均工資與勞動生產(chǎn)率的關(guān)系,從一總體中抽選 20個企業(yè),而獲得20對數(shù)據(jù),并以勞動生產(chǎn)率(單位:萬元人)為自變量,平均工資(單位:元人)為因變量,編制成數(shù)據(jù)文件,如下圖所示(e5-4-4) 。 從“分析”-“相關(guān)”-“雙變量”,進入雙變量相關(guān)分析主對話框,將變量“勞動生產(chǎn)率x”、“平均工資y”選擇進人變量欄,在相關(guān)系數(shù)類型中只選擇 Kendalls tau-b等級相關(guān),其余使用默認值,點擊“確定”按鈕運行程序。,對以上結(jié)果的解釋是,Kendall等級相關(guān)系數(shù)為0.919, p=0.00,相關(guān)具有統(tǒng)計學(xué)
12、意義,故可認為勞動生產(chǎn)率與平均工資間存在很強正相關(guān)。,三、偏相關(guān)分析 1、偏相關(guān)分析的基本概念 相關(guān)分析計算兩個變量之間的相互關(guān)系,分析兩個變量間線性關(guān)系的程度。往往因為第三個變量的作用,使得相關(guān)系數(shù)不能真實地反映兩個變量間的線性相關(guān)程度。這樣也就決定了二元變量的相關(guān)分析的不精確性。例如身高、體重與肺活量之間的關(guān)系。如果使用Pearson相關(guān)計算其相關(guān)系數(shù),可以得出肺活量、身高和體重均存在較強的線性相關(guān)性質(zhì)。但實際上呢?對體重相同的人而言,”是否身高值越大,其肺活量也越大呢?答案是否定的。正是因為身高與體重有著線性關(guān)系,肺活量與體重有著線性關(guān)系,因此得出了身高與肺活量之間存在較強的線性關(guān)系的錯
13、誤結(jié)論。偏相關(guān)分析就是在研究兩個變量之間的線性相關(guān)關(guān)系時控制可能對其產(chǎn)生影響的變量。,偏相關(guān)系數(shù)衡量任何兩個變量之間的關(guān)系,而使與這兩個變量有聯(lián)系的其他變量都保持不變。例如,我們研究銷售額與人口數(shù)、銷售額與總收入之間的關(guān)系,人口數(shù)量的多少會影響銷售額,總收入的大小亦會影響銷售額。由于人口數(shù)量的變化,總收入的大小也在經(jīng)常的變化之中,應(yīng)用簡單相關(guān)系數(shù)往往不能說明現(xiàn)象之間的關(guān)系程度。這時,必須在消除其他變量的影響后來研究兩個變量之間的相互關(guān)系,這種相關(guān)分析稱為偏相關(guān)分析,這種相關(guān)系數(shù)稱為偏相關(guān)系數(shù)。例如,在研究銷售額和總收入的相互關(guān)系時,可假定人口數(shù)量不變;在研究銷售額與人口數(shù)的相互關(guān)系時,可假定總
14、收入不變。 例如,變量X,Y,Z之間彼此存在著關(guān)系,為了衡量X和Y之間的關(guān)系,就必須假定 z保持不變,計算 x和 Y的偏相關(guān)系數(shù),我們用 rxy,表示。rxy稱為 z保持不變時,X和Y的偏相關(guān)系數(shù)。偏相關(guān)系數(shù)是由簡單相關(guān)系數(shù)決定的。,2、 偏相關(guān)分析的功能與應(yīng)用 應(yīng)用SPSS的偏相關(guān)分析過程可對變量進行偏相關(guān)分析;在偏相關(guān)分析中,系統(tǒng)可按用戶的要求對兩相關(guān)變量之外的某一或某些影響相關(guān)的其他變量進行控制,輸出控制其他變量影響后的相關(guān)系數(shù)。 偏相關(guān)分析的主要用途如下: 根據(jù)觀測資料應(yīng)用偏相關(guān)分析計算偏相關(guān)系數(shù),可以判斷哪些自變量對因變量的影響較大,而選擇作為必須考慮的自變量。至于哪些對因變量影響較
15、小的自變量,則可舍去不顧。這樣在計算多元回歸分析時,只要保留起主要作用的自變量,用較少的自變量描述因變量的平均變動量。 偏相關(guān)分析應(yīng)用的領(lǐng)域也非常廣,涉及自然科學(xué)和社會科學(xué)的各個方面,3、 偏相關(guān)分析應(yīng)用示例 下面舉例說明偏相關(guān)分析的應(yīng)用。 例5-4-5 某農(nóng)場在一塊試驗地作測定施肥量 X,害蟲危害程度Y(用數(shù)值表示,數(shù)值越大表示危害越嚴重),和畝產(chǎn)Z的試驗,所得數(shù)據(jù)如下表所示。 (e5-4-5) 第一年 第二年 第三年 第四年 施肥量X 14 27 39 67 害蟲危害程度Y 43 15 9 2 畝產(chǎn)Z 30 76 85 12 操作步驟: 分析-相關(guān)-偏相關(guān),(1)主對話框中的選擇項 變量:
16、用于存放偏相關(guān)分析的量 控制:用于存放控制變量 假設(shè)檢驗類型的選擇 雙尾檢驗。當事先不知道相關(guān)方向(正相關(guān)還是負相關(guān))時選擇此項,用于正負相關(guān)兩種可能的情況,是系統(tǒng)默認值。 單尾檢驗。如果事先知道相關(guān)方向可以選擇此項,用于只可能是正向或只可能是負向的情況。,是否顯示實際的顯著性水平 選擇 “顯示實際顯著水平”在顯示相關(guān)系數(shù)的同時,顯示實際的顯著性概率。不選擇此項,其顯著性概率使用星號來代替。一個星號“”表示其顯著性概率 在5%一1之間。兩個星號“*”表示其顯著性水平小于或等于1。 (2)“選項”對話框中的選擇項 在主對話框的右下角有一個“選項”按鈕,單擊它,便進入選項對話框 。,Statistics統(tǒng)計量選擇項 均值和標準差 零階相關(guān)系數(shù) 缺失值選擇項 按列表排除個案,剔除所有帶有缺失值的觀測值。系統(tǒng)默認為此項。 按對排除個案,成對剔除帶有缺失值的觀測值。 選擇完成之后,單擊“ 繼續(xù)”按鈕返回主對話框。,(1)第一行中的數(shù)值是偏相關(guān)系數(shù)。行、列變量相同的偏相關(guān)系數(shù)為1。 (2)第二行中的數(shù)值是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電氣裝置接地施工規(guī)范詳解
- 智慧化升級2025年老舊小區(qū)改造項目可行性深度研究報告
- 小學(xué)數(shù)學(xué)乘法教學(xué)重難點及訓(xùn)練方案
- 小學(xué)英語聽說讀寫技能提升訓(xùn)練
- 銀行信貸風(fēng)險審核流程及關(guān)鍵點
- 教育系統(tǒng)綜合考試命題評價標準手冊
- 東營基坑施工方案(3篇)
- 水庫水渠施工方案(3篇)
- 古箏校慶活動方案策劃(3篇)
- 增資輿情應(yīng)急預(yù)案(3篇)
- 校外配餐入校管理制度
- 寺廟信息服務(wù)管理制度
- 交通運輸信息化標準體系
- JJF(軍工) 186-2018 氦質(zhì)譜檢漏儀校準規(guī)范
- 財務(wù)合規(guī)審查實施方案計劃
- 移動通信基站設(shè)備安裝培訓(xùn)教材
- 2024-2025學(xué)年云南省昆明市盤龍區(qū)高二(上)期末數(shù)學(xué)試卷(含答案)
- 臨床成人失禁相關(guān)性皮炎的預(yù)防與護理團體標準解讀
- 創(chuàng)新創(chuàng)業(yè)教育學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 《最奇妙的蛋》完整版
- 三年級科學(xué)上冊蘇教版教學(xué)工作總結(jié)共3篇(蘇教版三年級科學(xué)上冊知識點整理)
評論
0/150
提交評論