版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、SPSS數(shù)據(jù)分析-第8章-SPSS的相關(guān)分析和線性回歸分析,SPSS統(tǒng)計分析方法及應(yīng)用,什么是相關(guān)分析,相關(guān)分析是分析客觀事物之間相關(guān)性的數(shù)量分析方法。許多事物或現(xiàn)象之間總是相互聯(lián)系的,并且可以通過一定的數(shù)量關(guān)系反映出來。 函數(shù)關(guān)系:兩事物之間一對一的關(guān)系。 統(tǒng)計關(guān)系:兩事物之間的多對一和一對多。,線性相關(guān)和非線性相關(guān),統(tǒng)計關(guān)系還可以分為: (1)線性相關(guān):當(dāng)一個變量的值發(fā)生變化時,另外的一個變量也發(fā)生大致相同的變化。在直角坐標(biāo)系中,如現(xiàn)象觀察值的分布大致在一條直線上,則現(xiàn)象之間的相關(guān)關(guān)系為線性相關(guān)或直線相關(guān)(Linear correlation)。 (2)非線性相關(guān):如果一個變量發(fā)生變動,另
2、外的變量也隨之變動,但是,其觀察值分布近似的在一條曲線上,則變量之間的相關(guān)關(guān)系為非線性相關(guān)或曲線相關(guān)(Curvilinear correlation),相關(guān)關(guān)系的種類,相關(guān)關(guān)系的種類:是否線性 線性相關(guān) 正相關(guān) 負(fù)相關(guān) 曲線相關(guān) 相關(guān)關(guān)系的種類:據(jù)變量的度量類型 定類變量和定類變量之間的相關(guān) 定序變量和定序變量之間的相關(guān) 定距變量和定距變量之間的相關(guān),相關(guān)關(guān)系的種類,相關(guān)關(guān)系的種類:是否線性 線性相關(guān) 正相關(guān) 負(fù)相關(guān) 曲線相關(guān) 相關(guān)關(guān)系的種類:據(jù)變量的度量類型 定類變量和定類變量之間的相關(guān) 定序變量和定序變量之間的相關(guān) 定距變量和定距變量之間的相關(guān),定類變量 定序變量 定距變量,定類變量變量的
3、一種,根據(jù)定性的原則區(qū)分總體各個案類別的變量。定類變量的值只能把研究對象分類,也即只能決定研究對象是同類抑或不同類,具有與的數(shù)學(xué)性質(zhì)。例如性別區(qū)分為男性和女性兩類 定序變量變量的一種,區(qū)別同一類別個案中等級次序的變量。定序變量能決定次序,也即變量的值能把研究對象排列高低或大小,具有與的數(shù)學(xué)特質(zhì)。它是比定類變量層次更高的變量,因此也具有定類變量的特質(zhì),即區(qū)分類別(,)。例如文化程度可以分為大學(xué)、高中、初中、小學(xué)、文盲。 定距變量 也是變量的一種,區(qū)別同一類別個案中等級次序及其距離的變量。它除了包括定序變量的特性外,還能確切測量同一類別各個案高低、大小次序之間的距離,因而具有加與減的數(shù)學(xué)特質(zhì)。但是
4、,定距變量沒有一個真正的零點。,相關(guān)分析的作用,判斷變量之間有無聯(lián)系 確定相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法 把握相關(guān)關(guān)系的方向與密切程度 為進一步采取其他統(tǒng)計方法進行分析提供依據(jù) 用來進行預(yù)測,相關(guān)分析和回歸分析區(qū)別,相關(guān)分析:如果僅僅研究變量之間的相互關(guān)系的密切程度和變化趨勢,并用適當(dāng)?shù)慕y(tǒng)計指標(biāo)描述。 回歸分析:如果要把變量間相互關(guān)系用函數(shù)表達出來,用一個或多個變量的取值來估計另一個變量的取值。,散點圖,通過觀察散點圖能夠直觀的發(fā)現(xiàn)變量之間的統(tǒng)計關(guān)系 以及它們的強弱程度和數(shù)據(jù)對的可能走向。散點圖以橫軸表示兩個變量中的一個變量,以縱軸表示另一個變量,將兩個變量之間相對應(yīng)的變量值以坐標(biāo)點的形式逐
5、一標(biāo)在直角坐標(biāo)系中,通過點的分布形狀、分布模式和疏密程度來形象描述兩個變量之間的相關(guān)關(guān)系。,矩陣散點圖:以矩陣的形式在多個坐標(biāo)軸上分別顯示多對變量間的統(tǒng)計關(guān)系。變量在那一行,那一行橫坐標(biāo)就是它。,線性相關(guān)的度量尺度數(shù)據(jù)間的相關(guān)性的度量,Pearson相關(guān)系數(shù) 相關(guān)系數(shù)的數(shù)值范圍是介于1與 +1之間: 如果|r| 0,表明兩個變量沒有線性相關(guān)關(guān)系。 如果|r| 1 ,則表示兩個變量完全直線相關(guān)。線性相關(guān)的方向通過相關(guān)系數(shù)的符號來表示,“+”號表示正相關(guān),“”表示負(fù)相關(guān)。,相關(guān)系數(shù)為0或接近于0不能說明兩個變量之間沒有相關(guān)性,它只說明沒有線性相關(guān)性。不能排除具有其它非線性關(guān)系。 Pearson 相
6、關(guān)系數(shù)是一種線性關(guān)聯(lián)度量。如果兩個變量關(guān)系密切,但其關(guān)系不是線性的,則 Pearson 相關(guān)系數(shù)就不是適合度量其相關(guān)性的統(tǒng)計量。,等級相關(guān)分析,等級相關(guān)分析 等級相關(guān)是指以等級次序排列或以等級次序表示的變量之間的相關(guān)。主要包括斯皮爾曼二列等級相關(guān)和肯德爾和諧系數(shù)多列等級相關(guān)。,Spearman等級相關(guān)系數(shù)定序變量之間的相關(guān)性的度量,斯皮爾曼等級相關(guān)系數(shù): 兩個變量為定序變量。 一個變量為定序變量,另一個變量為尺度數(shù)據(jù),且兩總體不是正態(tài)分布,樣本容量n不一定大于30。 數(shù)據(jù)的秩:秩rank,是一種數(shù)據(jù)排序的方式,可以知道某變量值在該列所有值中的名次。秩是對應(yīng)數(shù)值由大到小的,例如有100個數(shù)據(jù)都不
7、一樣的話,最大的數(shù)值對應(yīng)的秩就是100,最小的就是1。有重復(fù)數(shù)據(jù)時候,會按同名稱排列。,設(shè)D是兩個變量每對數(shù)據(jù)的等級差,n是樣本量。 則Spearman相關(guān)系數(shù)為:,Kendall的tau-b(K),Kendall的 系數(shù)是另一種計算定序變量之間或者定序和尺度變量之間相關(guān)系數(shù)的方法。Spearman的等級相關(guān)系數(shù)可以方便檢驗兩個定序變量是否相關(guān),但是很難具體解釋兩個變量如何相關(guān)及相關(guān)程度。Kendall的等級相關(guān)系數(shù)可以同時反映兩個變量的相關(guān)程度。,設(shè)樣本量為n,考察兩個變量X和Y之間的相關(guān)關(guān)系,X和Y的取值記為xi,yi。所有像(xi,yi)對的個數(shù)為n(n-1)/2(也就是 )。和分別表示
8、和的秩次,如果對于任意k,有我們稱(xk,yk)為同序?qū)?;否則,稱為逆序?qū)Α?總的同序?qū)Φ膫€數(shù)記為U,逆序?qū)Φ膫€數(shù)記為V,則Kendall的Tau系數(shù)的定義為:,偏相關(guān)分析,概念:當(dāng)有多個變量存在時,為了研究任何兩個變量之間的關(guān)系,而使與這兩個變量有聯(lián)系的其它變量都保持不變。即控制了其它一個或多個變量的影響下,計算兩個變量的相關(guān)性。 偏相關(guān)系數(shù):偏相關(guān)系數(shù)是用來衡量任何兩個變量之間的關(guān)系的大小。 自由度:在統(tǒng)計學(xué)中,自由度指的是計算某一統(tǒng)計量時,取值不受限制的變量個數(shù)。通常df=n-k。其中n為樣本含量,k為被限制的條件數(shù)或變量個數(shù),或計算某一統(tǒng)計量時用到其它獨立統(tǒng)計量的個數(shù)。,回歸分析,一元
9、線性回歸模型: 其中x為自變量;y為因變量; 為截距,即常量; 為回歸系數(shù),表明自變量對因變量的影響程度。,用最小二乘法求解方程中的兩個參數(shù),得到,回歸方程統(tǒng)計檢驗,回歸方程的擬合優(yōu)度:回歸直線與各觀測點的接近程度稱為回歸方程的擬合優(yōu)度,也就是樣本觀測值聚集在回歸線周圍的緊密程度 。 當(dāng)自變量是分類變量時,需要將原變量轉(zhuǎn)換成虛擬變量,所有虛擬變量都是 “1”和“0”取值的二分變量。(例如性別變量),回歸方程的統(tǒng)計檢驗,即:總離差平方和(SST)=剩余離差平方和(SST) +回歸離差平方和(SSR)其中;SSR是由x和y的直線回歸關(guān)系引起的,可以由回歸直線做出解釋;SSE是除了x對y的線性影響之
10、外的隨機因素所引起的Y的變動,是回歸直線所不能解釋的。,殘差分析,殘差是指由回歸方程計算得到的預(yù)測值與實際樣本值之間的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值等于0;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。,對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如果殘差均值為零,殘差圖的點應(yīng)該在縱坐標(biāo)為0的中心的帶狀區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。 DW檢驗: DW檢驗用來檢驗殘差的自
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電工合金熔煉及熱變形工崗前工作意識考核試卷含答案
- 化工洗滌工操作評估水平考核試卷含答案
- 2025年厚、薄膜混合集成電路及消費類電路合作協(xié)議書
- 隔離層制備工安全應(yīng)急測試考核試卷含答案
- 煙葉制絲設(shè)備操作工安全理論競賽考核試卷含答案
- 2025年科技中介服務(wù)合作協(xié)議書
- 2025年醫(yī)用檢驗與生化分析儀器項目發(fā)展計劃
- 2025年冷鏈裝備項目發(fā)展計劃
- 2025年滌綸高彈絲合作協(xié)議書
- 2026年烹飪計時器項目評估報告
- 上海市徐匯區(qū)2026屆初三一?;瘜W(xué)試題(含答案)
- 鉗工技能訓(xùn)練(第4版)PPT完整全套教學(xué)課件
- 電力工程課程設(shè)計-某機床廠變電所設(shè)計
- 馬鞍山經(jīng)濟技術(shù)開發(fā)區(qū)建設(shè)投資有限公司馬鞍山城鎮(zhèn)南部污水處理廠擴建工程項目環(huán)境影響報告書
- Unit 2 Reading and Thinking教學(xué)課件(英語選擇性必修第一冊人教版)
- 兒童常用補液
- GB/T 615-2006化學(xué)試劑沸程測定通用方法
- GB/T 22085.2-2008電子束及激光焊接接頭缺欠質(zhì)量分級指南第2部分:鋁及鋁合金
- GB/T 19939-2005光伏系統(tǒng)并網(wǎng)技術(shù)要求
- GB/T 18853-2015液壓傳動過濾器評定濾芯過濾性能的多次通過方法
- 工業(yè)管道施工與驗收規(guī)范
評論
0/150
提交評論