版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第三講 統(tǒng)計(jì)相關(guān)測量法,一、選擇相關(guān)測量法需要注意三個(gè)問題,第一、變量的測量層次:定類、定序和定距。屬于不同測量層次的變量,就要用不同的相關(guān)測量法。 第二、變量之間關(guān)系是對稱還是不對稱的。有些相關(guān)測量法是假定變量與變量之間具有對稱關(guān)系,有些則假定是不具有對稱關(guān)系。 第三、注意統(tǒng)計(jì)值的意義。一般選擇具有消減誤差比例意義的測量法,即PRE測量法。 根據(jù)變量層次,有六種相關(guān)測量情況: 兩個(gè)定類變量 兩個(gè)定序變量 兩個(gè)定距變量 一個(gè)定類變量和一個(gè)定距變量 一個(gè)定類變量和一個(gè)定序變量 一個(gè)定序變量和一個(gè)定距變量,二、兩個(gè)變量的相關(guān)測量法,三、兩個(gè)定類變量的統(tǒng)計(jì)相關(guān),1、Lambda相關(guān)測量法 Lambd
2、a相關(guān)測量法的基本邏輯是用一個(gè)定類變量來解釋或預(yù)測另一個(gè)定類變量時(shí),以眾數(shù)作為解釋或預(yù)測的標(biāo)準(zhǔn),可以減除多少預(yù)測誤差。 Lambda相關(guān)測量法有兩種形式。一種是對稱形式,即兩個(gè)變量間的關(guān)系是對稱的,不分自變量或因變量。另一種是不對稱形式,即要求一個(gè)是自變量(X),另一個(gè)是因變量(Y)。,(對稱形式),(非對稱形式),其中:My是Y變量的眾數(shù)次數(shù)。 Mx是X變量的眾數(shù)次數(shù)。 mx是Y變量的每個(gè)值(類別)之下X變量的眾值次數(shù)。 my是X變量的每個(gè)值(類別)之下X變量的眾值次數(shù)。 n 是全部樣本數(shù)目。,表1 100名青年的人生志愿與性別的關(guān)系,資料表明性別與志愿是非對稱關(guān)系,性別為自變量,志愿為因變
3、量,二者都是定類變量,故要應(yīng)用Lambda系數(shù)來計(jì)算相關(guān)情況。 根據(jù)的系數(shù)公式和表1的次數(shù)資料,可知M=50, m=40+30=70,n=100, 該統(tǒng)計(jì)量表明,以X解釋或預(yù)測Y,可以消減40%的誤差。,2、 tauY相關(guān)測量法,測量方法 tauY系數(shù)是屬于不對稱相關(guān)測量法,要求兩個(gè)定類變量中有一個(gè)是自變量(X),另一個(gè)是因變量(Y)。系數(shù)值在0與1之間,具有消減誤差比例的意義。該方法與Lamabda不同在于計(jì)算系數(shù)時(shí),包括所有的邊緣次數(shù)和條件次數(shù)。,其中:E1為不知道X而預(yù)測Y時(shí)的全部誤差,E2為知道X預(yù)測Y時(shí)的誤差。 n為全部個(gè)案數(shù)目, f為某條件次數(shù), Fy為Y變量的某個(gè)邊緣次數(shù), Fx
4、為X變量的某個(gè)邊緣次數(shù)。,根據(jù)表1的研究資料。全部樣本數(shù)目(n)是100。性別是自變量(X),邊緣次數(shù)(Fx)分別是60和40;志愿是因變量(Y),邊緣次數(shù)(Fy)分別是40、50和10。表內(nèi)有六個(gè)條件次數(shù),每者都代表同屬于某項(xiàng)Y值與某項(xiàng)X值的樣本數(shù)目(f)。,這個(gè)數(shù)值不但能表示性別與志愿的相關(guān)程度,而且可以解釋為以性別來預(yù)測或估計(jì)志愿,能夠消減22.4%的誤差。 由于tau-y測量法是考慮全部次數(shù),故其敏感度高于Lambda測量法。,tauy = (58-45)/58=22.4%,四、兩個(gè)定序變量的統(tǒng)計(jì)相關(guān),計(jì)算一個(gè)定序變量與另一個(gè)定序變量的相關(guān)系數(shù),可用Gamma系數(shù),dy 系數(shù),肯得爾的
5、tau系數(shù)以及斯皮爾曼的rho系數(shù)。 1、計(jì)算中所用的基本概念(同序?qū)?、異序?qū)?、同分對?同序?qū)?。如果某對樣本在兩個(gè)變量上的相對等級(jí)是相同的,則稱為同序?qū)Γ╯ameordered pair)。 異序?qū)ΑH绻硨颖驹趦蓚€(gè)變量上的相對等級(jí)是不相同的,則稱為異序?qū)Γ╠ifferent-ordered pair)。 同分對。如果兩個(gè)樣本在某變量上可能是同分(tie),即不能分高低,則稱為同分對。,四名學(xué)生的成績等級(jí),A與C是同序?qū)?,因?yàn)锳的數(shù)學(xué)成績等級(jí)低于C,其英文成績也低于C同理,B與C也是同序?qū)χ劣贏與B則是異序?qū)?因?yàn)锳的數(shù)學(xué)成績等級(jí)低于B,但其英文成績高于B同理,A與D, B與D,和C與D皆
6、是異序?qū)C合起來,同序?qū)τ袀€(gè),異序?qū)τ袀€(gè) s=2, Nd=4,2、Gamma相關(guān)測量法 計(jì)算公式: Gamma系數(shù)不考慮同分對數(shù)。公式中的分母,表示在預(yù)測或解釋任何一個(gè)個(gè)案的相對等級(jí)時(shí)可能的最大誤差。公式中的分子,表示以一對個(gè)案在一個(gè)變量上的相對等級(jí)來預(yù)測其在另一變量上的相對等級(jí)所能減少的誤差。 Gamma屬于對稱相關(guān)測量法。 3、d相關(guān)測量法 計(jì)算公式: 其中Ns是同序?qū)?shù),Nd是異序?qū)?shù),T是只在因變量Y上同分的對數(shù)。d相關(guān)測量法屬于非對稱相關(guān)測量法。,G=(Ns-Nd)/(Ns+Nd),D=(Ns-Nd)/(Ns-Nd+Ty),4、肯德爾的tau系數(shù),肯德爾的tau系數(shù)可分三種形式,分別
7、稱為tau-a,tau-b,tau-c,都是適用于分析對稱的關(guān)系。其基本邏輯是計(jì)算同序?qū)?shù)與異序?qū)?shù)之差在全部可能對數(shù)中所占的比例 如何選用這三種系數(shù)呢? 1、如果在兩個(gè)變量上都沒有同分對,則使用tau-a,該系數(shù)值是由-1+1。 2、如果有同分對,且在交叉分組表行數(shù)與列數(shù)相同(即r=c)的情況下,可用tau-b,其系數(shù)值是由-1+1。 3、tau-c則不考慮是否有同分對,也不考慮行數(shù)與列數(shù)是否相等,其系數(shù)值在-1+1之間。 Tau-c系數(shù)適合于社會(huì)科學(xué)研究,因?yàn)樯鐣?huì)科學(xué)研究在問卷的設(shè)計(jì)時(shí),不一定各個(gè)問題的選項(xiàng)都相同,在做交叉分析時(shí),表的大小無一定規(guī)則,同時(shí)表中常有很多同分對。,其中,Ns是同
8、序?qū)Γ琋d是異序?qū)?,n是全部個(gè)案數(shù)目,m是交互分類表的行數(shù)(r)與列數(shù)(c)中的較小者。,5、斯皮爾曼rho系數(shù),斯皮爾曼rho系數(shù)也稱等級(jí)相關(guān)系數(shù),其特點(diǎn)是在計(jì)算每個(gè)個(gè)案在兩個(gè)變量上的等級(jí)時(shí),不僅要區(qū)別二者的高低差異,而且還要計(jì)算二者差異的確切數(shù)值。 該方法的特點(diǎn)是:1、是對稱相關(guān)測量法,其統(tǒng)計(jì)值在-1+1之間;2、該值具有消減誤差比例的意義。,十個(gè)鄉(xiāng)的經(jīng)濟(jì)水平與衛(wèi)生水平,五、兩個(gè)定距變量的相關(guān),如果所研究的變量都屬于定距測量層次,可以用簡單線性回歸分析法測算以自變量的數(shù)值預(yù)測或估計(jì)因變量的數(shù)值,也可以用積距相關(guān)系數(shù)來測量兩個(gè)變量的相關(guān)程度。 1、 簡單線性回歸分析 簡單線性回歸分析就是根據(jù)
9、一個(gè)直線方程式,以一個(gè)自變量(X)的數(shù)值來預(yù)測一個(gè)因變量(Y)的數(shù)值。這個(gè)方程式表示為: Y1=a+bX,由于實(shí)際值是Y,則預(yù)測誤差便是:e = Y- Y1。將全部樣本個(gè)案的各個(gè)e相加起來就是誤差總數(shù),但這樣做的結(jié)果會(huì)引起正負(fù)值相抵消的問題。為了克服“正負(fù)抵消”問題,我們將e的平方值相加起來,再使之最小,這就是所謂的“最小二乘法準(zhǔn)則”。,通過求極值得到b解:,r=,2、積距相關(guān)測量法 盡管通過b值的作用,使我們能夠以X的變化來預(yù)測Y的變化。但由于b值沒有上限,難以判斷變量之間的相關(guān)強(qiáng)弱。因此需要應(yīng)用皮爾遜(pearson)的積距相關(guān)系數(shù)(r),公式如下:,r系數(shù)與b系數(shù)的區(qū)別,是r系數(shù)假定X與
10、Y的關(guān)系是對稱的,而且r的統(tǒng)計(jì)值是由-1至+1,同時(shí)r的平方值具有消減誤差的意義。這個(gè)r值,稱為決定系數(shù)。,六、定類與定距、定類與定序、定序與定距 變量的相關(guān),1、定類與定距相關(guān)比率測量法(Eta) 相關(guān)比率是測量一個(gè)定類變量與一個(gè)定距變量相關(guān)關(guān)系的方法。其中定類變量為自變量(X),定距變量為因變量(Y)。相關(guān)比率就是根據(jù)自變量的每一個(gè)值來預(yù)測或估計(jì)因變量的均值。Eta系數(shù)值是由0到1,其平方值具有消減誤差比例的意義。 2、定類與定序Lambda,tauy系數(shù) 3、定序與定距相關(guān)比率,例:語文水平與職業(yè)的關(guān)系,上表是研究20名學(xué)生的家庭職業(yè)背景(分為干部工人和農(nóng)民三類對其語文能力(由0至100
11、分)的影響. 家庭職業(yè)背景是自變量,屬于定類測量層次.而語文水平是因變量,屬于定距測量層次,故可用Eta統(tǒng)計(jì)量.,六、偏相關(guān)系數(shù),1、概念 在多元回歸分析中,其他變量被固定后,給定的任意兩個(gè)變量之間的相關(guān)系數(shù),叫偏相關(guān)系數(shù)。 在因果分析中,控制第三類變量以后,兩個(gè)變量的相關(guān)系數(shù)也稱偏相關(guān)系數(shù)。 2、計(jì)算公式 偏相關(guān)系數(shù)屬于對稱相關(guān)測量法的一種,它要求變量間是直線關(guān)系,且所有變量都必須是定距變量。 假定我們所研究的兩個(gè)變量X與Y,如果控制一個(gè)變量W,則偏相關(guān)系數(shù)的計(jì)算公式如下 :,公式1左邊的符號(hào)表示在控制W變量以后,X與Y的凈相關(guān)(下標(biāo)中的小點(diǎn)表示控制),而公式1右邊的各個(gè)r就是兩個(gè)變量之間的
12、積矩相關(guān)。分子中的第一項(xiàng)表示X與Y的相關(guān)程度,第二項(xiàng)分別表示X、Y與控制變量之間的相關(guān)關(guān)系。公式2、3表示同時(shí)控制兩個(gè)或兩個(gè)以上的第三變量,X與Y的凈相關(guān)。如此類推,可以同時(shí)控制更多的第三類變量。公式1也稱為一階相關(guān),公式2稱為二階相關(guān),等等。 例題4:利用偏相關(guān)系數(shù)分析27個(gè)村工業(yè)化程度與人均耕地面積和距離城市遠(yuǎn)近的關(guān)系。,27個(gè)村的工業(yè)化程度、耕地人口比例和距城遠(yuǎn)近,從理論上講,村的工業(yè)化程度與耕地面積有較強(qiáng)的負(fù)相關(guān)性。如果村中人均耕地面積多,就沒有迫切的需要和剩余的人力來發(fā)展工業(yè),相反,如果地少人多,就具有發(fā)展工業(yè)的迫切性與可能性。二者的相關(guān)關(guān)系為-0.64,能夠驗(yàn)證理論。 如果考慮到村子距城鎮(zhèn)距離遠(yuǎn)近這個(gè)因素,上述關(guān)系還存在嗎?離城越近的村,在信息與市場等要素方面,更具發(fā)展工業(yè)的條件。因此需要對距城鎮(zhèn)遠(yuǎn)近加以控制,作為進(jìn)一步考察工業(yè)化程度與人均耕地面積的前提條件。計(jì)算得偏相關(guān)系數(shù)為-0.47。這個(gè)數(shù)與原相關(guān)系數(shù)比較,明顯地減弱了。這說明人均耕地面積與工業(yè)化的關(guān)系,部分需要由離城遠(yuǎn)近來解釋。,七、其他偏相關(guān)測量法,如果是定類變量,需要用偏Lambda或凈tau-y系數(shù)來測量。該種方法就是依據(jù)控制變量的值把樣本分組,然后計(jì)算各個(gè)分組的系數(shù)值的加權(quán)平均。通常是以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學(xué)(食品科學(xué)與工程)食品營養(yǎng)學(xué)試題及答案
- 2025年中職建筑類(建筑基礎(chǔ)常識(shí))試題及答案
- 2025年大學(xué)第二學(xué)年(電子科學(xué)與技術(shù))半導(dǎo)體器件應(yīng)用試題及答案
- 2025年高職酒店管理(宴會(huì)服務(wù))試題及答案
- 高職第三學(xué)年(建筑工程技術(shù))砌體工程施工2026年試題及答案
- 2025年高職地質(zhì)學(xué)基礎(chǔ)(地質(zhì)勘察)試題及答案
- 2025年中職(數(shù)控技術(shù)應(yīng)用)數(shù)控銑床編程階段測試題及答案
- 2025年大學(xué)地理科學(xué)(土地規(guī)劃與管理)試題及答案
- 2025年中職安全工程技術(shù)(安全工程應(yīng)用)試題及答案
- 2025年大學(xué)本科二年級(jí)(游戲設(shè)計(jì))游戲場景設(shè)計(jì)測試題及答案
- 中考物理 題型06【電學(xué)實(shí)驗(yàn)題】押題必做15題
- 企業(yè)安全生產(chǎn)責(zé)任制評估與改進(jìn)方案
- 昆侖神話敘事的百年學(xué)術(shù)史重構(gòu)與跨學(xué)科研究
- (必刷)湖南專升本《基礎(chǔ)護(hù)理學(xué)》考點(diǎn)精粹必做300題-含答案
- 隧道監(jiān)測與數(shù)據(jù)采集技術(shù)方案
- 總經(jīng)辦辦公室工作總結(jié)及計(jì)劃
- 圍堤水下拋石工程的施工技術(shù)方案與安全措施
- 2025-2030中國鋼結(jié)構(gòu)建筑在新能源設(shè)施建設(shè)中的應(yīng)用前景報(bào)告
- 焊工安全培訓(xùn)考試題(附答案)
- 2025年直招軍官面試題型及答案
- 人工智能AI賦能干行百業(yè)白皮書2025
評論
0/150
提交評論