中科大SAS統(tǒng)計(jì)分析系統(tǒng)講義30Spearman等級(jí)相關(guān)分析_第1頁
中科大SAS統(tǒng)計(jì)分析系統(tǒng)講義30Spearman等級(jí)相關(guān)分析_第2頁
中科大SAS統(tǒng)計(jì)分析系統(tǒng)講義30Spearman等級(jí)相關(guān)分析_第3頁
中科大SAS統(tǒng)計(jì)分析系統(tǒng)講義30Spearman等級(jí)相關(guān)分析_第4頁
中科大SAS統(tǒng)計(jì)分析系統(tǒng)講義30Spearman等級(jí)相關(guān)分析_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

上海財(cái)經(jīng)大學(xué)經(jīng)濟(jì)信息管理系IS/SHUFEPagePAGE1ofNUMPAGES5Spearman等級(jí)相關(guān)分析秩相關(guān)的Spearman等級(jí)相關(guān)分析前面介紹了使用非參數(shù)方法比較總體的位置或刻度參數(shù),我們同樣也可以用非參數(shù)方法比較兩總體之間的相關(guān)問題。秩相關(guān)(rankcorrelation)又稱等級(jí)相關(guān),它是一種分析和等級(jí)間是否相關(guān)的方法。適用于某些不能準(zhǔn)確地測(cè)量指標(biāo)值而只能以嚴(yán)重程度、名次先后、反應(yīng)大小等定出的等級(jí)資料,也適用于某些不呈正態(tài)分布或難于判斷分布的資料。設(shè)和分別為和各自在變量X和變量Y中的秩,如果變量X與變量Y之間存在著正相關(guān),那么X與Y應(yīng)當(dāng)是同時(shí)增加或減少,這種現(xiàn)象當(dāng)然會(huì)反映在(,)相應(yīng)的秩(,)上。反之,若(,)具有同步性,那么(,)的變化也具有同步性。因此:(30.1)具有較小的數(shù)值。如果變量X與變量Y之間存在著負(fù)相關(guān),那么X與Y中一個(gè)增加時(shí),另一個(gè)在減小,具有較大的數(shù)值。既然由(,)構(gòu)成的樣本相關(guān)系數(shù)反映了X與Y之間相關(guān)與否的信息,那么在參數(shù)相關(guān)系數(shù)的公式中以和分別代替和,不是同樣地反映了這種信息嗎?基于這種想法,CharlesSpearman秩相關(guān)系數(shù)應(yīng)運(yùn)而生:(30.2)與形式上完全一致,但在中的秩,不管X與Y取值如何,總是只取1到之間的數(shù)值,因此它不涉及X與Y總體其他的內(nèi)在性質(zhì),例如,秩相關(guān)不需要總體具有有限兩階矩的要求。由于:因此,公式(30.2)可以化簡(jiǎn)為:(30.3)顯然在=時(shí),秩相關(guān)系數(shù)達(dá)到最大值+1。又因?yàn)椋憾诿繉?duì)+=時(shí)達(dá)到最小值,最小值求法為:所以,最小的為:最大的為:故秩相關(guān)系數(shù)的最小值為1-2=-1。在原假設(shè)和不相關(guān)的情況為真時(shí),即秩相關(guān)系數(shù)為0時(shí),的期望值為0,樣本的方差為(30.4)自由度為且分布關(guān)于零點(diǎn)對(duì)稱。當(dāng)10時(shí),的樣本分布可以標(biāo)準(zhǔn)化為近似的t分布:(30.5)例30.1某公司想要知道是否職工期望成為好的銷售員而實(shí)際上就能有好的銷售記錄。為了調(diào)查這個(gè)問題,公司的副總裁仔細(xì)地查看和評(píng)價(jià)了公司10個(gè)職工的初始面試摘要、學(xué)科成績(jī)、推薦信等材料,最后副總裁根據(jù)他們成功的潛能給出了單獨(dú)的等級(jí)評(píng)分。二年后獲得了實(shí)際的銷售記錄,得到了第二份等級(jí)評(píng)分,見表30.1中的第1到4列所示。統(tǒng)計(jì)問題為是否職工的銷售潛能與開始二年的實(shí)際銷售成績(jī)一致。表30.1職工的銷售潛能與銷售成績(jī)的秩相關(guān)分析職工編號(hào)潛能等級(jí)銷售成績(jī)成績(jī)等級(jí)124001112436031137300524412956-525562807-11633504-11710200100089260811982209-1110538523944Spearman秩相關(guān)系數(shù)的計(jì)算過程見表30.1中的第5到6列所示,最后計(jì)算結(jié)果為表明潛能與成績(jī)之間是較強(qiáng)的正相關(guān),高的潛能趨向于好的成績(jī)。秩相關(guān)系數(shù)原假設(shè)為0的t檢驗(yàn)統(tǒng)計(jì)量為:查表自由度為8,t=3.05的雙側(cè)p=0.0158。在0.05顯著水平上,t分布的上臨界點(diǎn)為2.30,由于3.05>2.30,因此,拒絕秩相關(guān)系數(shù)為0的原假設(shè),接受潛能與成績(jī)之間存在秩相關(guān)。Corr相關(guān)過程Corr相關(guān)過程用于計(jì)算變量之間的相關(guān)系數(shù),包括Pearson(皮爾遜)的乘積矩相關(guān)和加權(quán)乘積矩相關(guān)。還能產(chǎn)生三個(gè)非參數(shù)的關(guān)聯(lián)測(cè)量:Spearman的秩相關(guān),Kendall的tau-b和Hoeffding的相關(guān)性度量D。該過程也可以計(jì)算偏相關(guān)等一些單變量的描述性統(tǒng)計(jì)量。Corr過程說明proccorr過程一般由下列語句控制:proccorrdata=數(shù)據(jù)集<選項(xiàng)>;var變量列表;with變量列表;partial變量列表;weight變量;freq變量;By變量列表;run;proccorr語句調(diào)用corr過程,且是唯一必需的語句。如果只使用proccorr這一條語句,過程計(jì)算輸入數(shù)據(jù)集中所有數(shù)值變量之間的相關(guān)系數(shù)。其余語句是供選擇的。proccorr語句的選項(xiàng)outp=數(shù)據(jù)集名——產(chǎn)生含有Pearson相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outs=數(shù)據(jù)集名——產(chǎn)生含有Spearman等級(jí)相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outk=數(shù)據(jù)集名——產(chǎn)生含有Kendallτb相關(guān)系數(shù)的一個(gè)新數(shù)據(jù)集。outh=數(shù)據(jù)集名——產(chǎn)生含有HoeffdingD統(tǒng)計(jì)量的一個(gè)新數(shù)據(jù)集。pearson——要求計(jì)算通常的pearson乘積矩相關(guān)系數(shù),是缺省值。hoeffding——要求計(jì)算并輸出Hoeffding的D統(tǒng)計(jì)量。kendall——要求計(jì)算并輸出Kendallτb相關(guān)系數(shù)。spearman——要求計(jì)算并輸出Spearman等級(jí)相關(guān)系數(shù)。vardef=df|weight|wgt|wdf——指定計(jì)算方差時(shí)的除數(shù):df(自由度n–1),weight或wgt(權(quán)重之和),n(觀察數(shù)),wdf(權(quán)重之和-1)。缺省值為df。cov——計(jì)算協(xié)方差-方差矩陣。sscp——要求輸出平方和與交叉積和。csscp——要求輸出偏差平方和與交叉積和。best=數(shù)值——對(duì)每個(gè)變量輸出指定個(gè)數(shù)的絕對(duì)值最大的相關(guān)系數(shù)。noprint——禁止所有打印輸出。noprob——禁止輸出同這些相關(guān)有聯(lián)系的顯著性概率。nosimple——對(duì)原始數(shù)據(jù)執(zhí)行標(biāo)準(zhǔn)方差分析。rank——要求按絕對(duì)值從高到低的次序?qū)γ總€(gè)變量輸出相關(guān)系數(shù)。nocorr——抑制Pearson相關(guān)的計(jì)算及輸出。nomiss——將帶有某一變量缺失值的觀測(cè)值從所有計(jì)算中除去。nosimple——不輸出每個(gè)變量的簡(jiǎn)單描述性統(tǒng)計(jì)量。var語句該語句列出要計(jì)算相關(guān)系數(shù)的變量。例如,varabc;則計(jì)算a和b,a和c,b和c三對(duì)變量之間的相關(guān)系數(shù)。with語句為了得到變量間的特殊組合的相關(guān)系數(shù),該語句和var語句聯(lián)合使用。用var語句列出的變量在輸出相關(guān)陣的上方,而用with語句列出的變量豎在相關(guān)陣左邊。例如,varab;withxyz;則生成x和a,y和a,z和a,x和b,y和b,z和b。partial語句為了計(jì)算Pearson偏相關(guān),Spearman偏秩相關(guān),Kendall偏tau-b,用該語句給出偏出去(即固定)的變量名。weight語句為了計(jì)算加權(quán)的乘積矩相關(guān)系數(shù),用該語句給出權(quán)數(shù)變量名。該語句僅用于Pearson相關(guān)。freq語句當(dāng)規(guī)定freq語句時(shí),輸入數(shù)據(jù)集中的每個(gè)觀察假定代表n個(gè)觀察,其中n是該觀察中freq變量中的值。觀察的總數(shù)規(guī)定為freq變量值的和。by語句使用by語句能夠獲得用by變量定義的分組觀察的獨(dú)立分析結(jié)果。實(shí)例分析例30.1的SAS程序如下:datastudy.persons;inputxy@@;y=400-y;cards;24004360730012956280335010200926082205385;proccorrdata=study.personsspearman;varx;withy;run;程序說明:建立輸入數(shù)據(jù)集persons,要注意實(shí)際數(shù)據(jù)所表示的等級(jí)次序大小與SAS系統(tǒng)中自動(dòng)給出的等級(jí)次序大小的不同。輸入變量x,獲得從1到10的數(shù)據(jù),表示潛能等級(jí)從最高到最低,而輸入變量y,獲得從最大銷售額400到最小銷售額220,轉(zhuǎn)換銷售成績(jī)等級(jí)應(yīng)該是從高到低,即從1到10。但在SAS系統(tǒng)中把銷售成績(jī)數(shù)值從小到大按等級(jí)值從1到10給予。因此,需要顛倒變量x或變量y中數(shù)值大小的次序,本程序用最大銷售額400減去原來的銷售額實(shí)現(xiàn)次序顛倒,即語句y=400-y。等級(jí)相關(guān)與一般參數(shù)相關(guān)一樣仍然調(diào)用corr過程,只需要在選擇項(xiàng)中指定為何種等級(jí)相關(guān),我們選擇計(jì)算spearman秩相關(guān)系數(shù)。var語句列出要計(jì)算相關(guān)系數(shù)的第一個(gè)變量x,with語句必須要與var語句聯(lián)合使用,列出的要計(jì)算相關(guān)系數(shù)的第二變量y。主要結(jié)果如表30.2所示。表30.2用corr過程進(jìn)行多樣本輸出結(jié)果CorrelationAnalysisCorrelationAnalysis1'WITH'Variables:Y1'VAR'Variables:XSimpleStatisticsVariableNMeanStdDevMedianMinimumMaximumY1095.00000067.905163102.5000000200.000000X105.5000003.0276505.5000001.00000010.000000SpearmanCorrelationCoefficients/Prob>|R|underHo:Rho=0/N=10XY

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論