版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
多元數(shù)據(jù)圖表示法第1頁,共48頁,2023年,2月20日,星期一本章學(xué)習(xí)目標(biāo)領(lǐng)會作多元數(shù)據(jù)圖的思想。會作簡單的多元數(shù)據(jù)圖形并且會分析圖形。第2頁,共48頁,2023年,2月20日,星期一第三章多元數(shù)據(jù)圖表示法圖形有助于我們對所研究數(shù)據(jù)的直觀了解,如果能把一些多元數(shù)據(jù)直接顯示在平面圖上,便可以從圖形一目了然地看出多元數(shù)據(jù)之間的關(guān)系。當(dāng)只有一、二維數(shù)據(jù)時,可以使用通常的直角坐標(biāo)系在平面上點(diǎn)圖;當(dāng)有三維數(shù)據(jù)時,也可以使用空間直角坐標(biāo)系點(diǎn)圖,但是已經(jīng)不方便;當(dāng)維數(shù)大于3時,用通常的方法已不能點(diǎn)圖。但是在許多實(shí)際問題中,多元數(shù)據(jù)的維數(shù)都大于3。第3頁,共48頁,2023年,2月20日,星期一例考察北京、上海、陜西、甘肅四個省市人均生活消費(fèi)支出情況,選取以下五項(xiàng)指標(biāo),具體數(shù)據(jù)如下表:
肉禽及制品住房醫(yī)療保健交通和通訊文娛用品及服務(wù)北京563.51227.78147.76235.99510.78上海678.92365.07112.82301.46465.88陜西237.38174.48119.78141.07245.57甘肅253.41156.13102.96108.13212.20第4頁,共48頁,2023年,2月20日,星期一
多元數(shù)據(jù)圖表示法的分類:一類是使高維空間的點(diǎn)與平面上的某種圖形應(yīng),這種圖形能反映高維數(shù)據(jù)的某些特點(diǎn)或數(shù)據(jù)間的某些關(guān)系;另一類是在盡可能多地保留原數(shù)據(jù)信息的原則下進(jìn)行降維,若能使數(shù)據(jù)維數(shù)降至2或1維,則可在平面上點(diǎn)圖。第二類分類方法可用后面介紹的主成分分析、因子分析等去解決。這一章只對第一類方法介紹四種圖表示法,更多的方法可在有關(guān)專著中找到。第5頁,共48頁,2023年,2月20日,星期一3.1輪廓圖
作圖步驟為:
(1)作平面坐標(biāo)系,橫坐標(biāo)取個點(diǎn)表示個變量。
(2)對給定的一次觀測值,在個點(diǎn)上的縱坐標(biāo)(即高度)和它對應(yīng)的變量取值成正比。
(3)連接個高度的頂點(diǎn)得一折線,則一次觀測值的輪廓為一條多角折線形。次觀測值可畫出條折線,構(gòu)成輪廓圖。第6頁,共48頁,2023年,2月20日,星期一下圖畫出四條折線為北京、上海、陜西、甘肅五項(xiàng)指標(biāo)的數(shù)據(jù)即四個省市五項(xiàng)指標(biāo)的輪廓。輪廓圖第7頁,共48頁,2023年,2月20日,星期一由輪廓圖可以看出:北京、上海的居民生活消費(fèi)較高且相似;陜西、甘肅生活消費(fèi)較低且相似。如果考察的樣品較多,畫折線時圖形中可能出現(xiàn)重復(fù)點(diǎn)多,不便于區(qū)分哪個樣品對應(yīng)哪條折線,這時最好多用幾種顏色或長短虛實(shí)等標(biāo)志畫出折線。第8頁,共48頁,2023年,2月20日,星期一下表是我國華北地區(qū)5個省市2003年城鎮(zhèn)居民家庭平均每人全年消費(fèi)性支出的六項(xiàng)指標(biāo)數(shù)據(jù)考慮微機(jī)的普及應(yīng)用,圖形的制作則通過電腦實(shí)現(xiàn)。輪廓圖、矩陣散點(diǎn)圖在SPSS中制作,雷達(dá)圖則在EXCEL中實(shí)現(xiàn)。
表華北5省市城鎮(zhèn)居民家庭消費(fèi)性支出第9頁,共48頁,2023年,2月20日,星期一在SPSS中作輪廓圖的方法如下:(1)將原始數(shù)據(jù)輸入SPSS中。把不同地區(qū)當(dāng)成變量,而把支出指標(biāo)當(dāng)成觀測。作輪廓圖時的數(shù)據(jù)組織形式第10頁,共48頁,2023年,2月20日,星期一
(2)選擇菜單項(xiàng)Graphs→Line,打開LineCharts對話框,如圖。在對話框上方的三個選項(xiàng)用于選擇輪廓圖的形式,由于是這里是多變量作圖,所以選擇Multiple。在對話框下面的三個選項(xiàng)中選擇Valueofindividualcases。單擊Define按鈕,打開DefineMultipleLine對話框。
LineCharts對話框第11頁,共48頁,2023年,2月20日,星期一
(3)在DefineMultipleLine對話框中,將代表不同地區(qū)的5個變量移入LinesRepresent列表框中,將代表支出指標(biāo)的變量(variable)移入Variable框中。單擊OK按鈕,即可作出如圖所示的輪廓圖。從圖中可以清楚地看出北京市幾乎各項(xiàng)支出都排在第一,而山西省則幾乎每項(xiàng)支出都是最低的。DefineMultipleLine對話框第12頁,共48頁,2023年,2月20日,星期一輪廓圖第13頁,共48頁,2023年,2月20日,星期一散點(diǎn)圖又稱散布圖,它是以點(diǎn)的分布反映變量之間相關(guān)關(guān)系的可視化方法。矩陣散點(diǎn)圖則是一種反映多個變量之間相關(guān)關(guān)系的二維散點(diǎn)圖。利用SPSS制作矩陣散點(diǎn)圖的步驟如下:(1)在SPSS中按圖11.6的形式組織數(shù)據(jù),即把支出指標(biāo)當(dāng)成變量,而把不同地區(qū)當(dāng)成觀測。圖11.6作散點(diǎn)圖時的數(shù)據(jù)組織形式第14頁,共48頁,2023年,2月20日,星期一
(2)選擇菜單項(xiàng)Graphs→Scatter,打開Scatterplot對話框,如圖11.7。該對話框用于選擇散點(diǎn)圖的形式。選定Matrix,即矩陣散點(diǎn)圖,單擊Define按鈕,打開ScatterplotMatrix對話框,如圖11.8。圖11.7Scatterplot對話框第15頁,共48頁,2023年,2月20日,星期一圖11.8ScatterplotMatrix對話框
第16頁,共48頁,2023年,2月20日,星期一
(3)在打開的ScatterplotMatrix對話框中,將食品、衣著、居住三個變量移入MatrixVariables列表框中,將標(biāo)志變量region移入LabelCasesby列表框中。(4)點(diǎn)擊OK按鈕,得到如圖11.9所示的矩陣散點(diǎn)圖。從圖11.9可以看出,河北、山西、內(nèi)蒙古在居住和食品消費(fèi)支出方面與北京、天津相比較低,食品與居住支出變量之間存在一定的線性關(guān)系。天津在衣著支出方面較低,與最低的河北接近,與最高居住支出形成鮮明對比。北京則除在居住支出方面低于天津外,其他方面支出均高于華北其他省市。內(nèi)蒙古則在衣著支出方面僅次于北京,顯示出某種特殊消費(fèi)特征。第17頁,共48頁,2023年,2月20日,星期一矩陣散點(diǎn)圖
第18頁,共48頁,2023年,2月20日,星期一3.2雷達(dá)圖
作圖步驟:
(1)作一圓,并把圓周分為等分。
(2)連接圓心和各分點(diǎn),把這條半徑依次定義為各變量的坐標(biāo)軸,并標(biāo)以適當(dāng)?shù)目潭取?3)對給定的一次觀測值,把它的個分量值分別點(diǎn)在相應(yīng)的坐標(biāo)軸上,然后連接成一個邊形,這個邊形就是元觀測值的圖示,次觀測值可畫出個邊形。第19頁,共48頁,2023年,2月20日,星期一第20頁,共48頁,2023年,2月20日,星期一例如,根據(jù)前表中的數(shù)據(jù),調(diào)用EXCEL圖表向?qū)?,即可制作出如圖1~7所示的雷達(dá)圖。圖1畫出了北京、天津和河北的雷達(dá)圖,從圖可以看出,三省市消費(fèi)支出結(jié)構(gòu)有較大差異。北京人均消費(fèi)支出的各項(xiàng)指標(biāo)都高,對應(yīng)面積最大的六邊形,其次是天津,在三個省市中面積最小的是河北,天津在居住支出方面與北京較為接近,而在衣著和交通、通訊支出方面則與河北接近。其他支出方面三地存在較大差異。利用雷達(dá)圖的形狀、面積大小,可以對樣品進(jìn)行初始分類分析。為了加強(qiáng)雷達(dá)圖的效果,在雷達(dá)圖中適當(dāng)?shù)姆峙渥鴺?biāo)軸是很重要的,具體的分配辦法要結(jié)合分析的問題而定。例如可將要對比的指標(biāo)分布在左、右或上、下方,以便于對比分析。
第21頁,共48頁,2023年,2月20日,星期一當(dāng)觀測次數(shù)n較大和指標(biāo)較多時,畫出的雷達(dá)圖線段太多,圖形的效果會很差。為了獲得較好的可視化效果,在一張雷達(dá)圖上可以畫幾個樣品觀測數(shù)據(jù),甚至一張雷達(dá)圖只畫一個樣品觀測數(shù)據(jù)。如圖1~7所示,對這些圖進(jìn)行比較分析,也可了解其特點(diǎn)。圖1
第22頁,共48頁,2023年,2月20日,星期一圖2第23頁,共48頁,2023年,2月20日,星期一圖3第24頁,共48頁,2023年,2月20日,星期一圖4第25頁,共48頁,2023年,2月20日,星期一圖5第26頁,共48頁,2023年,2月20日,星期一圖6第27頁,共48頁,2023年,2月20日,星期一圖7第28頁,共48頁,2023年,2月20日,星期一當(dāng)觀測次數(shù)較大時,為使圖形清晰,每張圖可以只畫少數(shù)幾次觀測數(shù)據(jù),甚至每張圖只畫一次觀測值。為了獲得較好的效果,在雷達(dá)圖中適當(dāng)分配變量的坐標(biāo)軸,并選取合適的尺度是十分重要的。
注意:這里坐標(biāo)軸只有正半軸,因而只能表示非負(fù)數(shù)據(jù),若有負(fù)數(shù)據(jù),只能通過合理變換使之非負(fù)才行。第29頁,共48頁,2023年,2月20日,星期一3.3調(diào)和曲線圖
調(diào)和曲線圖的思想:把高維空間中的一個樣品點(diǎn)對應(yīng)于二維平面上的一條曲線。調(diào)和曲線圖是D.F.Andrews在1972年提出的三角多項(xiàng)式作圖法,所以又稱為三角多項(xiàng)式圖。第30頁,共48頁,2023年,2月20日,星期一
上例數(shù)據(jù)北京,上海,陜西,甘肅分別對應(yīng)的曲線為:第31頁,共48頁,2023年,2月20日,星期一
調(diào)和曲線圖第32頁,共48頁,2023年,2月20日,星期一在多項(xiàng)式的圖表示中,當(dāng)各變量的數(shù)值太懸殊時,最好先標(biāo)準(zhǔn)化后再作圖。調(diào)和曲線圖對聚類分析很有幫助,如果選擇聚類統(tǒng)計量為距離的話,同類的曲線非??拷鼣Q在一起,不同類的曲線擰成不同的束,非常直觀。調(diào)和曲線的性質(zhì):(1)保線性關(guān)系第33頁,共48頁,2023年,2月20日,星期一
(2)保歐式距離第34頁,共48頁,2023年,2月20日,星期一3.4星座圖
思想:將高維空間中的樣品點(diǎn)投影到平面上的一個半圓內(nèi),用投影點(diǎn)表示樣品點(diǎn)。
作圖步驟:
第35頁,共48頁,2023年,2月20日,星期一
(3)畫出一個半徑為1的上半圓及半圓底邊的直徑。第36頁,共48頁,2023年,2月20日,星期一下面對本章開頭所給出的數(shù)據(jù),使用相同的權(quán)數(shù)作星座圖。由數(shù)據(jù)表易知,各指標(biāo)的最高分,最低分以及它們的級差分別為:第37頁,共48頁,2023年,2月20日,星期一
它們的星座圖如下:第38頁,共48頁,2023年,2月20日,星期一在人工畫星座圖時,可按下面步驟去作:第39頁,共48頁,2023年,2月20日,星期一有時為了突出星星的位置,也可以不畫路徑,只畫星星,容易想象,如果這次觀測數(shù)據(jù)來自不同的類,且不同類的觀測數(shù)據(jù)所對應(yīng)的星星分別相對集中地散步在星座圖的不同區(qū)域,那么星座圖可能用于多變量數(shù)據(jù)的分類。從作圖過程可以看出:星星的位置和路徑與權(quán)數(shù)的選取有關(guān),取不同的權(quán)數(shù),畫出的星座圖也不同。一般權(quán)數(shù)選取的原則以實(shí)際問題的需要而定。通常情況對較重要指標(biāo)取權(quán)數(shù)大些,次要指標(biāo)取權(quán)數(shù)小些,如果指標(biāo)的重要程度相差不大或難以區(qū)分,則選取等權(quán)。多元數(shù)據(jù)的圖表示法還有很多,如臉譜圖,樹形圖,塑像圖等等。第40頁,共48頁,2023年,2月20日,星期一2023/4/2841目錄上頁下頁返回結(jié)束§3.5臉譜圖
臉譜圖是用臉譜來表達(dá)多變量的樣品,由美國統(tǒng)計學(xué)家H.Chernoff于1970年首先提出,該方法是將觀測的個變量(指針)分別用臉的某一部位的形狀或大小來表示,一個樣品(觀測)可以畫成一張臉譜。他首先將該方法用于聚類分析,引起了各國統(tǒng)計學(xué)家的極大興趣,并對他的畫法作出了改進(jìn),一些統(tǒng)計軟件也收入了臉譜圖分析法,國內(nèi)也有很多研究工作者將該方法應(yīng)用于多元統(tǒng)計分析中。
第41頁,共48頁,2023年,2月20日,星期一2023/4/2842目錄上頁下頁返回結(jié)束臉譜圖分析法的基本思想是由15—18個指針決定臉部特征,若實(shí)際資料變量更多將被忽略(有新的畫圖方法取消了臉的對稱性并引入更多臉部特征從而最多可以用36個變量來畫臉譜),若實(shí)際資料變量較少則臉部有些特征將被自動固定。統(tǒng)計學(xué)曾給出了幾種不同的臉譜圖的畫法,而對于同一種臉譜圖的畫法,將變量次序重新排列,得到的臉譜的形狀也會有很大不同。此處我們不對臉譜的各個部位與原始變量的數(shù)學(xué)關(guān)系作過多探討,而只說明其作圖的思想及軟件實(shí)現(xiàn)方法。第42頁,共48頁,2023年,2月20日,星期一2023/4/2843目錄上頁下頁返回結(jié)束按照切爾諾夫于1973年提出的畫法,采用15個指標(biāo),各指標(biāo)代表的面部特征為:1表示臉的范圍,2表示臉的形狀,3表示鼻子的長度,4表示嘴的位置,5表示笑容曲線,6表示嘴的寬度,7—11分別表示眼睛的位置,分開程度,角度,形狀和寬度,12表示瞳孔的位置,13—15分別表示眼眉的位置,角度及寬度。這樣,按照各變量的取值,根據(jù)一定的數(shù)學(xué)函數(shù)關(guān)系,就可以確定臉的輪廓、形狀及五官的部位、形狀,每一個樣本點(diǎn)都用一張臉譜來表示。而臉譜容易給人們留下較為深刻的印象,通過對臉譜的分析,就可以直觀地對原始資料進(jìn)行歸類或比較研究。第43頁,共48頁,2023年,2月20日,星期一2023/4/2844目錄上頁下頁返回結(jié)束S—Plus軟件收入了臉譜圖的作圖方法,下面我們舉例說明如何用S—Plus軟件畫臉譜圖:【例13-2】仍以我國35個上市公司的八大評價指標(biāo)為例說明,S—Plus畫臉譜圖的方法非常簡單,只要調(diào)用faces函數(shù)就可以實(shí)現(xiàn)了。將前面的資料的數(shù)字部分輸入S—Plus,并令文件名為gongsi.sdd,在命令窗口調(diào)用下面的函數(shù):faces(data.matrix(gongsi),fill=T,which=1:8,head="Facesof35Companies",ncol=5,scale=T,byrow=T)回車運(yùn)行就可以生成35個公司的臉譜圖,每一個公司用一張臉譜表示出來,但是,此時生成的臉譜圖不好與公司名對應(yīng),可將35個公司名放入一個向量a中,然后在上面的命令中加入選項(xiàng)labels=a,即可生成如下臉譜圖:第44頁,共48頁,2023年,2月20日,星期一2023/4/2845目錄上頁下頁返回結(jié)束第45頁,共48頁,2023年,2月20日,星期一2023/4/2846目錄上頁下頁返回結(jié)束臉譜圖給人的感覺形象直觀,容易留下較深刻的印象,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026上半年海南事業(yè)單位聯(lián)考三亞市營商環(huán)境建設(shè)局下屬事業(yè)單位招聘工作人員4人備考題庫第1號含答案詳解(綜合題)
- 2026上半年貴州事業(yè)單位聯(lián)考廣東省中醫(yī)院貴州醫(yī)院招聘13人備考題庫帶答案詳解(綜合題)
- 2026中國雄安集團(tuán)有限公司社會招聘備考題庫含答案詳解(典型題)
- 2026重慶市某國有企業(yè)外包員工招聘2人備考題庫附答案
- 2025年中醫(yī)骨傷科學(xué)考試試題(含答案)
- 2025年醫(yī)療糾紛防范試題及答案
- 地下工程防水施工方案題試題沖刺卷
- 2026湖南懷化市會同縣林城鎮(zhèn)第一完全小學(xué)招聘公益性崗位人員1人備考題庫及答案詳解參考
- 2026遼寧沈陽雙匯集團(tuán)校園招聘備考題庫含答案詳解
- 蘇州高新區(qū)(虎丘區(qū))市場監(jiān)督管理局公益性崗位招聘1人備考題庫及1套完整答案詳解
- 2025福建省閩西南水資源開發(fā)有限責(zé)任公司招聘5人筆試參考題庫附帶答案詳解
- 2026云南昆明市公共交通有限責(zé)任公司總部職能部門員工遴選48人筆試模擬試題及答案解析
- 2025至2030中國數(shù)字經(jīng)濟(jì)產(chǎn)業(yè)發(fā)展現(xiàn)狀及未來趨勢分析報告
- 上海市松江區(qū)2025-2026學(xué)年八年級(上)期末化學(xué)試卷(含答案)
- 導(dǎo)管室護(hù)理新技術(shù)
- 中國信通服務(wù):2025算力運(yùn)維體系技術(shù)白皮書
- 2026年焦作大學(xué)單招試題附答案
- 電力行業(yè)五新技術(shù)知識點(diǎn)梳理
- 《DLT 849.1-2004電力設(shè)備專用測試儀器通 用技術(shù)條件 第1部分:電纜故障閃測儀》專題研究報告 深度
- 餐飲業(yè)店長運(yùn)營效率考核表
- 超市安全生產(chǎn)協(xié)議書
評論
0/150
提交評論