《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第6-10章 展示變量間關(guān)系 -可視化的相關(guān)主題_第1頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第6-10章 展示變量間關(guān)系 -可視化的相關(guān)主題_第2頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第6-10章 展示變量間關(guān)系 -可視化的相關(guān)主題_第3頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第6-10章 展示變量間關(guān)系 -可視化的相關(guān)主題_第4頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第6-10章 展示變量間關(guān)系 -可視化的相關(guān)主題_第5頁
已閱讀5頁,還剩140頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析本書特色新穎的寫作視角嚴(yán)謹(jǐn)?shù)慕M織結(jié)構(gòu)完備的繪制代碼詳盡的圖形解讀賈俊平2026/1/266.1

散點(diǎn)圖及其輔助信息6.2密度散點(diǎn)圖和分箱散點(diǎn)圖6.3分組散點(diǎn)圖6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣6.53D散點(diǎn)圖和氣泡圖第6章展示變量間關(guān)系概要

本章導(dǎo)讀本章主要介紹數(shù)值變量之間關(guān)系的可視化方法,包括展示兩個(gè)變量之間關(guān)系的散點(diǎn)圖、展示多個(gè)變量之間關(guān)系的散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣等,并結(jié)合相關(guān)系數(shù)和回歸模型信息等進(jìn)行分析如果只涉及兩個(gè)數(shù)值變量,且觀測值不是很多時(shí),可以用普通散點(diǎn)圖進(jìn)行展示當(dāng)觀測值較多時(shí),圖形中的點(diǎn)會出現(xiàn)重疊而難以識別,此時(shí)可以繪制分箱散點(diǎn)圖或密度散點(diǎn)圖等進(jìn)行展示如果僅分析3個(gè)變量之間的關(guān)系,則可以繪制3D散點(diǎn)圖或氣泡圖如果分析多個(gè)變量之間的關(guān)系,則可以用散點(diǎn)圖矩陣進(jìn)行展示;當(dāng)觀測值較多時(shí),可以用相關(guān)系數(shù)矩陣進(jìn)行展示散點(diǎn)圖及其解讀

不同形態(tài)的散點(diǎn)圖6.1

散點(diǎn)圖及其輔助信息具有線性關(guān)系的兩個(gè)變量的散點(diǎn)圖大致在一條直線周圍隨機(jī)分布,其分布的形狀通常為一個(gè)橢圓,其形狀越扁平,表示線性關(guān)系越強(qiáng)6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖及其解讀散點(diǎn)圖——例題分析【例6-1】

—為分析上市公司各項(xiàng)財(cái)務(wù)指標(biāo)之間的關(guān)系,在主板、創(chuàng)業(yè)板和科創(chuàng)板中隨機(jī)抽取汽車類、家電類、醫(yī)藥類和食品類的股票共200只,得到的財(cái)務(wù)數(shù)據(jù)如表6-1所示股票類型上市板塊總股本(億股)每股收益(元)每股凈資產(chǎn)(元)凈資產(chǎn)收益率(%)每股資本公積金(元)每股現(xiàn)金流量(元)醫(yī)藥類創(chuàng)業(yè)板6.711.8211.218.112.983.42汽車類科創(chuàng)版8.870.703.964.760.482.99汽車類科創(chuàng)版11.680.947.856.322.193.05…………………………………………醫(yī)藥類創(chuàng)業(yè)板6.922.0011.699.233.743.38食品類主板6.791.778.418.713.483.54醫(yī)藥類創(chuàng)業(yè)板7.011.919.6810.744.293.706.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+置信帶【例6-1】

總股本與每股收益、每股凈資產(chǎn)與每股收益的散點(diǎn)圖6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+置信帶和預(yù)測帶【例6-1】

添加置信帶和預(yù)測帶的每股收益與每股凈資產(chǎn)的散點(diǎn)圖6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+回歸信息【例6-1】

添加回歸信息的散點(diǎn)圖6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+回歸信息【例6-1】

添加回歸模型摘要表的散點(diǎn)圖6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+回歸擬合殘差【例6-1】

每股收益與每股凈資產(chǎn)的線性擬合及殘差6.1

散點(diǎn)圖及其輔助信息散點(diǎn)圖+邊際圖【例6-1】

—在分析兩個(gè)變量關(guān)系的同時(shí),還想了解每個(gè)變量的分布形態(tài),可以在散點(diǎn)圖上添加每個(gè)變量分布的邊際圖形,如直方圖、核密度圖、箱線圖等6.1

散點(diǎn)圖及其輔助信息密度散點(diǎn)圖【例6-1】—高密度普通散點(diǎn)圖和平滑后的散點(diǎn)圖當(dāng)觀測的數(shù)據(jù)量很大時(shí),圖中的數(shù)據(jù)點(diǎn)會有大量的重疊,很難觀察數(shù)據(jù)點(diǎn)的分布使用顏色對散點(diǎn)圖進(jìn)行平滑或?qū)c(diǎn)進(jìn)行分箱處理,也可繪制二維密度散點(diǎn)圖6.2密度散點(diǎn)圖和分箱散點(diǎn)圖分箱散點(diǎn)圖【例6-1】—六邊形分箱散點(diǎn)圖和二維密度估計(jì)散點(diǎn)圖用箱子的數(shù)量表示點(diǎn)的多少,也可以繪制二維密度散點(diǎn)圖6.2密度散點(diǎn)圖和分箱散點(diǎn)圖分箱3D散點(diǎn)圖【例6-1】—六邊形分箱3D散點(diǎn)圖6.2密度散點(diǎn)圖和分箱散點(diǎn)圖分組散點(diǎn)圖分組散點(diǎn)圖——如果數(shù)值數(shù)據(jù)是在一個(gè)或多個(gè)因子(類別變量)的不同水平下獲得的,即觀測值是按因子水平分組的,則可以按因子水平分組繪制散點(diǎn)圖利用分組散點(diǎn)圖可以觀察按因子水平分組條件下兩個(gè)數(shù)值變量的關(guān)系分組散點(diǎn)圖有不同的繪制方式,繪制一幅圖形圖時(shí),可以使用顏色、點(diǎn)的形狀等區(qū)分不同的組別,也可以將每個(gè)組別繪制成一幅獨(dú)立的散點(diǎn)圖,然后以分面的方式組織成矩陣形式6.3

分組散點(diǎn)圖分組散點(diǎn)圖——根據(jù)點(diǎn)的大小、顏色和點(diǎn)形分組【例6-1】據(jù)點(diǎn)的大小、形狀和顏色分組6.3

分組散點(diǎn)圖分組散點(diǎn)圖——雙因子交叉分組【例6-1】—按股票類型和上市板塊交叉分面的散點(diǎn)圖6.3

分組散點(diǎn)圖分組散點(diǎn)圖+回歸信息【例6-1】—按上市板塊分組的每股凈資產(chǎn)與每股收益的散點(diǎn)圖添加回歸信息6.3

分組散點(diǎn)圖分組散點(diǎn)圖+邊際圖【例6-1】—為分組散點(diǎn)圖添加邊際圖6.3

分組散點(diǎn)圖分面散點(diǎn)圖+邊際圖【例6-1】—為分面散點(diǎn)圖添加邊際圖6.3

分組散點(diǎn)圖散點(diǎn)圖矩陣同時(shí)分析多個(gè)變量兩兩之間的關(guān)系將多個(gè)變量中任意兩個(gè)變量組合的散點(diǎn)圖排列成矩陣的形式,以便于觀察和比較分析當(dāng)多個(gè)數(shù)值變量按因子分類時(shí),可以繪制按因子分組的散點(diǎn)圖矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣【例6-1】6個(gè)變量的散點(diǎn)圖矩陣對角線上方繪制出二維核密度圖,用于展示數(shù)據(jù)分布的密度散點(diǎn)圖矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣分組散點(diǎn)圖矩陣【例6-1】—按上市板塊和股票類型分組的散點(diǎn)圖矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣密度散點(diǎn)圖矩陣【例6-1】—6個(gè)變量的二維密度估計(jì)散點(diǎn)圖矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣當(dāng)變量較多時(shí),散點(diǎn)圖矩陣中的各散點(diǎn)圖就會變得很小,難以識別和分析可以計(jì)算出變量間的相關(guān)系數(shù)矩陣并將其畫成圖形,這就是相關(guān)系數(shù)矩陣圖如果在分析變量間關(guān)系時(shí)需要檢驗(yàn)相關(guān)系數(shù)是否顯著,可以在相關(guān)系數(shù)矩陣中繪制出檢驗(yàn)的P值6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣【例6-1】—6個(gè)變量的相關(guān)系數(shù)矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣相關(guān)系數(shù)矩陣【例6-1】—6個(gè)變量的相關(guān)系數(shù)矩陣6.4散點(diǎn)圖矩陣和相關(guān)系數(shù)矩陣

3D散點(diǎn)圖【例6-1】—每股收益、每股凈資產(chǎn)、凈資產(chǎn)收益率的3D散點(diǎn)圖只分析3個(gè)變量之間的關(guān)系不推薦使用6.5

3D散點(diǎn)圖和氣泡散點(diǎn)圖氣泡散點(diǎn)圖氣泡圖散點(diǎn)圖—第3個(gè)變量數(shù)值的大小用氣泡的大小表示6.5

3D散點(diǎn)圖和氣泡散點(diǎn)圖氣泡散點(diǎn)圖【例6-1】—第3個(gè)變量(總股本)用笑臉表示6.5

3D散點(diǎn)圖和氣泡散點(diǎn)圖氣泡圖散點(diǎn)圖【例6-1】—按上市板塊和股票類型分面的氣泡散點(diǎn)圖6.5

3D散點(diǎn)圖和氣泡散點(diǎn)圖本章介紹的圖形主要用于展示數(shù)值變量之間的關(guān)系。其中,最基本的圖形是散點(diǎn)圖,適合于展示兩個(gè)數(shù)值變量根據(jù)分析需要,可以在散點(diǎn)圖上添加相關(guān)系數(shù)、回歸模型等信息,并為散點(diǎn)圖加上邊際圖,以擴(kuò)展圖形所提供的信息當(dāng)數(shù)據(jù)量較大時(shí),可以對散點(diǎn)圖進(jìn)行平滑或分箱處理當(dāng)有多個(gè)數(shù)值變量時(shí),可以繪制散點(diǎn)圖矩陣或相關(guān)系數(shù)矩陣當(dāng)數(shù)值數(shù)據(jù)是按因子分類時(shí),可以繪制按因子分組的散點(diǎn)圖。如果只分析3個(gè)數(shù)值變量之間的關(guān)系,雖然可以繪制3D散點(diǎn)圖,但不推薦使用,可考慮使用氣泡散點(diǎn)圖來分析本章小結(jié)

本章小結(jié)THEENDTHANKSTHEENDTHANKS2026/1/26R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析賈俊平2026/1/26本書特色新穎的寫作視角嚴(yán)謹(jǐn)?shù)慕M織結(jié)構(gòu)完備的繪制代碼詳盡的圖形解讀賈俊平2026/1/267.1

比較整體相似性7.2比較樣本間差異7.3對樣本進(jìn)行分類第7章比較樣本相似性概要本章介紹的樣本相似性的可視化圖形包括比較整體相似性的圖形,如平行坐標(biāo)圖、雷達(dá)圖等比較樣本間差異的圖形,如星圖、臉譜圖等對樣本進(jìn)行分類的圖形,如聚類圖、聚類熱圖等

本章導(dǎo)讀假定想要比較北京、上海、天津3個(gè)地區(qū)在食品煙酒、衣著、居住、生活用品及服務(wù)、交通通信、教育文化娛樂、醫(yī)療保健、其他用品及服務(wù)等8項(xiàng)支出方面是否有相似性,這里的3個(gè)地區(qū)就是樣本,8項(xiàng)消費(fèi)支出是8個(gè)變量,這就是多樣本在多個(gè)變量上取值的相似性問題如果關(guān)心3個(gè)地區(qū)是否相似,就是樣本相似性問題;如果關(guān)心8個(gè)變量之間是否相似,就是變量相似性問題。變量間的相似性可以使用散點(diǎn)圖和相關(guān)系數(shù)進(jìn)行分析平行坐標(biāo)圖平行坐標(biāo)圖(outlineplot)也稱輪廓圖或多線圖用X軸表示各樣本,用Y軸表示每個(gè)樣本的多個(gè)變量的數(shù)值(X軸和Y軸可以互換),將同一樣本在不同變量上的觀測值用折線連接起來觀察平行坐標(biāo)圖中各折線的形狀及其排列方式,可以比較各樣本在多個(gè)變量上取值的相似性及差異【例7-1】—2023年全國31個(gè)地區(qū)的人均消費(fèi)支出7.1

比較整體相似性地區(qū)地帶劃分區(qū)域劃分食品煙酒衣著居住生活用品及服務(wù)交通通信教育文化娛樂醫(yī)療保健其他用品及服務(wù)北京東部地帶華北1014220531866823524858379942761438天津東部地帶華北98151796777219274698367339371296河北東部地帶華北6739153449641459312923092174613…………………………………………………………青海西部地帶西北6361145836311072350415512174576寧夏西部地帶西北6150136639411397330124692455549新疆西部地帶西北6261143235851106275317252173679平行坐標(biāo)圖【例7-1】—2023年全國31個(gè)地區(qū)的人均消費(fèi)支出的平行坐標(biāo)圖7.1

比較整體相似性平行坐標(biāo)圖——按因子分面【例7-1】—按區(qū)域劃分和地帶劃分分面的31個(gè)地區(qū)8項(xiàng)人均消費(fèi)支出的平行坐標(biāo)圖7.1

比較整體相似性平行坐標(biāo)圖——分析兩個(gè)特定的變量【例7-1】—按地帶劃分和區(qū)域分組的31個(gè)地區(qū)食品煙酒支出和居住支出的平行坐標(biāo)圖7.1

比較整體相似性平行坐標(biāo)圖——添加節(jié)點(diǎn)的直方圖與核密度圖【例7-1】—按地帶劃分分組的31個(gè)地區(qū)的平行坐標(biāo)圖7.1

比較整體相似性雷達(dá)圖雷達(dá)圖(radarchart)也稱為蜘蛛圖(spiderchart)它是從一個(gè)點(diǎn)出發(fā),每個(gè)變量用一條射線表示,P個(gè)變量形成P條射線(P個(gè)坐標(biāo)軸),每個(gè)樣本在P個(gè)變量上的取值連接成線,即圍成一個(gè)區(qū)域,多個(gè)樣本圍成多個(gè)區(qū)域,就是雷達(dá)圖P個(gè)變量的計(jì)量單位可能不同,數(shù)值的量級往往差異很大,每條坐標(biāo)軸的刻度需要根據(jù)每個(gè)變量單獨(dú)確定,因此,不同坐標(biāo)軸的刻度是不可比的利用雷達(dá)圖也可以研究多個(gè)樣本之間的相似程度7.1

比較整體相似性雷達(dá)圖【例7-1】—北京、天津和上海8項(xiàng)人均消費(fèi)支出的雷達(dá)圖7.1

比較整體相似性雷達(dá)圖【例7-1】—中南地區(qū)8項(xiàng)人均消費(fèi)支出的分面雷達(dá)圖7.1

比較整體相似性雷達(dá)圖【例7-1】—按區(qū)域劃分和地帶劃分分組的8項(xiàng)人均消費(fèi)支出的雷達(dá)圖7.1

比較整體相似性星圖星圖(starplot)也被稱為雷達(dá)圖它用P個(gè)變量將圓P等分,并將P個(gè)半徑與圓心連接,再將一個(gè)樣本的P個(gè)變量的取值連接成一個(gè)P邊形,n個(gè)樣本形成n個(gè)獨(dú)立的P邊形,即為星圖利用星圖可根據(jù)n個(gè)P邊形比較n個(gè)樣本的相似性。繪制星圖時(shí),因各樣本的計(jì)量單位可能不同,或不同變量的數(shù)值差異可能很大,因此需要先對變量做標(biāo)準(zhǔn)化處理,之后再繪制星圖繪制星圖時(shí),因各樣本的計(jì)量單位可能不同,或不同變量的數(shù)值差異可能很大,因此需要先對變量做標(biāo)準(zhǔn)化處理,之后再繪制星圖7.2

比較樣本間差異星圖【例7-1】—全國31個(gè)地區(qū)的人均消費(fèi)支出的星圖7.2

比較樣本間差異星圖——散點(diǎn)星圖首先繪制出兩個(gè)變量的散點(diǎn)圖,然后將每個(gè)樣本的所有變量將制成星圖。這樣,就可以在分析所關(guān)注的兩個(gè)變量之間關(guān)系的同時(shí),比較各樣本在多個(gè)變量上的相似性【例7-1】—全國31個(gè)地區(qū)人均消費(fèi)支出的星圖7.2

比較樣本間差異臉譜圖臉譜圖(facesplot)由美國統(tǒng)計(jì)學(xué)家Chernoff(1973)首先提出,也稱為Chernoff臉譜(Chernofffaces)臉譜圖將P個(gè)變量(P個(gè)維度的數(shù)據(jù))用人臉部位的形狀或大小來表征通過對臉譜的分析,可根據(jù)P個(gè)變量對樣本進(jìn)行歸類或比較研究按照Chernoff提出的畫法,由15個(gè)變量決定臉部的特征,若實(shí)際變量更多,多出的將被忽略;若實(shí)際變量較少,變量將被重復(fù)使用15個(gè)變量代表的面部特征變量面部特征變量面部特征變量面部特征1臉的高度(heightofface)6笑容曲線(curveofsmile)11發(fā)型(stylingofhair)2臉的寬度(widthofface)7眼睛高度(heightofeyes)12鼻子高度(heightofnose)3臉的形狀(shapeofface)8眼睛寬度(widthofeyes)13鼻子寬度(widthofnose)4嘴的高度(heightofmouth)9頭發(fā)高度(heightofhair)14耳朵寬度(widthofears)5嘴的寬度(widthofmouth)10頭發(fā)寬度(widthofhair)15耳朵高度(heightofears)7.2

比較樣本間差異臉譜圖【例7-1】—全國31個(gè)地區(qū)的人均消費(fèi)支出的臉譜圖7.2

比較樣本間差異臉譜圖——散點(diǎn)臉譜圖【例7-1】—食品煙酒支出和醫(yī)療保健支出的臉譜圖散點(diǎn)圖7.2

比較樣本間差異散點(diǎn)餅圖將多個(gè)樣本的餅圖繪制成散點(diǎn)餅圖(scatterpieplot)用餅圖代替散點(diǎn)圖中的各個(gè)點(diǎn),并用餅的大小比較各樣本總數(shù)值多少,用餅的構(gòu)成分析各樣本數(shù)值構(gòu)成的差異或相似性7.2

比較樣本間差異聚類圖層次聚類(hierarchicalcluster)事先不確定要分多少類,而是先把每一個(gè)樣本作為一類,然后按照某種方法度量樣本之間的距離,并將距離最近的兩個(gè)樣本合并為一個(gè)類別,從而形成k-1個(gè)類別再計(jì)算出新產(chǎn)生的類別與其他各類別之間的距離,并將距離最近的兩個(gè)類別合并為一類。這時(shí),如果類別的個(gè)數(shù)仍然大于1,則重復(fù)這一步上述步驟,直到所有的類別都合并成一類為止K-均值聚類(K-meanscluster)不是把所有可能的聚類結(jié)果都列出來,使用者需要先指定要劃分的類別個(gè)數(shù),然后確定各聚類中心,再計(jì)算出各樣本到聚類中心的距離,最后按距離的遠(yuǎn)近進(jìn)行分類K-均值聚類中的“K”就是指事先指定要分的類別個(gè)數(shù),而“均值”則是指聚類的中心7.3

對樣本進(jìn)行分類層次聚類圖【例7-1】—全國31個(gè)地區(qū)的人均消費(fèi)支出的層次聚類樹狀圖7.3

對樣本進(jìn)行分類【例7-1】—31個(gè)地區(qū)層次聚類的圓形樹狀圖和植物形樹狀圖7.3

對樣本進(jìn)行分類層次聚類圖【例7-1】—31個(gè)地區(qū)層次聚類的網(wǎng)絡(luò)形樹狀圖7.3

對樣本進(jìn)行分類層次聚類圖【例7-1】—31個(gè)地區(qū)層次聚類結(jié)果(分成4類)類別地區(qū)地區(qū)數(shù)第1類北京,上海2第2類浙江,天津,江蘇3第3類福建,廣東,內(nèi)蒙古,湖北,湖南,山東,重慶7第4類遼寧,黑龍江,吉林,青海,新疆,安徽,河北,四川,陜西,寧夏,山西,河南,西藏,海南,廣西,江西,甘肅,貴州,云南,197.3

對樣本進(jìn)行分類層次聚類圖

K-均值聚類圖【例7-1】—31個(gè)地區(qū)分成4類的K-均值聚類圖7.3

對樣本進(jìn)行分類【例7-1】—31個(gè)地區(qū)分成4類的K-均值聚類結(jié)果分成4類分成3類類別地區(qū)地區(qū)數(shù)類別地區(qū)地區(qū)數(shù)第1類北京,上海2第1類北京,上海2第2類天津,浙江,江蘇,福建,廣東5第2類天津,浙江,江蘇,福建,廣東5第3類內(nèi)蒙古,重慶,山東,四川,遼寧,湖北,湖南,安徽,江西,海南10第3類新疆,青海,黑龍江,河北,山西,陜西,吉林,西藏,河南,寧夏,甘肅,云南,貴州,廣西,內(nèi)蒙古,遼寧,四川,重慶,安徽,湖北,江西,山東,湖南,海南24

第4類新疆,青海,黑龍江,西藏,陜西,山西,河北,吉林,河南,寧夏,甘肅,云南,貴州,廣西147.3

對樣本進(jìn)行分類

K-均值聚類圖熱圖(heatmap)是將矩陣中的每個(gè)數(shù)值轉(zhuǎn)化成一個(gè)顏色矩形,用顏色表示數(shù)值的近似大小或強(qiáng)度熱圖在很多領(lǐng)域都有應(yīng)用,比如基因組數(shù)據(jù)的可視化熱圖可以在聚類的基礎(chǔ)上同時(shí)用顏色表示出數(shù)據(jù)的大小繪制熱圖時(shí)要求數(shù)據(jù)必須是矩陣。由于各變量間的數(shù)值差異,一般需要做中心化或標(biāo)準(zhǔn)化處理。當(dāng)數(shù)據(jù)量很大時(shí),通常會將數(shù)據(jù)歸類后再繪制熱圖7.3

對樣本進(jìn)行分類

K-均值聚類圖聚類熱圖——可視化數(shù)值大小【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的2D熱圖和3D熱圖7.3

對樣本進(jìn)行分類聚類熱圖——可視化數(shù)據(jù)分布【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的頻數(shù)分布直方圖7.3

對樣本進(jìn)行分類聚類熱圖——可視化數(shù)據(jù)分布【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的密度分布熱圖7.3

對樣本進(jìn)行分類聚類熱圖——可視化數(shù)據(jù)分布【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的聚類熱圖7.3

對樣本進(jìn)行分類聚類熱圖——對樣本或變量分類【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的密度分布聚類熱圖7.3

對樣本進(jìn)行分類聚類熱圖——添加注釋信息【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的添加不同注釋信息的聚類熱圖7.3

對樣本進(jìn)行分類聚類熱圖——圓形聚類熱圖【例7-1】—31個(gè)地區(qū)居民人均消費(fèi)支出的圓形聚類熱圖7.3

對樣本進(jìn)行分類本章介紹的圖形主要用于比較多個(gè)樣本之間的相似性或差異用于比較多個(gè)樣本整體相似性的圖形主要有平行坐標(biāo)圖和雷達(dá)圖,它們易于比較和理解,但樣本不易過多比較樣本間差異的圖形主要有星圖和臉譜圖,它們是將每個(gè)樣本畫成一個(gè)圖形,適合于比較多個(gè)樣本之間差異的細(xì)節(jié),但不宜做整體比較對樣本進(jìn)行分類的圖形主要有聚類圖,它是使用統(tǒng)計(jì)中的聚類分析方法將多個(gè)樣本進(jìn)行分類,并畫出圖形,是分析樣本相似性的理想圖形。熱圖是用顏色飽和度來展示矩陣中交叉單元格的數(shù)值大小,但它不是為了精確觀察數(shù)據(jù)差異,而是找出數(shù)據(jù)分布的大致模式,通常與聚類圖結(jié)合使用本章小結(jié)

本章小結(jié)THEENDTHANKSTHEENDTHANKS2026/1/26R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析賈俊平2026/1/26本書特色新穎的寫作視角嚴(yán)謹(jǐn)?shù)慕M織結(jié)構(gòu)完備的繪制代碼詳盡的圖形解讀賈俊平2026/1/268.1

展示序列的變動特征8.2探索多序列的變化模型8.3比較不同時(shí)間點(diǎn)的差異8.4觀察每一天的數(shù)值變化8.5尋找序列的變化趨勢第8章展示時(shí)間序列

概要探索時(shí)間序列變化特征和模式的基本圖形是折線圖或面積圖當(dāng)有多個(gè)變量時(shí),可以繪制流線圖、地平線圖等要展示一個(gè)時(shí)間序列中各相鄰觀測值的變化方向,可以繪制瀑布圖;要展示多個(gè)樣本在不同時(shí)間上的變化趨勢,可以繪制斜線圖;要比較多個(gè)樣本在不同時(shí)間點(diǎn)上的排名變化,可以繪制凹凸圖如果數(shù)據(jù)是按一年中的每天記錄的,則可以繪制日歷圖展示每天的數(shù)據(jù)變化如果要尋找序列的變化趨勢,可以繪制平滑曲線和成分分解圖

本章導(dǎo)讀折線圖(linechart)是描述時(shí)間序列的基本圖形,它主要用于展示時(shí)間序列隨時(shí)間變化的形態(tài)和模式折線圖的x軸是時(shí)間,y軸是變量的觀測值y軸的起點(diǎn)值可以從0開始,也可以不從0開始如果一個(gè)序列觀測值的起點(diǎn)值較高,而其波動范圍又相對不大,為更好地觀察其變化特征,折線圖的y軸起點(diǎn)值可以不從0開始使用R繪制折線圖時(shí),會根據(jù)觀測值的情況自動確定y軸的起點(diǎn)值,當(dāng)然也可以自己設(shè)定折線圖8.1

展示序列的變動特征折線圖尤其適合展示單一時(shí)間序列如果要在一幅圖中同時(shí)展示多個(gè)序列,則繪制的序列數(shù)不易太多,且具有可比性,各序列觀測值的量綱(計(jì)量單位)應(yīng)相同,數(shù)量級差異也不能太大如果多個(gè)序列不具有不可比,或序列可比但觀測值的數(shù)量級差異太大,則不宜繪制在一幅圖中。此時(shí),可以分面繪制,將每個(gè)變量繪制成一幅獨(dú)立的圖形折線圖——分組和分面【例5-1】—空氣污染指標(biāo)8.1

展示序列的變動特征如果特別關(guān)注某個(gè)時(shí)間段數(shù)據(jù)變化的特征,可以對該時(shí)間段的折線進(jìn)行突出(高亮)顯示(highlighting)折線圖——突出顯示某個(gè)變量或時(shí)間段【例5-1】—空氣污染指標(biāo)8.1

展示序列的變動特征折線圖——按月和周分面【例5-1】—AQI,按季度、月份和周分面8.1

展示序列的變動特征面積圖【例5-1】空氣污染指標(biāo)面積圖(areagraph)是在折線圖的基礎(chǔ)上繪制的,它將折線與X軸之間的區(qū)域用顏色填充,填充的區(qū)域即為面積將多個(gè)時(shí)間序列繪制在一幅圖中時(shí),序列數(shù)不宜太多。當(dāng)序列較多時(shí),可以將每個(gè)序列單獨(dú)繪制一幅圖,并將多附圖以網(wǎng)格的形式擺放注意:折線圖的y軸起點(diǎn)值可以不從0開始,但繪制面積圖時(shí),y軸的起點(diǎn)值必須從0開始,這樣每個(gè)時(shí)間點(diǎn)陰影區(qū)域的高度才表示這個(gè)時(shí)間點(diǎn)上的觀測值8.1

展示序列的變動特征面積圖【例5-1】空氣污染指標(biāo)8.1

展示序列的變動特征流線圖流線圖(steamgraph)因其形狀類似河流,也被稱為流圖(streamgraph),有時(shí)也被稱為量化波圖。流線圖可以看作是堆疊面積圖的一種變形,不同的是,堆疊面積圖是以x軸為基準(zhǔn)線繪制的,而流線圖是將每個(gè)數(shù)據(jù)系列堆疊繪制在中心基準(zhǔn)線(零軸)的上下兩側(cè)。流線圖適合于展示多變量、大數(shù)據(jù)集的時(shí)間序列,通過觀察各數(shù)據(jù)系列隨時(shí)間推移的波峰和波谷,來發(fā)現(xiàn)序列的變化趨勢和模式【例5-1】—空氣污染指標(biāo)8.2

探索多序列的變化模式地平線圖地平線圖(

horizonplot)將多個(gè)時(shí)間序列并行繪制在一幅圖中,用于展示和比較多個(gè)時(shí)間序列的變化模式和特征使用顏色將序列的y軸進(jìn)行分割,也就是先將一個(gè)面積圖沿水平方向分成多個(gè)等高的塊,并用不同顏色來區(qū)分各個(gè)塊,然后把這些塊依次地疊加起來,就可以降低圖的高度,以達(dá)到在一幅圖中平行繪制出多個(gè)時(shí)間序列的目的用于區(qū)分塊的顏色可以自己選擇,比如,上升的部分用藍(lán)色表示,下降的部分用紅色表示,顏色越深表示變化的幅度越8.2

探索多序列的變化模式地平線圖一個(gè)虛擬的時(shí)間序列的折線圖和面積圖與地平線圖的比較8.2

探索多序列的變化模式地平線圖【例5-1】—空氣污染指標(biāo)8.2

探索多序列的變化模式地平線圖【例5-1】—空氣污染指標(biāo)8.2

探索多序列的變化模式瀑布圖瀑布圖(waterfallchart)用于展示一個(gè)時(shí)間序列中各相鄰觀測值的變化方向,而不是觀測值本身的整體變化模式可以用向上帶箭頭的線表示上升,向下帶箭頭的線表示下降,線的長短表示變化的幅度【例5-1】—空氣污染指標(biāo)8.3

比較不同時(shí)間點(diǎn)的差異斜線圖斜線圖(slopeplot)或稱斜率圖,展示具有多個(gè)樣本和多個(gè)序列構(gòu)成的面板數(shù)據(jù)(paneldata)斜線圖將面板數(shù)據(jù)中各樣本對應(yīng)的時(shí)間序列觀測值連線來觀察序列的趨勢是上升還是下降【例3-3】—31個(gè)地區(qū)2019—2023年的地區(qū)生產(chǎn)總值為例8.3

比較不同時(shí)間點(diǎn)的差異凹凸圖凹凸圖(bumpchart)或稱沖擊圖,它是用于展示兩列或多列數(shù)據(jù)點(diǎn)的一種圖形凹凸圖與斜線圖展示的都是面板數(shù)據(jù),不同的是凹凸圖展示的是各樣本在標(biāo)不同時(shí)間點(diǎn)的連續(xù)排位變化【例3-3】—31個(gè)地區(qū)2019—2023年的地區(qū)生產(chǎn)總值為例8.3

比較不同時(shí)間點(diǎn)的差異日歷圖日歷圖—用日歷的形式反映每一天的數(shù)據(jù)變化【例8-1】—空氣污染指標(biāo)8.4

觀察每一天的數(shù)值變化日歷圖——畫出部分月份【例8-1】—空氣污染指標(biāo)8.4

觀察每一天的數(shù)值變化日歷圖——畫出多個(gè)年份【例8-1】—空氣污染指標(biāo)8.4

觀察每一天的數(shù)值變化隨機(jī)成分平滑利用移動平均(movingaverage)將時(shí)間序列中的隨機(jī)波動平滑掉,從而有利于觀察其變化的固有模式移動平均是選擇固定長度的移動間隔,對序列逐期移動求得平均數(shù)作為平滑值【例5-1】——空氣污染指標(biāo)8.5

尋找序列的變化趨勢成分分解

【例8-2】——飲料銷售量數(shù)據(jù)8.5

尋找序列的變化趨勢本章介紹的圖形主要用于展示時(shí)間序列的變化特征和模式。折線圖是基本的圖形,面積圖是在折線下填充上顏色。折線圖和面積圖易于觀察和比較序列的變化特征,但繪制的序列不宜太多,否則不易區(qū)分和比較當(dāng)序列較多時(shí),可以采取分面方式繪制。流線圖和地平線圖適合于多序列大型數(shù)據(jù)集的展示,它不是為精確觀察序列的變化特征,而是利用顏色的分布觀察序列的整體變化模式瀑布圖主要用于展示相鄰數(shù)據(jù)點(diǎn)的變化方向和程度;斜線圖用于展示多個(gè)樣本在不同時(shí)間點(diǎn)上的數(shù)值變化;凹凸圖則用于展示多個(gè)樣本在兩個(gè)或多個(gè)時(shí)間點(diǎn)上的排名變化日歷圖是一種特殊的時(shí)間序列圖,它需要有每一天的觀測數(shù)據(jù)才能繪制。日歷圖的用途不是觀察數(shù)據(jù)的變化模式,而是重點(diǎn)觀測數(shù)據(jù)在一個(gè)月份或一年中較大值和較小值的分布位置隨機(jī)成分平滑則為例消除序列中的隨機(jī)成分以便觀察時(shí)間序列變化的固有趨勢,成分分解是觀察時(shí)間序列成分的有效方法本章小結(jié)

本章小結(jié)THEENDTHANKSTHEENDTHANKS2026/1/26R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析賈俊平2026/1/26本書特色新穎的寫作視角嚴(yán)謹(jǐn)?shù)慕M織結(jié)構(gòu)完備的繪制代碼詳盡的圖形解讀賈俊平2026/1/269.1組合式圖形9.2交互式圖形第9章組合式和交互式圖形

概要組合式圖形是將不同圖形組合在一起的呈現(xiàn)方式其目的主要有兩個(gè),一是節(jié)省繪圖空間,以便在更小的空間內(nèi)提供更多的數(shù)據(jù)信息;二是便于綜合比較分析創(chuàng)建組合式圖形的方式主要有兩種,一是將多幅獨(dú)立的圖形組合在一起,二是將子圖嵌入到主圖的指定位置組合式圖形的繪制要保持圖形整體的協(xié)調(diào)一致,提供具有互補(bǔ)價(jià)值的信息本章導(dǎo)讀圖形與表格的組合——圖形與原始數(shù)據(jù)表格的組合圖形與數(shù)據(jù)表格組合不僅可以節(jié)省文本空間,還可以為圖形提供互補(bǔ)信息組合在圖形中的表格可以是原始數(shù)據(jù)表格,也可以是數(shù)據(jù)分析結(jié)果的表格圖表的組合方式可以是并行組合,也可以將表格嵌套在圖形中【例】—2023年我國按年齡和性別分組人口數(shù)的金字塔圖9.1

組合式圖形圖形與表格的組合——對比分析圖形與描述統(tǒng)計(jì)量表格的組合將數(shù)據(jù)分析結(jié)果表格組合在圖形中更有分析價(jià)值【例3-2】—4個(gè)地區(qū)的人均消費(fèi)支出—嵌套條形圖、發(fā)散條形圖與描述統(tǒng)計(jì)量表格的組合——發(fā)散條形圖9.1

組合式圖形圖形與表格的組合——信息互補(bǔ)圖形與描述統(tǒng)計(jì)量表格的組合【例3-2】—4個(gè)地區(qū)的人均消費(fèi)支出—條形圖和環(huán)形圖與描述統(tǒng)計(jì)量表格的組合9.1

組合式圖形圖形與表格的組合——關(guān)聯(lián)圖形與描述統(tǒng)計(jì)量表格的組合【例5-1】—AQI數(shù)據(jù)為例##誤差條形圖展示了不同質(zhì)量等級下AQI的水平和離散程度;Q-Q圖顯示AQI不否服從正態(tài)分布;面積圖展示了序列的變化模式9.1

組合式圖形圖形與表格的組合——主圖+邊際圖+描述統(tǒng)計(jì)量表格【例7-1】—31個(gè)地區(qū)各項(xiàng)消費(fèi)支出—主圖加邊際圖與描述統(tǒng)計(jì)量表格的組合##熱圖的顏色飽和度展示了每個(gè)地區(qū)各項(xiàng)支出的多少,上方的條形圖展示了每個(gè)支出項(xiàng)目的總支出,右側(cè)的棒棒糖圖展示了每個(gè)地區(qū)的總支出,下方的表格給出了按地帶劃分分組的描述統(tǒng)計(jì)量9.1

組合式圖形圖形與注釋文本的組合——變量注釋【例5-1】—添加PM2.5的mean(均值)+3SD(標(biāo)準(zhǔn)差)線和PM2.5的median(中位數(shù))+3MAD(中位數(shù)絕對離差)線,用以判斷數(shù)據(jù)集中的離群點(diǎn)(outliers)。MAD是一個(gè)數(shù)據(jù)集中每個(gè)數(shù)據(jù)與其中位數(shù)離差絕對值的中位數(shù)。統(tǒng)計(jì)上通常將mean±3×SD范圍之外或median±3×MAD之外的數(shù)據(jù)稱為離群點(diǎn)。由于本例數(shù)據(jù)為右偏,僅畫出mean+3SD和median+3MAD兩條上限(也可以畫出下限,即mean-3SD和median-3MAD)9.1

組合式圖形圖形與注釋文本的組合——圖形注釋【例3-2】帕累托圖(Paretoplot)和瀑布圖(waterfallchart)9.1

組合式圖形圖形與注釋文本的組合——方法注釋【例】—為了解大學(xué)生對食堂就餐的滿意度,隨機(jī)抽取150名學(xué)生進(jìn)行問卷調(diào)查。問卷采用李克特量表(Likertscale)形式設(shè)計(jì),共包括6個(gè)調(diào)查項(xiàng)目,分別為“食品價(jià)格”“食品口味”“食品品種”“就餐環(huán)境”“就餐時(shí)間”“服務(wù)態(tài)度”,每個(gè)調(diào)查項(xiàng)目均包括5個(gè)回答選項(xiàng),分別為“A非常不滿意”“B不滿意”“C中立”“D滿意”“E非常滿意”9.1

組合式圖形圖形與注釋文本的組合——方法注釋【例】—圖形解釋:圖9-8是使用ggstats包中的gglikert函數(shù)繪制的一種特殊堆疊條形圖,它是將各回答項(xiàng)目從中間項(xiàng)(“中立”)依次向兩側(cè)堆疊,以便在一幅圖中比較多個(gè)調(diào)查項(xiàng)目的回答百分比圖9-8(a)中兩側(cè)為每個(gè)調(diào)查項(xiàng)目的回答百分比合計(jì)。函數(shù)默認(rèn)totals_include_center=FALSE,即合計(jì)數(shù)不含中間項(xiàng)(“中立”)。比如,左側(cè)的食品價(jià)格合計(jì)百分比49.3%是22.7%(非常不滿意)與26.7%(不滿意)的和(因百分比的四舍五入有差異),右側(cè)的食品價(jià)格合計(jì)百分比38.7%是18.7%(滿意)與20%(非常滿意)的和,不含中立選項(xiàng)的百分比圖9-8(b)是按性別分面繪制的,并設(shè)置totals_include_center=TRUE,因此兩側(cè)每個(gè)調(diào)查項(xiàng)目的回答百分比合計(jì)含中間項(xiàng)(“中立”)的一半。比如,男生左側(cè)的食品價(jià)格合計(jì)百分比52%是18%(非常不滿意)+28%(不滿意)+12%/2(中立),右側(cè)的食品價(jià)格合計(jì)百分比48%是21%(非常滿意)+21%(滿意)+12%/2(中立),其余類推9.1

組合式圖形主圖與局部放大子圖的組合——嵌入子圖【例5-1】—AQI與PM10的散點(diǎn)圖和AQI的折線圖9.1

組合式圖形【例5-1】—AQI與PM10數(shù)據(jù)9.1

組合式圖形主圖與局部放大子圖的組合——面板組合圖形與圖片的組合——背景圖片【例5-1】—部分?jǐn)?shù)據(jù)9.1

組合式圖形圖形與圖片的組合——填充圖片【例3-1】9.1

組合式圖形創(chuàng)建交互式圖形交互圖形(interactivegraph)或稱交互式網(wǎng)絡(luò)圖形(interactiveWebgraph),它是將圖形繪制成Web形式,從而實(shí)現(xiàn)圖形與數(shù)據(jù)的聯(lián)動在交互式圖形中,將鼠標(biāo)指針移到圖形的任意位置,可以觀察圖形對應(yīng)的數(shù)據(jù)點(diǎn)本節(jié)首先介紹plotly包繪制的幾種交互式圖形,然后介紹GWalkR包的簡要使用方法9.2

交互式圖形創(chuàng)建交互式圖形——plotly包繪制漏斗圖【例3-2】—2023年北京和上海居民人均消費(fèi)支出的交互漏斗圖9.2

交互式圖形創(chuàng)建交互式圖形——plotly包繪制的小提琴圖【圖9-6】9.2

交互式圖形創(chuàng)建交互式圖形——plotly包繪制散點(diǎn)圖9.2

交互式圖形創(chuàng)建交互式圖形——plotly包折線圖【例5-1】—AQI、PM2.5、PM10、二氧化硫和臭氧濃度數(shù)據(jù)——30日移動平均9.2

交互式圖形創(chuàng)建可視化儀表盤——GWalkR包簡介GWalkR包是將數(shù)據(jù)框轉(zhuǎn)換為類似“Tableau”的交互式界面,從而簡化R數(shù)據(jù)分析和數(shù)據(jù)可視化流程對于R用戶來說,GWalkR可以在R環(huán)境帶實(shí)現(xiàn)Tableau的交互性和視覺功能,從而使用交互式圖形進(jìn)行探索性數(shù)據(jù)分析##Tableau是一款商業(yè)智能工具軟件,它將數(shù)據(jù)運(yùn)算與圖表完美地嫁接在一起。用戶將數(shù)據(jù)拖放到數(shù)字“畫布”上就能創(chuàng)建出各種圖表。Tableau操作簡單,尤其適合于數(shù)據(jù)的展示和可視化分析,具有強(qiáng)調(diào)的交互性能9.2

交互式圖形創(chuàng)建可視化儀表盤——GWalkR包——Data交互界面【例5-1】9.2

交互式圖形創(chuàng)建可視化儀表盤——GWalkR包——Visualization交互界面【例5-1】9.2

交互式圖形組合式圖形是將圖形與圖形組合、圖形與數(shù)據(jù)表格組合、圖形與文本組合、圖形與圖片組合等繪制形式,目的是用節(jié)省文本空間。使用時(shí)可根據(jù)需要選擇不同組合方式交互式圖形是將圖形繪制成Web形式,實(shí)現(xiàn)數(shù)據(jù)與圖形的聯(lián)動,從而更有利于展示數(shù)據(jù)。使用plotly可以繪制多種交互式圖形;使用ggplotly函數(shù)可以將將gplot2的圖形對象轉(zhuǎn)換為plotly對象;使用RGWalkR包可以創(chuàng)建可視化儀表盤本章小結(jié)本章小結(jié)THEENDTHANKSTHEENDTHANKS2026/1/26R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析賈俊平2026/1/26本書特色新穎的寫作視角嚴(yán)謹(jǐn)?shù)慕M織結(jié)構(gòu)完備的繪制代碼詳盡的圖形解讀10.1

圖形元素10.2圖形比例10.3

圖形配色第10章可視化的相關(guān)主題

10.43D圖形10.5數(shù)據(jù)變換10.6圖形格式和圖形導(dǎo)出概要用最小的空間提供最多的信息是可視化的基本要求合理使用圖表,避免造成別人對數(shù)據(jù)的疑惑和誤解圖形應(yīng)盡可能簡潔合理,以能夠清晰地展示數(shù)據(jù)、合理地表達(dá)分析目的為依據(jù)規(guī)范使用圖形,既要追求美觀,也應(yīng)避免不必要的修飾本章導(dǎo)讀圖形元素圖形元素是指組成圖形的各個(gè)要素,也就是圖形的組件,比如坐標(biāo)軸、圖中的點(diǎn)或線、標(biāo)題等圖形元素可以粗略地分為表示數(shù)據(jù)的元素和不表示數(shù)據(jù)的元素表示數(shù)據(jù)的元素:圖中用于展示數(shù)據(jù)的組件,比如,條形圖中用于表示類別頻數(shù)的條、散點(diǎn)圖中的點(diǎn)、折線圖中的線等,這些元素主要用于表達(dá)數(shù)據(jù)所提供的信息,也是圖形的主體部分,這里稱之為主體信息不表示數(shù)據(jù)的元素:包括圖形的坐標(biāo)軸、坐標(biāo)軸刻度和標(biāo)簽、坐標(biāo)軸標(biāo)題(標(biāo)簽)、圖例、圖形標(biāo)題、圖形注釋等,這些元素主要提供人們理解圖形的一些其他信息,這里稱之為輔助信息圖形是形對獨(dú)立的一種信息載體,即使不看上下文,只看圖形也應(yīng)該能大概看懂其中的信息,因此必要的輔助信息也是不可或缺的10.1

圖形元素坐標(biāo)系數(shù)據(jù)可視化實(shí)際上是將數(shù)據(jù)映射到空間上的位置,這個(gè)空間就是坐標(biāo)系(coordinatesystem),它是一組位置坐標(biāo)及其幾何布局的組合坐標(biāo)軸可以是由幾個(gè)互相垂直的向量構(gòu)成的空間,比如由

x、y

兩個(gè)向量構(gòu)成的二維(twodimension,2D)直角坐標(biāo)系,由

x、y

和z三個(gè)向量構(gòu)成的三維(three-dimension,3D)坐標(biāo)系等可視化中常用的有直角坐標(biāo)系(rectangularcoordinates),也稱笛卡爾坐標(biāo)系(Cartesiancoordinatesystem)、極坐標(biāo)系(polarcoordinates)等直角坐標(biāo)系和極坐標(biāo)系何以相互轉(zhuǎn)換10.1

圖形元素坐標(biāo)軸刻度使用線性標(biāo)尺的坐標(biāo)軸繪圖,數(shù)軸的數(shù)值起點(diǎn)應(yīng)從0開始,尤其是在繪制條形圖時(shí),數(shù)值軸的刻度必須從0開始,否則可能會放大數(shù)值間的差異,造成視覺差異和理解錯誤有的圖形數(shù)值軸的刻度不一定從0開始,比如,時(shí)間序列折線圖,如果序列的波動范圍較小,從0開始則不宜觀測序列的波動10.1

圖形元素坐標(biāo)軸刻度假定隨機(jī)抽取50名學(xué)生(25名男生和25名女生),得到身高(cm)和體重(kg)數(shù)據(jù)繪制的散點(diǎn)圖10.1

圖形元素圖形標(biāo)題標(biāo)題(title):圖形標(biāo)題有主標(biāo)題、副標(biāo)題、坐標(biāo)軸標(biāo)題(標(biāo)簽)、圖例標(biāo)題等主標(biāo)題是指一幅圖的總標(biāo)題,它主要用于注釋圖形的內(nèi)容,一般包括圖中數(shù)據(jù)所屬的時(shí)間(when)、地點(diǎn)(where)和內(nèi)容(what)3個(gè)要素由于圖形是一種相對獨(dú)立的信息載體,只看主標(biāo)題就應(yīng)該知道圖形要表達(dá)的信息主標(biāo)題可以放在圖的上方,也可放在圖的下方坐標(biāo)軸標(biāo)題也稱坐標(biāo)軸標(biāo)簽,用于說明坐標(biāo)軸代表的變量名稱,還應(yīng)給出數(shù)據(jù)的計(jì)量單位10.1

圖形元素圖形比例把x軸稱為寬,y軸稱為高,圖形寬和高的比例大致為10:7或4:3從視覺效果看,這樣的圖形比例能夠合理展示數(shù)據(jù),也易于對圖形的解讀,過寬或過高的圖形都有可能歪曲數(shù)據(jù),給人留下錯誤的印象10.2

圖形比例圖形配色——強(qiáng)調(diào)分類顏色不僅可以美化圖形,還可以對數(shù)據(jù)起到分類的作用,也可以用于強(qiáng)調(diào)某些特別關(guān)注的數(shù)值或數(shù)據(jù)的其他特征圖形中使用的顏色一定要有明確的意義,無意義的著色可能會造成擾亂視線、畫蛇添足的后果10.3

圖形配色圖形配色——強(qiáng)調(diào)數(shù)值強(qiáng)調(diào)分類和數(shù)值大小強(qiáng)調(diào)分類和數(shù)值特征10.3

圖形配色

3D圖形——謹(jǐn)慎使用不能為了炫酷而毫無目的地使用3D圖不增加信息量、不增進(jìn)可閱讀性、不增強(qiáng)可理解性的3D圖形并沒有多大意義除非你既想吸引眼球又想掩人耳目、既想展示數(shù)據(jù)又想擾亂視線、既想表達(dá)觀點(diǎn)又想混淆視聽不是展示三維數(shù)據(jù)的圖形就是數(shù)據(jù)可視化中的偽3D圖(falsethreedimensionsgraph)10.4

3D圖形

3D圖形——謹(jǐn)慎使用3D圖形不僅不符合人們的視覺習(xí)慣,也難以解讀在有些場合,人們有意將圖形繪制成3D形式,有擾亂視線、混淆視聽之嫌從數(shù)據(jù)可視化的視角看,除非特別有必要,否則應(yīng)避免使用3D圖形。偽3D10.4

3D圖形

3D圖形——謹(jǐn)慎使用3D——圖形D1—費(fèi)時(shí)D2—費(fèi)力D3—費(fèi)解10.4

3D圖形D1—費(fèi)時(shí)D2—費(fèi)力D3—費(fèi)解

3D圖形——謹(jǐn)慎使用10.4

3D圖形數(shù)據(jù)變換——什么是數(shù)據(jù)變換

10.5

數(shù)據(jù)變換數(shù)據(jù)變換——線性變換方法

10.5

數(shù)據(jù)變換數(shù)據(jù)變換——變換示例設(shè)由12個(gè)數(shù)據(jù)構(gòu)成的數(shù)據(jù)集為(44,48,66,51,51,67,55,37,43,46,62,54)根據(jù)原始數(shù)據(jù)、標(biāo)準(zhǔn)化和歸一化后的數(shù)據(jù)繪制的點(diǎn)圖、箱線圖和核密度圖如圖10.5

數(shù)據(jù)變換數(shù)據(jù)變換——變換示例

10.5

數(shù)據(jù)變換

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論