《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第3章 比較數(shù)值大小和差異_第1頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第3章 比較數(shù)值大小和差異_第2頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第3章 比較數(shù)值大小和差異_第3頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第3章 比較數(shù)值大小和差異_第4頁
《數(shù)據(jù)可視化分析-基于R語言》(第 4 版)課件 第3章 比較數(shù)值大小和差異_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

R語言數(shù)據(jù)可視化分析賈俊平2026/1/26基于R語言數(shù)據(jù)可視化分析賈俊平2026/1/26本書特色新穎的寫作視角嚴謹?shù)慕M織結構完備的繪制代碼詳盡的圖形解讀賈俊平2026/1/263.1

用條形比較3.2用矩形比較3.3用圓或點比較3.4用顏色飽和度比較3.5其他比較方法3.6在條形圖上添加檢驗信息第3章比較數(shù)值大小和差異

概要比較數(shù)值大小的方法用條形或矩形表示數(shù)值大小,如條形圖、馬賽克圖等用圓或點的大小表示數(shù)值大小,如圓堆圖、氣泡圖等用顏色飽和度表示數(shù)值大小,如熱圖用點的位置或點與坐標軸的連線、點與點的連線等表示各類別對應的數(shù)值差異,如克利夫蘭點圖、棒棒糖圖和啞鈴圖等用字的大小表示詞頻多少的一種特殊圖形,即詞云圖

本章導讀本章圖形適用的數(shù)據(jù)——類別數(shù)據(jù)由類別變量得到的原始觀測類別,如男和女由原始類別生成的頻數(shù)分布表,即各個類別及其所對應的頻數(shù)向量,如男和女分別應的人數(shù)(頻數(shù))各類別對應的其他數(shù)值向量,如男和女分別對應的平均身高、各地區(qū)的地區(qū)生產(chǎn)總值等展示數(shù)據(jù)流向或流量用條形表示數(shù)值大小的基本圖形是條形圖(barplot),它是用條的長度或高度表示各類別數(shù)值大小,其條的寬度通常是固定的條形圖用于展示的數(shù)據(jù)可以是各類別對應的絕對值或百分比繪制條形圖使用的類別變量可以是一個、兩個或多個,其數(shù)據(jù)類型可以是原始的類別變量、由類別變量生成的頻數(shù)表、具有類別標簽的其他數(shù)值向量或數(shù)據(jù)框繪制條形圖時,各類別可以放在x軸(橫軸),也可以放在y軸(縱軸)。類別放在x軸的條形圖稱為垂直條形圖(verticalbarplot)或柱形圖,類別放在y軸的條形圖稱為水平條形圖(horizontalbarplot)條形圖3.1用條形比較單變量條形圖—根據(jù)一個類別變量或一維表繪制的條形圖,它是用一個坐標軸表示各類別、另一個坐標軸表示類別對應的數(shù)值繪制的條形圖普通條形圖一般是用條的高度或長度表示各類別數(shù)值的多少,各類別條的寬度是相同,且不添加數(shù)值標簽單變量條形圖——普通條形圖【例3-1】——隨機調(diào)查2000個消費者,得到網(wǎng)購情況的數(shù)據(jù)。分別繪制性別、網(wǎng)購原因和滿意度的條形圖3.1用條形比較性別網(wǎng)購原因滿意度女方便滿意男價格便宜不滿意女價格便宜不滿意………………女選擇性強不滿意男價格便宜中立女方便不滿意單變量條形圖——普通條形圖【例3-1】——geom_bar函數(shù)繪制的條形圖3.1用條形比較使用ggplot2中的geom_bar函數(shù)繪制條形圖時,默認繪圖數(shù)據(jù)是原始類別變量,函數(shù)按行計數(shù)(count)繪制條形圖要給條形圖添加數(shù)值標簽,繪圖數(shù)據(jù)需要由類別及其對應數(shù)值構成的數(shù)據(jù)框,然后使用geom_text函數(shù)添加標簽單變量條形圖——添加數(shù)值標簽【例3-1】——geom_bar函數(shù)繪制的條形圖3.1用條形比較有多個樣本的同類數(shù)據(jù)時,可以將多個樣本的單變量條形圖以分面形式繪制【例3-2】

2023年北京、天津、上海和重慶的居民人均消費支出數(shù)據(jù)。繪制分面條形并進行比較分析單變量條形圖——圖形分面3.1用條形比較用于展示兩個或兩個以上類別變量的絕對數(shù)值或百分比繪圖數(shù)據(jù)可以是多個原始的類別變量,也可以是二維或多維列聯(lián)表、帶有對應數(shù)值標簽的向量或數(shù)據(jù)框要展示各類別的絕對值,可以繪制并列條形圖、堆疊條形圖等;要展示類別數(shù)值構成,可以繪制比例條形圖或百分比條形圖等;要展示各類別變量的層次結構,可以繪制嵌套條形圖;要分析類別變量之間的關系,可以繪制帶檢驗信息的條形圖多變量條形圖3.1用條形比較并列條形圖和堆疊條形圖。根據(jù)繪制方式的不同,展示各類別絕對值的條形圖有并列條形圖(juxtaposedbarplot)和堆疊條形圖(stackedbarplot)等并列條形圖中,一個類別變量作為坐標軸,另一個類別變量各類別數(shù)值的條形并列擺放;在堆疊條形圖中,一個類別變量作為坐標軸,另一個類別變量各類別數(shù)值按比例堆疊在同一個條中多變量條形圖——展示絕對值【例3-1】—geom_col函數(shù)繪制的并列條形圖和堆疊條形圖如圖3.1用條形比較x軸交互分類的并列條形圖和堆疊條形圖如果有3個或以上的類別變量,想繪制一幅條形圖,可以使用多個變量交互分類的方式來設置分類軸,用另一個變量對交互分類軸上的變量再進行分類多變量條形圖——展示絕對值【例3-1】—性別、網(wǎng)購原因和滿意度的x軸交叉分類條形圖3.1用條形比較不等寬條形圖普通條形圖每個條的寬度都是相同的對于兩個類別變量或二維列聯(lián)表,可以用一個變量各類別條形的寬度表示樣本量,另一個類別變量的各類別以并列或堆疊的方式繪制條形圖,這樣的條形圖就是不等寬條形圖多變量條形圖——不等寬條形圖【例3-1】網(wǎng)購原因和滿意度的不等寬并列條形圖和堆疊條形圖3.1用條形比較比例條形圖(Proportionalbarchart)。將每個類別條的高度均設定為1繪制的條形圖條的寬度可以相等,也可以不相等。條寬不相等的比例條形圖也稱脊形圖(spineplot),或稱比例堆疊條形圖,它是根據(jù)各類別數(shù)值比例繪制的一種不等寬條形圖,其中條的寬度與各類別的數(shù)值成正比,條內(nèi)堆疊矩形的高度表示另一個類別變量各類別的數(shù)值比例脊形圖可以根據(jù)兩個類別變量繪制,也可以根據(jù)多個類別變量繪制。多變量條形圖——展示數(shù)值比例或百分比3.1用條形比較百分比條形圖(percentagebarchart)。百分比條形圖是用條的高度或長度表示各類別的數(shù)值百分比。與脊形圖類似,繪制百分比條形圖時,每個類別條的高度均設定為100%,條的寬度可相等,也可以不相等普通百分比條形圖。普通百分比條形圖各條的寬度是相等的,堆疊在條內(nèi)的矩形大小取決于另一個類別的數(shù)值百分比多變量條形圖——展示數(shù)值比例或百分比【例3-13.1用條形比較多變量條形圖——展示數(shù)值比例或百分比【例3-2】2023年4個地區(qū)居民人均消費支出的百分比條形圖3.1用條形比較不等寬百分比條形圖形圖中條的寬度與各類別數(shù)值大小成正比,條內(nèi)堆疊矩形的高度表示另一個類別變量各類別數(shù)值多變量條形圖——展示數(shù)值比例或百分比【例3-1】按性別分面的滿意度與網(wǎng)購原因的百分比條形圖3.1用條形比較極坐標條形圖極坐標條形圖(polarbarchart)也稱徑向條形圖(radialbarchart)或圓形條形圖(circularbarchart)它是將多個類別的條繪按圓形來布局。與直角坐標下繪制的條形圖相比,徑向條形圖可以在有限的空間內(nèi)展示更多的類別在類別數(shù)較多時,徑向條形圖可以作為普通條形圖的替代圖形徑向條形圖雖然可以節(jié)省空間,但其缺點是不宜比較各條的長度3.1用條形比較極坐標條形圖由ggplot2包中的coord_radial函數(shù)繪制的單變量極坐標條形圖【例3-2】2023年北京居民人均消費支出的極坐標條形圖3.1用條形比較極坐標條形圖雙變量極坐標條形圖3.1用條形比較【例3-2】極坐標條形圖極坐標堆疊條形圖3.1用條形比較【例3-2】玫瑰圖南丁格爾玫瑰圖(Nightingalerosediagram)是在極坐標下繪制的一種條形圖,又稱極區(qū)圖(polarareadiagram)玫瑰圖由英國護士和統(tǒng)計學家弗羅倫斯·南丁格爾(FlorenceNightingale)發(fā)明,她自己稱這類圖為雞冠花(coxcomb),用于表達戰(zhàn)地軍醫(yī)院季節(jié)性的死亡率【例3-2】—北京的各項支為例,繪制的玫瑰圖3.1用條形比較玫瑰圖【例3-2】—2023年北京、天津上海和重慶城鎮(zhèn)居民人均消費支出的玫瑰圖3.1用條形比較用矩形表示數(shù)值大小或差異的條形主要有馬賽克圖(mosaicplot)和矩形樹狀圖(rectangulartreemap)它們與條形圖的區(qū)別是矩形的長度和寬度都得可變的,而條形圖中條的寬度通常是固定的馬賽克圖和矩形樹狀圖均可用于展示一個類別變量、兩個或多個類別變量,尤其適合展示兩個或兩個以上的類別變量,二者的區(qū)別是馬賽克圖是按二維或多維表中的類別順序繪制出矩形,而矩形樹狀圖則是按類別的層次繪制出嵌套矩形馬賽克圖和矩形樹狀圖3.2用矩形比較馬賽克圖(mosaicplot):用矩形表示列聯(lián)表中對應頻數(shù)的一種圖形,圖中嵌套矩形的面積與列聯(lián)表相應單元格的頻數(shù)成正比除用于展示二維或多維列聯(lián)表外,也可用于展示具有多組類別標簽的其他數(shù)據(jù)馬賽克圖3.2用矩形比較矩形樹狀圖(rectangulartreemap):展示多層次分類的一種圖形,也稱分層樹狀圖用矩形表示各類別對應數(shù)值大小的一種圖形可用于展示一個或以上類別變量的各類別對應的數(shù)值向量。對于一個類別變量,可用矩形比較各類別數(shù)值的大小。對于兩個或兩個以上的類別變量,矩形樹狀圖可以在分層的基礎上比較各層次類別數(shù)值的大小,它將多個類別變量的層次結構繪制在一個表示總數(shù)值的大的矩形中,每個子類用不同大小的矩形嵌套在這個大的矩形中。嵌套矩形表示各子類別對應的數(shù)值,其大小與相應的子類數(shù)值成正比矩形樹狀圖3.2用矩形比較【例3-1】【例3-2】矩形樹狀圖3.2用矩形比較圓堆圖和氣泡圖是用圓表示數(shù)值大小。當類別數(shù)較多時可以使用圓堆圖(circlepacking)或稱圓堆積圖,它是將每個類別對應的數(shù)值用圓的大小表示,多個類別繪制的多個圓堆積在一起,圓的大小與相應的數(shù)值成正比。圓堆圖適合于展示多個類別對應的數(shù)值。與條形圖相比,圓堆圖更節(jié)省空間,但缺點是不易比較圓的大小【例3-3】

2019—2023年全國31個地區(qū)的地區(qū)生產(chǎn)總值圓堆圖3.3用圓或點比較氣泡圖(bubbleplot)也稱氣球圖(balloondiagram),它是用圓(或其他形狀)表示數(shù)值大小的一種圖形當x軸和y軸都是類別變量時,氣泡圖可用于展示二維列聯(lián)表或帶有行名稱和列名稱的數(shù)值矩陣,并用圓的大小表示交叉單元格的數(shù)值多少(圓的大小與數(shù)值多少成正比)當x軸和y軸都是數(shù)值變量時,可以用圓的大小表示第3個變量的數(shù)值大小氣泡圖【例3-1】和【例3-2】

3.3用圓或點比較熱圖(heatmap)熱圖是用顏色的飽和度(深淺)表示數(shù)值大小的圖形可以繪制成矩形的形式,用每個矩形的顏色飽和度表示二維表中每個單元格對應的數(shù)值大小可以將矩形轉(zhuǎn)換成極坐標,繪制出圓形的熱圖熱圖3.4用顏色飽和度比較【例3-1】

熱圖3.4用顏色飽和度比較【例3-2】

熱圖【例3-3】

3.4用顏色飽和度比較克利夫蘭點圖(Clevelanddotchart)是將各類別對應的數(shù)值用點的形式展示出來當類別數(shù)較多時,可以作為條形圖的替代條形克利夫蘭點圖【例3-3】

3.5

其他比較方法棒棒糖圖(lollipopcharts)是將各類別對應的數(shù)值用點與坐標軸連線的形式展示出來,因形似棒棒糖而得名棒棒糖圖可以垂直繪制,也可以水平繪制,還可以繪制成極坐標形式棒棒糖圖更節(jié)省空間。當類別數(shù)較多時,可以作為條形圖的替代條形棒棒糖圖【例3-3】——圖中的紅色虛線為均值

3.5

其他比較方法啞鈴圖(dumbbellchart)是用一條直線連接兩個數(shù)據(jù)點,因形似啞鈴而得名主要用于比較兩個數(shù)據(jù)點的差異最主要的應用場景是比較兩個不同時間點的數(shù)值差異和配對樣本的數(shù)值差異啞鈴圖【例3-3】

3.5

其他比較方法詞云圖(wordcloud)是由單個的字、詞或句子組成的圖形,主要由于比較詞頻的多少在詞云圖中,可根據(jù)詞頻的多少用不同的位置或字體大小來安排各詞語。比如,高頻詞用大的字體表示,并放在圖中顯眼的位置,低頻詞用小的字體表示,并放在圖中次要的位置等詞云圖【例3-4】

60個不同的詞及相應的詞頻詞詞頻可視化1500R語言1100分析855…………正態(tài)分布174圖形組合171詞云圖1713.5

其他比較方法詞云圖3.5

其他比較方法添加推斷信息

3.6在條形圖上添加推斷信息添加誤差信息——誤差條形圖添加誤差線的條形圖稱為誤差條形圖(errorbarchart),它是用條形的高度(或長度)表示樣本均值,并以均值為中心將一定的誤差范圍以誤差線的形式疊加在條形圖上誤差線可以是樣本均值±樣本標準差(standarddev

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論