版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 PAGE PAGE 249Table of Contents HYPERLINK l _bookmark0 HYPERLINK l _bookmark1 歡迎 HYPERLINK l _bookmark2 前言 HYPERLINK l _bookmark3 簡(jiǎn)介 HYPERLINK l _bookmark4 可視化數(shù)據(jù):將數(shù)據(jù)映射到美學(xué)上 HYPERLINK l _bookmark5 坐標(biāo)系和軸 HYPERLINK l _bookmark6 顏色刻度 HYPERLINK l _bookmark7 可視化的目錄 HYPERLINK l _bookmark8 可視化數(shù)量 HYPERLINK l
2、_bookmark9 可視化分布:直方圖和密度圖 HYPERLINK l _bookmark10 q-q 圖 HYPERLINK l _bookmark11 一次可視化多個(gè)分布 HYPERLINK l _bookmark12 可視化比例 HYPERLINK l _bookmark13 可視化嵌套比例 HYPERLINK l _bookmark14 可視化兩個(gè)或多個(gè)定量變量之間的關(guān)聯(lián) HYPERLINK l _bookmark15 可視化自變量的時(shí)間序列和其他函數(shù) HYPERLINK l _bookmark16 可視化趨勢(shì) HYPERLINK l _bookmark17 可視化地理空間數(shù)據(jù) HY
3、PERLINK l _bookmark18 可視化不確定性 HYPERLINK l _bookmark19 比例墨水原理 HYPERLINK l _bookmark20 處理重疊點(diǎn) HYPERLINK l _bookmark21 顏色使用的常見缺陷 HYPERLINK l _bookmark22 冗余編碼 HYPERLINK l _bookmark23 多面板圖形 HYPERLINK l _bookmark24 標(biāo)題,說明和表格 HYPERLINK l _bookmark25 平衡數(shù)據(jù)和上下文 HYPERLINK l _bookmark26 使用較大的軸標(biāo)簽 HYPERLINK l _book
4、mark27 避免線條圖 HYPERLINK l _bookmark28 3D HYPERLINK l _bookmark29 了解最常用的圖像文件格式 HYPERLINK l _bookmark30 選擇合適的可視化軟件 HYPERLINK l _bookmark31 講述一個(gè)故事并提出一個(gè)觀點(diǎn) HYPERLINK l _bookmark32 HYPERLINK l _bookmark33 技術(shù)注解 HYPERLINK l _bookmark34 參考1 11 21 31 41 51 61 71 81 91 101 1 121 131 141 151 161 171 181 191 201
5、211 221 231 241 251 261 271 281 291 301 311 321 331 341 35數(shù)據(jù)可視化的基礎(chǔ)知識(shí)原文: HYPERLINK /dataviz/ FundamentalsofDataVisualization校驗(yàn): HYPERLINK /wizardforcel 飛龍協(xié)議: HYPERLINK /licenses/by-nc-sa/4.0/ CC BY-NC-SA 4 0歡迎任何人參與和完善:一個(gè)人可以走的很快,但是一群人卻可以走的更遠(yuǎn)。 HYPERLINK / 在線閱讀 HYPERLINK /?_wv=1027&k=54ujcL3 ApacheCN 面試
6、求職交流群 724187166 HYPERLINK / ApacheCN 學(xué)習(xí)資源編譯npm install -g gitbook-cli gitbook fetch 3.2.3npm install -g gitbook-cli gitbook fetch 3.2.3git clone/apachecn/found-data-vis-zh cd found-data-vis-zhgitbook 聯(lián)系方式在我們的 HYPERLINK /apachecn/found-data-vis-zh apachecn/found-data-vis-zh github 上提 issue 發(fā)郵件到 Email
7、: HYPERLINK mailto:apachecn apachecn 在我們的 HYPERLINK /organization/348.html 組織學(xué)習(xí)交流群 中聯(lián)系群主/管理員即可 贊助我們歡迎原文: HYPERLINK /dataviz/ Welcome校驗(yàn): HYPERLINK /wizardforcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯本書旨在作為制作可視化,準(zhǔn)確反映數(shù)據(jù),講述故事和看起來很專業(yè)的指南。它源于我和實(shí)驗(yàn)室中的學(xué)生和博士后在數(shù)千個(gè)數(shù)據(jù)可視化上的合作經(jīng)驗(yàn)。多年來,我注意到同樣的問題一再出現(xiàn)。我試圖以本書的形式從這些互動(dòng)中收集我積累的知識(shí)。整本書都是用 R
8、 Markdown 編寫的,使用 RStudio 作為我的文本編輯器,以及bookdown 包來將一系列 Markdown 文檔轉(zhuǎn)換為連貫的整體。該書的源代碼托管在 GitHub 上, HYPERLINK /clauswilke/dataviz clauswilke/dataviz。如果您發(fā)現(xiàn)拼寫錯(cuò)誤或其他問題,請(qǐng)隨時(shí)在GitHub 上新建 ssue 或提交拉取請(qǐng)求。如果您執(zhí)行后者,請(qǐng)?jiān)谔峤幌⒅刑砑印?assign the copyright of this contribution to Claus 0 Wilke”(我將此貢獻(xiàn)的版權(quán)賦予 Claus 0 Wilke),以便我可以保留以其他
9、形式發(fā)布本書的選項(xiàng)。 HYPERLINK /licenses/by-nc-sa/4.0/legalcode CC 4 0 HYPERLINK /licenses/by-nc-nd/4.0/legalcode CC 4 0 許可協(xié)議授權(quán)。前言原文: HYPERLINK /dataviz/preface.html Preface 校驗(yàn): HYPERLINK /wizardforcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯如果您是科學(xué)家,分析師,顧問或任何其他必須制作技術(shù)文檔或報(bào)告的人,您需要掌握的最重要技能之一就是,以圖形形式進(jìn)行引人注目的數(shù)據(jù)可視化的能力。圖形通常為你的論據(jù)帶來權(quán)重。
10、他們清晰,有吸引力,令人信服。好的和壞的圖形之間的差異可能是高影響力或模糊不清的論文,補(bǔ)助或合同的得到或失去,工作面試的好與壞之間的差異。然而,令人驚訝的是,很少有資源可以教您如何制作引人注目的數(shù)據(jù)可視化。很少有大學(xué)提供有關(guān)這一主題的課程,也沒有很多關(guān)于這個(gè)主題的(當(dāng)然有些存在。)不是解釋為什么某些選擇是首選而其他選擇不是。在您的日常工作中,您只需要知道如何做出好的數(shù)據(jù),如果您很幸運(yùn),您有一位耐心的顧問會(huì)在您撰寫第一篇科學(xué)論文時(shí)教您一些技巧。在寫作的背景下,經(jīng)驗(yàn)豐富的編輯談?wù)摗岸洹?,聽到(在?nèi)部,當(dāng)你閱讀一篇散文時(shí))寫作是否良好的能力。我認(rèn)為,在圖形和其他可視化方面,我們同樣需要“眼睛”,看
11、到一個(gè)圖形,看看它是否平衡,清晰,引人注目的能力。就像寫作的情況一樣,可以學(xué)習(xí)查看圖形是否有效的能力。擁有眼睛主要是指,您了解更多簡(jiǎn)單規(guī)則和良好可視化原則,并注意其他人可能沒有的細(xì)節(jié)。根據(jù)我的經(jīng)驗(yàn),同樣像寫作一樣,你不會(huì)在周末讀書時(shí)開發(fā)眼睛。這是一個(gè)終身的過程,今天對(duì)你來說過于復(fù)雜或過于微妙的概念,可能會(huì)在五年后變得更有意義。我可以對(duì)自己說,我繼續(xù)開發(fā)我對(duì)圖形的理解。我經(jīng)常嘗試讓自己接觸新的方法, 并且我注意他人在他們的圖形中做出的視覺和設(shè)計(jì)選擇。我也愿意改變主意。我今天可能會(huì)認(rèn)為一個(gè)特定的圖形很棒,但下個(gè)月我可能會(huì)找到批評(píng)它的理由。所以考慮到這一點(diǎn),請(qǐng)不要把我說的任何東西當(dāng)作福音。仔細(xì)思考我
12、對(duì)某些選擇的理由, 并決定是否要采用它們。雖然本書中的材料是按邏輯展示的,但大多數(shù)章節(jié)都可以獨(dú)立存在,而且無需閱讀書籍封面。您可以隨意瀏覽,選擇您當(dāng)前感興趣的特定部分,或者涵蓋您正在考慮的特定設(shè)計(jì)選擇的部分。事實(shí)上,如果你不是一次性閱讀本書,而是在更長(zhǎng)的時(shí)間內(nèi)逐漸閱讀它,嘗試在你的圖形制作中應(yīng)用書中的一些概念,并回過頭來閱讀其他概念或重新閱讀您在一段時(shí)間后學(xué)到的概念,我認(rèn)為你會(huì)從這本書中獲得最大的收益。如果您在幾個(gè)月的時(shí)間過后重新閱讀它,您可能會(huì)發(fā)現(xiàn)同一章告訴您不同的事情。盡管本書中的幾乎所有圖形都是用 R 和 ggplot2 制作的,但我并不認(rèn)為這是 R 的書。我在談?wù)搱D形制作的一般原則。用
13、于制作圖形的軟件是隨意的。你可以使用任何你想要的繪圖軟件,來生成我在這里展示的各種圖形。但是,ggplot2 和類似的軟件包使我使用的許多技巧比其他繪圖庫(kù)簡(jiǎn)單得多。重要的是,因?yàn)檫@不是 R 的書,所以我不會(huì)在本書的任何地方討論代碼或編程技巧。我希望你專注于概念和圖形,而不是代碼。如果您對(duì)如何制作任何數(shù)據(jù)感到好奇,可以在 HYPERLINK /clauswilke/dataviz GitHub 存儲(chǔ)庫(kù)中查看該書的源代碼。關(guān)于繪圖軟件和圖形制作流程圖的思考一個(gè)新的繪圖庫(kù)或者出現(xiàn)一個(gè)新的范例,大量的科學(xué)家們轉(zhuǎn)而使用熱門的新工具 gnuplot,Xfig,Mathematica,Matlab,pyth
14、on matplotlib,R 中R 基本庫(kù),ggplot2R ggplot2,但我不希望在退休之前我會(huì)繼續(xù)使用它。軟件平臺(tái)的這種不斷變化,是本書不是編程手冊(cè),以及為什么我遺漏了所有代碼示例的主要原因之一。無論你使用哪種軟件,我都希望這本書對(duì)你有用,而且即使每個(gè)人都從 ggplot2 轉(zhuǎn)移并使用下一個(gè)新東西,我希望它仍然有價(jià)值。我意識(shí)到這個(gè)選擇對(duì)于一些 ggplot2 用戶來說可能會(huì)令人沮喪,他們想知道我如何制作給定圖形。我告訴他們,閱讀這本書的源代碼,它是可用的。此外,將來我可能會(huì)發(fā)布一個(gè)僅關(guān)注代碼的補(bǔ)充文檔。多年來我學(xué)到的一件事是,自動(dòng)化是你的朋友。我認(rèn)為作為數(shù)據(jù)分析流水線的一部分,圖形應(yīng)
15、該自動(dòng)生成(也應(yīng)該是自動(dòng)化的),它們應(yīng)該從流水線中出來,準(zhǔn)備好發(fā)送到打印機(jī),不需要手動(dòng)后處理。我看到很多學(xué)員自動(dòng)生成他們的圖形的粗略草稿,然后他們導(dǎo)入到 llustrator 中進(jìn)行修飾。這是壞主意并有幾個(gè)原因。首先,在您手動(dòng)編輯圖形的那一刻,您的最終圖形變得不可再現(xiàn)。第三方無法生成和您所做的完全相同的圖形。雖然這可能并不重要,如果您所做的只是更改軸標(biāo)簽的字體, 使線條模糊,并且很容易跨越到不太清晰的區(qū)域。舉個(gè)例子,假設(shè)你想用更可讀的標(biāo)簽手動(dòng)替換謎之標(biāo)簽。第三方可能無法驗(yàn)證標(biāo)簽更換是否合適。其次,如果您在圖形制作流水線中添加了大量手動(dòng)后處理,那么您將更不愿意進(jìn)行任何更改或重做您的工作。因此,您
16、可能會(huì)忽略協(xié)作者或同事做出的合理的更改請(qǐng)求,或者即使您實(shí)際重新生成了所有數(shù)據(jù),也可能會(huì)重復(fù)使用舊圖形。這些都不是假設(shè)的例子。我在實(shí)際場(chǎng)景中看到過他們。第三,你自己可能會(huì)忘記,你為準(zhǔn)備一個(gè)給定的圖形做了什么,或者你可能無法生成一個(gè)新數(shù)據(jù)的未來圖形,與你之前的圖形在視覺上完全匹配。由于上述所有原因,交互式繪圖程序是一個(gè)壞主意。它們固有地迫使您手動(dòng)制作您的圖形。實(shí)際上,最好自動(dòng)生成一個(gè)圖形草稿并在 llustrator 中修飾它,而不是在一些交互式繪圖程序中手工制作整個(gè)圖形。請(qǐng)注意,Excel 也是一個(gè)交互式繪圖程序,不建議用于圖形制作(或數(shù)據(jù)分析)。數(shù)據(jù)可視化圖書中的一個(gè)關(guān)鍵成分,是所提出的可視化
17、的可行性。很高興能夠發(fā)明一些優(yōu)雅的可視化新方法,但是如果沒有人能夠使用這種可視化輕松生成數(shù)據(jù),那么就沒有多大用處。例如,當(dāng) Tufte 首次提出迷你圖時(shí),沒有人能夠輕松制作它們。雖然我們需要有遠(yuǎn)見的人通過可能的方式來推動(dòng)世界的發(fā)展,但我認(rèn)為這本書是切實(shí)可行的,并直接適用于為其出版物制作圖形的職業(yè)數(shù)據(jù)科學(xué)家。因此,我在后續(xù)章節(jié)中提出的可視化,可以通過幾行 R 代碼,通過 和隨時(shí)可用的擴(kuò)展包生成。事實(shí)上,本書中的幾乎每一個(gè)圖形,除了第 HYPERLINK file:/localhost/C:/Users/liangfen/AppData/Local/Temp/calibre_eirabl/u4ol
18、qg_pdf_out/no-3d.html#no-3d 26, HYPERLINK file:/localhost/C:/Users/liangfen/AppData/Local/Temp/calibre_eirabl/u4olqg_pdf_out/image-file-formats.html#image-file-formats 27 和 HYPERLINK file:/localhost/C:/Users/liangfen/AppData/Local/Temp/calibre_eirabl/u4olqg_pdf_out/choosing-visualization-software.ht
19、ml#choosing-visualization-software 28 章中的一些圖形外,都是完全自動(dòng)生成的。致謝RStudio R Universe 變成一流的出版平臺(tái)所做的出色工作,這個(gè)Hadley Wickham ggplot2,這是用Yihui Xie R Markdown 以及編knitr bookdown 軟件包。如果這些工具沒有準(zhǔn)備就緒,我認(rèn)為我不會(huì)啟動(dòng)這R Markdown 文件很有趣,并且很容易收集材料并獲得動(dòng)力。特別感Achim Zeileis Reto Stauffer colorspace,Thomas Lin Pedersen 的ggforce 和 gganima
20、te,Kamil Slowikowski 的 ggrepel,Edzer Pebesma 的 sf Claire McWhite colorspace colorblindr R 裝配圖中的色覺缺陷。有幾個(gè)人對(duì)本書的草稿版本提供了有用的反饋。最重要的是,0Reilly 的編輯 Mike Loukides 和 Steve Haroz 都閱讀并評(píng)論了每一章。我還收到了 Carl Bergstrom, Jessica Hullman,Matthew Kay,Edzer Pebesma,Tristan Mahr,Jon Schwabish 和 Hadley Wickham 的有益評(píng)論。 Len Kie
21、fer 的博客和 Kieran Healy 的書和博客文章為圖形制作和數(shù)據(jù)集提供了許多靈感。許多人指出了小問題或錯(cuò)別字 , 包 括 Thiago Arrais,Malcolm Barrett,Jessica Burnett,Jon Calder, AntnioPedroCamargo,Daren Card,Kim Cressman,Akos Hajdu,Andrew Kinsman,Will Koehrsen,Alex Lalejini,John Leadley,Katrin Leinweber,Mikel Madina,Claire McWhite,Sbusiso Mkhondwane,Jo
22、se Nazario,Steve Putman,MalleSalmon,Christian Schudoma,James Scott-Brown,Enrico Spinielli,Wouter van der Bijl 和 Ron Yurko。我還要更廣泛地感謝 tidyverse 和 R 社區(qū)的所有其他貢獻(xiàn)者。確實(shí)存在可用于任何可視化挑戰(zhàn)的 R 包。所有這些包都是由數(shù)千名數(shù)據(jù)科學(xué)家和統(tǒng)計(jì)學(xué)家組成的廣泛社區(qū)開發(fā)的,其中許多都以某種形式為本書的制作做出了貢獻(xiàn)。簡(jiǎn)介原文: HYPERLINK /dataviz/introduction.html 1 ntroduction校驗(yàn): HYPERLINK
23、 /wizardforcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯數(shù)據(jù)可視化是部分藝術(shù)和部分科學(xué)。挑戰(zhàn)在于讓藝術(shù)變得正確而不會(huì)讓科學(xué)出錯(cuò), 反之亦然。首先,數(shù)據(jù)可視化必須準(zhǔn)確地傳達(dá)數(shù)據(jù)。它絕不能誤導(dǎo)或扭曲。如果一個(gè)數(shù)字是另一個(gè)數(shù)字的兩倍,但在可視化中它們看起來大致相同,那么可視化就是錯(cuò)誤的。同時(shí),數(shù)據(jù)可視化應(yīng)該是美學(xué)上令人愉悅的。良好的視覺呈現(xiàn)傾向于增強(qiáng)可視化的信息。如果圖形包含不和諧的顏色,不平衡的視覺元素或其他分散注意力的特征,那么觀察者將發(fā)現(xiàn)更難以檢查圖形并正確解釋它。根據(jù)我的經(jīng)驗(yàn),科學(xué)家經(jīng)常(雖然并非總是如此?。┲廊绾慰梢暬瘮?shù)據(jù)而不會(huì)產(chǎn)生嚴(yán)重的誤導(dǎo)。然而,它們可能沒有良好
24、的視覺美感,并且它們可能無意中做出視覺選擇,從而減損了他們想要的信息。另一方面,設(shè)計(jì)師可能制作看起來漂亮,但可能簡(jiǎn)單和松散地使用數(shù)據(jù)的可視化。我的目標(biāo)是為兩個(gè)群體提供有用的信息。本書試圖涵蓋可視化出版物,報(bào)告或演示文稿數(shù)據(jù)所需的關(guān)鍵原則,方法和概念。因?yàn)閿?shù)據(jù)可視化是一個(gè)廣闊的領(lǐng)域,并且在其最廣泛的定義中可能包括各種主題, 如技術(shù)原理圖,3D 動(dòng)畫和用戶界面,我必須限制本書的范圍。我特別報(bào)道了在印刷品,在線或幻燈片中呈現(xiàn)的靜態(tài)可視化的情況。除了可視化不確定性章節(jié)中的一個(gè)簡(jiǎn)短部分外,本書不包括交互式視覺效果或電影。因此,在本書中,我將互換使用“可視化”和“圖形”這兩個(gè)詞。本書也沒有提供如何用現(xiàn)有的
25、可視化軟件或編程庫(kù)制作圖形的任何指導(dǎo)。本書末尾的帶標(biāo)注的參考書目,包含了涵蓋這些主題的適當(dāng)文本的引用。這本書分為三個(gè)部分。第一個(gè)“從數(shù)據(jù)到可視化”描述了不同類型的繪圖和圖形,例如條形圖,散點(diǎn)圖或餅圖。它的主要重點(diǎn)是可視化科學(xué)。在這一部分中,我不是試圖提供所有可想象的可視化方法的百科全書,而是討論一組核心的視覺效果,您可能會(huì)在出版物和/或您自己的工作中遇到這些視覺效果。在組織這一部分時(shí),我試圖通過它們傳達(dá)的消息類型,而不是可視化數(shù)據(jù)的類型,來對(duì)可視化進(jìn)行分組。統(tǒng)計(jì)文本通常按數(shù)據(jù)類型描述數(shù)據(jù)分析和可視化,按數(shù)量和變量類型組織材料(一個(gè)連續(xù)變量,一個(gè)離散變量,兩個(gè)連續(xù)變量,一個(gè)連續(xù)變量和一個(gè)離散變量
26、等)。我相信只有統(tǒng)計(jì)學(xué)家才會(huì)覺得這個(gè)組織很有幫助。大多數(shù)人都會(huì)根據(jù)消息來思考,比如某事物有多大,它是如何由部分組成的,它與其他事物的關(guān)系等等。第二部分“圖形設(shè)計(jì)原理”討論了制作數(shù)據(jù)可視化時(shí)出現(xiàn)的各種設(shè)計(jì)問題。它的主要但不是唯一的重點(diǎn),是數(shù)據(jù)可視化的美學(xué)方面。一旦我們選擇了適合我們數(shù)據(jù)集的正確類型的繪圖或圖形,我們就必須對(duì)視覺元素做出美學(xué)選擇,例如顏色,符號(hào)和字體大小。這些選擇可以影響可視化的清晰程度和外觀的優(yōu)雅程度。第二部分的章節(jié)討論了在實(shí)際應(yīng)用中反復(fù)出現(xiàn)的最常見問題。第三部分“雜項(xiàng)主題”涵蓋了一些不符合前兩部分的遺留問題。它討論了常用于存儲(chǔ)圖像和繪圖的文件格式,它提供了有關(guān)可視化軟件選擇的想
27、法,并解釋了如何將單個(gè)圖形放入更大文檔的上下文中。丑陋,不好的和錯(cuò)誤的圖形在本書中,我經(jīng)常展示相同圖形的不同版本,一些作為如何制作良好可視化的示 例,一些作為反面示例。為了提供一個(gè)簡(jiǎn)單的視覺指南,說明哪些例子應(yīng)該被模 仿,哪些應(yīng)該被避免,我明確地將有問題的圖形標(biāo)記為“丑陋”,“不良”或“錯(cuò)誤”(1 1):丑陋 - 有審美問題的圖形,但其他方面很清楚,信息量很大。不良 - 與感知有關(guān)的問題;它可能不清楚,混亂,過于復(fù)雜或誤導(dǎo)性。錯(cuò)誤 - 有數(shù)學(xué)問題的圖形;這是客觀上不正確的。圖 1 1:丑陋,不良和錯(cuò)誤圖形的例子。顯示三個(gè)值A(chǔ) = 3B = SC = 4)的條形圖。這是一個(gè)合理的可視化, 沒有重
28、大缺陷。(b)(a)的丑陋版本。雖然繪圖在技術(shù)上是正確的,但它在美學(xué)上并不令人愉悅。顏色太亮而且沒用。背景網(wǎng)格太突出了。使用三種不同尺寸的三種不同字體顯示文本。(c)(a)的不良版本。每個(gè)條都顯示有自己的 y 軸刻度。由于刻度不對(duì)齊,這使得圖形有誤導(dǎo)性。人們可以很容易地得到三個(gè)值比實(shí)際值更接近的印象。(d)(a)部分的錯(cuò)誤版本。如果沒有明確的 y 軸刻度,則無法確定由條形表示的數(shù)字。條形似乎長(zhǎng)度為 1,3 和 2,即使顯示的值為 3,5 和 4。我沒有明確標(biāo)明好的圖形。任何未明確標(biāo)記為有缺陷的圖形都應(yīng)假定為至少可以接受。這是一個(gè)信息豐富的圖形,看起來很吸引人,并且可以按原樣打印。請(qǐng)注意, 在好
29、的圖形中,質(zhì)量仍然存在差異,一些好的圖形會(huì)比其他圖形更好。我通常會(huì)提供具體評(píng)級(jí)的理由,但有些是品味問題。一般來說,“丑陋”評(píng)級(jí)比“不良”或“錯(cuò)誤”評(píng)級(jí)更主觀。而且,“丑陋”和“不良”之間的界限有點(diǎn)模糊。有時(shí)糟糕的設(shè)計(jì)選擇會(huì)干擾人類的感知,以至于“不良”評(píng)級(jí)比“丑陋”評(píng)級(jí)更合適。無論如何, 我鼓勵(lì)你開發(fā)自己的眼睛并批判性地評(píng)估我的選擇。可視化數(shù)據(jù):將數(shù)據(jù)映射到美學(xué)上原文: HYPERLINK /dataviz/aesthetic-mapping.html 2 Visualizing data: Mapping data onto aesthetics校驗(yàn): HYPERLINK /wizardfo
30、rcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯每當(dāng)我們可視化數(shù)據(jù)時(shí),我們都會(huì)采用數(shù)據(jù)值并將它們以系統(tǒng)和邏輯的方式轉(zhuǎn)換為構(gòu)成最終圖形的視覺元素。盡管存在許多不同類型的數(shù)據(jù)可視化,并且乍一看散點(diǎn)圖,餅圖和熱圖似乎沒有太多共同點(diǎn),但所有這些可視化都可以用一種通用語(yǔ)言來描述,它捕獲了數(shù)據(jù)如何變成紙上的墨水斑點(diǎn),或屏幕上的彩色像素。主要的見解如下:所有數(shù)據(jù)可視化將數(shù)據(jù)值映射到所得圖形的可量化特征。我們將這些特征稱為美學(xué)。美學(xué)和數(shù)據(jù)類型美學(xué)描述了給定圖形元素的每個(gè)方面。圖 2 1 中提供了一些示例。每個(gè)圖形元素的關(guān)鍵成分當(dāng)然是它的位置,描述了元素的位置。在標(biāo)準(zhǔn) 2D 圖形中,我們通過 x 和
31、y 值來描述位置,但是其他坐標(biāo)系和一維或三維可視化也是可能的。接下2 1 中顯示的示例之外,我們?cè)跀?shù)據(jù)可視化中可能會(huì)遇到許多其他體大小,如果圖形對(duì)象重疊,我們可能必須指定它們是否部分透明。圖 2 1:數(shù)據(jù)可視化中常用的美學(xué):位置,形狀,大小,顏色,線寬,線型。這些美學(xué)中的一些可以表示連續(xù)和離散數(shù)據(jù)(位置,大小,線寬,顏色),而其他美學(xué)通常僅表示離散數(shù)據(jù)(形狀,線型)。間(50 51 秒)50 5 秒,50 51 秒, 50 50001 5 6 5 5 2 1 中的示例,位置,大小,顏色和線寬可以表示連續(xù)數(shù)據(jù),但形狀和線型通常只能表示離散數(shù)據(jù)。接下來,我們將考慮可能要在可視化中表示的數(shù)據(jù)類型。您
32、可能會(huì)將數(shù)據(jù)視為數(shù) 據(jù)還可以以離散類別的形式,以日期或時(shí)間的形式出現(xiàn),也可以作為文本(表2 1)。當(dāng)數(shù)據(jù)是數(shù)字時(shí)我們也稱它為定量的,當(dāng)它是類別時(shí)我們稱它為定性的。保存定性數(shù)據(jù)的變量是因子,不同的類別稱為水平。最常見的一個(gè)因子的水平是沒有順序的(如表 2 1 中的“狗”,“貓”,“魚”的例子),但是當(dāng)存在內(nèi)在因素時(shí)也可以在水平之間的對(duì)因子排序(如表 2 1 中的“好”,“一般”,“差”的例子)。表 2 1:典型數(shù)據(jù)可視化方案中遇到的變量類型。變量的類型例子適當(dāng)?shù)目潭让枋龆? 數(shù)值連續(xù)l.3, S.7, 83,l.Sxl0(-2)連續(xù)任意數(shù)值。這些可以是整數(shù),有理數(shù)或?qū)崝?shù)。定量/ 數(shù)值離散l,
33、2, 3, 4離散離散單位中的數(shù)字。這些最常見但不一定是整數(shù)。例如,如果給定數(shù)據(jù)集中不存在中間值,則數(shù)字 0.S, l.0, l.S 也可視為離散。定性/ 無序類別狗,貓,魚離散沒有順序的類別。這些是離散且唯一的類別,沒有固有的順序。這些變量也稱為因子。定性/ 有序類別好,一般, 差離散帶順序的類別。這些是具有順序的離散且唯一的類別。例如,“一般”總是介于“好”和“差” 之間。這些變量也稱為有序因子。日期或時(shí)間2018 年 1 月5 日,上午8:03連續(xù)或離散特定日期和/或時(shí)間。也可能是通用日期, 例如 7 月 4 日或 12 月 25 日(沒有年份)。文本The quick brown fo
34、x jumps over the lazy 無或離散自由格式的文本。如果需要,可以視為類別。要查看這些不同類型數(shù)據(jù)的具體示例,請(qǐng)查看表 2 2 。它顯示了數(shù)據(jù)集的前幾行, 它們提供了美國(guó)四個(gè)地點(diǎn)的日平均氣溫(30 年窗口中的平均日常溫度)。此表包含五個(gè)變量:月,日,位置,站點(diǎn) D 和溫度(以華氏度為單位)。月是有序因子,日是離散數(shù)值,位置是無序因子,站點(diǎn) D 同樣是無序因子,溫度是連續(xù)數(shù)值。表 2 2:數(shù)據(jù)集的前 12 行,列出了四個(gè)氣象站的日平均氣溫。 數(shù)據(jù)來源:N0AA。月日地點(diǎn)站點(diǎn) ID溫度Jan1ChicagoUSW0001481925 6Jan1San DiegoUSW0009310
35、755 2Jan1HoustonUSW0001291853 9Jan1Death ValleyUSC0004231951 0Jan2ChicagoUSW0001481925 5Jan2San DiegoUSW0009310755 3Jan2HoustonUSW0001291853 8Jan2Death ValleyUSC0004231951 2Jan3ChicagoUSW0001481925 3Jan3San DiegoUSW0009310755 3Jan3Death ValleyUSC0004231951 3Jan3HoustonUSW0001291853 8將地圖數(shù)據(jù)值縮放到美學(xué)上為了將數(shù)
36、據(jù)值映射到美學(xué)上,我們需要指定哪些數(shù)據(jù)值對(duì)應(yīng)于哪些特定的美學(xué)值。x 位置上。同樣,我們可能需要指定哪些數(shù)據(jù)值由特定形狀或顏色表示。數(shù)據(jù)值和美學(xué)值之間的映射是通過刻度創(chuàng)建的。刻度定義了數(shù)據(jù)和美學(xué)之間的唯一映射(圖 2 2)。重要的是,刻度必須是一對(duì)一的,這樣對(duì)于每個(gè)特定的數(shù)據(jù)值,只有一個(gè)美學(xué)值,反之亦然。如果刻度不是一對(duì)一的,那么數(shù)據(jù)可視化就變得模棱兩可。2 21 4 色刻度。對(duì)于每個(gè)刻度,每個(gè)數(shù)字對(duì)應(yīng)于唯一的位置,形狀或顏色,反之亦然。2 2 y 軸x 結(jié)果是一個(gè)標(biāo)準(zhǔn)線圖,顯示了四個(gè)位置隨著日期的變化的平均氣溫(2 3)。2 3y x 軸,以及位置到線的顏色。數(shù)據(jù)來源:N0AA。2 3 是一個(gè)
37、相當(dāng)標(biāo)準(zhǔn)的溫度曲線可視化,可能是大多數(shù)數(shù)據(jù)科學(xué)家首先直觀選擇y 量(溫度)(Stone,AlbersSzafir Setlur HYPERLINK l _bookmark4 2014)形而不是線條,每個(gè)月和位置都有一個(gè),我用每個(gè)月的平均氣溫對(duì)它們著色(圖 2 4)。圖 2 4:美國(guó)四個(gè)地點(diǎn)的每月正常平均溫度數(shù)據(jù)來源:N0AA2 4 使用兩個(gè)位置刻度(x y 軸的站點(diǎn)12 個(gè)水平的有序因子,位置是一個(gè)有四個(gè)水平的無序因子。因此,兩個(gè)位置刻度都是離散的。對(duì)于離散位置刻度,我們通常將因子的不同水平沿軸線以相等的間距放置。如果因子是有序的(就像這里的月份一樣),則需要按適當(dāng)?shù)捻樞蚍胖盟?。如果因子是無
38、序的(這里是站點(diǎn)的情況),那么順序是任意的,我們可以選擇我們想要的任何順序。我排列了整體最冷(芝加哥)到整體最熱(死亡谷)的地點(diǎn),來產(chǎn)生令人愉快的驚人色彩。但是,我可以選擇任何其他順序,這個(gè)圖形同樣有效。2 3 2 4 總共使用了三個(gè)刻度,兩個(gè)位置刻度和一個(gè)顏色刻度。這是基本可視2 5 使用五個(gè)刻度,兩同變量。圖 2 5:32 輛汽車(型號(hào)為 1973-74)的燃油效率與排量。該圖使用五個(gè)單獨(dú)的刻度來表示數(shù)據(jù):x 軸(排量);y 軸(燃油效率);數(shù)據(jù)點(diǎn)的顏色(功率);數(shù)據(jù)點(diǎn)的大?。ㄖ亓浚粩?shù)據(jù)點(diǎn)的形狀(缸數(shù))。顯示的五個(gè)變量中的四個(gè)(位移,燃料效率,功率和重量)一個(gè)(缸數(shù))可以被認(rèn)為是數(shù)值離散
39、的或定性的。數(shù)據(jù)來源:Motor Trend, 1974。參考Stone,Stone,M.,D.AlbersSzafir,andV.Setlur.20l4.“AnEngineeringModelforColorDiff坐標(biāo)系和軸 HYPERLINK /dataviz/coordinate-systems-axes.html 3 Coordinate systems and axes校驗(yàn): HYPERLINK /wizardforcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯要進(jìn)行任何類型的數(shù)據(jù)可視化,我們需要定義位置刻度,來確定不同數(shù)據(jù)值的在圖形中的位置。如果不將不同數(shù)據(jù)點(diǎn)放置在不同
40、位置,我們就無法可視化數(shù)據(jù),即使我們只是沿著一條線將它們彼此相鄰排列。對(duì)于常規(guī)的 2d 可視化,需要兩個(gè)數(shù)字來唯一地指定一個(gè)點(diǎn),因此我們需要兩個(gè)位置刻度。這兩個(gè)刻度通常但不一定是圖的 x 和 y 軸。我們還必須指定這些刻度的相對(duì)幾何排列。通常, x 軸水平延伸,y 軸垂直,但我們可以選擇其他排列。例如,我們可以使 y 軸相對(duì)于 x 軸成銳角,或者我們可以讓一個(gè)軸成圓形而另一個(gè)軸徑向延伸。一組位置刻度及其相對(duì)幾何排列的組合稱為坐標(biāo)系。笛卡爾坐標(biāo)2d x y 值唯x y 軸彼此正交,數(shù)據(jù)值沿兩個(gè)軸均等間隔放置(3 1 )連續(xù)的位置刻度,它們可以表示正實(shí)數(shù)和負(fù)實(shí)數(shù)。要完全指定坐標(biāo)系,我們需要指3 1
41、 x -2 2 3 2,y -2 2 2 2。這些軸邊界之間的任何數(shù)據(jù)值都放置在圖中的相應(yīng)位置。軸邊界之外的任何數(shù)據(jù)值都將被丟棄。3 1xy 。兩個(gè)軸形成等間距的網(wǎng)x y 1 (2, l)(0, 0)右側(cè)的兩個(gè)x y 單位。點(diǎn)(-l, -l)x 單位和位于下方的一個(gè) y 單位。10 5 公里有一個(gè)網(wǎng)格線。笛卡爾坐標(biāo)系可以具有代表兩個(gè)不同單位的兩個(gè)軸。每當(dāng)我們將兩種不同類型的變x y 2 3 2 3 y 20 度,x 軸以月為單位測(cè)量,網(wǎng)格線在每三個(gè)月的第一個(gè)月。無論何時(shí)以不同的單位測(cè)量?jī)蓚€(gè)軸,我們都可以相對(duì)于另一個(gè)軸拉伸或壓縮,并保持?jǐn)?shù)據(jù)的有效可視化(3 2 )。哪個(gè)y 寬的圖形則相反。理想情
42、況下,我們希望選擇一個(gè)寬高比,以確保任何位置上的重要差異都是顯而易見的。3 2y x 軸。部分(a),(b)和(c)以不同的縱橫比展示相同的圖。所有三個(gè)部分都是溫度數(shù)據(jù)的有效可視化。數(shù)據(jù)來源:N0AA。x y 軸以相同的單位測(cè)量,那么兩個(gè)軸的網(wǎng)格間距應(yīng)該相等,這x y 軸的相同的距離,對(duì)應(yīng)于相同數(shù)量的數(shù)據(jù)單位。例如,我們可以繪制一年中每天的休斯頓,德克薩斯州與加利福尼亞州圣地亞哥的溫度(3 3a)3 3 中的情況。3 3:休斯頓,TX 的日平均溫度,相對(duì)于加利福尼亞州圣地亞哥的相應(yīng)平均溫度1 月,4 月,7 10 (a)(b)溫度以攝氏度表示。數(shù)據(jù)來源:N0AA。您可能想知道如果更改數(shù)據(jù)單位會(huì)
43、發(fā)生什么。畢竟,單位是任意的,你的偏好可能與其他人不同。單位變化是線性變換,我們?cè)谒袛?shù)據(jù)值中添加或減去一個(gè)數(shù)字和或?qū)⑺袛?shù)據(jù)值與另一個(gè)數(shù)字相乘。幸運(yùn)的是,笛卡爾坐標(biāo)系在這種線性變換下是不變的。因此,您可以更改數(shù)據(jù)的單位,只要相應(yīng)地更改軸,所得圖形就不會(huì)改 3 3a 3 3b。兩者都顯示相同的數(shù)據(jù),但在部分(a)位是華氏度,而在部分(b)中它們是攝氏度。即使網(wǎng)格線位于不同的位置并且沿軸的數(shù)字不同,兩個(gè)數(shù)據(jù)可視化看起來完全相同。非線性軸在笛卡爾坐標(biāo)系中,沿軸的網(wǎng)格線在數(shù)據(jù)單元和所得可視化中均勻間隔。我們將這些坐標(biāo)系中的位置刻度稱為線性的。雖然線性刻度通常提供數(shù)據(jù)的準(zhǔn)確表示,但是存在非線性刻度更佳
44、的情況。在非線性刻度中,數(shù)據(jù)單元中的均勻間距對(duì)應(yīng)于可視化中的不均勻間隔,或者相反地,甚至可視化中的間距對(duì)應(yīng)于數(shù)據(jù)單元中的不均勻間隔。最常用的非線性刻度是對(duì)數(shù)(log)刻度。對(duì)數(shù)刻度在乘法中是線性的,因此刻度3 4 中進(jìn)行了演示,其中1, 3 16, 10, 31 6 1003 16 31 6 似1 10 之間,在對(duì)數(shù)刻度上10 100 $10 0 5 = sqrt10 sim 3 16$ 和等價(jià)的$3 16 times 3 16 sim 10 $ 來看到這一點(diǎn)。類似地,$101 5 = 10 times 100 5 sim 31 6$。圖 3 4:線性和對(duì)數(shù)刻度之間的關(guān)系。點(diǎn)對(duì)應(yīng)于數(shù)據(jù)值 1,
45、 3 16, 10, 31 6, 100,它們是對(duì)數(shù)刻度上的均勻間隔數(shù)。我們可以在線性刻度上顯示這些數(shù)據(jù)點(diǎn),我們可以對(duì)它們進(jìn)行對(duì)數(shù)轉(zhuǎn)換然后以線性刻度顯示,或者我們可以在對(duì)數(shù)刻度上顯示它們。重要的是,對(duì)數(shù)刻度的正確軸標(biāo)題是顯示的變量的名稱,而不是該變量的對(duì)數(shù)。有區(qū)別(3 4 )。唯一的區(qū)別在于單個(gè)軸刻度線和整個(gè)軸的標(biāo)簽。在大多數(shù)情況軸刻度線標(biāo)簽的數(shù)字。關(guān)于對(duì)數(shù)基數(shù)的混淆風(fēng)險(xiǎn)也較小。當(dāng)使用對(duì)數(shù)轉(zhuǎn)換的數(shù)據(jù) 10 的對(duì)數(shù)感到困惑。不常見的標(biāo)簽是模棱兩可的,例如: log(x),它根本沒有指定基數(shù)。我建議您在使用對(duì)數(shù)轉(zhuǎn)換數(shù)據(jù)時(shí)始終標(biāo)明基數(shù)。繪制對(duì)數(shù)轉(zhuǎn)換的數(shù)據(jù)時(shí),請(qǐng)始終在軸標(biāo)簽中指定基 數(shù)。因?yàn)閷?duì)數(shù)刻度上
46、的乘法看起來像線性刻度上的加法,所以對(duì)數(shù)刻度是通過乘法或除法獲得的任何數(shù)據(jù)的自然選擇。特別是,比值通常應(yīng)以對(duì)數(shù)刻度顯示。例如,我已經(jīng)記錄了德克薩斯州每個(gè)縣的居民人數(shù),并將其除以德克薩斯州所有縣的居民人數(shù)中位數(shù)。得到的比值是可以大于或小于 1 的數(shù)字。恰好為 1 的比值意味著相應(yīng)的縣具有居民的中位數(shù)。當(dāng)以對(duì)數(shù)刻度可視化這些比值時(shí),我們可以清楚地看到,德克薩斯州的人口數(shù)量對(duì)稱地分布在中位數(shù)附近,并且人口最多的縣的人數(shù)比中位數(shù)多100 多倍,而人口最少的縣則少 100 多倍(圖 3 5 )。相比之下,對(duì)于相同的數(shù)據(jù),線性刻度模糊了中等人口數(shù)量的縣與人口數(shù)量小于中位數(shù)的縣之間的差異(圖3 6)。3 5
47、:德克薩斯州的人口數(shù)量與其中值的關(guān)系。選擇縣按名稱突出顯示。虛線表1,對(duì)應(yīng)于具有中值人口數(shù)的縣。人口最多的縣的居民人數(shù)比中位數(shù)縣大100 100 倍。數(shù)據(jù)來源:2010 國(guó)十年普查。3 6:德克薩斯州的人口規(guī)模與其中值的關(guān)系。通過在線性刻度上顯示比值,我1 1 以線性刻度顯示。數(shù)據(jù)來源:2010 年美國(guó)十年普查。1 01 的值表示除法。例如,我們可以寫 l0 = l x l0 和 0.l = l / l0 0 1。它的一個(gè)方法是考慮 log0 = -inf 1 0,它需要除以無限多個(gè)有限值(例如, l/l0/l0/l0/l0/l0/l0 . = 0 或者一個(gè)除以無窮大(即 l / inf =
48、0 )。3 5 3 6 中顯示的德克薩斯州,人口最多的縣(Harris)20104,092,459名居民,而人口最少的縣(Loving)82 人。所以即使我們沒有將人口數(shù)量除以中位數(shù)來將他們變成比值,對(duì)數(shù)刻度也是合適的。但如果有一個(gè)擁有 0 居民的縣, 我們會(huì)怎么做?這個(gè)縣無法以對(duì)數(shù)刻度顯示,因?yàn)樗挥谪?fù)無窮大。在這種情況下,建議有時(shí)使用平方根刻度,它使用平方根變換而不是對(duì)數(shù)變換(圖 3 7 )。就像對(duì)數(shù)刻度一樣,平方根刻度將較大的數(shù)字壓縮成較小的范圍,但與對(duì)數(shù)刻度不同,它允許存在 0。圖 3 7:線性和平方根刻度之間的關(guān)系。點(diǎn)對(duì)應(yīng)于數(shù)據(jù)值 0, 1, 4, 9, 16, 25, 36,49,
49、它們是平方根刻度上的等間隔數(shù),因?yàn)樗鼈兪菑?0 到 7 的整數(shù)的平方。我們可以以線性刻度顯示這些數(shù)據(jù)點(diǎn),我們可以對(duì)它們進(jìn)行平方根變換然后以線性刻度顯示,或者我們可以在平方根刻度上顯示它們。0, 4, 25, 49, 81(每個(gè)偶數(shù)的平方)處的軸刻度線將非常不直觀?;蛘撸覀兛梢砸跃€性間隔(10, 20, 30 等)置它們,但這會(huì)導(dǎo)致刻度的小端附近的軸刻度線太少,或在大端附近太多。在圖 3 7 0, 1, 5, 10, 20, 30, 40 50 處。這些值是任意的,但可以合理覆蓋數(shù)據(jù)范圍。從北到南的線性范圍。例如,如果我們想知道開車穿過一個(gè)地區(qū)可能需要多長(zhǎng)時(shí) 3 8 以線性和平方根刻度顯示美國(guó)
50、東北部的州的面積。即使這些州的面積完全不同(3 8 a),穿過每個(gè)州所需的時(shí)間將更接近于平方根刻度上的數(shù)字(3 8b)而不是線性刻度上的數(shù)字(3 8a)。圖 3 8:美國(guó)東北部各州的面積。(a)以線性刻度顯示的面積。 (b)以平方根刻度顯示的面積。數(shù)據(jù)來源:Google。帶曲線軸的坐標(biāo)系是彎曲的。特別是,在極坐標(biāo)系中,我們通過角度和到原點(diǎn)的徑向距離來指定位 置,因此角度軸是圓形的(3 9)。3 9(a)笛卡爾坐標(biāo)系中顯示的三個(gè)數(shù)據(jù)(b)極坐標(biāo)系中顯示的相同三個(gè)數(shù)據(jù)點(diǎn)。我們從(a)x 坐標(biāo)并將它們用作角坐標(biāo),并將來自(a)y 0 4x = 0 x = 4 是該坐標(biāo)系中的相同位置。極坐標(biāo)對(duì)于周期性
51、數(shù)據(jù)可能是有用的,使得刻度一端的數(shù)據(jù)值可以從邏輯上連接到12 31 日是一年中的最后一天, 但它也是一年中第一天的前一天。如果我們想要顯示一年中某些數(shù)量的變化,那么2 3 的平均溫度。因?yàn)槠骄鶞囟仁桥c任何特定年份無關(guān)的平均溫度,12 31 日可以被1 1 366 天(2 29 日)系中繪制平均溫度,我們強(qiáng)調(diào)它們具有的這種周期特性(3 10)2 3 相比,極坐標(biāo)版本突出了死亡谷,休斯頓和圣地亞哥從秋末到早春的溫度。在笛卡爾坐12 1 月初的溫度值顯示在圖的不同部分,因此不形成單個(gè)視覺單元。3 10示平均溫度(華氏),1 1 日開始在六點(diǎn)鐘位置逆時(shí)針排列。我們遇到彎曲線軸的第二種情況是地理空間數(shù)據(jù)
52、,即地圖。地球上的位置由其經(jīng)度和緯度指定。但由于地球是一個(gè)球體,繪制緯度和經(jīng)度作為笛卡爾軸是誤導(dǎo)和不推薦的(3 誤,并且相對(duì)于地球上真實(shí)形狀的線條,在保留面積或角度之間取得不同的平衡(圖 3 11)。3 3D 球體上的Goode homolosine 投影完美地代表了真實(shí)的表面面積,代價(jià)是將一些陸塊分成單獨(dú)的部分,最著名的是格陵蘭島和南極洲。羅賓遜投Winkel tripel 投影都在角度和面積扭曲之間取得平衡,它們通常用于整個(gè)地球的地圖。顏色刻度原文: HYPERLINK /dataviz/color-basics.html 4 Color scales校驗(yàn): HYPERLINK /wiza
53、rdforcel 飛龍自豪地采用 HYPERLINK / 谷歌翻譯數(shù)據(jù)可視化中的顏色有三個(gè)基本用例:(i)我們可以使用顏色來區(qū)分?jǐn)?shù)據(jù)組; (ii) 我們可以用顏色來表示數(shù)據(jù)值; (iii)我們可以使用顏色突出顯示。我們使用的顏色類型以及我們使用它們的方式在這三種情況下完全不同。作為區(qū)分的工具的顏色時(shí)也彼此相同。第二個(gè)條件要求相對(duì)于其他顏色,不應(yīng)該突出任何一種顏色。并 色會(huì)在被著色的物品之間產(chǎn)生明顯的順序,根據(jù)定義,它們沒有順序。許多合適的定性顏色刻度很容易獲得。圖 4 1 顯示了三個(gè)代表性的例子。特別是,ColorBrewer 項(xiàng)目提供了很好的定性顏色刻度選擇,包括相當(dāng)淺和相當(dāng)深的顏色(Bre
54、wer 2017)。圖 4 1:定性顏色刻度示例。 0kabe to 刻度是本書(0kabe 和 to 2008)中使用的默認(rèn)刻度。 ColorBrewer Dark2 刻度由 ColorBrewer 項(xiàng)目(Brewer 2017)提供。 ggplot2 色調(diào)刻度是廣泛使用的繪圖軟件 ggplot2 中的默認(rèn)定性刻度。4 2 。它顯示了美國(guó)各州2000 2010 域?qū)λ鼈冞M(jìn)行了著色。這種著色突出表明,同一地區(qū)的國(guó)家經(jīng)歷了類似的人口增 長(zhǎng)。特別是,西部和南部各州人口增長(zhǎng)最多,而中西部和東北部各州增長(zhǎng)較少。4 2:2000 2010 年美國(guó)的人口增長(zhǎng)。西部和南部的州增長(zhǎng)最大,而中西部局代表數(shù)據(jù)值的
55、顏色顏色也可用于表示數(shù)據(jù)值,例如收入,溫度或速度。在這種情況下,我們使用順序顏色刻度。這樣的刻度包含一系列顏色,其清楚地指示(i)哪些值大于或小于哪些值,以及(ii)兩個(gè)特定值彼此有多遠(yuǎn)。第二點(diǎn)意味著需要感知顏色刻度在其整個(gè)范圍內(nèi)均勻變化。順序刻度可以基于單個(gè)色調(diào)(例如,從深藍(lán)色到淺藍(lán)色)或基于多個(gè)色調(diào)(例如, 從深紅色到淺黃色)(圖 4 3 )。多色調(diào)刻度傾向于遵循自然界中可見的顏色漸變,例如深紅色,綠色或藍(lán)色至淺黃色,或深紫色至淺綠色。相反,例如深黃色至淺藍(lán)色,看起來不自然,并沒有生成有用的順序刻度。圖 4 3:連續(xù)顏色刻度示例。 ColorBrewer Blues 刻度是一種單色刻度,從
56、深藍(lán)到淺藍(lán)不等。 Heat 和 Viridis 刻度是多色調(diào)刻度,分別從深紅色到淺黃色,從深藍(lán)色到綠色到淺黃色。4 4 顯示了一個(gè)示例,其中我將德克薩斯州每個(gè)縣的年收入中位數(shù)映射到這些縣的地圖上。4 4:德克薩斯州的年收入中位數(shù)。德克薩斯州主要城市地區(qū)的收入中位數(shù)最Loving 計(jì)值,因此該縣顯示為灰色。數(shù)據(jù)來源:2015 年的美國(guó)五年社區(qū)調(diào)查們,這樣就可以立即看出一個(gè)值是正還是負(fù),以及它在任何一個(gè)方向上到零的距 視為兩個(gè)連續(xù)的刻度,它們?cè)谝粋€(gè)共同的中點(diǎn)處拼接在一起,通常用淺色來表示(4 5 )方向上大致相同。否則,數(shù)據(jù)值的感知幅度將取決于它是否高于或低于中點(diǎn)值。圖 4 5:發(fā)散顏色刻度示例。
57、發(fā)散的刻度可以被認(rèn)為是在共同的中點(diǎn)顏色處拼接在一起的兩個(gè)連續(xù)刻度。發(fā)散刻度的常見顏色選擇包括棕色至藍(lán)綠色,粉紅色至黃綠色以及藍(lán)色至紅色。作為發(fā)散顏色刻度的示例應(yīng)用,請(qǐng)考慮圖 4 6 ,其顯示德克薩斯州的縣的白人百分比。盡管百分比總是一個(gè)正數(shù),但這里的發(fā)散刻度是合理的,因?yàn)?50% 是一個(gè)有50% 50% 視化清楚地顯示了哪些縣白人占多數(shù),哪些縣他們是少數(shù),以及哪些縣中白人和非白人以大致相等的比例出現(xiàn)。圖 4 6:德克薩斯州的縣的白人的百分比。白人在德克薩斯州北部和東部占多數(shù), 但在德克薩斯州南部或西部則不然。數(shù)據(jù)來源:2010 年美國(guó)十年普查作為突出顯示的工具的顏色顏色也可以是突出顯示數(shù)據(jù)中特
58、定元素的有效工具。數(shù)據(jù)集中可能存在特定的類別或值,其中包含有關(guān)我們想要講述的故事的關(guān)鍵信息,我們可以通過向讀者強(qiáng)調(diào)相關(guān)的圖形元素來強(qiáng)調(diào)故事。實(shí)現(xiàn)強(qiáng)調(diào)的一個(gè)簡(jiǎn)單方法是,將這些圖形元素用一種顏色或一組顏色著色,這些顏色可以生動(dòng)地突出圖形的其他部分。這種效果可以通過強(qiáng)調(diào)色刻度來實(shí)現(xiàn),這些顏色刻度包含一組柔和顏色和一組匹配的更強(qiáng),更暗和/或更柔和的顏色(圖 4 7)。4 7:強(qiáng)調(diào)色刻度示例,每個(gè)都有四種基色和三種強(qiáng)調(diào)色。強(qiáng)調(diào)色刻度可以通過幾種不同的方式得出:(頂部)我們可以采用現(xiàn)有的顏色刻度(例如,0kabe to 4 1 )并使某些顏色變淡和/或部分去飽和,同時(shí)使其他顏色變暗;(中我們可以采用灰度值
59、并將它們與顏色配對(duì); (下)我們可以使用現(xiàn)有的強(qiáng)調(diào)色刻度,例如 ColorBrewer 項(xiàng)目中的那個(gè)。作為相同數(shù)據(jù)如何使用不同著色方法支持不同故事的示例,我創(chuàng)建了圖 4 2 的變體,現(xiàn)在我突出顯示兩個(gè)特定州,Texas 和 Louisiana(圖 4 8 )。這兩個(gè)州都在南方,他們是近鄰,然而一個(gè)州(德克薩斯州)是美國(guó)增長(zhǎng)速度第五快的州,而另一個(gè)州是 2000 年至 2010 年間增長(zhǎng)最慢的州。4 82000 2010 經(jīng)歷了美國(guó)最高和最低的人口增長(zhǎng)率,數(shù)據(jù)來源:美國(guó)人口普查局使用強(qiáng)調(diào)色時(shí),基線顏色不會(huì)引起注意,這一點(diǎn)至關(guān)重要。注意基線顏色是多么單調(diào)(圖 4 8)。然而,它們很好地支持強(qiáng)調(diào)色。
60、很容易犯下使用過于豐富多彩的基線顏色的錯(cuò)誤,這樣他們最終會(huì)爭(zhēng)奪讀者對(duì)強(qiáng)調(diào)色的注意力。但是,有一個(gè)簡(jiǎn)單的補(bǔ)救措施。只需刪除圖中所有元素的所有顏色,但突出顯示的數(shù)據(jù)類別或點(diǎn)除外。圖 4 9 中提供了該策略的一個(gè)示例。圖 4 9:田徑運(yùn)動(dòng)員是參加流行運(yùn)動(dòng)的最矮和最瘦的男性職業(yè)運(yùn)動(dòng)員之一。數(shù)據(jù)來源:Telford and Cunningham(1991)參考Brewer,Brewer,CynthiaA.20l7.“ColorBrewer2.0.ColorAdviceforCartography.”http:/www.C Okabe,M.,andK.Ito.2008.“ColorUniversalDes
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 遼寧省葫蘆島市2025-2026學(xué)年高一上學(xué)期1月期末考試語(yǔ)文試卷(含答案)
- 湖南省長(zhǎng)沙市望城區(qū)第二中學(xué)2025-2026學(xué)年高一上學(xué)期期末考試地理試卷(含答案)
- 安徽省合肥市琥珀中學(xué)2025-2026學(xué)年上學(xué)期期末八年級(jí)物理試卷及答案(含答案)
- 2025-2026學(xué)年滬科版八年級(jí)數(shù)學(xué)上冊(cè)期末測(cè)試卷(含答案)
- 飛盤介紹教學(xué)課件
- 飛機(jī)設(shè)計(jì)培訓(xùn)課件
- 2026山東事業(yè)單位統(tǒng)考菏澤市定陶區(qū)招聘初級(jí)綜合類崗位人員考試備考題庫(kù)及答案解析
- 2026四川廣元市青川縣衛(wèi)生系統(tǒng)部分醫(yī)療衛(wèi)生機(jī)構(gòu)招聘編外專業(yè)技術(shù)人員9人備考考試題庫(kù)及答案解析
- 2026河南鄭州地鐵招聘安檢員備考考試試題及答案解析
- 2026臺(tái)州市椒江永誠(chéng)置業(yè)有限公司招聘編外工作人員6人備考考試試題及答案解析
- 2025-2030中國(guó)低壓變頻器行業(yè)營(yíng)銷渠道及投融資方式分析研究報(bào)告
- 2025山東恒豐銀行濟(jì)南分行社會(huì)招聘1人筆試歷年典型考題及考點(diǎn)剖析附帶答案詳解
- 渠道管理制度規(guī)范
- 2025年企業(yè)安全生產(chǎn)培訓(xùn)講義
- GB/T 714-2025橋梁用結(jié)構(gòu)鋼
- 心臟瓣膜置換術(shù)護(hù)理查房
- 【診療方案】慢性阻塞性肺疾病診治指南(2025年修訂版)
- 初三上學(xué)期物理期末復(fù)習(xí)知識(shí)詳解(含答案)
- 營(yíng)養(yǎng)員指導(dǎo)員培訓(xùn)
- 期末模擬測(cè)試(試卷)2025-2026學(xué)年六年級(jí)語(yǔ)文上冊(cè)(統(tǒng)編版)
- 2025-2026學(xué)年蘇教版小學(xué)數(shù)學(xué)三年級(jí)上冊(cè)期末綜合測(cè)試卷及答案(三套)
評(píng)論
0/150
提交評(píng)論