版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
ggplot2簡(jiǎn)介ggplot2最早出現(xiàn)于2005年,相對(duì)于lattice而言,ggplot2的語(yǔ)法更加簡(jiǎn)潔;ggplot2包是基于Wilkinson在《GrammarofGraphics》一書中所提出的圖形語(yǔ)法的具體實(shí)現(xiàn);ggplot2的核心理念是將繪圖與數(shù)據(jù)分離,數(shù)據(jù)相關(guān)的繪圖與數(shù)據(jù)無(wú)關(guān)的繪圖分離;ggplot的繪圖有以下幾個(gè)特點(diǎn):第一,有明確的起始(以ggplot函數(shù)開(kāi)始)與終止(一句語(yǔ)句一幅圖);其二,圖層之間的疊加是靠“+”號(hào)實(shí)現(xiàn)的,越后面其圖層越高。圖形語(yǔ)法涉及到的一些概念如下:幾何對(duì)象(geom):表示圖形中我們實(shí)際看到的圖形元素,如各種點(diǎn)、線等元素。標(biāo)度(scale):標(biāo)度的作用是將數(shù)據(jù)映射到圖形空間,比如用顏色、大小或形狀來(lái)表示不同的數(shù)據(jù)。通過(guò)自定義標(biāo)度,可以更加精確地控制圖形的外觀。坐標(biāo)系(coord):描述了數(shù)據(jù)如何映射到圖形所在的平面,最常用的是直角坐標(biāo)軸,坐標(biāo)軸可以進(jìn)行變換以滿足不同的需要,如對(duì)數(shù)坐標(biāo)、極坐標(biāo)和地圖投影。圖層(layer):如果你用過(guò)photoshop,那么對(duì)于圖層一定不會(huì)陌生。一個(gè)圖層好比是一張玻璃紙,包含有各種圖形元素,你可以分別建立圖層然后疊放在一起,組合成圖形的最終效果。圖層可以允許用戶一步步的構(gòu)建圖形,方便單獨(dú)對(duì)圖層進(jìn)行修改、增加統(tǒng)計(jì)量、甚至改動(dòng)數(shù)據(jù)。分面(facet):
很多時(shí)候需要將數(shù)據(jù)按某種方法分組,分別進(jìn)行繪圖,分面就是控制分組繪圖的方法和排列形式。通過(guò)坐標(biāo)系和分面,用戶可以控制圖形元素的位置。9.1快速作圖qplot()qplot(x,y=NULL,...,data,facets=NULL,margins=FALSE,geom="auto",xlim=c(NA,NA),ylim=c(NA,NA),log="",main=NULL,xlab=deparse(substitute(x)),ylab=deparse(substitute(y)),asp=NA,stat=NULL,position=NULL)參數(shù)x,y,傳遞到每一圖層中的圖形屬性,簡(jiǎn)而言之就是分別代表所畫圖層的X坐標(biāo)和Y坐標(biāo)。data作圖使用的數(shù)據(jù)框(可選),如果指定了數(shù)據(jù)框,qplot()會(huì)首先在數(shù)據(jù)框內(nèi)查找變量名;如果沒(méi)有指定數(shù)據(jù)框,R就會(huì)在當(dāng)前環(huán)境中嘗試提取向量創(chuàng)建一個(gè)數(shù)據(jù)框。
facets圖形/數(shù)據(jù)的分面。這是ggplot2作圖比較特殊的一個(gè)概念,它把數(shù)據(jù)按某種規(guī)則進(jìn)行分類,每一類數(shù)據(jù)做一個(gè)圖形,所以最終效果就是一頁(yè)多圖。qplot(mpg,wt,data=mtcars)qplot(mpg,wt,data=mtcars,colour=cyl)qplot(mpg,wt,data=mtcars,size=cyl)qplot(mpg,wt,data=mtcars,facets=vs~am)在上述4個(gè)例子中,還有colour、size、shape等其他圖形屬性參數(shù),分別用點(diǎn)的顏色、點(diǎn)的大小以及點(diǎn)的形狀表示不同的數(shù)值。可以通過(guò)geom參數(shù)來(lái)指定繪制的幾何對(duì)象類型,如geom=”smooth”將擬合一條平滑曲線,geom=”boxplot”將繪制箱線胡須圖,geom=”histogram”繪制直方圖,geom=”freqpoly”繪制頻率多邊形,geom=”density”繪制密度曲線9.2ggplot2圖形語(yǔ)法ggplot(data=NULL,mapping=aes(),...,environment=parent.frame())+graph_functionggplot(mtcars,aes(mpg,wt,colour=cyl))+
geom_point()示例數(shù)據(jù)集映射加入幾何對(duì)象試試只輸入ggplot(mtcars,aes(mpg,wt,colour=cyl)),看結(jié)果如何?9.3散點(diǎn)圖散點(diǎn)圖一般用來(lái)描述兩個(gè)連續(xù)變量之間的關(guān)系,圖中的每一個(gè)點(diǎn)表示一個(gè)觀測(cè)值,根據(jù)散落在圖中點(diǎn)的位置,可以判斷數(shù)據(jù)的大概趨勢(shì)。另外,人們也會(huì)在散點(diǎn)圖中添加基于統(tǒng)計(jì)模型的趨勢(shì)線來(lái)更直觀地顯示數(shù)據(jù)趨勢(shì)。geom_point(mapping=NULL,data=NULL,stat="identity",position="identity",...,na.rm=FALSE,show.legend=NA,
inherit.aes=TRUE)ggplot(mtcars,aes(wt,mpg))+geom_point()再來(lái)看看圖形屬性是如何通過(guò)aes來(lái)進(jìn)行設(shè)定的,為了簡(jiǎn)化輸入,我們將ggplot()初始化的圖層賦值給變量p,然后分別在P上疊加其他散點(diǎn)圖層:p<-ggplot(mtcars,aes(wt,mpg))p+geom_point(aes(colour=factor(cyl)))p+geom_point(aes(shape=factor(cyl)))p+geom_point(aes(size=qsec))p+geom_point(aes(shape=factor(cyl)))+scale_shape(solid=FALSE)9.4面積圖面積圖就是折線圖的一種特例,它強(qiáng)調(diào)因變量隨自變量而變化的程度geom_area(mapping=NULL,data=NULL,stat="identity",position="stack",na.rm=FALSE,show.legend=NA,inherit.aes=TRUE,...)huron<-data.frame(year=2001:2010,level=c(50,60,80,88,97,99,105,110,120,134))h<-ggplot(huron,aes(year))h+geom_area(aes(y=level))ggplot(huron,aes(year))+geom_area(aes(y=level),fill="blue",colour="red")9.5箱形圖箱形圖(Box-plot)又稱為盒須圖、盒式圖或箱線圖,是一種用作顯示一組數(shù)據(jù)分散情況資料的統(tǒng)計(jì)圖,每組數(shù)據(jù)圖形由一個(gè)矩形及上下兩條邊緣線組成,因形狀如箱子而得名。箱形圖主要包含六個(gè)數(shù)據(jù)節(jié)點(diǎn),將一組數(shù)據(jù)從大到小排列,分別計(jì)算出他的上邊緣,上四分位數(shù)Q3,中位數(shù),下四分位數(shù)Q1,下邊緣,以及異常值。(但ggplot2中箱形圖分位數(shù)的計(jì)算方法稍有不同,上下邊緣都為四分位數(shù)的1.5倍,讀者可以通過(guò)?geom_boxplot()查看計(jì)算方法的差異。)geom_boxplot(mapping=NULL,data=NULL,stat="boxplot",position="dodge",...,outlier.colour=NULL,outlier.color=NULL,outlier.shape=19,outlier.size=1.5,outlier.stroke=0.5,notch=FALSE,notchwidth=0.5,varwidth=FALSE,na.rm=FALSE,show.legend=NA,inherit.aes=TRUE)
p<-ggplot(mpg,aes(class,hwy))p+geom_boxplot()p+geom_boxplot()+coord_flip()#坐標(biāo)軸翻轉(zhuǎn)
p+geom_boxplot(fill="red",colour="#3366FF",alpha=0.5)p+geom_boxplot(outlier.colour="red",outlier.shape=1)示例9.6條形圖條形圖一般用于顯示各個(gè)項(xiàng)目之間的比較情況,例如可以用來(lái)展示四個(gè)不同季度的銷售情況,但是不適宜用來(lái)展示X為連續(xù)變量的情況。根據(jù)所展示的數(shù)據(jù)的含義不同,條形圖可以分為兩種類型,一種條形的高度表示數(shù)據(jù)的頻數(shù)(stat="count"),而另一種則表示數(shù)值大?。╯tat="identity"),默認(rèn)情況下是第一種類型。geom_bar(mapping=NULL,data=NULL,stat="count",position="stack",...,width=NULL,binwidth=NULL,na.rm=FALSE,show.legend=NA,inherit.aes=TRUE)g<-ggplot(mpg,aes(class))#對(duì)于mpg中的數(shù)據(jù)樣式,讀者可以直接輸入mpg查看g+geom_bar()df<-data.frame(trt=c("a","b","c"),outcome=c(2.3,1.9,3.2))ggplot(df,aes(trt,outcome))+geom_bar(stat="identity")#需手動(dòng)對(duì)stat進(jìn)行指定示例:分別表示數(shù)據(jù)的頻數(shù)(stat="count")和表示數(shù)值大小(stat="identity")的條形圖9.7光滑密度曲線光滑密度曲線其實(shí)是頻率分布直方圖的一種極限情況,當(dāng)樣本容量充分放大時(shí),圖中的組距就會(huì)充分縮短,這時(shí)圖中的階梯折線就會(huì)演變成一條光滑的曲線,這條曲線就稱為密度曲線。這條曲線排除了由于取樣不同和測(cè)量不準(zhǔn)所帶來(lái)的誤差,能夠精確地反映總體的分布規(guī)律。geom_density(mapping=NULL,data=NULL,stat="density",position="identity",...,na.rm=FALSE,show.legend=NA,inherit.aes=TRUE)ggplot(diamonds,aes(carat))+geom_density()輸出一條默認(rèn)狀態(tài)的密度曲線:ggplot(diamonds,aes(carat))+geom_density(adjust=1/5)ggplot(diamonds,aes(carat))+geom_density(adjust=5)通過(guò)adjust參數(shù)可以調(diào)整曲線的光滑度基于分組數(shù)據(jù)的密度曲線,可以將分組變量映射給colour或者fill等圖形屬性。ggplot(diamonds,aes(depth,colour=cut))+geom_density()+xlim(55,70)ggplot(diamonds,aes(depth,fill=cut,colour=cut))+geom_density(alpha=0.1)+xlim(55,70)通過(guò)alpha參數(shù)改變填充色的透明度通過(guò)xlim()設(shè)置X軸的坐標(biāo)范圍ggplot(diamonds,aes(x=depth))+geom_density()+facet_grid(cut~.)使用分面功能進(jìn)行分組9.8線圖這里所指的線圖和折線圖不一樣,線圖一般不單獨(dú)使用,而是與其他圖形(如散點(diǎn)圖)搭配使用。R中有三種線圖,由斜率和截距決定的線圖abline、水平線圖hline和豎直線圖vlinegeom_abline(mapping=NULL,data=NULL,...,slope,intercept,na.rm=FALSE,show.legend=NA)geom_hline(mapping=NULL,data=NULL,...,yintercept,na.rm=FALSE,show.legend=NA)geom_vline(mapping=NULL,data=NULL,...,xintercept,na.rm=FALSE,show.legend=NA)p<-ggplot(mtcars,aes(wt,mpg))+geom_point()p+geom_vline(xintercept=5)p+geom_vline(xintercept=1:5)p+geom_hline(yintercept=20)p+geom_abline(intercept=20)coef(lm(mpg~wt,data=mtcars))#coef()的功能為返回選定模型的系數(shù),可使用?coef()查看詳細(xì)介紹(Intercept)wt37.285126-5.344472p+geom_abline(intercept=37,slope=-5)p+geom_smooth(method="lm",se=FALSE)上面添加的線圖可能沒(méi)有統(tǒng)計(jì)意義,我們可以先通過(guò)模型求出回歸方程,再用回歸方程中的斜率和截距來(lái)進(jìn)行繪圖;或者使用geom_smooth()函數(shù)達(dá)到同樣的目的9.9小提琴圖箱線圖可以展示分位數(shù)的位置,而密度曲線可以展示數(shù)據(jù)的分布情況,小提琴圖綜合了箱線圖和密度曲線圖的特點(diǎn),適合對(duì)多組數(shù)據(jù)的分布進(jìn)行比較。傳統(tǒng)的小提琴圖一般會(huì)在中間添加一個(gè)箱線圖,同時(shí)用一個(gè)白圈表示中位數(shù)并通過(guò)設(shè)置outlier.colour=NA來(lái)隱藏箱線圖中的異常點(diǎn),這使得所得的圖形看起來(lái)就是一把小提琴,因而得名。geom_violin(mapping=NULL,data=NULL,stat="ydensity",position="dodge",...,draw_quantiles=NULL,trim=TRUE,scale="area",na.rm=FALSE,show.legend=NA,inherit.aes=TRUE)p<-ggplot(mtcars,aes(factor(cyl),mpg))p+geom_violin()9.10調(diào)整圖形外觀設(shè)置標(biāo)題及坐標(biāo)系名稱p<-ggplot(mtcars,aes(mpg,wt))+geom_point()p+labs(title="Newplottitle")p+ggtitle("Newplottitle2")可以看到,ggtitle(“…”)和labs(title=”…”)是等效的使用xlab()來(lái)設(shè)置X軸標(biāo)題,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京市大興區(qū)觀音寺街道社區(qū)衛(wèi)生服務(wù)中心招聘勞務(wù)派遣人員1人(行政技能輔助崗)備考考試試題及答案解析
- 2026年河北石油職業(yè)技術(shù)大學(xué)單招綜合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年桂林山水職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考題庫(kù)含詳細(xì)答案解析
- 2026年貴州工貿(mào)職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年黑龍江建筑職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026年江西生物科技職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026年濰坊工商職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試備考題庫(kù)含詳細(xì)答案解析
- 2026年四川應(yīng)用技術(shù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試備考試題含詳細(xì)答案解析
- 2026年克拉瑪依職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年三亞航空旅游職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026年陜西西安市高三高考一模數(shù)學(xué)試卷試題(含答案詳解)
- 外事工作培訓(xùn)
- 鎮(zhèn)海區(qū)國(guó)資系統(tǒng)招聘筆試題庫(kù)2026
- 2025至2030中國(guó)高壓套管行業(yè)調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 廣州市2026屆高一數(shù)學(xué)第一學(xué)期期末統(tǒng)考試題含解析
- AI在建筑中的應(yīng)用【演示文檔課件】
- 2026秋招:國(guó)家電投面試題及答案
- 《2025年CSCO前列腺癌診療指南》更新要點(diǎn)解讀
- 面向工業(yè)智能化時(shí)代的新一代工業(yè)控制體系架構(gòu)白皮書
- 2024年四川省成都市青羊區(qū)中考數(shù)學(xué)二診試卷(含答案)
- 左心導(dǎo)管檢查及造影操作技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論