項目4 分布型數(shù)據(jù)可視化_第1頁
項目4 分布型數(shù)據(jù)可視化_第2頁
項目4 分布型數(shù)據(jù)可視化_第3頁
項目4 分布型數(shù)據(jù)可視化_第4頁
項目4 分布型數(shù)據(jù)可視化_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Python數(shù)據(jù)可視化案例教程全課導航項目1搭建數(shù)據(jù)可視化開發(fā)平臺項目2

Python數(shù)據(jù)可視化基礎項目3比較型數(shù)據(jù)可視化項目5關聯(lián)型數(shù)據(jù)可視化項目4分布型數(shù)據(jù)可視化項目6比例型數(shù)據(jù)可視化項目7時間型數(shù)據(jù)可視化項目8文本型數(shù)據(jù)可視化項目9地理空間型數(shù)據(jù)可視化項目10點評網站美食店鋪數(shù)據(jù)可視化項目4

分布型數(shù)據(jù)可視化知識目標了解分布型數(shù)據(jù)的概念及應用場景。了解直方圖、箱形圖、密度圖和小提琴圖的概念及應用。掌握使用seaborn繪制直方圖、箱形圖、密度圖和小提琴圖的方法。技能目標能使用直方圖、箱形圖、密度圖和小提琴圖對分布型數(shù)據(jù)進行可視化和分析。素養(yǎng)目標培養(yǎng)實踐能力,在實踐中學習、在學習中實踐。強化身體健康安全意識,敬畏生命、珍惜生命。項目目標分布型數(shù)據(jù)可視化常用于呈現(xiàn)和探索數(shù)據(jù)的分布情況,幫助用戶了解數(shù)據(jù)的集中趨勢、離散程度、偏態(tài)和峰度等特征,以及發(fā)現(xiàn)數(shù)據(jù)中的異常值和離群點。分布型數(shù)據(jù)可視化可以應用于許多場景,如市場研究、環(huán)境監(jiān)測、人口統(tǒng)計等。本項目將基于某高校一年級學生的體質指數(shù)實現(xiàn)分布型數(shù)據(jù)可視化。項目描述按照項目要求,將“某高校一年級學生體質指數(shù).xlsx”文件中的數(shù)據(jù)進行可視化的方法如下。(1)使用直方圖實現(xiàn)不同體質指數(shù)區(qū)間學生數(shù)量可視化。首先新建Python文件;然后編寫代碼,實現(xiàn)從數(shù)據(jù)源中讀取數(shù)據(jù),使用seaborn繪制不同體質指數(shù)區(qū)間學生數(shù)量直方圖;最后對圖表進行分析。(2)使用小提琴圖實現(xiàn)不同性別學生體質指數(shù)可視化。首先新建Python文件;然后編寫代碼,實現(xiàn)從數(shù)據(jù)源中讀取數(shù)據(jù),使用seaborn繪制不同性別學生體質指數(shù)小提琴圖;最后對圖表進行分析。項目分析為了更好地實現(xiàn)某高校一年級學生體質指數(shù)可視化,本項目將對相關知識進行介紹,包括分布型數(shù)據(jù)的概念及應用場景,直方圖、箱形圖、密度圖和小提琴圖的概念及應用,以及使用seaborn繪制這些圖表的方法。項目分析全班學生以3~5人為一組,各組選出組長。組長組織組員掃碼觀看“常見的分布型數(shù)據(jù)及可視化圖表”視頻,討論并回答下列問題。問題1:列舉生活中常見的分布型數(shù)據(jù)。問題2:列舉常見的分布型數(shù)據(jù)可視化圖表。項目準備常見的分布型數(shù)據(jù)及可視化圖表4.1

什么是分布型數(shù)據(jù)4.2

直方圖項目實施——某高校一年級學生體質指數(shù)可視化項目導航4.3

箱形圖4.4

密度圖4.5

小提琴圖4.1

什么是分布型數(shù)據(jù)4.1什么是分布型數(shù)據(jù)分布型數(shù)據(jù)主要是指用于描述數(shù)據(jù)值在某個范圍內分布情況的數(shù)據(jù)??梢允沁B續(xù)型的分布型數(shù)據(jù)可以是離散型的如身高、體重等如人口、性別等4.1什么是分布型數(shù)據(jù)與確定性數(shù)據(jù)相比,分布型數(shù)據(jù)具有一定的隨機性和不確定性??梢越沂緮?shù)據(jù)的規(guī)律、趨勢和模式通過對分布型數(shù)據(jù)進行統(tǒng)計描述和可視化分析用于后續(xù)的數(shù)據(jù)建模、預測和決策分布型數(shù)據(jù)可視化常用的圖表直方圖箱形圖密度圖小提琴圖4.1什么是分布型數(shù)據(jù)對分布型數(shù)據(jù)進行統(tǒng)計描述和可視化分析有什么作用?分布型數(shù)據(jù)可視化常用的圖表有哪些?課堂檢測什么是分布型數(shù)據(jù)課堂小結4.2

直方圖4.2直方圖直方圖是一種將數(shù)據(jù)的值劃分為若干個等寬、不重疊的區(qū)間,并統(tǒng)計每個區(qū)間內數(shù)據(jù)數(shù)量或分布概率的圖表,它可以表示數(shù)據(jù)的分布情況,如不同成績區(qū)間的學生數(shù)量分布、不同年齡區(qū)間的員工數(shù)量分布等。直方圖是一個連續(xù)變量的概率分布估計,因此它還可以用于分析數(shù)據(jù)是否符合正態(tài)分布。4.2直方圖數(shù)據(jù)所屬的區(qū)間區(qū)間對應數(shù)據(jù)的數(shù)量或占比使用直方圖實現(xiàn)某餐廳不同消費金額區(qū)間消費次數(shù)可視化?!纠?-1】

本案例基于“某餐廳顧客消費記錄.xlsx”文件中的數(shù)據(jù),使用seaborn的histplot()函數(shù)繪制直方圖。函數(shù)中,x為“消費金額(元)”列標簽,顏色映射hue為“顧客類型”列標簽,data為讀取的DataFrame格式的數(shù)據(jù),矩形柱的個數(shù)bins為15,直方圖類型multiple為“stack”(堆積直方圖)?!締栴}分析】4.2直方圖提示由于繪制圖表的步驟基本一致,案例和項目實施不再詳細講解步驟,只分析重點。importpandasaspd#導入pandas庫#導入matplotlib庫中的pyplot模塊importmatplotlib.pyplotaspltimportseabornassns#導入seaborn庫df=pd.read_excel(‘某餐廳顧客消費記錄.xlsx’)#讀取數(shù)據(jù)plt.figure(figsize=(8,

4))#創(chuàng)建畫布并設置畫布大小#設置圖表樣式,包括樣式主題和中文字體sns.set_style(style=‘darkgrid’,

rc={‘font.sans-serif’:‘SimHei’})【參考代碼】使用直方圖實現(xiàn)某餐廳不同消費金額區(qū)間消費次數(shù)可視化。【例4-1】

4.2直方圖sns.set_palette(‘colorblind’)#設置顏色主題#繪制直方圖sns.histplot(x=‘消費金額(元)’,

hue=‘顧客類型’,data=df,bins=15,

multiple=‘stack’)plt.title(‘某餐廳不同消費金額區(qū)間消費次數(shù)直方圖’)#設置圖表標題plt.ylabel(‘消費次數(shù)’)#設置y軸標題plt.show()#顯示圖表【參考代碼】使用直方圖實現(xiàn)某餐廳不同消費金額區(qū)間消費次數(shù)可視化?!纠?-1】

4.2直方圖【運行結果】【結果分析】會員和普通顧客的消費次數(shù)相差不大,單次消費金額小于200元的消費次數(shù)居多,單次消費金額都小于1000元。使用直方圖實現(xiàn)某餐廳不同消費金額區(qū)間消費次數(shù)可視化?!纠?-1】

4.2直方圖使用什么函數(shù)繪制直方圖?課堂檢測直方圖課堂小結4.3

箱形圖4.3箱形圖箱形圖可以顯示一組數(shù)據(jù)的最大值、最小值、中位數(shù)和上下四分位數(shù)等統(tǒng)計指標,還可以通過上限值和下限值檢測異常值,任何高于上限值或低于下限值的數(shù)據(jù)都可以認為是異常值。4.3箱形圖其中,上下限值由上下四分位數(shù)及上下限值與上下四分位數(shù)的距離決定。例如,使用Q1和Q3分別表示下四分位數(shù)和上四分位數(shù),上下限值與上下四分位數(shù)的距離取1.5,則上限值=Q3+(Q3-Q1)*1.5,下限值=Q1-(Q3-Q1)*1.5。4.3箱形圖箱形圖不受異常值的影響,能夠以一種相對穩(wěn)定的方式真實、直觀地展示數(shù)據(jù)的分布情況,能粗略地看出數(shù)據(jù)是否具有對稱性及數(shù)據(jù)的離散程度等,特別適用于比較多組數(shù)據(jù)。使用箱形圖實現(xiàn)某餐廳不同分店顧客滿意度可視化。【例4-2】

本案例基于“某餐廳顧客消費記錄.xlsx”文件中的數(shù)據(jù),使用seaborn

的boxplot()函數(shù)繪制箱形圖。函數(shù)中,x為“分店”列標簽,y為“顧客滿意度”列標簽,data為讀取的DataFrame格式的數(shù)據(jù),有無凹槽notch為True,上下限值與上下四分位數(shù)的距離whis為0.5,分類變量的顯示順序order為[‘第一分店’,‘第二分店’,‘第三分店’]?!締栴}分析】4.3箱形圖importpandasaspd#導入pandas庫#導入matplotlib庫中的pyplot模塊importmatplotlib.pyplotaspltimportseabornassns#導入seaborn庫df=pd.read_excel(‘某餐廳顧客消費記錄.xlsx’)#讀取數(shù)據(jù)plt.figure(figsize=(8,

4))#創(chuàng)建畫布并設置畫布大小#設置圖表樣式,包括樣式主題和中文字體sns.set_style(style=‘ticks’,

rc={‘font.sans-serif’:‘SimHei’})【參考代碼】使用箱形圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-2】

4.3箱形圖sns.set_palette(sns.color_palette(‘husl’))#設置顏色主題#繪制箱形圖sns.boxplot(x=‘分店’,

y=‘顧客滿意度’,data=df,notch=True,

whis=0.5,

order=[‘第一分店’,

‘第二分店’,

‘第三分店’])plt.title(‘某餐廳不同分店顧客滿意度箱形圖’)#設置圖表標題plt.show()#顯示圖表【參考代碼】使用箱形圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-2】

4.3箱形圖【運行結果】【結果分析】每個箱體都在顧客滿意度較高位置,說明顧客對該餐廳的總體滿意度較高。其中,第一分店和第三分店的總體滿意度相對較高,第二分店的總體滿意度相對較低。此外,第一分店有較少滿意度特別低的記錄,可以重點分析這些消費信息,有助于提升顧客消費體驗。使用箱形圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-2】

4.3箱形圖什么樣的數(shù)據(jù)可以認為是異常值?使用什么函數(shù)繪制箱形圖?課堂檢測箱形圖課堂小結4.4

密度圖4.4密度圖密度圖使用平滑曲線來表示數(shù)據(jù)的分布情況,是直方圖的變體。密度圖的峰值反映了數(shù)據(jù)在某個特定值或范圍內的集中程度,峰值越大,則數(shù)據(jù)在該特定值或范圍內的分布越集中。4.4密度圖相比于直方圖,密度圖不受分布區(qū)間數(shù)量的影響,因此可以更加準確地反映數(shù)據(jù)的分布情況。例如,僅4個分布區(qū)間的直方圖所展示的數(shù)據(jù)分布情況,不如20個分布區(qū)間的直方圖準確,然而密度圖不會有這種問題。使用密度圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-3】

本案例基于“某餐廳顧客消費記錄.xlsx”文件中的數(shù)據(jù),使用seaborn

的kdeplot()函數(shù)繪制密度圖。函數(shù)中,x為“顧客滿意度”列標簽,顏色映射hue為“分店”列標簽,data為導入的DataFrame格式的數(shù)據(jù),hue變量的顯示順序hue_order為[‘第一分店’,‘第二分店’,‘第三分店’]?!締栴}分析】4.4密度圖【參考代碼】使用密度圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-3】

4.4密度圖importpandasaspd#導入pandas庫#導入matplotlib庫中的pyplot模塊importmatplotlib.pyplotaspltimportseabornassns#導入seaborn庫df=pd.read_excel(‘某餐廳顧客消費記錄.xlsx’)#讀取數(shù)據(jù)plt.figure(figsize=(8,

4))#創(chuàng)建畫布并設置畫布大小#設置圖表樣式,包括樣式主題和中文字體sns.set_style(style=‘ticks’,

rc={‘font.sans-serif’:‘SimHei’})【參考代碼】使用密度圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-3】

4.4密度圖sns.set_palette(sns.color_palette(‘husl’))#設置顏色主題#繪制密度圖sns.kdeplot(x=‘顧客滿意度’,

hue=‘分店’,data=df,

hue_order=[‘第一分店’,

‘第二分店’,

‘第三分店’])plt.title(‘某餐廳不同分店顧客滿意度密度圖’)#設置圖表標題plt.ylabel(‘概率密度’)#設置y軸標題plt.show()#顯示圖表【運行結果】【結果分析】第三分店的顧客滿意度密度圖峰值最靠右,說明顧客對該分店總體滿意度相對較高,而第二分店的顧客滿意度密度圖峰值最靠左,說明顧客對該分店總體滿意度相對較低。使用密度圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-3】

4.4密度圖相比于直方圖,密度圖有什么優(yōu)點?使用什么函數(shù)繪制密度圖?課堂檢測密度圖課堂小結4.5

小提琴圖4.5小提琴圖小提琴圖能同時展示數(shù)據(jù)的分布情況及概率密度,是箱形圖和密度圖的結合體,其內部是箱形圖,外部是密度圖。4.5小提琴圖不僅可以顯示數(shù)據(jù)的統(tǒng)計分位數(shù)小提琴圖結合了箱形圖和密度圖的優(yōu)點還可以顯示數(shù)據(jù)的分布形態(tài)某區(qū)域圖形面積越大,該區(qū)域對應的值附近的分布概率越大。使用小提琴圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-4】

本案例基于“某餐廳顧客消費記錄.xlsx”文件中的數(shù)據(jù),使用seaborn

的violinplot()函數(shù)繪制小提琴圖。函數(shù)中,x為“分店”列標簽,y為“顧客滿意度”列標簽,data為讀取的DataFrame格式的數(shù)據(jù),分類變量的顯示順序order為[‘第一分店’,‘第二分店’,‘第三分店’]?!締栴}分析】4.5小提琴圖【參考代碼】importpandasaspd#導入pandas庫#導入matplotlib庫中的pyplot模塊importmatplotlib.pyplotaspltimportseabornassns#導入seaborn庫df=pd.read_excel(‘某餐廳顧客消費記錄.xlsx’)#讀取數(shù)據(jù)plt.figure(figsize=(8,

4))#創(chuàng)建畫布并設置畫布大小#設置圖表樣式,包括樣式主題和中文字體sns.set_style(style=‘ticks’,

rc={‘font.sans-serif’:‘SimHei’})使用小提琴圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-4】

4.5小提琴圖【參考代碼】sns.set_palette(sns.color_palette(‘husl’))#設置顏色主題#繪制小提琴圖sns.violinplot(x=‘分店’,

y=‘顧客滿意度’,data=df,

order=[‘第一分店’,

‘第二分店’,

‘第三分店’])plt.title(‘某餐廳不同分店顧客滿意度小提琴圖’)#設置圖表標題plt.show()#顯示圖表使用小提琴圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-4】

4.5小提琴圖【運行結果】【結果分析】小提琴圖不僅展示了顧客滿意度的統(tǒng)計分位數(shù),還展示了顧客滿意度的分布情況,與箱形圖和密度圖的分析結果一致。使用小提琴圖實現(xiàn)某餐廳不同分店顧客滿意度可視化?!纠?-4】

4.5小提琴圖小提琴圖有什么優(yōu)點?使用什么函數(shù)繪制小提琴圖?課堂檢測小提琴圖課堂小結項目實施

某高校一年級學生體質指數(shù)可視化某高校一年級學生體質指數(shù)可視化1.直方圖:不同體質指數(shù)區(qū)間學生數(shù)量可視化直方圖:不同體質指數(shù)區(qū)間學生數(shù)量可視化2.小提琴圖:不同性別學生體質指數(shù)可視化某高校一年級學生體質指數(shù)可視化小提琴圖:不同性別學生體質指數(shù)可視化1.實訓目標練習使用seaborn繪制直方圖、箱形圖、密度圖和小提琴圖,實現(xiàn)分布型數(shù)據(jù)可視化。項目實訓2.實訓內容(1)基于“某餐廳顧客消費記錄.xlsx”文件中的數(shù)據(jù),執(zhí)行以下操作。①使用直方圖實現(xiàn)不同顧客滿意度區(qū)間消費次數(shù)可視化。②使用小提琴圖實現(xiàn)不同類型顧客消費金額可視化。項目實訓項目實訓2.實訓內容(2)基于“某高校一年級學生體質指數(shù).xlsx”文件中的數(shù)據(jù),執(zhí)行以下操作。①使用箱形圖實現(xiàn)不同性別學生體重可視化。②使用密度圖實現(xiàn)不同性別學生身高可視化。請學生結合本項目的學習情況,對學習成果進行自評和互評(組內成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論