版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
數(shù)據(jù)可視化技術(shù)與應用租房信息數(shù)據(jù)可視化項目實戰(zhàn)項目導讀作為租房網(wǎng)站的商家,租房信息數(shù)據(jù)可視化項目實戰(zhàn)能夠為其客戶提供幫助。該項目旨在以可視化的方式展示租房信息數(shù)據(jù),包括三大租房網(wǎng)站排名數(shù)據(jù)、典型租房城市排名數(shù)據(jù)和租房價格相關(guān)性數(shù)據(jù)等。收集和整理這些數(shù)據(jù),并利用數(shù)據(jù)可視化技術(shù)將其以氣泡圖和熱力圖的形式展示出來,以便更好地理解和分析目前租房的狀況和趨勢等信息。項目導讀01洞察市場和趨勢03用戶體驗優(yōu)化02租房定價和策略制訂通過對租房信息數(shù)據(jù)進行可視化展示和分析,租房網(wǎng)站商家可以更直觀地了解三大租房網(wǎng)站的排名情況,以及典型租房城市的排名情況,這有助于租房網(wǎng)站商家獲取市場洞察和趨勢,為他們的租房業(yè)務決策提供支持和參考。通過租房價格相關(guān)性數(shù)據(jù)的可視化,租房網(wǎng)站商家可以更好地了解租房價格與其他因素的關(guān)系,如城市、地區(qū)和房型等,這有助于租房網(wǎng)站商家制定合理的租房定價策略,提高租房業(yè)務的競爭力。通過可視化技術(shù)展示租房信息,租房網(wǎng)站商家可以更好地了解租房用戶對不同房源的需求和喜好,這有助于租房網(wǎng)站商家優(yōu)化租房網(wǎng)站的用戶界面和功能,提升用戶體驗,吸引更多的租房用戶。項目目標知識目標能力目標素養(yǎng)目標掌握氣泡圖的繪制方法掌握熱力圖的繪制方法思考氣泡圖和散點圖的區(qū)別掌握PyEcharts中的配置選項通過租房信息可視化案例培養(yǎng)學生的探究精神通過租房信息可視化案例培養(yǎng)學生數(shù)據(jù)驅(qū)動決策的意識三大租房網(wǎng)站排名數(shù)據(jù)可視化項目實戰(zhàn)典型租房城市排名數(shù)據(jù)可視化項目實戰(zhàn)0102目錄CONCENTS租房價格相關(guān)性數(shù)據(jù)可視化項目實戰(zhàn)03總結(jié)與建議049-1三大租房網(wǎng)站排名數(shù)據(jù)可視化項目實戰(zhàn)過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符使用氣泡圖進行數(shù)據(jù)的可視化分析0102目錄CONCENTS9-1-1過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符從“素材與案例\項目9\數(shù)據(jù)集\”路徑中找到“中國租客信息數(shù)據(jù)集.csv”文件,該數(shù)據(jù)集的文件類型依然為CSV,使用Python處理CSV文件可以使用pandas模塊。打開“中國租客信息數(shù)據(jù)集.csv”文件,其中一共30列數(shù)據(jù),每列字段名如下圖所示。過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符importpandasaspddf=pd.read_csv(r'c:\Users\Administrator\Desktop\中國租房信息數(shù)據(jù)集.csv',encoding='gbk')#讀取CSV文件allowed_names=['網(wǎng)站A','網(wǎng)站B','網(wǎng)站c']#設置允許的租房網(wǎng)站名稱列表invalid_rows=df[~df['租房網(wǎng)站名稱'].isin(allowed_names)]#判斷是否存在異常字符ifinvalid_rows.emptyprint("沒有異常字符")》else:invalid_row_numbersinvalid_rows.index.tolist()#輸出存在異常字符的行號print("存在異常字符的行號:",invalid_row_numbers)代碼如下:過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符代碼運行結(jié)果:過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符針對上述代碼,需要對invalid_rows=df[~df['租房網(wǎng)站名稱'].isin(allowed_names)]進行講解,這組代碼的作用是從DataFramedf中選擇不在允許的網(wǎng)站名稱列表allowed_names中的行。具體解釋如下:df['租房網(wǎng)站名稱]:選擇了DataFramedf中的一列,該列包含租房網(wǎng)站的名稱。代碼講解:過濾三大租房網(wǎng)站排名數(shù)據(jù)的異常字符名稱是否在允許的網(wǎng)站名稱列表allowed_names中,然后使用波浪線~對結(jié)果取反,即選擇不在允許的網(wǎng)站名稱列表中的行。invalid_rows=df[~df['租房網(wǎng)站名稱'].isin(allowed._names)]:將選擇的行賦值給變量invalid._rows,這些行包含不在允許的網(wǎng)站名稱列表中的數(shù)據(jù)。通過這組代碼,讀者可以過濾掉不在允許的網(wǎng)站名稱列表中的行,只保留允許的網(wǎng)站名稱對應的行數(shù)據(jù)。代碼講解:9-1-2使用氣泡圖進行數(shù)據(jù)的可視化分析使用氣泡圖進行數(shù)據(jù)的可視化分析1、使用氣泡圖進行數(shù)據(jù)的可視化分析氣泡圖用于展示多個變量之間的關(guān)系。它通過在二維平面上繪制圓形氣泡來表示數(shù)據(jù),其中氣泡的位置代表兩個變量的取值,氣泡的大小代表第3個變量的取值。觀察氣泡的位置和大小,可以直觀地了解變量之間的關(guān)系和趨勢。氣泡圖的構(gòu)成如下圖所示。使用氣泡圖進行數(shù)據(jù)的可視化分析使用氣泡圖進行數(shù)據(jù)的可視化分析這個表格清晰地展示了散點圖和氣泡圖在不同方面的區(qū)別和特點。散點圖適用于展示兩個變量之間的關(guān)系,使用橫軸和縱軸來表示變量值,數(shù)據(jù)點以離散的點表示;而氣泡圖適用于3個變量的展示,除了橫軸和縱軸,還使用氣泡的大小或顏色來表示第3個變量的值,數(shù)據(jù)點以氣泡的形式呈現(xiàn)。同時,氣泡圖可以更直觀地展示數(shù)據(jù)點之間的差異,提供額外的數(shù)據(jù)維度。使用氣泡圖進行數(shù)據(jù)的可視化分析#導入所需的庫和模塊frompyecharts.chartsimportScatter#導入Scatter類frompyechartsimportoptionsasopts#導入選項模塊,用于配置圖表的參數(shù)frompyecharts.globalsimportThemeType#導入內(nèi)置主題類型importwebbrowser#導入webbrowser模塊,用于在瀏覽器中打開HTML文件importpandasaspd#導入pandas庫,用于數(shù)據(jù)處理df=pd.read_csv(r'c:\Users\Administrator\Desktop\中國租房信息數(shù)據(jù)集.csv',encoding='gbk')#讀取數(shù)據(jù)集#使用pandas讀取CSV數(shù)據(jù)文件#統(tǒng)計數(shù)據(jù)name_counts=df['租房網(wǎng)站名稱'].value._counts()#對租房網(wǎng)站名稱列中的值進行計數(shù),得到每個名稱的出現(xiàn)次數(shù)代碼如下:使用氣泡圖進行數(shù)據(jù)的可視化分析#準備氣泡圖數(shù)據(jù)x_valueslist(range(len(name_counts)))
#創(chuàng)建一個與網(wǎng)站數(shù)量相同長度的列表,作為氣泡圖的×軸數(shù)據(jù)y_valuesname_counts.tolist()
#將租房網(wǎng)站名稱的計數(shù)轉(zhuǎn)換為列表,作為氣泡圖的y軸數(shù)據(jù)bubble._sizes=y_values#使用計數(shù)作為氣泡的大小#創(chuàng)建氣泡圖對象bubble_chart=(Scatter(init_opts=opts.Initopts(theme=ThemeType.LIGHT))#初始化一個Scatter對象,設置為淺色主題.add_xaxis(name_counts.index.tolist())
#設置x軸數(shù)據(jù)為租房網(wǎng)站名稱.add_yaxis(series._name="租房網(wǎng)站",
#設置系列名稱代碼如下:使用氣泡圖進行數(shù)據(jù)的可視化分析y_axis=y_values,
#設置y軸數(shù)據(jù)symbol_size=bubble_sizes) #設置氣泡大小,根據(jù)計數(shù)動態(tài)變化.set_global_opts (title_opts=opts.Tit1eOpts(title="租房網(wǎng)站排名",pos_left='center'),#設置圖表標題legend_opts=opts.Legendopts(is_show=False),visualmap_opts=opts.VisualMapoptstype_="size",
#設置視覺映射類型為按大小映射max_=max(bubble._sizes),
#視覺映射最大值min_=min(bubble_sizes),
#視覺映射最小值pos_right='0px')))#視覺映射組件位置#渲染圖表到HL文件,并用瀏覽器打開bubble_chart.render("bubble_chart.html")#渲染圖表,并保存為bubble_chart.html文件webbrowser.open("bubble_chart.html")#使用默認瀏覽器打開HTML文件代碼如下:使用氣泡圖進行數(shù)據(jù)的可視化分析由下圖可以看出,3個網(wǎng)站的租房信息數(shù)據(jù)排名差距并不大,但也能看出在一些城市,大眾對網(wǎng)站C的認可度是比較高的。代碼運行結(jié)果:使用氣泡圖進行數(shù)據(jù)的可視化分析上圖中右下角的下三角是視覺映射組件,
由Visua1MapOpts類實現(xiàn),
該類中的字段是PyEcharts中用于配置視覺映射組件的參數(shù)。
視覺映射可以通過不同的視覺表現(xiàn)
(如顏色、大小、
明暗等)
來展示數(shù)據(jù)的差異或分布情況。Visua1MapOpts類中常用的一些配置選項見下表。代碼講解:使用氣泡圖進行數(shù)據(jù)的可視化分析VisuaLMapOpts類中常用的配置選項使用氣泡圖進行數(shù)據(jù)的可視化分析如果想將氣泡圖的代碼修改為散點圖的代碼,只需刪除symbol_size=bubble_sizes,該代碼是根據(jù)計數(shù)動態(tài)變化設置氣泡大小的。另外,還需要刪除前面提到的視覺映射組件,即visualmap_opts=opts.VisualMapOpts(type_="size",max_=max(bubble_sizes),min_=min(bubble_sizes),pos_right='Opx'),這些代碼是針對不同氣泡大小設置的,所以散點圖也不需要,修改完畢后再次運行代碼即可得到如圖9-5所示的散點圖。代碼講解:使用氣泡圖進行數(shù)據(jù)的可視化分析使用氣泡圖進行數(shù)據(jù)的可視化分析由上圖可以發(fā)現(xiàn),雖然3個點所對應的縱坐標值不同,但是點的大小是一樣的。另外,針對使用PyEcharts創(chuàng)建的氣泡圖,也可以使用Matplotlib生成可視化氣泡圖。代碼如下:importmatplotlib.pyplotaspltimportpandasaspdimportnumpyasnpplt.rcParams['font.sans-serif']['simhei']
#設置字體為SimHeidf=pd.read_csv(r'C:\Users\Administrator\Desktop\中國租房信息數(shù)據(jù)集.csv',encoding='gbk')
#讀取數(shù)據(jù)集#統(tǒng)計數(shù)據(jù)name_counts=df['租房網(wǎng)站名稱'].value_counts()使用氣泡圖進行數(shù)據(jù)的可視化分析websites=df['租房網(wǎng)站名稱'].unique()#準備氣泡圖數(shù)據(jù)x_valuesnp.arange(len(websites))y_valuesname_counts.tolist(bubble_sizesy_valuesbubble_sizes[size0.2forsizeinbubble_sizes]#縮小氣泡的大小#創(chuàng)建氣泡圖plt.scatter(x_values,y_values,s=bubble_sizes,alpha=0.5)p1t.x1abe1('租房網(wǎng)站類別)p1t.y1abe1('網(wǎng)站數(shù)量')p1t.tit1e('租房網(wǎng)站排名')代碼如下:使用氣泡圖進行數(shù)據(jù)的可視化分析name_counts=df['租房網(wǎng)站名稱'].value_counts()plt.xticks(x_values,websites)
#設置橫坐標刻度標簽plt.ylim(0,max(y_values)1.1)
#設置縱坐標范圍plt.show()
#顯示圖形代碼如下:運行上述代碼,可以顯示用Matplotlib生成的氣泡圖。使用氣泡圖進行數(shù)據(jù)的可視化分析對比Matplotlib和PyEcharts生成的氣泡圖和代碼可知,Matplotlib是一個使用廣泛的繪圖庫,提供了大量的繪圖功能和自定義選項。它需要較多的代碼來創(chuàng)建和定制圖形,但提供了更多的靈活性和自定義選項。在Matplotlib中,需要使用plt.scatter()函數(shù)創(chuàng)建氣泡圖,并通過調(diào)整參數(shù)來控制氣泡的大小、顏色和不透明度等。Matplotlib適合在靜態(tài)的環(huán)境中生成圖形,如保存為圖像文件顯示。PyEcharts是一個基于Echarts庫的Python圖表庫,具有更高的抽象層級。使用氣泡圖進行數(shù)據(jù)的可視化分析它提供了簡單的API調(diào)用來生成各種圖表,并提供了豐富的主題、樣式和交互選項。在PyEcharts中,使用Scatter()類創(chuàng)建氣泡圖,通過add_xaxis()和add_yaxis()方法設置數(shù)據(jù),并通過set_global_opts()方法設置坐標軸標簽和標題。PyEcharts適合在Web應用程序和可交互式環(huán)境中生成圖表,可以通過HTML文件進行顯示??偟膩碚f,Matplotlib提供了更多的靈活性和自定義選項,而PyEcharts提供了更高的抽象層級和交互功能。選擇使用哪個庫取決于讀者的需求和個人偏好。9-2典型租房城市排名數(shù)據(jù)可視化項目實戰(zhàn)典型租房城市排名數(shù)據(jù)的操作使用熱力圖進行數(shù)據(jù)的可視化分析0102目錄CONCENTS9-2-1典型租房城市排名數(shù)據(jù)的操作典型租房城市排名數(shù)據(jù)的操作在該任務中,同樣使用在子項目9-1用到的數(shù)據(jù)集“中國租房信息數(shù)據(jù)集.csv”,子項目9-1用到了“租房網(wǎng)站名稱”列,這里將使用“租房網(wǎng)站名稱”和“城市”列,如圖9-7所示。本任務需要處理“城市”列,對“城市”列的處理和子項目9-1中處理“租房網(wǎng)站名稱”列一樣,只需參考子項目9-1即可。9-2-2使用熱力圖進行數(shù)據(jù)的可視化分析使用熱力圖進行數(shù)據(jù)的可視化分析熱力圖是一種用于可視化數(shù)據(jù)分布和集中程度的圖表。它通常以數(shù)據(jù)矩陣的形式呈現(xiàn)每個數(shù)據(jù)矩陣的顏色深淺表示對應數(shù)據(jù)的數(shù)值大小。較深的顏色代表較高的數(shù)值,較淺的顏色代表較低的數(shù)值。通過熱力圖快速了解數(shù)據(jù)的分布情況和集中程度,可以得出有關(guān)數(shù)據(jù)集的有益見解。熱力圖廣泛應用于各個領域,如地理信息系統(tǒng)、生物學和金融分析等,為人進行數(shù)據(jù)分析和做出決策提供了強大的可視化工具。熱力圖的構(gòu)成如圖9-8所示。使用熱力圖進行數(shù)據(jù)的可視化分析圖9-8熱力圖的構(gòu)成使用熱力圖進行數(shù)據(jù)的可視化分析由圖9-8可以看出,熱力圖提供了直觀且易于理解的數(shù)據(jù)可視化方式,通過使用顏色編碼和漸變效果,使復雜的數(shù)據(jù)模式和趨勢一日了然。熱力圖的特點和優(yōu)勢見表9-3。表9-3熱力圖的特點和優(yōu)勢使用熱力圖進行數(shù)據(jù)的可視化分析frompyecharts.chartsimportHeatMapfrompyechartsimportoptionsasoptsimportpandasaspdimportwebbrowser#讀取數(shù)據(jù)集df=pd.read_csv(r'C:\Users\Administrator\Desktop\中國租房信息數(shù)據(jù)集.csv',encoding='gbk')#獲取唯一的城市和租房網(wǎng)站名稱列表cities=df['城市'].unique().tolist()websites=df['租房網(wǎng)站名稱'].unique().tolist()#創(chuàng)建熱力圖對象代碼如下:使用熱力圖進行數(shù)據(jù)的可視化分析heatmap=(HeatMap().add_xaxis(cities).add_yaxis("租房網(wǎng)站名稱",websites,[[city,website,df[(df['租房網(wǎng)站名稱']==website)&(df['城市']==city)].shape[o]]forwebsiteinwebsitesforcityincitiesl,代碼如下:
通過圖9-9可以看出,并沒有哪個租房網(wǎng)站在所提到的3個城市都有較大的優(yōu)勢,反而是根據(jù)業(yè)務重心不同,所布局的城市是不同的。使用熱力圖進行數(shù)據(jù)的可視化分析運行結(jié)果:代碼運行結(jié)果如圖9-9所示。使用熱力圖進行數(shù)據(jù)的可視化分析在創(chuàng)建熱力圖的代碼中,使用PyEcharts2.0版本創(chuàng)建的熱力圖不再使用HeatMap()類,因為這個類在新版本中已經(jīng)不存在,取而代之的是使用HeatMap功能通過Chant類的不同配置來實現(xiàn),即通過pyecharts.charts來配置HeatMap類。下面介紹在PyEchants2.0版本中HeatMap類的方法及其參數(shù)。add_xaxis(x_axis_data):添加熱力圖的軸數(shù)據(jù)。x_axis_data是一個列表,包含了熱力圖X軸上的數(shù)據(jù)點。代碼講解:使用熱力圖進行數(shù)據(jù)的可視化分析add_yaxis(series_name,y_axis_data):添加熱力圖的Y軸數(shù)據(jù)和對應的系列名稱。series_name是一個字符串,表示系列的名稱,用于在圖例中展示。y_axis_data是一個列表,包含了熱力圖Y軸上的數(shù)據(jù)點。set_global_opts(opts):設置熱力圖的全局配置項。參數(shù)opts是一個配置項對象,用于配置熱力圖的全局屬性,如標題(TiteOpts)、視覺映射(VisualMapOpts)、提示框(TooltipOpts)和工具箱(ToolboxOpts)等。代碼講
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GBT 2492-2017 固結(jié)磨具 交付砂輪允許的不平衡量 測量》專題研究報告
- 《GBT 21792-2008閃燃和非閃燃測定 閉杯平衡法》專題研究報告
- 《GBT 15940-2008 同步數(shù)字體系信號的基本復用結(jié)構(gòu)》專題研究報告
- 《GBT 2423.1-2008電工電子產(chǎn)品環(huán)境試驗 第2部分:試驗方法 試驗A:低溫》專題研究報告
- 道路安全員培訓總結(jié)課件
- 2026年魯教版八年級語文上冊期末考試題庫附參考答案
- 道路交通安全宣傳課件
- 重陽節(jié)活動總結(jié)15篇
- 道岔鉗工測量知識課件
- 道口員培訓課件
- JB∕T 13026-2017 熱處理用油基淬火介質(zhì)
- 人教版高一化學方程式大全
- DB64 1996-2024 燃煤電廠大氣污染物排放標準
- 鄰近鐵路營業(yè)線施工安全監(jiān)測技術(shù)規(guī)程 (TB 10314-2021)
- 樣板加油站打造方案
- 浙江省杭州市西湖區(qū)2023-2024學年六年級上學期期末科學試卷
- 生物化學第30章蛋白質(zhì)降解和氨基酸的分解代謝
- YY/T 1269-2015血液透析和相關(guān)治療用水處理設備常規(guī)控制要求
- 保密資格標準認定辦法試題2017-含答案
- “雙減”背景下小學數(shù)學減負提質(zhì)的策略優(yōu)秀獲獎科研論文
- 國家開放大學電大《外國文學專題(本)》期末題庫及答案
評論
0/150
提交評論