基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析_第1頁
基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析_第2頁
基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析_第3頁
基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析_第4頁
基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

目錄

1.引言............................................................................................................................1

1.1.項(xiàng)目背景......................................................................................................1

1.2.開發(fā)環(huán)境與工具..........................................................................................1

1.2.1.Python簡介.........................................................................................1

1.2.2.PyCharm簡介.......................................................................................2

1.2.3.Python第三方庫簡介.........................................................................2

1.2.4.Tableau簡介.......................................................................................3

1.2.5.Jupyternotebook簡介.....................................................................3

2.項(xiàng)目需求分析.........................................................................................................3

2.1.可行性需求分析..........................................................................................3

2.2.采集目標(biāo)功能分析......................................................................................4

2.3.關(guān)鍵技術(shù)分析..............................................................................................4

2.3.1.網(wǎng)絡(luò)爬蟲技術(shù)......................................................................................4

2.3.2.文件存取技術(shù)......................................................................................5

2.3.3.可視化技術(shù)..........................................................................................6

3.數(shù)據(jù)采集.................................................................................................................7

3.1.采集頁面分析..............................................................................................7

3.2.字段分析......................................................................................................8

3.3.編程實(shí)現(xiàn)......................................................................................................9

4.數(shù)據(jù)清洗與處理...................................................................................................10

4.1.數(shù)據(jù)清洗....................................................................................................11

4.2.數(shù)據(jù)儲存....................................................................................................11

4.3.編程實(shí)現(xiàn)....................................................................................................11

5.數(shù)據(jù)統(tǒng)計(jì)與分析...................................................................................................12

5.1.數(shù)據(jù)準(zhǔn)備....................................................................................................12

5.2.數(shù)據(jù)展示....................................................................................................15

5.2.1.根據(jù)評分對酒店信息的統(tǒng)計(jì)............................................................15

I

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

5.2.2.根據(jù)價(jià)格對酒店進(jìn)行數(shù)據(jù)分析........................................................16

5.2.3.根據(jù)點(diǎn)評數(shù)對酒店的數(shù)據(jù)分析........................................................17

5.2.4.根據(jù)位置對酒店的數(shù)據(jù)分析............................................................18

5.3.綜述............................................................................................................19

6.小結(jié).......................................................................................................................19

參考資料.........................................................................................................................20

II

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析

1.引言

在當(dāng)代社會的推動下,大數(shù)據(jù)已經(jīng)滲透我們生活大大小小的方面,其產(chǎn)生

的數(shù)據(jù)也隨之增長,也正因?yàn)閿?shù)據(jù)的指數(shù)型增長,使得大數(shù)據(jù)成為一種新型的

社會資源,這如此籠長、繁雜的數(shù)據(jù),衍生出許許多多的互聯(lián)網(wǎng)行業(yè),為我們

的生活提供了很多就業(yè)崗位,因此我們對大數(shù)據(jù)進(jìn)行分析是十分有必要的,不

僅僅可以從中發(fā)現(xiàn)許多的商機(jī),還能加深我們對互聯(lián)網(wǎng)的了解,為我們的生活

提供了很多便利。

python與我們的生活息息相關(guān),無論是互聯(lián)網(wǎng)上編程、還是Web開發(fā)以及

人工智能上為我們提供了許許多多的崗位,所以我們作為新時(shí)代青年,是很有

必要對python進(jìn)行一定的學(xué)習(xí)與探討。

1.1.項(xiàng)目背景

隨著大數(shù)據(jù)對我們的生活影響越來越大,在我們生活的方方面面都便利著

我們的生活方式,不僅能夠提高人們對數(shù)據(jù)的利用效率,而且能夠?qū)?shù)據(jù)的重

復(fù)利用,大大降低我們的生活成本。

同時(shí),在大數(shù)據(jù)的影響下,出現(xiàn)了很多新型的崗位職業(yè),以及大數(shù)據(jù)迅速

衍生成為一個(gè)新興行業(yè),為我們帶來機(jī)遇與挑戰(zhàn)。

對于社會來說,大數(shù)據(jù)為社會治理降低了成本,保障社會的穩(wěn)定和安全。

對于我們個(gè)人來說,我們可以通過互聯(lián)網(wǎng)上所爬取的數(shù)據(jù)來為我們的學(xué)習(xí)、工

作進(jìn)行一個(gè)參照的模板。

我所設(shè)計(jì)的畢業(yè)設(shè)計(jì)是基于python的住哪兒網(wǎng)數(shù)據(jù)采集與分析,通過對該

網(wǎng)站評分、點(diǎn)評數(shù)、標(biāo)簽、價(jià)格以及位置這些關(guān)鍵的酒店信息點(diǎn)解析爬取采集

分析,從而讓我們大家了解在互聯(lián)網(wǎng)的模式下,我們該如何按照自己的需求選

擇酒店。

1.2.開發(fā)環(huán)境與工具

1.2.1.Python簡介

由于Python語言的簡潔性、易讀性以及可拓展性,以及它在網(wǎng)絡(luò)爬蟲、數(shù)

1

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

據(jù)分析、web開發(fā)等多個(gè)方面日益強(qiáng)大流行,因此我們有必要對python進(jìn)行進(jìn)

一步的了解。

Python的創(chuàng)始人是GudiovanRossum,于1989年獨(dú)立開發(fā)完成初版。1991

年,發(fā)明了第一個(gè)Python編譯器同時(shí)發(fā)行第一個(gè)公開發(fā)行版。由于當(dāng)時(shí)計(jì)算機(jī)

性能差、加上java語言的誕生使得python發(fā)展十分緩慢。Python2.4-

November30,2004,同年目前最流行的WEB框架Django誕生;Python2.5-

September19,2006;Python2.6-October1,2008;Python2.7-July

3,2010;Python3.1-2009年6月27日;Python3.2-2011年2月20日;Python

3.3-2012年9月29日;Python3.4-2014年3月16日;Python3.5-2015年9

月13日。

1.2.2.PyCharm簡介

PyCharm是一種PythonIDE(IntegratedDevelopmentEnvironment,集

成開發(fā)環(huán)境),帶有一整套可以幫助用戶在使用Python語言開發(fā)時(shí)提高其效率

的工具。

Pycharm是輔助我們學(xué)習(xí)python的一種學(xué)習(xí)軟件。他的功能很齊全,比如

說可以只能python輔助、網(wǎng)頁開發(fā)框架、科學(xué)工具、遠(yuǎn)程開發(fā)能力等等,其中

還可以跨技術(shù)開發(fā),不僅支持python,還支持JavaScript、Cython、SQL、

HTML\CSS、Node等。Pycharm對于我們學(xué)習(xí)python的實(shí)踐操作起著至關(guān)重要的

作用。

Pycharm可以在windows、Linux、macOS這些系統(tǒng)下使用。

1.2.3.Python第三方庫簡介

Requests:是用Python語言編寫,基于urllib,采用Apache2Licensed

開源協(xié)議的HTTP庫。用于python爬取網(wǎng)頁,常用的比如:requests.get、

requests.post、requests.put等。

BeautifulSoup:用于python對xml、html的解析,適合我們python的初

學(xué)者,缺點(diǎn)是反應(yīng)較為緩慢,整體來說對我們幫助還是很大的。

Numpy:為python提供很多高級的數(shù)學(xué)方法,是我們平時(shí)使用python不可

或缺的庫。

Matplotlib:是python中的一種繪制圖形的庫,為我們通過圖像的方式來

分析數(shù)據(jù),常用于畫靜態(tài)圖。

Pyecharts:也是python的一種繪制圖形的庫,它在matplotlib的基礎(chǔ)上

2

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

進(jìn)行改良,一般畫較為復(fù)雜的圖形。

Pandas:用于python的數(shù)據(jù)操作和分析,建立在Numpy之上的庫。同時(shí)把

數(shù)據(jù)保存在scv文件里,也可以進(jìn)行數(shù)據(jù)清洗。

Scapy:用Python寫的數(shù)據(jù)包探測和分析庫。

Sympy:可以做代數(shù)評測、差異化、擴(kuò)展、復(fù)數(shù)等等,它在提示信息這一塊做

的十分不錯。

1.2.4.Tableau簡介

Tableau用于幫助我們查看和理解數(shù)據(jù),它可以快速分析、可視化并分享數(shù)

據(jù)。它的基本操作包括:字段的操作、函數(shù)與計(jì)算、表計(jì)算類型、排序與篩選

以及參數(shù)。

Tableau的數(shù)據(jù)分析十分的快,可視化以工作表的形式創(chuàng)建,并且Tableau

不需要編程技能就可以運(yùn)行。

1.2.5.Jupyternotebook簡介

Jupyternotebook是一個(gè)十分快捷和流行的python工具。它可以用于數(shù)據(jù)

的清理、建模統(tǒng)計(jì)、構(gòu)建和訓(xùn)練機(jī)器學(xué)習(xí)模型以及數(shù)據(jù)的可視化等其他功能。

用戶可以將自己輸入的代碼組合到一個(gè)可讀性好,容易共享,對新手好的文檔

里,而且還會編譯各種解釋性文字。Jupyternotebook是以網(wǎng)頁的形式打開的,

我們直接在網(wǎng)頁上進(jìn)行代碼的輸入運(yùn)行,運(yùn)行的結(jié)果就會直接出現(xiàn)在下面,如

在編程過程中需要編寫說明文檔,可在同一個(gè)頁面中直接編寫,便于作及時(shí)的

說明和解釋。

2.項(xiàng)目需求分析

2.1.可行性需求分析

1.技術(shù)可行性

通過python可視化來查看分析我們想要的數(shù)據(jù)是十分方便的,它相對于

java、c語言更加簡便、快捷。Python與Java相比更適用于新手、初學(xué)者,python

的框架要比Java更為強(qiáng)大,語言更為簡潔。Python也可以用于web的開發(fā),可

以用不同的url映射到python代碼模塊來處理數(shù)據(jù)庫和生成HTML文件。

2.項(xiàng)目可行性

在互聯(lián)網(wǎng)大數(shù)據(jù)的背景下,互聯(lián)網(wǎng)酒店在我們的生活中占比越來越重,對

3

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

我們的影響也越來越大。我今天所分析的就是住哪兒網(wǎng)互聯(lián)網(wǎng)酒店的數(shù)據(jù),通

過住哪兒網(wǎng)酒店評分、價(jià)格、位置等關(guān)鍵信息的數(shù)據(jù)處理與分析來為大家進(jìn)行

對互聯(lián)網(wǎng)酒店的了解。

2.2.采集目標(biāo)功能分析

本次項(xiàng)目的數(shù)據(jù)集取自于住哪兒網(wǎng),是通過python爬取住哪兒網(wǎng)酒店的各

種關(guān)鍵信息。爬取前75頁的酒店信息,數(shù)據(jù)清洗后一共1050條數(shù)據(jù)記錄,以

此盡可能保證數(shù)據(jù)可靠性。

此次爬取的住哪兒網(wǎng),主要獲得了以下信息為:酒店名稱、酒店的每日住

宿價(jià)格、酒店在此網(wǎng)站上的點(diǎn)評數(shù)、酒店的實(shí)時(shí)位置、酒店在本網(wǎng)站的標(biāo)簽。

主要目的是通過實(shí)際數(shù)據(jù)來分析本網(wǎng)站酒店的一些屬性。比如:酒店位置在哪,

我們就可通過我們自身的需求來選擇離我們最方便的酒店;爬取酒店每日住宿

的價(jià)格,我們可以根據(jù)自身的情況來選擇我們所需要的價(jià)位;爬取點(diǎn)評數(shù),通

過我們對點(diǎn)評數(shù)的分析可以知道此酒店是否服務(wù)到位、酒店設(shè)施是否齊全、酒

店位置是否滿意等等;以及酒店標(biāo)簽的爬取是為了了解網(wǎng)站對酒店的評價(jià)或者

酒店對自身的評價(jià),由此可以督促酒店自我的檢查以及保養(yǎng)。

2.3.關(guān)鍵技術(shù)分析

2.3.1.網(wǎng)絡(luò)爬蟲技術(shù)

在現(xiàn)如今大數(shù)據(jù)時(shí)代,對于網(wǎng)絡(luò)上要采集的數(shù)據(jù)信息也越來越多,人力已

經(jīng)逐漸跟不上時(shí)代要需求,人力采集信息的效率低、成本高,以及錯誤率也很

高;因此基于成本以及節(jié)約時(shí)間的考慮,我們必須要用網(wǎng)絡(luò)爬蟲來進(jìn)行數(shù)據(jù)的

采集。

網(wǎng)絡(luò)爬蟲也被稱作為蜘蛛爬蟲(WebSpider)。是指編寫一段編程,然后通

過編寫程序來實(shí)現(xiàn)網(wǎng)站的爬取,從中提取網(wǎng)站的數(shù)據(jù)來進(jìn)行保存。

網(wǎng)絡(luò)爬蟲的原理是設(shè)定好需要爬取的目的,然后找到網(wǎng)頁的URL,然后利用

URL進(jìn)行頁面的解析,然后提取該URL上所有的URL,進(jìn)行繼續(xù)訪問和頁面解析;

如果第二次的URL還可以提取URL的話,那就可以繼續(xù)進(jìn)行解析。

通用爬蟲:是指通過搜索引擎的組成部分,是將互聯(lián)網(wǎng)上的頁面下載到本

地,進(jìn)行備份儲存,然后進(jìn)行數(shù)據(jù)清洗。

聚焦爬蟲:是指根據(jù)自己指定的需求來抓取網(wǎng)頁數(shù)據(jù)。

4

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

Roboot.txt協(xié)議:又稱‘君子協(xié)議’,是指自己的網(wǎng)址如果不想給其他人

爬取數(shù)據(jù),則通過編寫roboot.txt協(xié)議來進(jìn)行約束,防止被其他人爬取,但是

該協(xié)議只是口頭協(xié)議,并不能強(qiáng)制約束。

反爬蟲:是指自己網(wǎng)站通過設(shè)置驗(yàn)證碼等來防止其他人爬取數(shù)據(jù)。

反反爬蟲:顧名思義,通過自己的手段破解反爬蟲。

Ip代理:有點(diǎn)類似于買房時(shí)候的中介,是代替自己的一個(gè)載體(有些反爬蟲

技術(shù)可以禁止Ip的訪問,這時(shí)候我們就必須換一個(gè)ip進(jìn)行爬取)

Use-Agent:網(wǎng)頁代理,是一種身份標(biāo)識,可以為瀏覽器的身份標(biāo)識也可以

為爬蟲程序的身份標(biāo)識。

Cookie:可以保存用戶的信息,為用戶提供便利,但cookie是直接放在頭

部信息里面,cookie可被其他人竊取,信息就會泄露;所以存在風(fēng)險(xiǎn)。

常見爬蟲的爬取策略分為:深度優(yōu)先爬行策略、廣度優(yōu)先爬行策略、大站

爬行策略、反鏈策略。

網(wǎng)絡(luò)爬蟲系統(tǒng)的工作原理分為:控制器、解析器、資源庫。

控制器是接受URL鏈接進(jìn)行分配線程,然后啟動線程運(yùn)行。

解析器是指對所爬取網(wǎng)頁的文本進(jìn)行處理分析。

資源庫是指將解析好的數(shù)據(jù)下載保存在本地的容器,并提供生成索引的目

標(biāo)源。

2.3.2.文件存取技術(shù)

爬蟲請求解析后的數(shù)據(jù),需要保存下來,才能進(jìn)行下一步的處理,一般保

存數(shù)據(jù)的方式有如下幾種:

文件:txt、csv、json等,保存數(shù)據(jù)量小。

關(guān)系型數(shù)據(jù)庫:mysql等,保存數(shù)據(jù)量大。

Python文件儲存也分為Python內(nèi)置方法、numpy模塊方法、os模塊方法、

csv模塊方法Pythn內(nèi)置方法;在不借助外界庫的前提下,python內(nèi)置方法也

可以進(jìn)行數(shù)據(jù)的儲存。

文本文件儲存:

圖2-1txt文件儲存

5

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

csv文件儲存:

圖2-2txtcsv文件儲存

Json文件儲存:

圖2-3json文件儲存

2.3.3.可視化技術(shù)

可視化主要通過借助圖形的方式來分析和表達(dá)我們所需要的數(shù)據(jù),而體現(xiàn)

數(shù)據(jù)的價(jià)值。

數(shù)據(jù)可視化常見的庫有:matplotlib庫、pyecharts庫、seaborn庫、ggpolt

庫、pygal庫等。

matplotlib庫:

比較重要的繪圖庫,基于numpy的數(shù)組運(yùn)算,繪畫功能十分強(qiáng)大。

pyecharts庫:

用于生成Echarts圖標(biāo)的圖庫。于python直接對接,Echarts是百度開源

的一個(gè)數(shù)據(jù)可視化JS庫。

seaborn庫:

是python比較重要的第三方包,在matplotlib庫的基礎(chǔ)上進(jìn)行了更高級

的API封裝,使得畫圖更容易,該庫是matplotlib庫專攻可視化的模塊。

ggpolt庫:

是基于R的ggpolt2和python的繪畫系統(tǒng),在使用ggpolt庫之前要先把

數(shù)據(jù)轉(zhuǎn)化為dataframe格式。

pygal庫:以對象的方式進(jìn)行繪圖。

6

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

3.數(shù)據(jù)采集

3.1.采集頁面分析

打開QQ瀏覽器,輸入網(wǎng)址/hotellist/e0101/,然

后我們就能進(jìn)入我們所要爬取的頁面。如圖:

圖3-1爬取頁面

接著我們點(diǎn)擊鼠標(biāo)右鍵,選擇檢查。如圖所示:

圖3-2打開檢查頁面

我們在右側(cè)選擇network,然后刷新頁面,刷新完頁面在右側(cè)選擇第一個(gè)文

件查看頭部信息。

7

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-3查看網(wǎng)頁頭部信息

從上圖我們得知,網(wǎng)頁的URL為:/hotellist/e0101/

網(wǎng)頁的請求為get請求;網(wǎng)頁的用戶代理為:Mozilla/5.0(WindowsNT

10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/77.0.3865.120

Safari/537.36Core/00QQBrowser/10.9.4621.400。同時(shí),在上面我

們可以得知cookie。

3.2.字段分析

我們先定位按鈕來選擇我們所要爬取酒店數(shù)據(jù)的字段。如圖所示:

圖3-4選取數(shù)據(jù)字段信息

然后鼠標(biāo)右擊復(fù)制字段的xpath來用于編程。

8

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

3.3.編程實(shí)現(xiàn)

導(dǎo)入所需的庫:

圖3-5導(dǎo)入庫

設(shè)置請求頭用get方法請求頭部,然后將我們爬取的頭部信息輸入進(jìn)去,

利用xpath循環(huán)解析網(wǎng)頁,截取的數(shù)據(jù)為前75頁,每頁的前十四家酒店的信息,

最后將爬取的數(shù)據(jù)保存到zhunaer.csv文件中。爬取的代碼如下:

圖3-6爬取網(wǎng)頁

9

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖3-7爬取網(wǎng)頁

4.數(shù)據(jù)清洗與處理

數(shù)據(jù)清洗也叫數(shù)據(jù)清理,數(shù)據(jù)清洗包括識別和替換不完整、不準(zhǔn)確和有問

題的數(shù)據(jù);通過有效的數(shù)據(jù)清洗分析是數(shù)據(jù)使用的支撐。

在當(dāng)前大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值正在逐漸升高,大大小小的公司企業(yè)都需

要收集客戶以及市場的數(shù)據(jù)信息,通過所收集的數(shù)據(jù)來對自己的產(chǎn)品以及市場

的流動狀態(tài)來進(jìn)行調(diào)整,以達(dá)到利益最大化的目的。在這一過程中,數(shù)據(jù)的清

洗分析將變得尤為重要,數(shù)據(jù)量越大其中的問題毛病也越多,數(shù)據(jù)會隨時(shí)間的

變化而變化、眾多數(shù)據(jù)也有質(zhì)量上的差異,以及數(shù)據(jù)分析不到位等等很多差異

導(dǎo)致造成直接或者間接的損失。

10

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

4.1.數(shù)據(jù)清洗

導(dǎo)入庫:

圖4-1導(dǎo)入庫

讀取zhunaer.csv文件:

圖4-2讀取文件

對文件進(jìn)行去重處理:

圖4-3文件去重

4.2.數(shù)據(jù)儲存

Python數(shù)據(jù)的儲存分為三種儲存方式:

一是文件儲存的方式:TXT文件儲存、JSON文件儲存、csv文件儲存

二是關(guān)系型數(shù)據(jù)庫:有MySQL等數(shù)據(jù)庫

三是非關(guān)系型數(shù)據(jù)庫:Mongodb、redis等數(shù)據(jù)庫

現(xiàn)在我所使用的為to_csv()文件儲存的方式來保存數(shù)據(jù),編碼方式為gbk:

圖4-4保存文件

4.3.編程實(shí)現(xiàn)

對zhunaer.csv文件分析處理,我們得知可以分為評分、點(diǎn)評數(shù)、位置、

價(jià)格這四個(gè)酒店關(guān)鍵點(diǎn)來進(jìn)行分析。

對點(diǎn)評數(shù)、價(jià)格、位置取前十個(gè)數(shù)據(jù)的分析儲存,取全部評分?jǐn)?shù)據(jù)用于后

續(xù)的數(shù)據(jù)分析。

11

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖4-5取前十?dāng)?shù)據(jù)的儲存

5.數(shù)據(jù)統(tǒng)計(jì)與分析

5.1.數(shù)據(jù)準(zhǔn)備

導(dǎo)入相關(guān)的庫:

圖5-1導(dǎo)入庫

導(dǎo)入儲存好的評分的酒店文件,然后進(jìn)行數(shù)據(jù)的折線圖畫圖分析,然后對

繪畫好的圖進(jìn)行網(wǎng)頁保存方便后期查看:

圖5-2評分?jǐn)?shù)據(jù)的畫圖保存

12

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

導(dǎo)入酒店每日住宿價(jià)格排名前十的數(shù)據(jù)文件,進(jìn)行柱狀圖畫圖分析,然后

保存圖畫結(jié)果:

圖5-3價(jià)格數(shù)據(jù)的畫圖保存

導(dǎo)入點(diǎn)評數(shù)前十的數(shù)據(jù)文件,進(jìn)行折線圖畫圖分析,保存圖畫結(jié)果:

圖5-4點(diǎn)評數(shù)數(shù)據(jù)的畫圖保存

導(dǎo)入與價(jià)格前十相對應(yīng)位置的數(shù)據(jù)文件,進(jìn)行餅圖畫圖分析,保存結(jié)果:

13

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

圖5-5位置數(shù)據(jù)的畫圖保存

14

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

5.2.數(shù)據(jù)展示

5.2.1.根據(jù)評分對酒店信息的統(tǒng)計(jì)

圖5-6評分?jǐn)?shù)據(jù)的圖畫分析

互聯(lián)網(wǎng)技術(shù)對我們的生活帶來了很多方便,也在一步步深入我們的生活,

從而衍生出了互聯(lián)網(wǎng)酒店這一行業(yè)。在行業(yè)競爭壓力整體環(huán)境比較大的情況下,

人們對酒店的需求也有了進(jìn)一步的增大,所以對進(jìn)行酒店進(jìn)行一個(gè)整體的評價(jià)

分?jǐn)?shù)是必不可少的。一般來說,網(wǎng)站對酒店打的分越高,說明大家對這一家酒

店的印象越好、滿意度越高,就跟人穿衣服一樣,也會優(yōu)先穿自己覺得好看比

較滿意的衣服;對于酒店本身而言,這代表著顧客對自己的肯定,同時(shí)評分也

可以提高自己的檔次,在一眾互聯(lián)網(wǎng)酒店中脫穎而出;可以吸引一些追求高檔

次、高要求的顧客,提高自己的收入和客源;然后通過自己吸收的客源來提高

自身的知名度、信譽(yù)度。總之,評分越高的酒店不僅對自身還是顧客必然是互

利共贏的選擇。

我所爬取的住哪兒玩酒店的評分?jǐn)?shù)據(jù),如上圖所示;在評分滿分為5分的

情況下仍有北京心院民宿、北京司馬臺圓滿之家農(nóng)家樂、北京司馬臺蔡云生農(nóng)

家院等酒店為5分,說明分?jǐn)?shù)為5分的這部分酒店無論是顧客滿意度還是自身

對酒店設(shè)施、服務(wù)都是非常好的,這部分酒店可以作為顧客在外挑選酒店的首

選。同時(shí)我們可以從以上圖中分析得知,評分越高的酒店說明它的內(nèi)部配置也

是成正比,酒店也是屬于服務(wù)行業(yè),內(nèi)部配置包括設(shè)施的配備、安保系統(tǒng)以及

15

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

酒店服務(wù);評分越高的酒店,這就能體現(xiàn)出這些酒店顧客、平臺整體的一個(gè)評

價(jià)接近于滿分;像評分為4.9分的映向城酒店(北京故宮店)、東籬居(北京望京

SOHO悠樂匯店)、北京漫宜·云崖民宿等這一類酒店,說明大部分評價(jià)為比較滿

意,也有一部分是因?yàn)轭櫩团c酒店方有一些些小磨差導(dǎo)致,整體來說也評分滿

分的酒店差距不大;評分為4.5-4.9之間的酒店我們認(rèn)作為酒店存在一些固定

的隱患問題,有些是因?yàn)榉块g隔音不好、服務(wù)態(tài)度問題,這些酒店多多留意進(jìn)

行改善會好很好,4.5分以下的酒店就比如說像來來酒店(北京順義石門地鐵站

店)、速8酒店(北京西單佟麟閣路店)等酒店,說明顧客對酒店的一個(gè)整體印象

不是很好,我們作為顧客應(yīng)盡量按自己的需求來選擇這些酒店。

5.2.2.根據(jù)價(jià)格對酒店進(jìn)行數(shù)據(jù)分析

圖5-7前十價(jià)格數(shù)據(jù)的圖畫分析

上圖為本網(wǎng)站酒店每日住宿價(jià)格前十的數(shù)據(jù)分析。

價(jià)格是酒店對自己情況來指定自己收入多少的關(guān)鍵信息點(diǎn)。價(jià)格對我們顧

客來說,從價(jià)格上一般就能體現(xiàn)一個(gè)酒店的整體情況,包括酒店的評分情況,

一般評分越高酒店給人能接受的價(jià)位也會增加,它們之間的關(guān)系一般成正比,

同時(shí)也能反映酒店自身服務(wù)和設(shè)施是否到位,一般酒店自身?xiàng)l件比較好的話,

酒店的成本也會增加價(jià)格也會有所波動;當(dāng)然這些都在位置的基礎(chǔ)上,一般酒

店地段越好,酒店所花費(fèi)的成本也會越高,成本增加也會造成價(jià)格的增加。另

一方面,不同價(jià)位的酒店也對應(yīng)著不同層次的需求,也為我們挑選酒店提供合

理的需求滿意度。

16

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

通過上圖我們得知,在排名前十的價(jià)位中,北京小湯一瓢私湯度假民宿、

北京老官地180號院民宿的日均價(jià)格已破萬元,說明這兩家酒店比較符合高要

求高檔次的顧客人群消費(fèi),同時(shí)酒店的設(shè)施也會比一般酒店要好上不少,包括

酒店的安保、隱私服務(wù)等也會做到在高需求人群的滿意度之內(nèi);北京漫宜·云

崖民宿酒店價(jià)格在8000元以上10000元以下,這說明與上兩家的位置有關(guān),度

假區(qū)、景區(qū)的價(jià)格往往會比市區(qū)的要貴;青龍峽無舍民宿、塞倫斯·密境民宿

像這類酒店價(jià)位處于5000-6000之間,我們可以通過分析得知,景區(qū)之間按人

流量來說,人流量越大影響酒店的成本以及酒店的定價(jià),就比如說北京小湯一

瓢私湯度假民宿與青龍峽無舍民宿這兩家酒店所處的景區(qū)人流量不一樣,北京

小湯一瓢私湯度假民宿價(jià)格為15000,青龍峽無舍民宿價(jià)格為6000,影響的因

素正是景區(qū)的人流量導(dǎo)致的;紅螺寺山樓無憂民宿、北京夜闌星舍民宿、北京

山舍民宿、北京嘉度Resort、北京山隱小住民宿這六家酒店價(jià)格相對來說差異

不大,說明這六家酒店所處地段的人流量、酒店的內(nèi)部配置都大同小異。

5.2.3.根據(jù)點(diǎn)評數(shù)對酒店的數(shù)據(jù)分析

圖5-8點(diǎn)評數(shù)前十?dāng)?shù)據(jù)的圖畫分析

以上為酒店點(diǎn)評數(shù)前十的數(shù)據(jù)分析圖。

點(diǎn)評數(shù)是指顧客對已經(jīng)居住酒店過后的評價(jià),這是顧客真真實(shí)實(shí)居住過后

感受,它可以有好的評價(jià)與各種不滿意的評語,對還未入住過的顧客和酒店自

身有著警示作用,點(diǎn)評數(shù)越多說明居住過后來進(jìn)行評價(jià)的人越多,評價(jià)的內(nèi)容

也會增多,在互聯(lián)網(wǎng)上顧客要入住時(shí)如果有不好的評價(jià)也會被后面查看酒店信

17

湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)

息的顧客所看到,造成客源的損失,同時(shí)不好的評價(jià)過多也會導(dǎo)致酒店的評分

變低,造成酒店各方面的損失。

通過上圖我們得知,北京新僑諾富特飯店、北京崇文門飯店、北京人衛(wèi)酒

店的點(diǎn)評數(shù)比較高,說明該酒店顧客住后給予的評價(jià)最多,說明酒店的人流量

相對來說是比較大的,評分相對穩(wěn)定。北京千禧大酒店、北京裕龍國際酒店、

北京富力萬達(dá)嘉華酒店這三家酒店的點(diǎn)評數(shù)差值不大,說明這三家酒店的客源、

評價(jià)也差距不大;北京王府井希爾頓酒店、北京天倫王朝酒店、北京景山酒店、

北京東直門智選假日酒店著四家酒店點(diǎn)評數(shù)在2500-3200之間,相對于前幾家

酒店來說還有待提高,酒店方可以通過降低價(jià)格等方面來提高自己的整體點(diǎn)評

數(shù)。

5.2.4.根據(jù)位置對酒店的數(shù)據(jù)分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論