版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
目錄
1.引言............................................................................................................................1
1.1.項(xiàng)目背景......................................................................................................1
1.2.開發(fā)環(huán)境與工具..........................................................................................1
1.2.1.Python簡介.........................................................................................1
1.2.2.PyCharm簡介.......................................................................................2
1.2.3.Python第三方庫簡介.........................................................................2
1.2.4.Tableau簡介.......................................................................................3
1.2.5.Jupyternotebook簡介.....................................................................3
2.項(xiàng)目需求分析.........................................................................................................3
2.1.可行性需求分析..........................................................................................3
2.2.采集目標(biāo)功能分析......................................................................................4
2.3.關(guān)鍵技術(shù)分析..............................................................................................4
2.3.1.網(wǎng)絡(luò)爬蟲技術(shù)......................................................................................4
2.3.2.文件存取技術(shù)......................................................................................5
2.3.3.可視化技術(shù)..........................................................................................6
3.數(shù)據(jù)采集.................................................................................................................7
3.1.采集頁面分析..............................................................................................7
3.2.字段分析......................................................................................................8
3.3.編程實(shí)現(xiàn)......................................................................................................9
4.數(shù)據(jù)清洗與處理...................................................................................................10
4.1.數(shù)據(jù)清洗....................................................................................................11
4.2.數(shù)據(jù)儲存....................................................................................................11
4.3.編程實(shí)現(xiàn)....................................................................................................11
5.數(shù)據(jù)統(tǒng)計(jì)與分析...................................................................................................12
5.1.數(shù)據(jù)準(zhǔn)備....................................................................................................12
5.2.數(shù)據(jù)展示....................................................................................................15
5.2.1.根據(jù)評分對酒店信息的統(tǒng)計(jì)............................................................15
I
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
5.2.2.根據(jù)價(jià)格對酒店進(jìn)行數(shù)據(jù)分析........................................................16
5.2.3.根據(jù)點(diǎn)評數(shù)對酒店的數(shù)據(jù)分析........................................................17
5.2.4.根據(jù)位置對酒店的數(shù)據(jù)分析............................................................18
5.3.綜述............................................................................................................19
6.小結(jié).......................................................................................................................19
參考資料.........................................................................................................................20
II
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
基于Python的住哪兒網(wǎng)數(shù)據(jù)采集與分析
1.引言
在當(dāng)代社會的推動下,大數(shù)據(jù)已經(jīng)滲透我們生活大大小小的方面,其產(chǎn)生
的數(shù)據(jù)也隨之增長,也正因?yàn)閿?shù)據(jù)的指數(shù)型增長,使得大數(shù)據(jù)成為一種新型的
社會資源,這如此籠長、繁雜的數(shù)據(jù),衍生出許許多多的互聯(lián)網(wǎng)行業(yè),為我們
的生活提供了很多就業(yè)崗位,因此我們對大數(shù)據(jù)進(jìn)行分析是十分有必要的,不
僅僅可以從中發(fā)現(xiàn)許多的商機(jī),還能加深我們對互聯(lián)網(wǎng)的了解,為我們的生活
提供了很多便利。
python與我們的生活息息相關(guān),無論是互聯(lián)網(wǎng)上編程、還是Web開發(fā)以及
人工智能上為我們提供了許許多多的崗位,所以我們作為新時(shí)代青年,是很有
必要對python進(jìn)行一定的學(xué)習(xí)與探討。
1.1.項(xiàng)目背景
隨著大數(shù)據(jù)對我們的生活影響越來越大,在我們生活的方方面面都便利著
我們的生活方式,不僅能夠提高人們對數(shù)據(jù)的利用效率,而且能夠?qū)?shù)據(jù)的重
復(fù)利用,大大降低我們的生活成本。
同時(shí),在大數(shù)據(jù)的影響下,出現(xiàn)了很多新型的崗位職業(yè),以及大數(shù)據(jù)迅速
衍生成為一個(gè)新興行業(yè),為我們帶來機(jī)遇與挑戰(zhàn)。
對于社會來說,大數(shù)據(jù)為社會治理降低了成本,保障社會的穩(wěn)定和安全。
對于我們個(gè)人來說,我們可以通過互聯(lián)網(wǎng)上所爬取的數(shù)據(jù)來為我們的學(xué)習(xí)、工
作進(jìn)行一個(gè)參照的模板。
我所設(shè)計(jì)的畢業(yè)設(shè)計(jì)是基于python的住哪兒網(wǎng)數(shù)據(jù)采集與分析,通過對該
網(wǎng)站評分、點(diǎn)評數(shù)、標(biāo)簽、價(jià)格以及位置這些關(guān)鍵的酒店信息點(diǎn)解析爬取采集
分析,從而讓我們大家了解在互聯(lián)網(wǎng)的模式下,我們該如何按照自己的需求選
擇酒店。
1.2.開發(fā)環(huán)境與工具
1.2.1.Python簡介
由于Python語言的簡潔性、易讀性以及可拓展性,以及它在網(wǎng)絡(luò)爬蟲、數(shù)
1
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
據(jù)分析、web開發(fā)等多個(gè)方面日益強(qiáng)大流行,因此我們有必要對python進(jìn)行進(jìn)
一步的了解。
Python的創(chuàng)始人是GudiovanRossum,于1989年獨(dú)立開發(fā)完成初版。1991
年,發(fā)明了第一個(gè)Python編譯器同時(shí)發(fā)行第一個(gè)公開發(fā)行版。由于當(dāng)時(shí)計(jì)算機(jī)
性能差、加上java語言的誕生使得python發(fā)展十分緩慢。Python2.4-
November30,2004,同年目前最流行的WEB框架Django誕生;Python2.5-
September19,2006;Python2.6-October1,2008;Python2.7-July
3,2010;Python3.1-2009年6月27日;Python3.2-2011年2月20日;Python
3.3-2012年9月29日;Python3.4-2014年3月16日;Python3.5-2015年9
月13日。
1.2.2.PyCharm簡介
PyCharm是一種PythonIDE(IntegratedDevelopmentEnvironment,集
成開發(fā)環(huán)境),帶有一整套可以幫助用戶在使用Python語言開發(fā)時(shí)提高其效率
的工具。
Pycharm是輔助我們學(xué)習(xí)python的一種學(xué)習(xí)軟件。他的功能很齊全,比如
說可以只能python輔助、網(wǎng)頁開發(fā)框架、科學(xué)工具、遠(yuǎn)程開發(fā)能力等等,其中
還可以跨技術(shù)開發(fā),不僅支持python,還支持JavaScript、Cython、SQL、
HTML\CSS、Node等。Pycharm對于我們學(xué)習(xí)python的實(shí)踐操作起著至關(guān)重要的
作用。
Pycharm可以在windows、Linux、macOS這些系統(tǒng)下使用。
1.2.3.Python第三方庫簡介
Requests:是用Python語言編寫,基于urllib,采用Apache2Licensed
開源協(xié)議的HTTP庫。用于python爬取網(wǎng)頁,常用的比如:requests.get、
requests.post、requests.put等。
BeautifulSoup:用于python對xml、html的解析,適合我們python的初
學(xué)者,缺點(diǎn)是反應(yīng)較為緩慢,整體來說對我們幫助還是很大的。
Numpy:為python提供很多高級的數(shù)學(xué)方法,是我們平時(shí)使用python不可
或缺的庫。
Matplotlib:是python中的一種繪制圖形的庫,為我們通過圖像的方式來
分析數(shù)據(jù),常用于畫靜態(tài)圖。
Pyecharts:也是python的一種繪制圖形的庫,它在matplotlib的基礎(chǔ)上
2
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
進(jìn)行改良,一般畫較為復(fù)雜的圖形。
Pandas:用于python的數(shù)據(jù)操作和分析,建立在Numpy之上的庫。同時(shí)把
數(shù)據(jù)保存在scv文件里,也可以進(jìn)行數(shù)據(jù)清洗。
Scapy:用Python寫的數(shù)據(jù)包探測和分析庫。
Sympy:可以做代數(shù)評測、差異化、擴(kuò)展、復(fù)數(shù)等等,它在提示信息這一塊做
的十分不錯。
1.2.4.Tableau簡介
Tableau用于幫助我們查看和理解數(shù)據(jù),它可以快速分析、可視化并分享數(shù)
據(jù)。它的基本操作包括:字段的操作、函數(shù)與計(jì)算、表計(jì)算類型、排序與篩選
以及參數(shù)。
Tableau的數(shù)據(jù)分析十分的快,可視化以工作表的形式創(chuàng)建,并且Tableau
不需要編程技能就可以運(yùn)行。
1.2.5.Jupyternotebook簡介
Jupyternotebook是一個(gè)十分快捷和流行的python工具。它可以用于數(shù)據(jù)
的清理、建模統(tǒng)計(jì)、構(gòu)建和訓(xùn)練機(jī)器學(xué)習(xí)模型以及數(shù)據(jù)的可視化等其他功能。
用戶可以將自己輸入的代碼組合到一個(gè)可讀性好,容易共享,對新手好的文檔
里,而且還會編譯各種解釋性文字。Jupyternotebook是以網(wǎng)頁的形式打開的,
我們直接在網(wǎng)頁上進(jìn)行代碼的輸入運(yùn)行,運(yùn)行的結(jié)果就會直接出現(xiàn)在下面,如
在編程過程中需要編寫說明文檔,可在同一個(gè)頁面中直接編寫,便于作及時(shí)的
說明和解釋。
2.項(xiàng)目需求分析
2.1.可行性需求分析
1.技術(shù)可行性
通過python可視化來查看分析我們想要的數(shù)據(jù)是十分方便的,它相對于
java、c語言更加簡便、快捷。Python與Java相比更適用于新手、初學(xué)者,python
的框架要比Java更為強(qiáng)大,語言更為簡潔。Python也可以用于web的開發(fā),可
以用不同的url映射到python代碼模塊來處理數(shù)據(jù)庫和生成HTML文件。
2.項(xiàng)目可行性
在互聯(lián)網(wǎng)大數(shù)據(jù)的背景下,互聯(lián)網(wǎng)酒店在我們的生活中占比越來越重,對
3
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
我們的影響也越來越大。我今天所分析的就是住哪兒網(wǎng)互聯(lián)網(wǎng)酒店的數(shù)據(jù),通
過住哪兒網(wǎng)酒店評分、價(jià)格、位置等關(guān)鍵信息的數(shù)據(jù)處理與分析來為大家進(jìn)行
對互聯(lián)網(wǎng)酒店的了解。
2.2.采集目標(biāo)功能分析
本次項(xiàng)目的數(shù)據(jù)集取自于住哪兒網(wǎng),是通過python爬取住哪兒網(wǎng)酒店的各
種關(guān)鍵信息。爬取前75頁的酒店信息,數(shù)據(jù)清洗后一共1050條數(shù)據(jù)記錄,以
此盡可能保證數(shù)據(jù)可靠性。
此次爬取的住哪兒網(wǎng),主要獲得了以下信息為:酒店名稱、酒店的每日住
宿價(jià)格、酒店在此網(wǎng)站上的點(diǎn)評數(shù)、酒店的實(shí)時(shí)位置、酒店在本網(wǎng)站的標(biāo)簽。
主要目的是通過實(shí)際數(shù)據(jù)來分析本網(wǎng)站酒店的一些屬性。比如:酒店位置在哪,
我們就可通過我們自身的需求來選擇離我們最方便的酒店;爬取酒店每日住宿
的價(jià)格,我們可以根據(jù)自身的情況來選擇我們所需要的價(jià)位;爬取點(diǎn)評數(shù),通
過我們對點(diǎn)評數(shù)的分析可以知道此酒店是否服務(wù)到位、酒店設(shè)施是否齊全、酒
店位置是否滿意等等;以及酒店標(biāo)簽的爬取是為了了解網(wǎng)站對酒店的評價(jià)或者
酒店對自身的評價(jià),由此可以督促酒店自我的檢查以及保養(yǎng)。
2.3.關(guān)鍵技術(shù)分析
2.3.1.網(wǎng)絡(luò)爬蟲技術(shù)
在現(xiàn)如今大數(shù)據(jù)時(shí)代,對于網(wǎng)絡(luò)上要采集的數(shù)據(jù)信息也越來越多,人力已
經(jīng)逐漸跟不上時(shí)代要需求,人力采集信息的效率低、成本高,以及錯誤率也很
高;因此基于成本以及節(jié)約時(shí)間的考慮,我們必須要用網(wǎng)絡(luò)爬蟲來進(jìn)行數(shù)據(jù)的
采集。
網(wǎng)絡(luò)爬蟲也被稱作為蜘蛛爬蟲(WebSpider)。是指編寫一段編程,然后通
過編寫程序來實(shí)現(xiàn)網(wǎng)站的爬取,從中提取網(wǎng)站的數(shù)據(jù)來進(jìn)行保存。
網(wǎng)絡(luò)爬蟲的原理是設(shè)定好需要爬取的目的,然后找到網(wǎng)頁的URL,然后利用
URL進(jìn)行頁面的解析,然后提取該URL上所有的URL,進(jìn)行繼續(xù)訪問和頁面解析;
如果第二次的URL還可以提取URL的話,那就可以繼續(xù)進(jìn)行解析。
通用爬蟲:是指通過搜索引擎的組成部分,是將互聯(lián)網(wǎng)上的頁面下載到本
地,進(jìn)行備份儲存,然后進(jìn)行數(shù)據(jù)清洗。
聚焦爬蟲:是指根據(jù)自己指定的需求來抓取網(wǎng)頁數(shù)據(jù)。
4
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
Roboot.txt協(xié)議:又稱‘君子協(xié)議’,是指自己的網(wǎng)址如果不想給其他人
爬取數(shù)據(jù),則通過編寫roboot.txt協(xié)議來進(jìn)行約束,防止被其他人爬取,但是
該協(xié)議只是口頭協(xié)議,并不能強(qiáng)制約束。
反爬蟲:是指自己網(wǎng)站通過設(shè)置驗(yàn)證碼等來防止其他人爬取數(shù)據(jù)。
反反爬蟲:顧名思義,通過自己的手段破解反爬蟲。
Ip代理:有點(diǎn)類似于買房時(shí)候的中介,是代替自己的一個(gè)載體(有些反爬蟲
技術(shù)可以禁止Ip的訪問,這時(shí)候我們就必須換一個(gè)ip進(jìn)行爬取)
Use-Agent:網(wǎng)頁代理,是一種身份標(biāo)識,可以為瀏覽器的身份標(biāo)識也可以
為爬蟲程序的身份標(biāo)識。
Cookie:可以保存用戶的信息,為用戶提供便利,但cookie是直接放在頭
部信息里面,cookie可被其他人竊取,信息就會泄露;所以存在風(fēng)險(xiǎn)。
常見爬蟲的爬取策略分為:深度優(yōu)先爬行策略、廣度優(yōu)先爬行策略、大站
爬行策略、反鏈策略。
網(wǎng)絡(luò)爬蟲系統(tǒng)的工作原理分為:控制器、解析器、資源庫。
控制器是接受URL鏈接進(jìn)行分配線程,然后啟動線程運(yùn)行。
解析器是指對所爬取網(wǎng)頁的文本進(jìn)行處理分析。
資源庫是指將解析好的數(shù)據(jù)下載保存在本地的容器,并提供生成索引的目
標(biāo)源。
2.3.2.文件存取技術(shù)
爬蟲請求解析后的數(shù)據(jù),需要保存下來,才能進(jìn)行下一步的處理,一般保
存數(shù)據(jù)的方式有如下幾種:
文件:txt、csv、json等,保存數(shù)據(jù)量小。
關(guān)系型數(shù)據(jù)庫:mysql等,保存數(shù)據(jù)量大。
Python文件儲存也分為Python內(nèi)置方法、numpy模塊方法、os模塊方法、
csv模塊方法Pythn內(nèi)置方法;在不借助外界庫的前提下,python內(nèi)置方法也
可以進(jìn)行數(shù)據(jù)的儲存。
文本文件儲存:
圖2-1txt文件儲存
5
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
csv文件儲存:
圖2-2txtcsv文件儲存
Json文件儲存:
圖2-3json文件儲存
2.3.3.可視化技術(shù)
可視化主要通過借助圖形的方式來分析和表達(dá)我們所需要的數(shù)據(jù),而體現(xiàn)
數(shù)據(jù)的價(jià)值。
數(shù)據(jù)可視化常見的庫有:matplotlib庫、pyecharts庫、seaborn庫、ggpolt
庫、pygal庫等。
matplotlib庫:
比較重要的繪圖庫,基于numpy的數(shù)組運(yùn)算,繪畫功能十分強(qiáng)大。
pyecharts庫:
用于生成Echarts圖標(biāo)的圖庫。于python直接對接,Echarts是百度開源
的一個(gè)數(shù)據(jù)可視化JS庫。
seaborn庫:
是python比較重要的第三方包,在matplotlib庫的基礎(chǔ)上進(jìn)行了更高級
的API封裝,使得畫圖更容易,該庫是matplotlib庫專攻可視化的模塊。
ggpolt庫:
是基于R的ggpolt2和python的繪畫系統(tǒng),在使用ggpolt庫之前要先把
數(shù)據(jù)轉(zhuǎn)化為dataframe格式。
pygal庫:以對象的方式進(jìn)行繪圖。
6
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
3.數(shù)據(jù)采集
3.1.采集頁面分析
打開QQ瀏覽器,輸入網(wǎng)址/hotellist/e0101/,然
后我們就能進(jìn)入我們所要爬取的頁面。如圖:
圖3-1爬取頁面
接著我們點(diǎn)擊鼠標(biāo)右鍵,選擇檢查。如圖所示:
圖3-2打開檢查頁面
我們在右側(cè)選擇network,然后刷新頁面,刷新完頁面在右側(cè)選擇第一個(gè)文
件查看頭部信息。
7
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖3-3查看網(wǎng)頁頭部信息
從上圖我們得知,網(wǎng)頁的URL為:/hotellist/e0101/
網(wǎng)頁的請求為get請求;網(wǎng)頁的用戶代理為:Mozilla/5.0(WindowsNT
10.0;WOW64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/77.0.3865.120
Safari/537.36Core/00QQBrowser/10.9.4621.400。同時(shí),在上面我
們可以得知cookie。
3.2.字段分析
我們先定位按鈕來選擇我們所要爬取酒店數(shù)據(jù)的字段。如圖所示:
圖3-4選取數(shù)據(jù)字段信息
然后鼠標(biāo)右擊復(fù)制字段的xpath來用于編程。
8
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
3.3.編程實(shí)現(xiàn)
導(dǎo)入所需的庫:
圖3-5導(dǎo)入庫
設(shè)置請求頭用get方法請求頭部,然后將我們爬取的頭部信息輸入進(jìn)去,
利用xpath循環(huán)解析網(wǎng)頁,截取的數(shù)據(jù)為前75頁,每頁的前十四家酒店的信息,
最后將爬取的數(shù)據(jù)保存到zhunaer.csv文件中。爬取的代碼如下:
圖3-6爬取網(wǎng)頁
9
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖3-7爬取網(wǎng)頁
4.數(shù)據(jù)清洗與處理
數(shù)據(jù)清洗也叫數(shù)據(jù)清理,數(shù)據(jù)清洗包括識別和替換不完整、不準(zhǔn)確和有問
題的數(shù)據(jù);通過有效的數(shù)據(jù)清洗分析是數(shù)據(jù)使用的支撐。
在當(dāng)前大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值正在逐漸升高,大大小小的公司企業(yè)都需
要收集客戶以及市場的數(shù)據(jù)信息,通過所收集的數(shù)據(jù)來對自己的產(chǎn)品以及市場
的流動狀態(tài)來進(jìn)行調(diào)整,以達(dá)到利益最大化的目的。在這一過程中,數(shù)據(jù)的清
洗分析將變得尤為重要,數(shù)據(jù)量越大其中的問題毛病也越多,數(shù)據(jù)會隨時(shí)間的
變化而變化、眾多數(shù)據(jù)也有質(zhì)量上的差異,以及數(shù)據(jù)分析不到位等等很多差異
導(dǎo)致造成直接或者間接的損失。
10
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
4.1.數(shù)據(jù)清洗
導(dǎo)入庫:
圖4-1導(dǎo)入庫
讀取zhunaer.csv文件:
圖4-2讀取文件
對文件進(jìn)行去重處理:
圖4-3文件去重
4.2.數(shù)據(jù)儲存
Python數(shù)據(jù)的儲存分為三種儲存方式:
一是文件儲存的方式:TXT文件儲存、JSON文件儲存、csv文件儲存
二是關(guān)系型數(shù)據(jù)庫:有MySQL等數(shù)據(jù)庫
三是非關(guān)系型數(shù)據(jù)庫:Mongodb、redis等數(shù)據(jù)庫
現(xiàn)在我所使用的為to_csv()文件儲存的方式來保存數(shù)據(jù),編碼方式為gbk:
圖4-4保存文件
4.3.編程實(shí)現(xiàn)
對zhunaer.csv文件分析處理,我們得知可以分為評分、點(diǎn)評數(shù)、位置、
價(jià)格這四個(gè)酒店關(guān)鍵點(diǎn)來進(jìn)行分析。
對點(diǎn)評數(shù)、價(jià)格、位置取前十個(gè)數(shù)據(jù)的分析儲存,取全部評分?jǐn)?shù)據(jù)用于后
續(xù)的數(shù)據(jù)分析。
11
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖4-5取前十?dāng)?shù)據(jù)的儲存
5.數(shù)據(jù)統(tǒng)計(jì)與分析
5.1.數(shù)據(jù)準(zhǔn)備
導(dǎo)入相關(guān)的庫:
圖5-1導(dǎo)入庫
導(dǎo)入儲存好的評分的酒店文件,然后進(jìn)行數(shù)據(jù)的折線圖畫圖分析,然后對
繪畫好的圖進(jìn)行網(wǎng)頁保存方便后期查看:
圖5-2評分?jǐn)?shù)據(jù)的畫圖保存
12
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
導(dǎo)入酒店每日住宿價(jià)格排名前十的數(shù)據(jù)文件,進(jìn)行柱狀圖畫圖分析,然后
保存圖畫結(jié)果:
圖5-3價(jià)格數(shù)據(jù)的畫圖保存
導(dǎo)入點(diǎn)評數(shù)前十的數(shù)據(jù)文件,進(jìn)行折線圖畫圖分析,保存圖畫結(jié)果:
圖5-4點(diǎn)評數(shù)數(shù)據(jù)的畫圖保存
導(dǎo)入與價(jià)格前十相對應(yīng)位置的數(shù)據(jù)文件,進(jìn)行餅圖畫圖分析,保存結(jié)果:
13
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
圖5-5位置數(shù)據(jù)的畫圖保存
14
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
5.2.數(shù)據(jù)展示
5.2.1.根據(jù)評分對酒店信息的統(tǒng)計(jì)
圖5-6評分?jǐn)?shù)據(jù)的圖畫分析
互聯(lián)網(wǎng)技術(shù)對我們的生活帶來了很多方便,也在一步步深入我們的生活,
從而衍生出了互聯(lián)網(wǎng)酒店這一行業(yè)。在行業(yè)競爭壓力整體環(huán)境比較大的情況下,
人們對酒店的需求也有了進(jìn)一步的增大,所以對進(jìn)行酒店進(jìn)行一個(gè)整體的評價(jià)
分?jǐn)?shù)是必不可少的。一般來說,網(wǎng)站對酒店打的分越高,說明大家對這一家酒
店的印象越好、滿意度越高,就跟人穿衣服一樣,也會優(yōu)先穿自己覺得好看比
較滿意的衣服;對于酒店本身而言,這代表著顧客對自己的肯定,同時(shí)評分也
可以提高自己的檔次,在一眾互聯(lián)網(wǎng)酒店中脫穎而出;可以吸引一些追求高檔
次、高要求的顧客,提高自己的收入和客源;然后通過自己吸收的客源來提高
自身的知名度、信譽(yù)度。總之,評分越高的酒店不僅對自身還是顧客必然是互
利共贏的選擇。
我所爬取的住哪兒玩酒店的評分?jǐn)?shù)據(jù),如上圖所示;在評分滿分為5分的
情況下仍有北京心院民宿、北京司馬臺圓滿之家農(nóng)家樂、北京司馬臺蔡云生農(nóng)
家院等酒店為5分,說明分?jǐn)?shù)為5分的這部分酒店無論是顧客滿意度還是自身
對酒店設(shè)施、服務(wù)都是非常好的,這部分酒店可以作為顧客在外挑選酒店的首
選。同時(shí)我們可以從以上圖中分析得知,評分越高的酒店說明它的內(nèi)部配置也
是成正比,酒店也是屬于服務(wù)行業(yè),內(nèi)部配置包括設(shè)施的配備、安保系統(tǒng)以及
15
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
酒店服務(wù);評分越高的酒店,這就能體現(xiàn)出這些酒店顧客、平臺整體的一個(gè)評
價(jià)接近于滿分;像評分為4.9分的映向城酒店(北京故宮店)、東籬居(北京望京
SOHO悠樂匯店)、北京漫宜·云崖民宿等這一類酒店,說明大部分評價(jià)為比較滿
意,也有一部分是因?yàn)轭櫩团c酒店方有一些些小磨差導(dǎo)致,整體來說也評分滿
分的酒店差距不大;評分為4.5-4.9之間的酒店我們認(rèn)作為酒店存在一些固定
的隱患問題,有些是因?yàn)榉块g隔音不好、服務(wù)態(tài)度問題,這些酒店多多留意進(jìn)
行改善會好很好,4.5分以下的酒店就比如說像來來酒店(北京順義石門地鐵站
店)、速8酒店(北京西單佟麟閣路店)等酒店,說明顧客對酒店的一個(gè)整體印象
不是很好,我們作為顧客應(yīng)盡量按自己的需求來選擇這些酒店。
5.2.2.根據(jù)價(jià)格對酒店進(jìn)行數(shù)據(jù)分析
圖5-7前十價(jià)格數(shù)據(jù)的圖畫分析
上圖為本網(wǎng)站酒店每日住宿價(jià)格前十的數(shù)據(jù)分析。
價(jià)格是酒店對自己情況來指定自己收入多少的關(guān)鍵信息點(diǎn)。價(jià)格對我們顧
客來說,從價(jià)格上一般就能體現(xiàn)一個(gè)酒店的整體情況,包括酒店的評分情況,
一般評分越高酒店給人能接受的價(jià)位也會增加,它們之間的關(guān)系一般成正比,
同時(shí)也能反映酒店自身服務(wù)和設(shè)施是否到位,一般酒店自身?xiàng)l件比較好的話,
酒店的成本也會增加價(jià)格也會有所波動;當(dāng)然這些都在位置的基礎(chǔ)上,一般酒
店地段越好,酒店所花費(fèi)的成本也會越高,成本增加也會造成價(jià)格的增加。另
一方面,不同價(jià)位的酒店也對應(yīng)著不同層次的需求,也為我們挑選酒店提供合
理的需求滿意度。
16
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
通過上圖我們得知,在排名前十的價(jià)位中,北京小湯一瓢私湯度假民宿、
北京老官地180號院民宿的日均價(jià)格已破萬元,說明這兩家酒店比較符合高要
求高檔次的顧客人群消費(fèi),同時(shí)酒店的設(shè)施也會比一般酒店要好上不少,包括
酒店的安保、隱私服務(wù)等也會做到在高需求人群的滿意度之內(nèi);北京漫宜·云
崖民宿酒店價(jià)格在8000元以上10000元以下,這說明與上兩家的位置有關(guān),度
假區(qū)、景區(qū)的價(jià)格往往會比市區(qū)的要貴;青龍峽無舍民宿、塞倫斯·密境民宿
像這類酒店價(jià)位處于5000-6000之間,我們可以通過分析得知,景區(qū)之間按人
流量來說,人流量越大影響酒店的成本以及酒店的定價(jià),就比如說北京小湯一
瓢私湯度假民宿與青龍峽無舍民宿這兩家酒店所處的景區(qū)人流量不一樣,北京
小湯一瓢私湯度假民宿價(jià)格為15000,青龍峽無舍民宿價(jià)格為6000,影響的因
素正是景區(qū)的人流量導(dǎo)致的;紅螺寺山樓無憂民宿、北京夜闌星舍民宿、北京
山舍民宿、北京嘉度Resort、北京山隱小住民宿這六家酒店價(jià)格相對來說差異
不大,說明這六家酒店所處地段的人流量、酒店的內(nèi)部配置都大同小異。
5.2.3.根據(jù)點(diǎn)評數(shù)對酒店的數(shù)據(jù)分析
圖5-8點(diǎn)評數(shù)前十?dāng)?shù)據(jù)的圖畫分析
以上為酒店點(diǎn)評數(shù)前十的數(shù)據(jù)分析圖。
點(diǎn)評數(shù)是指顧客對已經(jīng)居住酒店過后的評價(jià),這是顧客真真實(shí)實(shí)居住過后
感受,它可以有好的評價(jià)與各種不滿意的評語,對還未入住過的顧客和酒店自
身有著警示作用,點(diǎn)評數(shù)越多說明居住過后來進(jìn)行評價(jià)的人越多,評價(jià)的內(nèi)容
也會增多,在互聯(lián)網(wǎng)上顧客要入住時(shí)如果有不好的評價(jià)也會被后面查看酒店信
17
湖南商務(wù)職業(yè)技術(shù)學(xué)院畢業(yè)設(shè)計(jì)
息的顧客所看到,造成客源的損失,同時(shí)不好的評價(jià)過多也會導(dǎo)致酒店的評分
變低,造成酒店各方面的損失。
通過上圖我們得知,北京新僑諾富特飯店、北京崇文門飯店、北京人衛(wèi)酒
店的點(diǎn)評數(shù)比較高,說明該酒店顧客住后給予的評價(jià)最多,說明酒店的人流量
相對來說是比較大的,評分相對穩(wěn)定。北京千禧大酒店、北京裕龍國際酒店、
北京富力萬達(dá)嘉華酒店這三家酒店的點(diǎn)評數(shù)差值不大,說明這三家酒店的客源、
評價(jià)也差距不大;北京王府井希爾頓酒店、北京天倫王朝酒店、北京景山酒店、
北京東直門智選假日酒店著四家酒店點(diǎn)評數(shù)在2500-3200之間,相對于前幾家
酒店來說還有待提高,酒店方可以通過降低價(jià)格等方面來提高自己的整體點(diǎn)評
數(shù)。
5.2.4.根據(jù)位置對酒店的數(shù)據(jù)分析
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護(hù)士培訓(xùn)考試題庫含答案
- 計(jì)劃調(diào)度員職位專業(yè)書籍及學(xué)習(xí)答案
- 會計(jì)面試題及財(cái)務(wù)實(shí)操能力考察
- 2025年便捷物流配送服務(wù)項(xiàng)目可行性研究報(bào)告
- 2025年現(xiàn)代化養(yǎng)殖技術(shù)研發(fā)項(xiàng)目可行性研究報(bào)告
- 2025年線上線下零售融合發(fā)展項(xiàng)目可行性研究報(bào)告
- 2025年車聯(lián)網(wǎng)及智能交通系統(tǒng)集成項(xiàng)目可行性研究報(bào)告
- 2026年閩西職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性考試題庫及參考答案詳解一套
- 2026年湖北省宜昌市單招職業(yè)適應(yīng)性測試題庫及答案詳解1套
- 2026年安徽醫(yī)學(xué)高等??茖W(xué)校單招職業(yè)傾向性考試題庫及答案詳解1套
- 基建工程索賠管理人員索賠證據(jù)收集與審核指南
- AI智能生產(chǎn)平臺-AI+質(zhì)量管理
- 農(nóng)村山塘維修合同
- 量子點(diǎn)材料的發(fā)光性能研究與應(yīng)用
- 2025廣東廣州市衛(wèi)生健康委員會直屬事業(yè)單位廣州市紅十字會醫(yī)院招聘47人(第一次)筆試考試參考題庫及答案解析
- 中國外運(yùn)招聘筆試題庫2025
- 建筑物拆除施工溝通協(xié)調(diào)方案
- 2025食品行業(yè)專利布局分析及技術(shù)壁壘構(gòu)建與創(chuàng)新保護(hù)策略報(bào)告
- 2025四川省教育考試院招聘編外聘用人員15人考試筆試模擬試題及答案解析
- 特許經(jīng)營教學(xué)設(shè)計(jì)教案
- 2025年智能消防安全系統(tǒng)開發(fā)可行性研究報(bào)告
評論
0/150
提交評論