【《基于游客興趣點的旅游路線系統(tǒng)設(shè)計》8100字】_第1頁
【《基于游客興趣點的旅游路線系統(tǒng)設(shè)計》8100字】_第2頁
【《基于游客興趣點的旅游路線系統(tǒng)設(shè)計》8100字】_第3頁
【《基于游客興趣點的旅游路線系統(tǒng)設(shè)計》8100字】_第4頁
【《基于游客興趣點的旅游路線系統(tǒng)設(shè)計》8100字】_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于游客興趣點的旅游路線系統(tǒng)設(shè)計目錄1緒論 41.1研究背景和現(xiàn)狀 41.1.1智慧旅游的背景與現(xiàn)狀 41.1.2國內(nèi)外相關(guān)研究現(xiàn)狀 41.2研究目的和意義 51.3本文主要工作內(nèi)容 52問題分析 63相關(guān)算法研究 73.1游客興趣點識別算法 73.1.1MMHC貝葉斯網(wǎng)絡(luò)算法設(shè)計 73.1.2建立貝葉斯有向無環(huán)圖 83.1.3模型參數(shù)調(diào)整 83.1.4效果驗證 93.2旅游路線推薦算法 103.2.1初始化路線 103.2.2插入過程 113.2.3抖動過程 113.2.4迭代局部搜索 114旅游路線推薦系統(tǒng)的設(shè)計與實現(xiàn) 134.1系統(tǒng)整體框架設(shè)計 134.2數(shù)據(jù)處理 144.2.1對移動數(shù)據(jù)分類 144.2.2數(shù)據(jù)清洗 154.3模型建模 154.4前臺業(yè)務(wù)呈現(xiàn) 154.4.1系統(tǒng)功能設(shè)計與實現(xiàn) 154.4.2系統(tǒng)頁面展示 165總結(jié)和展望 185.1總結(jié) 185.2展望 18摘要:隨著旅游市場的火爆以及旅游信息的飛速增長,在線旅游應(yīng)用成為互聯(lián)網(wǎng)+的重要行業(yè)應(yīng)用。由于很多游客在出游時難以及時尋找到自己的心儀路線,基于游客興趣點分析的旅游路線推薦系統(tǒng)應(yīng)運而生,其為游客提供可能感興趣的旅游路線,幫助游客完成出游計劃?,F(xiàn)有的很多旅游推薦系統(tǒng)都將目光集中在游客的興趣點挖掘上,認(rèn)為對游客的興趣進(jìn)行針對性推薦就可以滿足游客的需求,但是它們存在游客個人特性挖掘方法缺乏創(chuàng)新、推薦準(zhǔn)確率不高等問題,難以達(dá)到令游客滿意的效果,因此,“以游客為中心”的智慧旅游推薦系統(tǒng)成為本文研究的重點和方向。本文基于移動游客海量數(shù)據(jù)為依托,采用基于貝葉斯網(wǎng)絡(luò)算法的大數(shù)據(jù)分析技術(shù)進(jìn)行游客興趣點分析,發(fā)現(xiàn)游客興趣點不同導(dǎo)致他們的景點路線選擇情況各異,因此設(shè)計了基于游客興趣點的旅游路線個性化推薦方案,并研究提出了基于旅游游客興趣點的個性化路線推薦算法。最終,設(shè)計和實現(xiàn)了基于智能終端的旅游路線推薦APP系統(tǒng)。該系統(tǒng)以游客興趣點分析算法為核心,通過數(shù)據(jù)采集、數(shù)據(jù)處理、模型建模以及前臺業(yè)務(wù)呈現(xiàn)四部分實現(xiàn)。為游客提供了一個以游客興趣點為核心的旅游出行的智能化掌端路線推薦系統(tǒng)。關(guān)鍵詞:大數(shù)據(jù)智慧旅游游客興趣點路線推薦1緒論1.1研究背景和現(xiàn)狀1.1.1智慧旅游的背景與現(xiàn)狀20世紀(jì)以來,互聯(lián)網(wǎng)技術(shù)和大數(shù)據(jù)技術(shù)快速發(fā)展,已經(jīng)和人民群眾的生活息息相關(guān),智慧旅游作為應(yīng)用大數(shù)據(jù)技術(shù)的一個熱門項目,受到社會大眾的廣泛關(guān)注,智慧旅游建設(shè)必然需要架構(gòu)科學(xué)合理的管理系統(tǒng)。近幾年來,隨著我國經(jīng)濟(jì)的發(fā)展,人民的生活水平逐漸提高,旅游業(yè)隨之發(fā)展。當(dāng)今社會,如何將我國旅游業(yè)和大數(shù)據(jù)技術(shù)結(jié)合起來建設(shè)智慧旅游成為旅游業(yè)發(fā)展的一個重要問題。在大數(shù)據(jù)技術(shù)應(yīng)用的大背景下,架構(gòu)科學(xué)合理的智慧旅游管理模型,將大數(shù)據(jù)技術(shù)與旅游業(yè)深度結(jié)合,能夠解決旅游業(yè)中出現(xiàn)的各種問題。如何提升通旅游行業(yè)景區(qū)質(zhì)量和服務(wù)水平來獲取游客滿意是“智慧旅游”關(guān)注的重點。各個省市的景區(qū)都在盡力規(guī)劃景區(qū)建設(shè),利用信息化的技術(shù),把一些旅游資源進(jìn)行整合,然后為廣大游客量身定做,提供適需對路的旅游產(chǎn)品。傳統(tǒng)旅游行業(yè)吸引游客的方法和手段無法分析游客實際使用感知體驗,導(dǎo)致客戶滿意度下降,而這些都將是“智慧旅行”概念所主要解決的問題。1.1.2國內(nèi)外相關(guān)研究現(xiàn)狀國內(nèi)外學(xué)者針對“智慧旅游”這一問題已經(jīng)展開了一些相關(guān)研究:英國倫敦基于3G網(wǎng)絡(luò)逐漸推出倫敦智能導(dǎo)游系統(tǒng),韓國針對自助游客推出了智慧網(wǎng)絡(luò)系統(tǒng),美國科羅拉多州的滑雪場推出了RFID技術(shù)的定位裝置反饋系統(tǒng),而在國內(nèi),包括攜程網(wǎng)、途牛網(wǎng)、去哪兒網(wǎng)、天貓在內(nèi)的眾多網(wǎng)絡(luò)平臺開始推進(jìn)與國內(nèi)景區(qū)的合作,開展門票為核心網(wǎng)絡(luò)售票業(yè)務(wù)。盡管智慧旅游的呼聲很高,但是由于它與最新信息技術(shù)相關(guān)性高、缺少以游客為中心的智能分析與推薦,以及出現(xiàn)的時間尚短等原因,智慧旅游的研究和實踐還很缺乏,呈現(xiàn)出霧里看花的表象[1]。1.2研究目的和意義在疫情防控常態(tài)化背景下,如何將現(xiàn)代信息化技術(shù)全面融合于旅游業(yè)服務(wù)過程中,綜合考慮疫情防控、經(jīng)濟(jì)復(fù)蘇和旅游業(yè)復(fù)工復(fù)產(chǎn),系統(tǒng)構(gòu)建智慧旅游服務(wù)創(chuàng)新模式,成為統(tǒng)籌推進(jìn)疫情防控和旅游業(yè)復(fù)工復(fù)產(chǎn)的關(guān)鍵[2]。本課題以移動網(wǎng)絡(luò)大數(shù)據(jù)為基礎(chǔ),為新一代的智慧旅行路線規(guī)劃提供理論及實踐支持。移動游客的位置、興趣偏好與行為模式的移動大數(shù)據(jù)可以有助于影響公眾旅游活動中行程路線的規(guī)劃、選擇以及推薦策略。基于移動通信網(wǎng)絡(luò)大數(shù)據(jù),進(jìn)行路線規(guī)劃和推薦是未來智慧旅游的大趨勢。1.3本文主要工作內(nèi)容在海量游客的移動行為軌跡數(shù)據(jù)中可以從不同的方面體現(xiàn)出各個地點的熱度,以及地點之間的相互關(guān)聯(lián)。某個地點是否可以判為游客興趣點是一個研究問題,并且在特定的時間段內(nèi)根據(jù)游客興趣點,如何高效合理進(jìn)行個性路線推薦又是一個研究問題。也因此,在解決前一個問題的基礎(chǔ)上,可以進(jìn)一步解決第二個問題,從而得到更有針對性、更有效率的路線推薦方案,進(jìn)而提高游客體驗。本文基于移動大數(shù)據(jù)來為游客設(shè)計個性化的景點路線推薦系統(tǒng)。本文的主要工作如下:(1)根據(jù)互聯(lián)網(wǎng)上收集到的游客歷史記錄信息,對游客的出游路線進(jìn)行分析,發(fā)現(xiàn)游客興趣點不同會導(dǎo)致游客在景點路線選擇時表現(xiàn)出明顯的不同,因此,計劃對基于游客興趣點的個性化路線推薦方法進(jìn)行研究。(2)游客興趣點識別算法進(jìn)行研究。為了識別出游客興趣點,采用可一種最大最小爬山(MMHC)的貝葉斯網(wǎng)絡(luò)算法進(jìn)行興趣點識別。通過建立貝葉斯有向無環(huán)圖、調(diào)整網(wǎng)絡(luò)參數(shù),最后得出游客興趣點的貝葉斯網(wǎng)絡(luò)拓?fù)鋱D。通過結(jié)果對比發(fā)現(xiàn)隨著時間推移、數(shù)據(jù)量的積累,貝葉斯結(jié)構(gòu)學(xué)習(xí)算法會不斷調(diào)整參數(shù)、優(yōu)化結(jié)構(gòu),使貝葉斯網(wǎng)絡(luò)不斷完善,從而出現(xiàn)更準(zhǔn)確的預(yù)測結(jié)果。(3)對個性化路線推薦算法進(jìn)行研究,基于識別出的游客興趣點,采用一種基于迭代局部搜素算法的景區(qū)線路規(guī)劃算法。通過結(jié)果驗證,發(fā)現(xiàn)將游客興趣點及參觀時間作為評判最優(yōu)解的標(biāo)準(zhǔn),可以有效避免規(guī)劃出的路線冗余和耗時的問題。(4)進(jìn)行路線推薦系統(tǒng)設(shè)計和實現(xiàn),將系統(tǒng)分為數(shù)據(jù)采集、數(shù)據(jù)處理、模型建模和前臺業(yè)務(wù)呈現(xiàn)四個主要層,在系統(tǒng)的整體運行上考慮了大數(shù)據(jù)挖掘算法的需要,構(gòu)建了數(shù)據(jù)采集層和數(shù)據(jù)處理層,同時依照算法流程建立了模型建模層,最后考慮到推薦系統(tǒng)的游客使用方面,設(shè)計并實現(xiàn)了業(yè)務(wù)應(yīng)用層,將個性化路線推薦結(jié)果通過掌端APP形式展現(xiàn)給游客,為游客提供服務(wù)界面。2問題分析當(dāng)一個游客來到一個陌生的城市旅行,他可能想要觀光,或者此時他正想要找一個地方享受一頓美餐,興趣點推薦的目標(biāo)就是在這種時刻,為游客提供建議和幫助,篩選出有價值、游客感興趣的地點進(jìn)行路線推薦。然而,在許多實際的應(yīng)用場景下跨城市的旅行者在當(dāng)?shù)氐脑L問數(shù)據(jù)非常稀疏,使得游客喜好建模變得非??嚯y。圖1游客興趣點分析示意圖根據(jù)統(tǒng)計收集到的互聯(lián)網(wǎng)旅游信息中游客歷史訪問記錄中的類別信息,發(fā)現(xiàn)不同的游客其訪問的景點類別分布有著較大差異,并且部分游客在不同時期的訪問類別分布也有很大差別。本文基于訪問類別分布情況,將游客大致分為三種。第一種游客,他們的興趣比較單調(diào),這類游客的興趣愛好相對比較固定的,游客的喜歡景點類別也是單一的,這種游客大部分旅游目的地都是統(tǒng)一類別的景區(qū)。第二種游客,他們的興趣多種多樣,這種游客的興趣點也是固定的,然而,與第一種游客不同的是,第二種游客的喜好不止一類,他們喜歡的景區(qū)類別會有多個,但是這些類別在訪問分布中的差距并不大。第三種游客,他們的興趣變化很大,這種游客的興趣不是固定的,而是會隨著時間的變化而發(fā)生變化,這中游客的類別訪問分布有時是難以確定和預(yù)測出來的。對于三種游客,能夠發(fā)現(xiàn)不管是基于群體的推薦還是基于游客興趣點的推薦都不是很好描述所有游客的情況?;谌后w的推薦在為興趣變化游客進(jìn)行推薦時很可能將興趣多樣游客作為其鄰居,在這樣的情況下推薦的結(jié)果是興趣變化游客曾經(jīng)經(jīng)常訪問的景點,但是目標(biāo)游客可能已經(jīng)改變了興趣,所以推薦結(jié)果不能得到較好的效果?;谟慰团d趣點的推薦在針對興趣變化游客進(jìn)行推薦時,也會產(chǎn)生游客曾經(jīng)感興趣的景點類別,造成景點推薦的結(jié)果不滿足游客的需求。本文的路線推薦算法考慮到以上旅游推薦問題,將游客的興趣點作為研究的主要特性,能夠在一定程度上解決興趣變化游客的景點路線推薦問題。3相關(guān)算法研究數(shù)據(jù)挖掘算法一直是大數(shù)據(jù)分析推薦系統(tǒng)最為重要研究部分,不同大數(shù)據(jù)分析推薦系統(tǒng)的獨特性就在于其所使用的數(shù)據(jù)挖掘算法不同,可以說數(shù)據(jù)挖掘算法的不斷優(yōu)化是大數(shù)據(jù)分析更新?lián)Q代的動力。下面詳細(xì)對游客興趣點識別和旅游路線推薦采用的數(shù)據(jù)挖掘算法進(jìn)行研究。3.1游客興趣點識別算法本文采用一種貝葉斯網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法進(jìn)行游客興趣點識別。傳統(tǒng)的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)方法是對樣本數(shù)據(jù)進(jìn)行一次學(xué)習(xí),模型的結(jié)構(gòu)和參數(shù)在之后的預(yù)測中不再改變。而本文是對海量的移動數(shù)據(jù)進(jìn)行挖掘分析,面對移動實時數(shù)據(jù)波動性大的特性時,本文在選取建立貝葉斯網(wǎng)絡(luò)模型的結(jié)構(gòu)學(xué)習(xí)算法時選取一種MMHC貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)算法。詳細(xì)實現(xiàn)步驟如下:3.1.1MMHC貝葉斯網(wǎng)絡(luò)算法設(shè)計經(jīng)過分析研究,設(shè)計MMHC貝葉斯網(wǎng)絡(luò)算法的過程如下:圖2MMHC貝葉斯網(wǎng)絡(luò)算法流程圖通過對數(shù)據(jù)集中的屬性進(jìn)行自動學(xué)習(xí),找出屬性之間的關(guān)聯(lián)度,從而構(gòu)建基于貝葉斯網(wǎng)絡(luò)的游客興趣點模型結(jié)構(gòu)。本文應(yīng)用的數(shù)據(jù)集非常大,有3千萬條數(shù)據(jù),是一個大規(guī)模數(shù)據(jù)集。普通的網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)算法最多只能學(xué)習(xí)約2萬條數(shù)據(jù)。改進(jìn)的MMHC貝葉斯網(wǎng)絡(luò)算法通過啟發(fā)式搜索確定網(wǎng)絡(luò)結(jié)構(gòu)邊的方向,對模型結(jié)構(gòu)進(jìn)行學(xué)習(xí),能夠適應(yīng)大規(guī)模的數(shù)據(jù)集。3.1.2建立貝葉斯有向無環(huán)圖利用信息熵的方法確定網(wǎng)絡(luò)模型的骨架結(jié)構(gòu),枚舉計算網(wǎng)絡(luò)模型的兩個節(jié)點之間的信息熵判斷兩個節(jié)點之間的關(guān)聯(lián)強(qiáng)度。并將兩個節(jié)點間有聯(lián)系的連接一條無向邊,這樣構(gòu)成一個網(wǎng)絡(luò)模型的骨架結(jié)構(gòu)。貝葉斯網(wǎng)絡(luò)的有向無環(huán)圖建立的過程如下圖所示:圖3有向無環(huán)圖建立過程然后通過打分搜索算法,確定邊的方向,使網(wǎng)絡(luò)結(jié)構(gòu)模型的效果達(dá)到最優(yōu)。3.1.3模型參數(shù)調(diào)整貝葉斯網(wǎng)絡(luò)算法能夠根據(jù)歷史數(shù)據(jù),對已構(gòu)建的模型結(jié)構(gòu)進(jìn)行參數(shù)學(xué)習(xí),調(diào)整模型結(jié)構(gòu)節(jié)點的參數(shù),使得模型參數(shù)最大化,從而構(gòu)建最優(yōu)的模型。通過倍增學(xué)習(xí)的方式動態(tài)改變用戶離網(wǎng)預(yù)測模型的結(jié)構(gòu)。如下公式所示,通過對上一次學(xué)習(xí)得到的結(jié)果和最近一次學(xué)習(xí)得到的結(jié)果進(jìn)行加權(quán),對參數(shù)進(jìn)行調(diào)整,使模型的結(jié)構(gòu)逐漸趨向于穩(wěn)定。通過確定的網(wǎng)絡(luò)結(jié)構(gòu)來量化變量之間的依賴關(guān)系,確定每個變量對應(yīng)的條件概率分布表,即確定網(wǎng)絡(luò)參數(shù)。圖4參數(shù)調(diào)整過程示例截圖3.1.4效果驗證本文選取了2000個樣本對該模型進(jìn)行分析,經(jīng)過試驗驗證,可以看出,貝葉斯網(wǎng)絡(luò)建模方法具有更加穩(wěn)定的性能和更高效的處理效率,且預(yù)測結(jié)果更加準(zhǔn)確。表1貝葉斯網(wǎng)絡(luò)算法實驗結(jié)果分析表模型樣本數(shù)比率(%)標(biāo)準(zhǔn)誤差貝葉斯模型正確153276.60.009467錯誤46823.4圖5貝葉斯網(wǎng)絡(luò)算法實驗結(jié)果分析圖可以看出,本文采用的MMHC貝葉斯網(wǎng)絡(luò)建模方法是貝葉斯網(wǎng)絡(luò)的一種優(yōu)化與延展,其具有強(qiáng)大的不確定性問題處理能力。MMHC貝葉斯網(wǎng)絡(luò)用條件概率表達(dá)各個信息要素之間的相關(guān)關(guān)系,能在有限的、不完整的、不確定的信息條件下進(jìn)行學(xué)習(xí)和推理。隨著時間推移、數(shù)據(jù)量的積累,貝葉斯結(jié)構(gòu)學(xué)習(xí)算法會不斷調(diào)整參數(shù)、優(yōu)化結(jié)構(gòu),使貝葉斯網(wǎng)絡(luò)不斷完善,從而出現(xiàn)更準(zhǔn)確的分析結(jié)果。3.2旅游路線推薦算法本文提出一種基于迭代局部搜素算法的景區(qū)線路規(guī)劃算法,將游客興趣點及參觀時間作為評判最優(yōu)解的標(biāo)準(zhǔn),可以有效避免規(guī)劃出的路線冗余和耗時的問題。同時,本文提出的算法對于起始點和終點相同的情況,也可以給出適當(dāng)?shù)木€路規(guī)劃方案,而且可以在時間允許的情況下,以游客興趣點作為本次路線的重要依據(jù)。本技術(shù)方案需要實現(xiàn)的最終目標(biāo)效果:在迭代局部搜索算法的基礎(chǔ)上,改進(jìn)其規(guī)劃出的路線行程花費較長的缺點,同時游客的興趣點一定會被包括在推薦的路線中。算法的詳細(xì)實現(xiàn)步驟如下:3.2.1初始化路線首先,根據(jù)游客輸入的開始時間、時間預(yù)算、起始位置和結(jié)束位置,首先將起始位置和結(jié)束位置規(guī)劃到線路中,認(rèn)為游客訪問完開始位置后,直接訪問結(jié)束位置,更新路線中的起始位置及結(jié)束位置的到達(dá)時間、等待時間、開始參觀時間,并更新目前為止總時間消耗及總分?jǐn)?shù),以及同時間預(yù)算相比,還可以用于訪問其它位置的時間。然后在起始位置和結(jié)束位置之間插入游客興趣點信息,插入規(guī)則與上文插入過程相同。然后更新路線總分?jǐn)?shù)及總時間消耗。3.2.2插入過程對于沒有達(dá)到局部最優(yōu)的路線(剩余的預(yù)算時間還可以訪問其它景點),會遍歷Locations數(shù)組,對于flag=0的所有位置都會計算該位置插入到目前線路中任意兩個景點之間的時間消耗shift,記錄最小的時間消耗minShift以及對應(yīng)的最佳插入位置(記錄前一個景點及后一個景點),對于所有flag=0的位置,都會計算一個插入比率ratio,計算方法為該位置的分?jǐn)?shù)的平方除以該位置的minShift,將比率最高的景點插入到路線中,插入位置為記錄的最佳插入位置。該景點插入到線路之后,更新路線中其它訪問的到達(dá)時間、等待時間、開始訪問時間,以及路線的總分?jǐn)?shù)、總時間消耗,以及剩余的預(yù)算時間,同時將該位置的flag設(shè)置為1。該方法為遞歸的方法,會重復(fù)執(zhí)行上述步驟,直到達(dá)到局部最優(yōu)解(剩余的時間預(yù)算沒有辦法參觀任意其它景點)。3.2.3抖動過程抖動過程是從線路的某個景點開始,連續(xù)刪除后續(xù)的幾個景點,之后將刪除段之后的景點前移,更新刪除后線路中景點的到達(dá)時間、等待時間、開始參觀時間,以及路線的總時間、總分?jǐn)?shù)、剩余的預(yù)算時間。目的是對刪除之后的線路重新執(zhí)行插入操作,避免陷入局部最優(yōu)解。抖動過程有兩個參數(shù),s和r,s表示開始刪除的數(shù)組下標(biāo),r表示連續(xù)刪除的景點個數(shù)。圖6刪除中間某段訪問的路線的示意圖3.2.4迭代局部搜索迭代局部搜索算法結(jié)合插入與抖動步驟,給定無改進(jìn)的最大迭代次數(shù)max(一般為150次),對于確定的最優(yōu)解執(zhí)行抖動之后再插入的操作,如果再次插入得到的結(jié)果沒有原先的最優(yōu)解好,那么迭代次數(shù)加1,更新抖動步驟的參數(shù)之后對再次插入的結(jié)果繼續(xù)執(zhí)行抖動步驟,然后再次執(zhí)行插入步驟,直到max次迭代之后,確定的最優(yōu)解都沒有找到更好的結(jié)果,那么我們就認(rèn)為目前確認(rèn)的這個方案就是全局最優(yōu)解;如果某次抖動之后再插入的結(jié)果好于原先的最優(yōu)解,那么替換最優(yōu)解,重置抖動步驟的參數(shù)及迭代次數(shù),對新的最優(yōu)解重新開始上述步驟。流程圖如下:圖7迭代局部搜索算法流程圖本文選擇在迭代局部搜索算法的基礎(chǔ)上,改進(jìn)其規(guī)劃處路線行程花費較長的缺點,同時又根據(jù)需求提出新的功能,即起始位置和結(jié)束位置可以為同一位置并且必須訪問到游客興趣點的景點。在此基礎(chǔ)上進(jìn)行算法的設(shè)計與實現(xiàn),根據(jù)試驗對該算法的性能進(jìn)行測試,測試結(jié)果表明當(dāng)路線總分?jǐn)?shù)相同的情況下,本文算法更傾向于選擇時間消耗更小的路線,同時能夠正確處理起始位置與結(jié)束位置相同的情況以及包含游客興趣點的情況。并且,該算法能夠在幾秒的時間內(nèi)完成計算輸出結(jié)果。a)算法路線時間對比圖b)算法執(zhí)行時間對比圖圖8迭代局部搜索算法試驗對比圖4旅游路線推薦系統(tǒng)的設(shè)計與實現(xiàn)4.1系統(tǒng)整體框架設(shè)計為了保證基于游客興趣點的旅游路線推薦算法能夠應(yīng)用于實踐中,本文設(shè)計并實現(xiàn)了基于掌端的路線推薦系統(tǒng)。系統(tǒng)框圖如下:本系統(tǒng)架構(gòu)共分為四個層次,分別為數(shù)據(jù)采集層、數(shù)據(jù)處理層、模型建模層、可視化應(yīng)用層。數(shù)據(jù)采集層主要對系統(tǒng)所需的移動用戶行為軌跡、上網(wǎng)信息等數(shù)據(jù)通過大數(shù)據(jù)平臺進(jìn)行匯總,數(shù)據(jù)處理層主要完成數(shù)據(jù)的統(tǒng)計和篩選和入庫,模型建模層主要是通過R語言、算法庫等技術(shù)完成數(shù)據(jù)分析,可視化應(yīng)用層主要完成面向用戶的可視化平臺搭建工作。系統(tǒng)架構(gòu)圖如圖9所示。圖9旅游路線推薦系統(tǒng)架構(gòu)圖4.2數(shù)據(jù)處理數(shù)據(jù)處理層包含了兩個部分:對原始數(shù)據(jù)的預(yù)處理和預(yù)處理后的數(shù)據(jù)匯總。圖10為數(shù)據(jù)預(yù)處理的數(shù)據(jù)流程圖,原始用戶軌跡數(shù)據(jù)和上網(wǎng)數(shù)據(jù)存儲在Hadoop集群的大數(shù)據(jù)平臺上,本系統(tǒng)使用Hive和MapReduce程序從Hbase中的原始數(shù)據(jù)抽取需要的字段。然后經(jīng)過匯總和篩選。圖10數(shù)據(jù)預(yù)處理流程圖4.2.1對移動數(shù)據(jù)分類遼寧移動擁有用戶海量的數(shù)據(jù)資源和完備的底層Hadoop集群架構(gòu),本文數(shù)據(jù)數(shù)據(jù)是基于遼寧移動的大數(shù)據(jù)平臺提供的用戶軌跡數(shù)據(jù),上網(wǎng)數(shù)據(jù)等數(shù)據(jù)資源信息。通過對移動現(xiàn)有的數(shù)據(jù)進(jìn)行充分的研究分析,對數(shù)據(jù)分類如下:表2數(shù)據(jù)分類表分類數(shù)據(jù)源量級用戶上網(wǎng)日志攜程200M/日途牛400M/日去哪兒150M/日天貓30M/日用戶軌跡數(shù)據(jù)用戶ID1.5T/日經(jīng)緯度400G/日時間800G/日4.2.2數(shù)據(jù)清洗將原始數(shù)據(jù)存儲在大數(shù)據(jù)平臺的Hadoop集群上,并從Hbase中的原始數(shù)據(jù)中抽取出需要的字段。對這些數(shù)據(jù)在Hadoop硬件集群中進(jìn)行清洗處理,整理數(shù)據(jù)并過濾掉個別壞點。最后從用戶軌跡數(shù)據(jù)、上網(wǎng)日志中抽取并清洗后,得到以下與游客興趣點相關(guān)的數(shù)據(jù)信息:圖11清洗后的數(shù)據(jù)信息表截圖4.3模型建模完成數(shù)據(jù)處理工作之后,模型建模層就能夠利用數(shù)據(jù)庫中的規(guī)整數(shù)據(jù)進(jìn)行游客興趣點識別,然后基于識別出的興趣點實現(xiàn)路線推薦算法架構(gòu)搭建了。模型建模層通過與數(shù)據(jù)庫的協(xié)同工作,提取游客興趣點和旅游推薦算法所需的數(shù)據(jù),保證模型計算層整體順利運行。在之前己經(jīng)介紹過旅游路線推薦系統(tǒng)使用的游客興趣點識別和路線推薦算法的整體過程,所以本節(jié)不進(jìn)行詳細(xì)說明。4.4前臺業(yè)務(wù)呈現(xiàn)業(yè)務(wù)應(yīng)用層是為了讓游客能夠更好的使用旅游推薦系統(tǒng)的服務(wù),所以要將推薦系統(tǒng)的成果輸出到可見頁面上。4.4.1系統(tǒng)功能設(shè)計與實現(xiàn)本系統(tǒng)采用APP方式在掌端進(jìn)行呈現(xiàn),系統(tǒng)的功能圖如圖12所示。圖12旅游推薦系統(tǒng)功能圖4.4.2系統(tǒng)頁面展示(1)路線推薦功能頁面展示下面對路線推薦掌端APP中的路線推薦功能進(jìn)行詳細(xì)說明。首先,點擊路線規(guī)劃界面后可以進(jìn)入景點內(nèi)路線規(guī)劃,點擊景點規(guī)劃跳轉(zhuǎn)到游玩景點推薦與規(guī)劃,點擊相應(yīng)的按鈕進(jìn)行規(guī)劃和分析。圖13路線推薦功能頁面展示圖(1)在路線規(guī)劃界面點擊查詢后可以進(jìn)入詳細(xì)頁面,點擊時間可以選擇起止時間,點擊景點可以選擇想要游玩的景點,點擊開始導(dǎo)航按鈕進(jìn)行路線規(guī)劃,展示了游玩時間和游玩順序。圖14路線推薦功能頁面展示圖(2)(2)地圖管理功能頁面展示用戶信息管理功能主要包括用戶定位、實時路況、用戶導(dǎo)航等,部分展示頁面如下圖所示。圖15地圖管理功能頁面展示圖(3)用戶信息管理功能頁面展示用戶信息管理功能主要包括用戶登錄、用戶注冊、系統(tǒng)設(shè)置、用戶信息設(shè)置等,部分展示頁面如下圖所示。圖16用戶信息管理功能頁面展示圖5總結(jié)和展望5.1總結(jié)在國內(nèi)旅游市場呈爆炸式發(fā)展,旅游信息呈指數(shù)式增長的情況下,人們在決定旅游計劃的時候面臨著很多可能的選擇,旅游推薦系統(tǒng)為游客提供其可能感興趣的景點,在一定程度上解決了游客選擇難的情況,并且良好的推薦效果會促使游客選擇推薦列表中的景點出游。因此各大旅游網(wǎng)站紛紛設(shè)計旅游推薦系統(tǒng)來更好地為游客服務(wù),也為了增長自己的銷售量[3]。游客在一個陌生的城市,亟待快捷方便地找到熱門旅游景點并規(guī)劃好游玩路線。本文從用戶大量軌跡信息中發(fā)掘游客興趣點,以此

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論