數(shù)據(jù)挖掘在Web中的應用案例分析_第1頁
數(shù)據(jù)挖掘在Web中的應用案例分析_第2頁
數(shù)據(jù)挖掘在Web中的應用案例分析_第3頁
數(shù)據(jù)挖掘在Web中的應用案例分析_第4頁
免費預覽已結束,剩余1頁可下載查看

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

數(shù)據(jù)挖掘在Web中的應用案例分析數(shù)據(jù)挖掘在Web中的應用案例分析數(shù)據(jù)挖掘在Web中的應用案例分析xxx公司數(shù)據(jù)挖掘在Web中的應用案例分析文件編號:文件日期:修訂次數(shù):第1.0次更改批準審核制定方案設計,管理制度[數(shù)據(jù)挖掘在Web中的應用]在競爭日益激烈的網(wǎng)絡經(jīng)濟中,只有贏得用戶才能最終贏得競爭的優(yōu)勢。作為一個網(wǎng)站,你知道用戶都在你的網(wǎng)站上干什么嗎你知道你的網(wǎng)站哪些部分最為用戶喜愛、哪些讓用戶感到厭煩什么地方出了安全漏洞什么樣的改動帶來了顯著的用戶滿意度提高、什么樣的改動反而丟失了用戶你怎樣評價你的網(wǎng)站廣告條的效率、你知道什么樣的廣告條點擊率最高嗎“知己知彼,才能百戰(zhàn)不殆”,你真的了解自己嗎挑戰(zhàn)的背后機會仍存,所有客戶行為的電子化(ClickStream),使得大量收集每個用戶的每一個行為數(shù)據(jù)、深入研究客戶行為成為可能。如何利用這個機會,從這些“無意義”的繁瑣數(shù)據(jù)中得到大家都看得懂的、有價值的信息和知識是我們面臨的問題。[問題]:根據(jù)你所學的知識,思考從網(wǎng)站中所獲取的大量數(shù)據(jù)中,我們能做哪些有意義的數(shù)據(jù)分析基于WEB使用的挖掘,也稱為WEB日志挖掘(WebLogMining)。與前兩種挖掘方式以網(wǎng)上的原始數(shù)據(jù)為挖掘對象不同,基于WEB使用的挖掘面對的是在用戶和網(wǎng)絡交互的過程中抽取出來的第二手數(shù)據(jù)。這些數(shù)據(jù)包括:網(wǎng)絡服務器訪問記錄、代理服務器日志記錄、用戶注冊信息以及用戶訪問網(wǎng)站時的行為動作等等。WEB使用挖掘將這些數(shù)據(jù)一一紀錄到日志文件中,然后對積累起來的日志文件進行挖掘,從而了解用戶的網(wǎng)絡行為數(shù)據(jù)所具有的意義。我們前面所舉的例子正屬于這一種類型?;赪EB內(nèi)容的挖掘:非結構化半結構化\文本文檔超文本文檔\Bagofwordsn-grams詞短語概念或實體關系型數(shù)據(jù)\TFIDF和變體機器學習統(tǒng)計學(包括自然語言處理)\歸類聚類發(fā)掘抽取規(guī)則發(fā)掘文本模式建立模式.基于WEB結構的挖掘:半結構化數(shù)據(jù)庫形式的網(wǎng)站鏈接結構\超文本文檔鏈接\邊界標志圖OEM關系型數(shù)據(jù)圖形\Proprietary算法ILP(修改后)的關聯(lián)規(guī)則\發(fā)掘高頻的子結構發(fā)掘網(wǎng)站體系結構歸類聚類.基于WEB使用的挖掘:交互形式\服務器日志記錄瀏覽器日志記錄\關系型表圖形\Proprietary算法機器學習統(tǒng)計學(修改后的)關聯(lián)規(guī)則\站點建設改進與管理銷建立用戶模式.根據(jù)你所學的數(shù)據(jù)挖掘知識,談談哪些數(shù)據(jù)挖掘技術可以應用于Web中,以這些數(shù)據(jù)挖掘技術可以完成哪些功能WebMining技術已經(jīng)應用于解決多方面的問題,比如基于WEB內(nèi)容和結構的挖掘極大的幫助了我們從浩瀚的網(wǎng)絡資源中更加快速而準確的獲取所需要的資料,而基于使用的數(shù)據(jù)挖掘之威力,更是在商業(yè)運作上發(fā)揮的淋漓盡致,具體表現(xiàn)在:(1)對網(wǎng)站的修改能有目的有依據(jù)穩(wěn)步的提高用戶滿意度發(fā)現(xiàn)系統(tǒng)性能瓶頸,找到安全漏洞,查看網(wǎng)站流量模式,找到網(wǎng)站最重要的部分,發(fā)現(xiàn)用戶的需要和興趣,對需求強烈的地方提供優(yōu)化,根據(jù)用戶訪問模式修改網(wǎng)頁之間的連接,把用戶想要的東西以更快且有效的方式提供給用戶,在正確的地方正確的時間把正確的信息提供給正確的人。(2)測定投資回報率測定廣告和促銷計劃的成功度找到最有價值的ISP和搜索引擎測定合作和結盟網(wǎng)站對自身的價值(3)提供個性化網(wǎng)站對大多數(shù)WEB應用來說,讓用戶感到真?zhèn)€網(wǎng)站是完全為他自己定制的個性化網(wǎng)站,是WEB站點成功的秘訣。針對不同的用戶完全按照其個人的興趣和愛好(數(shù)據(jù)挖掘算法得到的用戶訪問模式)向用戶動態(tài)的提供要瀏覽的建議自動提供個性化的網(wǎng)站。通過對問題(1)和(2)的回答,你認為用戶和網(wǎng)站經(jīng)營者分別可以得到什么好處Web數(shù)據(jù)挖掘在電子商務方面的應用Web挖掘這方面的應用可以為企業(yè)更有效的確認目標市場、改進決策獲得更大的競爭優(yōu)勢提供幫助,從中可得到商家用于特定消費群體或個體進行定向營銷的決策信息。電子商務方面的Web挖掘功能主要是如下幾個方面:首先,客戶分類和客戶聚類。對Web的客戶訪問信息進行挖掘。對客戶進行分類分析。應用聚類分析對客戶進行分組,并且分析組中客戶的共同特征,這樣就可以讓商家更好了解自己的客戶,向客戶提供更有針對性的服務。其次是找到潛在的客戶。在對Web的客戶訪問信息的挖掘中,利用分類技術可在因特網(wǎng)上找到未來的潛在客戶。最后保留客戶的駐留時間。對于客戶而言,在網(wǎng)上每個銷售商對于客戶來說都是樣的,如何盡量使客戶在自己的網(wǎng)上駐留更長的時間,這樣對于商家才能有更多客戶和更大的利潤空間。Web數(shù)據(jù)挖掘在網(wǎng)絡教育中的應用教育網(wǎng)絡化的趨勢不僅為學生提供了便利的學習方式和廣泛的選擇,也為學校提供了更加深入了解學生需求信息和學生行為特征的可能性。由于受教育對象個體之間存在著極大的差異性,網(wǎng)絡教學也必<優(yōu)麥電子商務論文>須是一種適應個別化學習需求的個性化教學。這種個性化教學的提供。是通過將傳統(tǒng)的數(shù)據(jù)挖掘MWeb結合起來。進行Web數(shù)據(jù)挖掘,即從Web文檔和Web活動中抽取學生感興趣的潛在的有用模式和隱藏的信息,作為對學生提供個性化教學服務的依據(jù),協(xié)助管理者優(yōu)化站點結構。提高站點效率,更好地為網(wǎng)絡教育服務。在網(wǎng)站設計中的應用在網(wǎng)站設計方面中的應用,主要是通過對網(wǎng)站內(nèi)容的挖掘。特別是對文本內(nèi)容的挖掘,可以有效地組織網(wǎng)站信息。如采用自動歸類技術實現(xiàn)網(wǎng)站信息的層次性組織;通過對用戶訪問日志記錄信息的挖掘,把握用戶感興趣的信息。從而有助于開展網(wǎng)站信息推送服務以及個人信息的定制服務,吸引更多的用戶。附:Web數(shù)據(jù)挖掘中常用的技術:數(shù)據(jù)挖掘領域常用的分類聚類技術、關聯(lián)規(guī)則技術序列模式技術和Web特有的路徑分析技術等。分類聚類技術數(shù)據(jù)分類技術可以通過挖掘數(shù)據(jù)中的某些共同特性從而對數(shù)據(jù)項進行分類。在Web數(shù)據(jù)挖掘中,分類技術可以根據(jù)捕獲的Web訪問用戶的個人信息或共同的訪問模式得出訪問某一服務器文件的用戶特征。常用的數(shù)據(jù)分類技術有:判定樹歸納、貝葉斯分類和貝葉斯網(wǎng)絡、神經(jīng)網(wǎng)絡、基于案例的推理、遺傳算法、粗糙集方法和模糊集方法。聚類是一個將物理或者抽象對象的集合分組成由類似的對象組成的多個類或簇的過程。聚類分析技術能用于對Web上的文檔進行分類,已發(fā)現(xiàn)信息。聚類分析能作為一個獨立的工具來獲得數(shù)據(jù)分布的情況,觀察每個簇的特點,集中對某些簇做進一步的分析。常用的聚類算法大體上可以劃分為幾類:劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法和基于模型的方法。關聯(lián)規(guī)則挖掘技術關聯(lián)規(guī)則挖掘技術主要用于從用戶訪問序列數(shù)據(jù)庫的序列項中挖掘出相關的規(guī)則。在Web挖掘中,關聯(lián)規(guī)則挖掘就是要挖掘出用戶在一個訪問會話期間從服務器上訪問的頁面或文件之間的聯(lián)系,這些頁面之間可能并不存在直接的引用關系。最常用的算法是Aprior算法,它從事務數(shù)據(jù)庫中挖掘出最大頻繁訪問項集,這個項集就是關聯(lián)規(guī)則挖掘出來的用戶訪問模式。時間序列模式挖掘技術時間序列模式數(shù)據(jù)挖掘就是要挖掘出交易集之間的有時間序列的模式。在網(wǎng)站服務器日志里,用戶的訪問是以一段時間為單位記載的。經(jīng)過數(shù)據(jù)凈化和事件交易確認得到一個間斷的時間序列,這些序列所反映的用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論