文本數(shù)據分析案例需求+數(shù)據準備_第1頁
文本數(shù)據分析案例需求+數(shù)據準備_第2頁
文本數(shù)據分析案例需求+數(shù)據準備_第3頁
文本數(shù)據分析案例需求+數(shù)據準備_第4頁
文本數(shù)據分析案例需求+數(shù)據準備_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

案例需求+數(shù)據準備教師:亢華愛北京信息職業(yè)技術學院商務數(shù)據分析與應用專業(yè)教學資源庫目錄Contents案例需求概述數(shù)據準備1PART概述概述伴隨著互聯(lián)網的普及,電子商務獲得了迅速地發(fā)展,國內市場中知名的電商平臺有淘寶、天貓、京東等,這使得網絡購物成為一種趨勢概述?大家在網購時都會擔心這樣的問題:實物的質量是否與商品描述相符通常大家會參考已購用戶的評價進行判斷本章將針對某寶網站中某衛(wèi)衣的用戶評價進行簡單的分析,并使用詞云渲染一些關鍵詞2PART案例需求案例需求詞云就是對網絡文本中出現(xiàn)頻率比較高的“關鍵詞”予以視覺上的突岀,形成關鍵詞渲染,從而過濾掉大量的文本信息,使得瀏覽網頁的人一眼掃過文本就可以領略文本的主旨,具體如圖8-7所示。圖8-7

詞云示例案例需求本案例設計目的獲取某網站中用戶對某衛(wèi)衣的評論,從這些評論文本中篩選出現(xiàn)頻率較高的一些詞語,并使用詞云的方式進行展示,讓有意向購買此商品的用戶能夠快速地了解到其他用戶對該產品的感受,并為他們提供有效地參考依據。3PART數(shù)據準備通過網絡爬蟲技術爬取某網站中某衛(wèi)衣的評價信息,并保存到“商品評價信息.csv”文件中,使用Excel工具打開后如圖8-8所示。數(shù)據準備圖8-8打開“商品評價信息.CSV”文件數(shù)據準備在某寶平臺的評價系統(tǒng)中,如果用戶沒有做出評價,會以“此用戶未評價”的信息顯示到評價板上,并且在交易完成的15天后系統(tǒng)自動默認給予賣家好評圖8-7中可能會存在一些相同的評價、無意義的評價、未評價等文本,這類評價信息對我們后期的分析是沒有任何意義的,所以需要將這些評價信息進行一些處理參考文獻[1]黑馬程序員.Python數(shù)據分析與應用:從數(shù)據獲取到可視化.中國鐵道出版社:2019.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論