《數(shù)據(jù)采集與預(yù)處理》課件0:課程簡介_第1頁
《數(shù)據(jù)采集與預(yù)處理》課件0:課程簡介_第2頁
《數(shù)據(jù)采集與預(yù)處理》課件0:課程簡介_第3頁
《數(shù)據(jù)采集與預(yù)處理》課件0:課程簡介_第4頁
《數(shù)據(jù)采集與預(yù)處理》課件0:課程簡介_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

課程學(xué)習(xí)方法1課程主要模塊課程簡介目錄職業(yè)發(fā)展趨勢2課程學(xué)習(xí)方法3國內(nèi)大數(shù)據(jù)行業(yè)發(fā)展的如火如荼,作為互聯(lián)網(wǎng)時代新型的產(chǎn)業(yè),大數(shù)據(jù)行業(yè)其實是互聯(lián)網(wǎng)和計算機結(jié)合的產(chǎn)物,互聯(lián)網(wǎng)實現(xiàn)了數(shù)據(jù)的網(wǎng)絡(luò)化,計算機實現(xiàn)了數(shù)據(jù)的數(shù)字化,兩者結(jié)合賦予了大數(shù)據(jù)生命力。大數(shù)據(jù)時代的到來,簡單的說是海量數(shù)據(jù)完美計算能力結(jié)合的結(jié)果。確切的說是移動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)產(chǎn)生了海量的數(shù)據(jù),大數(shù)據(jù)計算技術(shù)完美的解決了海量數(shù)據(jù)的收集、存儲、計算、分析的問題。大數(shù)據(jù)時代開啟人類社會利用數(shù)據(jù)價值的另一個時代。因大數(shù)據(jù)計算技術(shù)可以完美地解決海量數(shù)據(jù)的收集、存儲、計算、分析的問題,所以移動通信、導(dǎo)航、電商、社交等互聯(lián)網(wǎng)現(xiàn)狀無一不在推動著大數(shù)據(jù)行業(yè)的快速發(fā)展。簡單來說,大數(shù)據(jù)的發(fā)展是因為可以迎合互聯(lián)網(wǎng)時代的剛需。

職業(yè)發(fā)展趨勢

大數(shù)據(jù)相關(guān)崗位

職業(yè)發(fā)展趨勢

職業(yè)發(fā)展趨勢語言受歡迎程度IEEESpectrum2020編程語言Top10職業(yè)發(fā)展趨勢

職業(yè)發(fā)展趨勢

一個爬蟲工程師的成長之路/p/112038604職業(yè)發(fā)展趨勢2職業(yè)發(fā)展趨勢課程簡介目錄課程主要模塊1課程考核及學(xué)習(xí)方法3課程主要模塊知識模塊學(xué)時第一模塊數(shù)據(jù)采集基礎(chǔ)4第二模塊靜態(tài)網(wǎng)頁數(shù)據(jù)采集18(實驗8)第三模塊動態(tài)網(wǎng)頁數(shù)據(jù)采集8(實驗2)第四模塊Scrapy框架10(實驗4)第五模塊數(shù)據(jù)清洗pandas6(實驗2)總學(xué)時:48,理論32,實驗16課程主要模塊(1)理解數(shù)據(jù)采集與清洗在大數(shù)據(jù)生命周期的應(yīng)用(2)理解大數(shù)據(jù)環(huán)境下的數(shù)據(jù)采集方法(3)理解爬蟲的基本原理(4)掌握Requests庫的get和post方法(5)掌握selenium庫的元素查找、元素操縱、窗口切換方法(6)掌握Xpath、BeautifulSoup、CSS選擇器、正則表達式等解析方法(7)掌握Scrapy框架的基本原理、運用BasicSpider和CrawlSpider編寫爬蟲(8)掌握數(shù)據(jù)的文件,關(guān)系型數(shù)據(jù)庫的存儲方法(9)掌握Pandas對采集數(shù)據(jù)進行數(shù)據(jù)清洗的方法課程主要模塊工具與設(shè)備:1、筆記本或臺式電腦2、python開發(fā)工具、Pycharm等主流IDE3、MySQL數(shù)據(jù)庫4、互聯(lián)網(wǎng)環(huán)境周二上理論課,不需要電腦;周五需要帶上自己的筆記本電腦進行實驗3職業(yè)發(fā)展趨勢課程簡介目錄課程考核及學(xué)習(xí)方法1課程主要模塊2課程考核平時成績:占50%(課堂表現(xiàn)10,實驗報告20,章節(jié)測試20)考試成績:占50%(閉卷理論考試)課堂表現(xiàn)正確回答問題+(2~5)分,錯誤不扣分;上課不準(zhǔn)玩手機、睡覺、說話;不能遲到、早退;曠課(3次取消考試資格)學(xué)習(xí)方法課堂上準(zhǔn)備一個練習(xí)本,針對重點知識和案例進行課堂練習(xí)認真對待作業(yè),代碼可以在本機環(huán)境中運行,提交到超星平臺學(xué)會獨立思考,嘗試用不同的思路或方法完成案例推薦學(xué)習(xí)網(wǎng)站和教學(xué)資源網(wǎng)絡(luò)爬蟲與信息提取(嵩天)/course/BIT-1001870001PythonPython數(shù)據(jù)分析與展示(嵩天)/cour

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論