傻傻分不清的理論-第十一天附有答案_第1頁
傻傻分不清的理論-第十一天附有答案_第2頁
傻傻分不清的理論-第十一天附有答案_第3頁
傻傻分不清的理論-第十一天附有答案_第4頁
傻傻分不清的理論-第十一天附有答案_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

傻傻分不清的理論第十一天[復(fù)制]1.(單選)WebMagic使用哪個日志框架作為slf4j的實現(xiàn).如果你自己定制了slf4j的實現(xiàn)[單選題]*A.log4jB.logbackC.slf4j-log4j12(正確答案)D.以上都不對2.(單選)webmagic-core的目標是什么[單選題]*A.是成為網(wǎng)頁爬蟲的一個教科書般的實現(xiàn)。(正確答案)B.注解格式定義爬蟲C.模擬瀏覽器進行頁面渲染D.分布式支持3.(單選)webmagic遵循哪個開發(fā)協(xié)議?[單選題]*A.gunB.Apache2.0協(xié)議(正確答案)C.httpD.tcp4.(單選)WebMagic中的Downloader組件作用是什么?[單選題]*A.下載、(正確答案)B.處理、C.管理D.持久化5.(單選)WebMagic中的Pipeline組件作用是什么?[單選題]*A.下載、B.處理、C.管理D.持久化(正確答案)6.(單選)WebMagic中的Scheduler組件作用是什么?[單選題]*A.下載、B.處理、C.管理(正確答案)D.持久化7.(單選)WebMagic中的PageProcessor組件作用是什么?[單選題]*A.下載、B.處理、(正確答案)C.管理D.持久化8.(單選)用于數(shù)據(jù)流轉(zhuǎn)的對象Request的作用是什么?[單選題]*A.對URL地址的一層封裝(正確答案)B.代表了從Downloader下載到的一個頁面C.保存PageProcessor處理的結(jié)果D.以上都不對9.(單選)用于數(shù)據(jù)流轉(zhuǎn)的對象Page的作用是什么?[單選題]*A.對URL地址的一層封裝B.代表了從Downloader下載到的一個頁面(正確答案)C.保存PageProcessor處理的結(jié)果D.以上都不對10.(單選)用于數(shù)據(jù)流轉(zhuǎn)的對象ResultItems的作用是什么?[單選題]*A.對URL地址的一層封裝B.代表了從Downloader下載到的一個頁面C.保存PageProcessor處理的結(jié)果(正確答案)D.以上都不對11.(單選)哪個是是WebMagic操作的入口,它封裝了爬蟲的創(chuàng)建、啟動、停止、多線程等功能[單選題]*A.DownloaderB.、PageProcessorC.、SchedulerD.、PipelineE.Spider(正確答案)12.(單選)哪個是WebMagic內(nèi)部流程的核心[單選題]*A.DownloaderB.、PageProcessorC.、SchedulerD.、PipelineE.Spider(正確答案)13.(單選)Downloader作用是什么[單選題]*A.負責從互聯(lián)網(wǎng)上下載頁面(正確答案)B.負責解析頁面,抽取有用信息C.負責管理待抓取的URL,以及一些去重的工作D.負責抽取結(jié)果的處理14.(單選)PageProcessor作用是什么[單選題]*A.負責從互聯(lián)網(wǎng)上下載頁面B.負責解析頁面,抽取有用信息(正確答案)C.負責管理待抓取的URL,以及一些去重的工作D.負責抽取結(jié)果的處理15.(單選)Scheduler作用是什么[單選題]*A.負責從互聯(lián)網(wǎng)上下載頁面B.負責解析頁面,抽取有用信息C.負責管理待抓取的URL,以及一些去重的工作(正確答案)D.負責抽取結(jié)果的處理16.(單選)Pipeline作用是什么[單選題]*A.負責從互聯(lián)網(wǎng)上下載頁面B.負責解析頁面,抽取有用信息C.負責管理待抓取的URL,以及一些去重的工作D.負責抽取結(jié)果的處理(正確答案)17.(單選)Spider是爬蟲啟動的入口,其中thread(n)作用是[單選題]*A.開啟n個線程(正確答案)B.啟動C.異步啟動D.停止爬蟲18.(單選)Spider是爬蟲啟動的入口,其中run()作用是[單選題]*A.開啟n個線程B.啟動(正確答案)C.異步啟動D.停止爬蟲19.(單選)Spider是爬蟲啟動的入口,其中start()/runAsync()作用是[單選題]*A.開啟n個線程B.啟動C.異步啟動(正確答案)D.停止爬蟲20.(單選)Spider是爬蟲啟動的入口,其中stop()作用是[單選題]*A.開啟n個線程B.啟動C.異步啟動D.停止爬蟲(正確答案)1.WebMagic特性有*A.簡單的API,可快速上手(正確答案)B.模塊化的結(jié)構(gòu),可輕松擴展(正確答案)C.提供多線程和分布式支持(正確答案)D.支持任何語言2.WebMagic由四個組件構(gòu)成,分別是*A.Downloader(正確答案)B.、PageProcessor(正確答案)C.、Scheduler(正確答案)D.、Pipeline(正確答案)3.WebMagic的主要部分是*A.webmagic-core(正確答案)B.webmagic-extension(正確答案)C.webmagic-MVCD.webmagic-downloadE.webmagic-selenium4.WebMagic的外圍功能有*A.webmagic-samples(正確答案)B.webmagic-scripts(正確答案)C.webmagic-selenium(正確答案)D.webmagic-saxon(正確答案)5.WebMagic的生命周期包含*A.鏈接提取、(正確答案)B.頁面下載、(正確答案)C.內(nèi)容抽取、(正確答案)D.持久化(正確答案)6.WebMagic支持哪些特性*A.支持多線程抓取,(正確答案)B.分布式抓取,(正確答案)C.支持自動重試、(正確答案)D.自定義UA/cookie(正確答案)7.WebMagic可以支持哪些方式進行鏈接和內(nèi)容的提取*A.css(正確答案)B.selector、(正確答案)C.xpath(正確答案)D.正則表達式(正確答案)8.webmagic-extensionwebmagic的擴展模塊,提供一些更方便的編寫爬蟲的工具。包括哪些支持?*A.注解格式定義爬蟲、(正確答案)B.JSON、(正確答案)C.分布式(正確答案)D.以上都對(正確答案)9.webmagic的主要特色有哪些?*A.完全模塊化的設(shè)計,強大的可擴展性。(正確答案)B.核心簡單但是涵蓋爬蟲的全部流程,靈活而強大,也是學習爬蟲入門的好材料(正確答案)C.提供豐富的抽取頁面API。(正確答案)D.無配置,但是可通過POJO+注解形式實現(xiàn)一個爬蟲。(正確答案)10.webmagic的有哪些優(yōu)點?*A.支持多線程。(正確答案)B.支持分布式。(正確答案)C.支持爬取js動態(tài)渲染的頁面。(正確答案)D.無框架依賴,可以靈活的嵌入到項目中去。(正確答案)1.(判斷)WebMagic是一個簡單靈活的Java爬蟲框架[單選題]*A.正確(正確答案)B.錯誤2.(判斷)WebMagic需要依賴<groupId>us.codecraft</groupId>[單選題]*<artifactId>webmagic-core</artifactId>A.正確(正確答案)B.錯誤3.(判斷)WebMagic需要依賴<groupId>us.codecraft</groupId>[單選題]*<artifactId>webmagic-extension</artifactId>A.正確(正確答案)B.錯誤4.(判斷)WebMagic是開源的[單選題]*A.正確(正確答案)B.錯誤5.(判斷)WebMagic的設(shè)計參考了業(yè)界最優(yōu)秀的爬蟲Scrapy[單選題]*A.正確(正確答案)B.錯誤6.(判斷)WebMagic具有很好的擴展性[單選題]*A.正確(正確答案)B.錯誤7.(判斷)wegMagic注重實用性[單選題]*A.正確(正確答案)B.錯誤8.(判斷)WebM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論