雨課堂在線學堂《大數(shù)據(jù)技術與應用》作業(yè)單元考核答案_第1頁
雨課堂在線學堂《大數(shù)據(jù)技術與應用》作業(yè)單元考核答案_第2頁
雨課堂在線學堂《大數(shù)據(jù)技術與應用》作業(yè)單元考核答案_第3頁
雨課堂在線學堂《大數(shù)據(jù)技術與應用》作業(yè)單元考核答案_第4頁
雨課堂在線學堂《大數(shù)據(jù)技術與應用》作業(yè)單元考核答案_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1/3單選題(1分)李院士提到統(tǒng)計學中對數(shù)據(jù)的基本要求是_______。大數(shù)據(jù)的一個標志性的特點是_______。滿足獨立同分布,滿足獨立同分布滿足獨立同分布,不滿足獨立同分布不滿足獨立同分布,滿足獨立同分布不滿足獨立同分布,不滿足獨立同分布答案B2/3單選題(1分)統(tǒng)計學中數(shù)據(jù)量一般_______數(shù)據(jù)維數(shù)。大數(shù)據(jù)中數(shù)據(jù)量_______數(shù)據(jù)維數(shù)。因此在大數(shù)據(jù)處理中需要進行_______。大于,小于,稀疏建模大于,小于,降維處理小于,大于,降維處理小于,大于,稀疏建模答案B3/3單選題(1分)李院士介紹的圖像分類實驗中效果最好的算法是_______,準確率能夠達到_______左右。DeepLearning,15%MachineLearning,25%DeepLearning,25%MachineLearning,15%答案A1/3單選題(1分)吳甘沙先生提到大數(shù)據(jù)的三大思想是______。全集,混雜性,因果性采樣,混雜性,相關性全集,混雜性,相關性采樣,精確性,因果性答案C2/3單選題(1分)不同于傳統(tǒng)數(shù)據(jù)分析假設,大數(shù)據(jù)先______,再______。大數(shù)據(jù)的挖掘能夠發(fā)現(xiàn)數(shù)據(jù)的______。進行假設,采集數(shù)據(jù)驗證,相關性采集數(shù)據(jù),進行數(shù)據(jù)挖掘,相關性進行假設,采集數(shù)據(jù)驗證,因果性采集數(shù)據(jù),進行數(shù)據(jù)挖掘,因果性答案B3/3單選題(1分)吳甘沙先生舉了______的例子作為正面樣例,說明大數(shù)據(jù)分析中storytelling的重要性。魔球理論Target預測消費者懷孕Facebook推送內容與用戶情緒變化Uber數(shù)據(jù)分析答案A1/3單選題(1分)董先生提到,NoSQL解決了數(shù)據(jù)的_____的問題,但會失去_____。Scalability,一致性Scalability,容錯性Transaction,一致性Transaction,容錯性答案A2/3單選題(1分)Google的三篇BigDataPapers不包括_____。MapReduceGFSSparkBigTable答案C3/3單選題(1分)λ架構的三層架構不包括_____。batchlayerspeedlayerservinglayerdatalayer答案D1/3單選題(1分)楊光信先生提到的幾次變革中,由On-premise向Cloud變革的源動力為________。可擴展性不足適應新的硬件環(huán)境數(shù)據(jù)時效性數(shù)據(jù)架構成本答案D2/3單選題(1分)MPP最大部署規(guī)模約為________,Hadoop最大部署規(guī)模約為________。數(shù)十臺,數(shù)百臺數(shù)百臺,數(shù)萬臺數(shù)千臺,數(shù)萬臺數(shù)萬臺,數(shù)百萬臺答案B3/3單選題(1分)分布式系統(tǒng)使用________原則替代原有的________原則,主要是犧牲了一定的________。ACID,BASE,可用性ACID,BASE,一致性BASE,ACID,可用性BASE,ACID,一致性答案D1/3單選題(1分)信息可視化參考模型總共有________層3456答案C2/3單選題(1分)可視化設計對應學科是________。數(shù)據(jù)挖掘信息可視化人機交互認知信息學答案B3/3單選題(1分)選項中不屬于基于Planarity的布局算法是________。樹布局彈簧電荷布局層次布局正交布局答案B1/3單選題(1分)以下不屬于彭元先生所介紹的OpenSOC平臺收集的攻擊樣本的是________。DNS查詢日志W(wǎng)ebShare樣本病毒樣本APT事件答案A2/3單選題(1分)傳統(tǒng)安全手段中,網(wǎng)銀的雙因子認證是基于________。流量及文件特征頻率監(jiān)測算法身份識別token黑名單阻斷答案C3/3單選題(1分)在大數(shù)據(jù)時代,通過________可以解決未公開漏洞難防的問題。態(tài)勢感知威脅情報搜集攻擊溯源行為識別答案D1/3單選題(1分)鐘院士將人類發(fā)現(xiàn)問題、定義問題的能力稱為人類的_________。經(jīng)驗智慧規(guī)范智慧顯性智慧隱性智慧答案D2/3單選題(1分)鐘院士定義機制主義人工智能中,C型具備的是_________的知識。經(jīng)驗性規(guī)范性專家性常識性答案D3/3單選題(1分)目前人工智能研究的主要流派中,通過專家系統(tǒng)內置規(guī)范知識,用推理來解決問題的是_________。結構主義功能主義行為主義機械主義答案B1/3單選題(1分)2005年NIST對機器翻譯的評測中,從中文到英文的翻譯一致性最高能達到約________。25%35%45%55%答案B2/3單選題(1分)吳軍博士舉了大數(shù)據(jù)在傳統(tǒng)行業(yè)應用的三個例子不包括________。風力發(fā)電機葉片更換Prada時裝擺放位置TARGET百貨發(fā)票寄送電視臺收視率統(tǒng)計答案D3/3單選題(1分)吳軍博士提到Google進行癌癥影像診斷的例子中,使用了約________個病例,檢測準確率能達到________。500萬,95%200萬,98%100萬,98%1000萬,95%答案B1/3單選題(1分)蘇中先生介紹的QA系統(tǒng)聚合了多個已有系統(tǒng)的成果并取得很好的效果,其中應用了________的思想。BaggingBoostingWrapperEmbedding答案B2/3單選題(1分)蘇中先生認為目前制約CPU繼續(xù)發(fā)展的因素主要是功耗受________影響。人腦的功耗大約為________。核數(shù),50瓦線程數(shù),100瓦主頻,20瓦集成度,5瓦答案C3/3單選題(1分)截止蘇中先生演講時,考慮所有終端之和,移動設備的存儲能力________服務器,計算能力________服務器。強于,強于強于,弱于弱于,強于弱于,弱于答案B1/5單選題(1分)根據(jù)消費者權益保護法,收集、使用消費者個人信息要遵守哪些原則?正當、合法、必要正當、準確、合法正當、合理、必要合法、合理、必要答案A2/5判斷題(1分)根據(jù)演講者的理解:大數(shù)據(jù)的特征不僅僅是數(shù)據(jù)規(guī)模大,更重要的一個特征就是這些數(shù)據(jù)之間的關系十分復雜。答案√3/5判斷題(1分)不同行業(yè)的敏感信息基本相同,主要包括基因、病例、健康歷史、犯罪記錄、家庭住址、私人活動等。答案×4/5判斷題(1分)能否識別特定自然人是分享、公開個人信息數(shù)據(jù)時的一個重要紅線。答案√5/5判斷題(1分)數(shù)據(jù)公司在數(shù)據(jù)的法律層面必須關注的五個核心風險點有:知識產權,監(jiān)管,數(shù)據(jù)外泄,用戶投訴和媒體曝光。答案√1/3單選題(1分)對于典型的大數(shù)據(jù)問題,解決問題的效果隨著采樣率的降低而____。顯著降低緩慢降低基本不變答案A2/3單選題(1分)不同于傳統(tǒng)的IOE系統(tǒng),互聯(lián)網(wǎng)企業(yè)在挖掘數(shù)據(jù)對廣告的變現(xiàn)價值時更多地使用了____。交易數(shù)據(jù)行為數(shù)據(jù)答案B3/3單選題(1分)在講座介紹的廣告?zhèn)€性化推薦系統(tǒng)框架中,盡量避免使用的是____。關系型數(shù)據(jù)庫HadoopSparkStorm答案A1/5判斷題(1分)廣義上,區(qū)塊鏈技術包括分布式共識、隱私與安全保護等技術。答案√2/5判斷題(1分)對信息使用哈希算法之后,信息沒有減少。答案×3/5單選題(1分)區(qū)塊鏈技術的三次熱潮不包括以下的哪一項:比特幣為代表的加密貨幣以太坊帶來的性能大幅提升區(qū)塊鏈為基礎的分布式賬本技術互聯(lián)網(wǎng)資本關注帶來的應用加速落地答案B4/5單選題(1分)以下哪項不是區(qū)塊鏈技術解決的數(shù)據(jù)科學目前面臨的挑戰(zhàn)?數(shù)據(jù)的真實性數(shù)據(jù)的安全交換和隱私保護數(shù)據(jù)價值的衡量和實現(xiàn)大量數(shù)據(jù)的存儲和處理答案D5/5單選題(1分)以下哪項不是確保數(shù)據(jù)安全交換和流通的技術?所有權確認數(shù)據(jù)隱私保護數(shù)據(jù)清洗自動化交易答案C1/3單選題(1分)LR、GBDT、FM各自適合處理的特征是_____、_____、_____。離散、稀疏、連續(xù)稀疏、連續(xù)、離散離散、稠密、稀疏稀疏、連續(xù)、稠密答案C2/3單選題(1分)根據(jù)講座,相比于被動推薦方式,_____不是主動推薦方式的特點。內容個性化環(huán)境個性化人群個性化渠道個性化答案A3/3單選題(1分)為了解決用戶興趣收斂問題,可以應用_____模型。Follow-the-regularized-LeaderDeepNeuralNetworksGBDT+FactorizationMachineExploreandExploit答案D1/3單選題(1分)用戶理解在業(yè)界通常有Persona和Profile兩種分析方法,它們的特點分別是_____和_____。數(shù)據(jù)量大,數(shù)據(jù)量小用戶角色,用戶畫像描述幾類典型用戶,表達任意目標群體實現(xiàn)了自動化,便于人工分析答案C2/3單選題(1分)針對標簽有偏、標簽抖動和無(單)標簽問題,講者提到的可行解決方案是_____、_____、_____。將數(shù)據(jù)劃分成區(qū)間、結合回歸與分類方法、參考第三方數(shù)據(jù)將數(shù)據(jù)劃分成區(qū)間、引入投票機制、參考第三方數(shù)據(jù)PUlearning,多天投票,參考第三方數(shù)據(jù)參考第三方數(shù)據(jù),多天投票,PUlearning答案D3/3單選題(1分)根據(jù)講座內容,基于WOI數(shù)據(jù),不包括以下哪種應用?設備簇發(fā)現(xiàn)家庭結構推測出行軌跡識別早新聞定時推送答案A1/3單選題(1分)愛奇藝用于大數(shù)據(jù)選角的策略是_____。知識庫知識庫、專家系統(tǒng)用戶畫像系統(tǒng)知識庫、用戶畫像系統(tǒng)答案D2/3單選題(1分)與BiLSTM+CRF模型相比,LatticeLSTM模型的改進是_____。可以用字作為單位進行編碼利用到左右語境的信息把分詞作為一個軟性的特征串聯(lián)到字向量里面以上都是答案C3/3單選題(1分)電影評分中貝葉斯平均法的思路是_____。考慮打分的分布情況引入先驗概率引入多項分布引入德里克雷分布答案B1/5判斷題(1分)AI前景非常廣闊,且現(xiàn)在AI技術已經(jīng)成熟。答案×2/5判斷題(1分)對話作為更自然的人機交互方式,在未來3-5年將成為非常重要的服務入口。答案√3/5單選題(1分)人工智能的作用對應到人的三個方面不包括感知與分析理解與思考觀察與學習決策與交互答案C4/5單選題(1分)下面哪一項不屬于營銷畫像應用四階段?單點畫像,解決業(yè)務痛點連點成面,活動營銷產品化激發(fā)創(chuàng)意,活動營銷場景化開拓市場,活動營銷國際化答案D5/5單選題(1分)下面哪一項不屬于在菜品畫像構建過程中數(shù)據(jù)處理的方法?數(shù)據(jù)清洗人工打標機器學習打標語義消歧答案A1/4單選題(1分)影響該方法的真正因素是____。數(shù)據(jù)量的大小有效特征的輸入訓練的迭代次數(shù)參數(shù)的自適應調整答案B2/4單選題(1分)趙楠先生概括用戶畫像包括____和____兩種屬性。靜態(tài),動態(tài)主觀,客觀基本,行為過程,結果答案C3/4單選題(1分)趨勢預測的偏差相對較小,而細粒度預測是一個很大的挑戰(zhàn),為了解決這個問題,美團旅行做了______、未來的間夜預測、將預測拆分到SKU這三件事。統(tǒng)計庫存約束根據(jù)售賣時間計算售賣占比統(tǒng)計歷史SKU售賣情況還原歷史的用戶需求答案D4/4單選題(1分)實踐證明預測效果較好的方法是____,時間序列邏輯回歸xgboost模型GBDT算法答案C1/2單選題(1分)據(jù)陳彧總結,以下哪項不是“大數(shù)據(jù)”和傳統(tǒng)的“小數(shù)據(jù)”的區(qū)別?數(shù)據(jù)規(guī)模的采樣聚合與全量數(shù)據(jù)結構的結構化與非結構化數(shù)據(jù)質量的高與參差不齊數(shù)據(jù)來源的集中與分散答案D2/2單選題(1分)對于客戶信用問題,使用弱數(shù)據(jù)相比于使用強數(shù)據(jù)有什么優(yōu)勢?可以冷啟動,并且能夠避免經(jīng)濟周期帶來的強數(shù)據(jù)的誤差需求的數(shù)據(jù)質量不高,數(shù)據(jù)的獲取難度降低數(shù)據(jù)處理更加簡單,能夠節(jié)約海量客戶情況下的計算資源數(shù)據(jù)更加模糊,能夠保護用戶隱私答案A1/4單選題(1分)下面哪個角色不是阿里DMP的核心參與者?數(shù)據(jù)提供方數(shù)據(jù)消費方數(shù)據(jù)存儲方數(shù)據(jù)加工方答案C2/4單選題(1分)下面哪個不是阿里精準營銷閉環(huán)的環(huán)節(jié)之一?消費者透視營銷觸達數(shù)據(jù)變現(xiàn)效果反饋答案C3/4多選題(2分)在演講者看來,下面哪些是大數(shù)據(jù)的的重要特征?數(shù)據(jù)量大彼此關聯(lián)場景多樣持續(xù)更新答案<spandata-v-268de5e8=""class="radio_jqqunselectablepointDefaultmultiply">A<spandata-v-268de5e8=""class="radio_jqqunselectablepointDefaultmultiply">B<spandata-v-268de5e8=""class="radio_jqqunselectablepointDefaultmultiply">C<spandata-v-268de5e8=""class="radio_jqqunselectablepointDefaultmultiply">D4/4單選題(1分)下面那個不是阿里集團提出“去IOE”項目的原因高昂的軟件License海量數(shù)據(jù)的計算時長難以接受傳統(tǒng)IOE架構甚至無法滿足功能需求軟件開發(fā)人員編程難度過大答案D1/3單選題(1分)在講座中提到的在線營銷的幾種結算方式中,對流量方有利的方式是___,對商家更有利的方式是___,優(yōu)質流量更有可能以___方式結算。CPS/CPA,CPM,CPMCPS/CPA,CPM,CPS/CPACPM,CPS/CPA,CPMCPM,CPS/CPA,CPS/CPA答案C2/3單選題(1分)在講座提到的實時競價體系中,DSP、SSP和ADExchange三方的角色分別是對用戶流量報價,識別用戶并標記,提供用戶流量對用戶流量報價,提供用戶流量,識別用戶并標記識別用戶并標記,對用戶流量報價,提供用戶流量識別用戶并標記,提供用戶流量,對用戶流量報價答案B3/3單選題(1分)請根據(jù)講座中介紹的GSP競價機制,計算商家B獲取的流量與價格。其中網(wǎng)站提供的流量為100萬次展現(xiàn),底價為6.00元。分別有A、B、C共3個商家提供CPM報價,分別為9.99元,8.99元,7.99元,其預算分別為2700元、1800元和1000元。20萬,9元18萬,10元22.5萬,8元答案C1/3單選題(1分)下面哪個不是演講者提及的搜索引擎排名模塊(Ranking)中的重要技術問題?CTR預測ROI預測競價Lookalike算法答案D2/3判斷題(1分)數(shù)據(jù)稀疏可能會對模型的效果造成重要的影響。答案√3/3判斷題(1分)提高特征維度、增大數(shù)據(jù)容量往往會在一定程度上提高模型的準確率,所以線上系統(tǒng)應該盡量使用更多的特征、更多的數(shù)據(jù)。答案×1/3單選題(1分)案例1中,對于全程調度問題,解決的架構包括____、____、____三大模塊。底層上游下游業(yè)務數(shù)據(jù)準備機器學習估計運籌優(yōu)化目標用戶畫像騎手畫像商家畫像建模優(yōu)化評估答案B2/3單選題(1分)即時配送在業(yè)務層面上面臨的三個趨勢是____、____、____。需求個性化運力差異化品類多樣化時間規(guī)劃精細化區(qū)域調度精細化多業(yè)務協(xié)同客戶量大需求多樣品類多樣配送規(guī)范無人機器配送短距離電商

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論