版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
11.下面不屬于大數(shù)據(jù)4V特性有()。B、類型多C、速度快D、應用價值高解析:數(shù)據(jù)科學理論與實踐2.線性模型試圖學得一個屬性的(_)來進行預測的函數(shù)。A、線性組合B、非線性組合解析:機器學習3.給定測試樣本,基于某種距離度量找出訓練集中與其最靠近的k個訓練樣本,然后基于這k個樣本的信息來進行預測。這種學習算法稱為()。B、k近鄰學習C、隨機森林25.(_)算法是一種挖掘關聯(lián)規(guī)則的頻繁項集算法,其核心思想是通解析:https://baike.baidu./item/APRI0RI/200074638.支持向量機優(yōu)化問題的形式是(_)。10.下列哪項具體任務不屬于情感分析?()513.LasVegasWrapper在拉斯維加斯方法框架下使用(_)策略來進行子集搜15.下面對線性模型中偏置值b的說法正確的是(_)。6721.LSTM中門的輸出是()之間的實數(shù)向量。C、0到-1D、1到2822.以下描述不正確的是()。23.下面對范數(shù)規(guī)則化描述錯誤的是()。24.Dave于2012年發(fā)布(_)首次全面地刻畫了當時快速發(fā)展的大數(shù)據(jù)技術體9表示向量中存在大量的0.這樣的向量稱為()。28.下列對于查準率的描述,解釋正確的是()。129.數(shù)據(jù)戰(zhàn)略的目標是()。文本(段落或者文檔)被看作是()的詞匯集合,忽略語法甚至是單詞的順務?計算不同F(xiàn)之間的關聯(lián)度?()解析:數(shù)據(jù)挖掘:概念與技術(第三版)P7436.考察一個由三個卷積層組成的CNN:kernel=3×3,stride=2,padding=SAME。最低層輸出100個特征映射(featuremap),中間層200個特征映射,最高層400個特征映射。輸入是200×300的RGB圖片,總參數(shù)的數(shù)量是多少?()解析:深度學習201卷積網(wǎng)絡37.1特征分析,2影響分析,3原因分析,4數(shù)據(jù)審計,5忽略,6刪除,7插B、信息是客觀的存在D、信息是對數(shù)據(jù)進行計量形成的記錄49.當閔可夫斯基距離公式中的系數(shù)p值為2時,可得到(_)的公式。54.(_)表達了在當前任務上任何學習算法所能達到的期望泛化誤差的下界,即刻畫了學習問題本身的難度。D、泛化誤差解析:機器學習P4655.tensorflow中的tf.nn.conv2d()的函數(shù),其作用是()。A、圖像輸入B、進行卷積C、進行池化D、圖像輸出解析:/qq_35370018/arti56.F1參數(shù)(_),說明模型越穩(wěn)定。C、越趨近于某一特定值D、F1參數(shù)和模型穩(wěn)定性沒有關系解析:https://zhidao.baidu./question/15008448524332A、PCA61.隱馬爾可夫模型是一種著名的(_)模型。62.K-搖臂賭博機屬于(_)算法。67.IDF采用了IWF的幾次平方?()68.英文如何分詞?()基本流程順序是(_)。73.核主成分分析是一種(_)方法。A、數(shù)據(jù)變換D、二十世紀八十年代是機器學習稱為一個獨立的學科領域、各種機器學習技術解析:機器學習P10,1187.(_)中基學習器的多樣性不僅來自樣本擾動,還來自屬性擾動。D、傳統(tǒng)決策樹解析:機器學習P18088.處理文本數(shù)據(jù),循環(huán)神經網(wǎng)絡與前饋神經網(wǎng)絡相比有()的優(yōu)點。B、訓練結果不會發(fā)散C、不需要激活函數(shù)C、知識是從相關信息中過濾、提煉及加工而解析:數(shù)據(jù)科學理論與實踐P290.在支持向量機中,(_)允許支持向量機在一些樣本上出錯。A、硬間隔B、軟間隔D、拉格朗日乘子法解析:機器學習P12991.主成分分析的優(yōu)化目標是一個()。解析:機器學習P23092.下面不屬于數(shù)據(jù)科學平臺的有(_)。解析:圖像處理、分析與機器視覺分割P125B、小數(shù)據(jù)可能沒價值,但是小數(shù)據(jù)組成的大數(shù)據(jù)卻很有價值,這叫做價值涌現(xiàn)D、小數(shù)據(jù)可能不涉及隱私,但是大數(shù)據(jù)可能嚴重威脅個人隱私,這叫隱私涌現(xiàn)95.一個輸入為(32,32,3)的數(shù)據(jù)集,通過一個大小為2×2的不重疊最大池化層,輸出()。97.()度量了學習算法的期望預測與真實結果的偏離程度。100.預剪枝是指在決策樹生成過程中,對每個結點在劃分(_)進行估計。104.圖像識別常用softmax函數(shù)接在模型的輸出上,其作用為:()。A、增加不同類別之間的區(qū)分度B、突出輸出向量中類標的對應的維度C、對輸出歸一化,同時以概率的更好解釋輸出向量D、過濾無用的環(huán)境信息解析:深度學習深度前饋網(wǎng)絡P105105.做卷積運算的缺點是,卷積圖像的大小會不斷縮小,另外圖像的左上角的元素只被一個輸出所使用,所以在圖像邊緣的像素在輸出中采用較少,也就意味著你丟掉了很多圖像邊緣的信息。為了解決這個問題,在卷積過程中引入了解析:/ice_actor/article/details/106.邊界跟蹤技術技術屬于哪一類分割方法。()A、閾值分割法B、邊緣分割法C、區(qū)域分割法D、特征分區(qū)法107.支持向量機的優(yōu)化問題是最小化<w·w>的平方,這實現(xiàn)了(_)。108.一個輸入為(32,32,3)的數(shù)據(jù)集,通過一個卷積核個數(shù)為8,大小為5*5,步長為1的卷積層,輸出()。A、ORACLE112.LasVegasWrapper是一種典型的(_)算法。115.剪枝是決策樹學習算法對付()的主要手段。119.tf.nn.rnn_cell.BasicLSTMCell(n_hidple=True)函數(shù)中的參數(shù)forget_bias的含義是()。解析:https://blog.csdn.neB、智慧是人類的創(chuàng)造性設計、批判性思考和C、智慧是從信息中發(fā)現(xiàn)的共性規(guī)律、模型、模式、理論、方法等121.后剪枝是先從訓練集生成一顆完整的決策樹,然后()地解析:機器學習122.建立一個模型,通過這個模型根據(jù)已知的變量值來預測其他某個變量值屬于數(shù)據(jù)挖掘的哪一類任務?A、根據(jù)內容檢索B、建模描述C、預測建模D、尋找模式和規(guī)則解析:數(shù)據(jù)挖掘:概念與技術(第三版)P69123.TF-IDF模型中IDF是指(_)。A、詞頻數(shù)B、逆文檔頻率C、詞頻率D、逆文檔頻數(shù)解析:/zhaome124.tensorflow中的tf.nn.max_pool()函數(shù)中的padding參數(shù),作用是()。A、池化方法B、是否要在邊緣補零C、是否要排序D、該層的名稱答案:BA、制定“數(shù)據(jù)戰(zhàn)略”B、研發(fā)“數(shù)據(jù)產品”C、模擬“數(shù)據(jù)學習”D、構建“數(shù)據(jù)生態(tài)系統(tǒng)”解析:機器學習P298D、HTML是非結構化數(shù)據(jù)129.現(xiàn)實中往往會遇到“不完整”的訓練樣本,在這情形下,可用(_)。A、邊際似然D、貝葉斯分類器解析:機器學習C、Rand指數(shù)133.()是具有適應性的簡單單元組成的廣泛并行互聯(lián)的網(wǎng)絡。135.概率模型的訓練過程就是()過程。C、可以通過python將csv文件轉換成Excel格式142.嵌入式選擇是一種(_)算法。146.()度量了同樣大小的訓練集的變動所導致的學習性能的變化。151.一般地,”人“與”馬“分別與”人馬“相似;要達到這個目的,可以令”人“”馬“與”人馬“之間的距離都比較但”人“與”馬“之間的距離很大,此時該距離不滿足(_)。A、非負性D、直遞性解析:機器學習P199-201152.卷積神經網(wǎng)絡中的dropout模塊的作用是()。A、防止結果發(fā)散B、防止梯度消失C、防止報錯D、防止過擬合153.主成分分析是一種常用的(_)方法。種關鍵詞提取算法叫做()。161.tensorflow中的tf.nn.max_pool()的函數(shù),其作用是()。162.下面不屬于NewSQL的有(_)。163.聚類算法的性能度量可稱為(_)。166.在同一個問題中,錯誤率和精度的關系A、錯誤率等于精度值加1B、錯誤率加精度等于1C、精度減錯誤率等于1D、兩者之間沒有關系解析:機器學習P29167.(_)就是把已知物體的模板與圖像中所有未知物體進行比較,如果某一未A、統(tǒng)計法B、句法識別法168.從加工程度看,數(shù)據(jù)產品可以包含的選項有(_);1.內容,2.情感,3.服169.下列不屬于大數(shù)據(jù)4V特性的是().185.任何一個核函數(shù)都隱式地定義了一個(_)空間。A、元數(shù)據(jù)B、主數(shù)據(jù)C、關系數(shù)據(jù)D、業(yè)務數(shù)據(jù)解析:數(shù)據(jù)科學理論與實踐188.長短時記憶神經網(wǎng)絡被設計用來解決什么問題?()解析:深度學習LSTMP249189.以下關于機器學習描述錯誤的是(_)。A、機器學習的目標是使學得的模型能很好地適用于“新樣本”B、學得模型適用于新樣本的能力,稱為“泛化”能力C、具有強泛化能力的模型不能很好地適用于整個樣本空間D、一般認為,數(shù)據(jù)樣本越多,獲得的模型的泛化能力越強答案:C解析:機器學習P3192.(_)由兩層神經元組成。197.將閔可夫斯基距離和(_)結合即可處理混合屬性。A、ValueDifferenceMect答案:A“Botlikesfootball”的詞袋模型表示為:解析:統(tǒng)計自然語言處理語言模型P162,命名實體翻譯P585199.數(shù)據(jù)科學是一門將“現(xiàn)實世界”映射到“數(shù)據(jù)世界”,在“數(shù)據(jù)層次”上研究“現(xiàn)實世界”的問題,并根據(jù)“數(shù)據(jù)世界”的分析結果,對“現(xiàn)實世界”進行預測、解釋或決策的()。200.下面關于貝葉斯學習相關描述正確的有(_)。A、貝葉斯學習等價于頻數(shù)概率D、貝葉斯學習是一種以貝葉斯法則為基礎的,并通過概率手段進行學習的方法201.k近鄰學習是一種()。204.下列對于精度的描述,解釋正確的是(_)。1208.決策樹中的葉結點對應于(_)。209.若學習算法不依賴于環(huán)境建模,則稱為(_)解析:統(tǒng)計自然語言處理情感分析技術評測P737211.一切以數(shù)據(jù)作為驅動或者核心的產品叫做()A、創(chuàng)新性產品B、數(shù)據(jù)產品C、風控產品D、核心產品答案:B解析:數(shù)據(jù)科學理論與實踐P157212.核矩陣是(_)的。A、沒有規(guī)律D、樣本矩陣解析:機器學習213.在馬爾科夫隨機場中,()個變量之間的聯(lián)合概率分布能基于團分解為多個因子的乘積。解析:機器學習P322A、結構化數(shù)據(jù)可以直接用傳統(tǒng)關系數(shù)據(jù)庫進行存儲D、XML不是結構化數(shù)據(jù)215.事件A在另外一個事件B已經發(fā)生條件下的發(fā)生概率,稱為(_)。C、條件概率216.以下選項不包含在DIKW金字塔中的是(217.決策樹的生成是一個(_)過程。219.輸入圖像為32x32,經過步長為1,不進行padding,卷積核為5x5的卷積層后,得到的特征圖尺寸是多少?()222.Relief的擴展變體Relief-F能夠處理(_)問題。223.(_)是神經網(wǎng)絡的基本單位。點盡可能接近、異類樣例的投影點盡可能遠離”,這說的是()算法。A、PCA228.在模型評估與度量的方法中,()直接將數(shù)據(jù)集劃分為兩個互斥的集解析:數(shù)據(jù)挖掘:概念與技術(第三版)P37231.遺忘門的作用是()。234.感知機只有()神經元進行激活函數(shù)處理,即只擁有一層功能神經元。235.決策論中,將“期望損失”稱為(_)。237.在k均值算法中,假定聚類簇數(shù)k=3,則在算法開始時隨機選取()個樣240.(_)是一類用圖來表達變量相關關系的概率模型。A、preprocessing.scale243.下列對于查全率的描述,解釋正確的是(_)。1248.LSTM的全稱是()。252.()采用概率模型來表達聚類原型。解析:機器學習P206253.()是基于TopicModel的關鍵詞抽取。254.隨機森林是在(_)上的一個擴展變體。A、Boosting解析:機器學習255.真負率是指(_)。A、正樣本預測結果數(shù)/正樣本實際數(shù)B、被預測為負的正樣本結果數(shù)/正樣本實際數(shù)C、被預測為正的負樣本結果數(shù)/負樣本實際數(shù)D、負樣本預測結果數(shù)/負樣本實際數(shù)256.TF-IDF模型中TF是指()。257.馬爾可夫隨機場有一組(_),這是定義在變量子集上的非負實函數(shù),主個詞B只在其中3篇出現(xiàn)。根據(jù)逆文檔頻率,()比較關鍵。D、A和B260.假正率是指(_)。263.下列關于軟支持向量機的說法正確的是(_)。B、部分回歸系數(shù)會趨近于0,但不會取值為0268.(_)訓練好之后可以通過一些屬性變量的觀測值來推測其他屬性變量的取值。A、貝葉斯決策B、貝葉斯分類器C、貝葉斯網(wǎng)D、結構解析:機器學習解析:統(tǒng)計自然語言處理問答系統(tǒng)P714A、Velocity是指速度快B、實時分析數(shù)據(jù)處理要求速度快C、大數(shù)據(jù)中所說的“速度”包括兩種:增長速度和處理速度D、通常而言,處理速度比增長速度快276.(_)通過構建并結合多個學習器來完成學習任務。280.下列對于錯誤率的公式,解釋正確的是(_)。1擇的啟發(fā)式或“價值觀”換操作,對其中的個人(組織)敏感數(shù)據(jù)進行替換或刪除操作。283.下面不屬于數(shù)據(jù)歸約方法有()。B、度歸約284.以下描述不正確的是()。A、耐抗性是指對于數(shù)據(jù)局部不良反應的非敏感性B、殘差是指一個總括統(tǒng)計量或模型擬合值減去數(shù)據(jù)285.決策樹的基本流程遵循(_)的策略。286.Relief是為(_)問題設計的。289.規(guī)則生成本質上是一個(_)搜索過程。291.(_)的基本思想是學習過程由信號解析:數(shù)據(jù)挖掘:概念與技術(第三版)P58297.假負率是指(_)。301.RNN的全稱是()。302.p尾法確定圖像分割的閾值,適用于()的情況。304.在(_)特征選擇中,特征選擇算法本身作為組成部分嵌入到學習算法305.定義域為{1,2,3}的離散屬性也可稱為稱為(_)。307.下列關于數(shù)據(jù)的說法,不正確的是()A、數(shù)據(jù)的類別有多種多樣D、數(shù)據(jù)點之間的距離滿足d_ij+d_jk≥d_ik308.以下對大數(shù)據(jù)4V特性描述不正確的是()。A、在大數(shù)據(jù)中,價值與數(shù)據(jù)總量的大小不存在線性關系B、數(shù)據(jù)量大是相對計算與存儲能力而定的D、大數(shù)據(jù)中所說的“速度”包括兩種:增長速度和處理速度309.當(_)過高,會出現(xiàn)過擬合現(xiàn)象310.圖像中的椒鹽噪聲可以用()去除。312.(_)也稱為“基于密度的聚類”數(shù)319.當(_)過高,會出現(xiàn)欠擬合現(xiàn)象327.平均濾波對()的表現(xiàn)比較好。329.高斯核也稱為(_)。333.接受者操作特征曲線簡稱(_)。E4%BD%9C%E7%89%B9%E5%BE%81%E6%9B%B2%E7%BA%BF/207335.下列算法中屬于圖像平滑處理的是()。337.在概率圖模型中,(_)模型是結構最簡單的動態(tài)貝葉斯網(wǎng),主要用于時據(jù)治理的哪一步()340.在k近鄰學習算法中,隨著k的增加,上界將逐漸降低,當k區(qū)域無窮大A、貝葉斯錯誤率C、最優(yōu)值D、上界341.詞匯表的增長將會導致文檔向量不斷的增長,表現(xiàn)為文檔向量的()不斷解析:數(shù)據(jù)科學理論與實踐P6343.在支持向量機中,核函數(shù)的主要作用是()。A、將低維空間中線性不可分的數(shù)據(jù)映射到高維空間,使其線性可分B、將高維空間中線性不可分的數(shù)據(jù)映射到低維空間,使其線性可分C、將高維空間中線性可分的數(shù)據(jù)映射到低維空間,使其線性不可分D、將低維空間中線性可分的數(shù)據(jù)映射到高維空間,使其線性不可分344.以下描述不正確的是(_)。A、客戶代表的是項目的最終利益和目的B、大數(shù)據(jù)成為重塑國家競爭優(yōu)勢的新機遇C、大數(shù)據(jù)是小數(shù)據(jù)的集合349.成熟度等級1.已執(zhí)行級,2.已定義級,3.已優(yōu)化級,4.已測量級,5.已管理級,則由低到高排序為()。354.以下哪項方法不屬于漢語分詞方法?()356.向量空間模型的缺陷不包括()D、B2B營銷D、A,B和C364.交叉驗證的目的是()。并給出了(_)類關鍵過程域,共()個關鍵活動。366.(_)是分類錯誤的樣本數(shù)占樣本總數(shù)的比例。解析:數(shù)據(jù)挖掘:概念與技術(第三版)P69370.以下描述不正確的是()。374.數(shù)據(jù)產品開發(fā)的關鍵環(huán)節(jié)是()。376.著名的C4.5決策樹算法使用(_)來選擇最優(yōu)劃分屬性。A、ravelB、貝葉斯決策解析:機器學習382.與k均值算法類似,()也是試圖找到一組原型向量來刻畫聚類結構,C、k均值算法解析:機器學習P204383.()是指過濾器在圖像上滑動的距離。解析:https://blog.csdn.384.貝葉斯決策論是在(_)框架下實施決策的基本方法。385.情感信息抽取不包括以下哪些方法?()段387.對于分類任務來說,在所有相關概率都已知的理想情形下,(_)考慮如390.以下描述不正確的是()。393.一般地,在新樣本上的誤差稱為(_)。A、定義一個“數(shù)據(jù)驅動型組織”合策略是(_)。400.在概率圖模型中,(_)模型是一種判別式無向圖模型。解析:統(tǒng)計自然語言處理語言模型自適應方法P190,特征權重計算方法P6735.下列關于聚類,說法正確的是(_)。A、聚類任務中也可使用有標記訓練樣本B、聚類試圖將數(shù)據(jù)集中的樣本劃分為若干個通常是不相交的子集C、聚類可作為一個單獨的過程,用于尋找數(shù)據(jù)內在的分布結構D、聚類不可作為分類等其他學習任務的前驅過程解析:機器學習6.基于機器學習的情感分類方法有()。A、貝葉斯分類器B、支持向量機C、條件隨機場D、最大熵分類器解析:7.對于正交屬性空間中的樣本點,若存在一個超平面對所有樣本進行恰當?shù)谋磉_,則這樣的超平面應具有(_)和(_)的性質。A、最近重構性B、最大可分性C、最遠重構性D、最小可分性10.下列關于嵌入式選擇描述正確的是(_)。D、嵌入式特征選擇方法直接針對給定學習器進行優(yōu)化15.當閔可夫斯基距離公式中的系數(shù)p值為1時,可得到(_)的公式。D、AUC越接近1.0,檢測方法真實性越高27.下列關于偏差、方差、均方差、泛化誤差的作用表述正確的是()。B、方差刻畫了數(shù)據(jù)擾動所造成的影響28.企業(yè)應用包括(_)和人力資本、金融、生產能力、后臺自動化等。C、法律D、客戶服務29.下列關于ROC曲線描述正確的是(_)。C、辨別力不同的被試的ROC曲線也不同。30.下列屬于半監(jiān)督學習方法的是(_)。A、半監(jiān)督支持向量機B、圖半監(jiān)督學習C、生成式方法D、支持向量機解析:機器學習31.下面屬于范數(shù)規(guī)則化的作用的是(_)和()。A、保證模型盡可能的簡單,避免過擬合B、約束模型特征C、最小化問題D、最大化問題32.基于語義的情感詞典方法有(_)等流程。A、構建詞典34.以下提法中正確的是()。35.Apriori算法是一種最有影響的挖掘布爾關聯(lián)規(guī)則頻繁項集的算法。其核心是基于兩階段頻集思想的遞推算法。該關聯(lián)規(guī)則在分類上屬于(_)、A、邏輯關聯(lián)B、布爾關聯(lián)答案:BCD36.下列關于交叉驗證法描述正確的是()。A、交叉驗證法先將數(shù)據(jù)集劃分為k個大小相似的互斥子集B、交叉驗證法將數(shù)據(jù)集劃分成的k個子集應盡可能保持數(shù)據(jù)分布的一致性C、通常把交叉驗證法稱為k折交叉驗證D、假定數(shù)據(jù)集D中包含m個樣本,若令交叉驗證法中的系數(shù)k=m,則得到了交叉驗證法的一個特例:自助法解析:機器學習P2637.圖像分割中常使用的領域有()。解析:圖像處理、分析與機器視覺分割P125
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年簡陽市三星幼兒園臨聘人員招聘備考題庫附答案詳解
- 2026年洛陽商業(yè)職業(yè)學院招聘備考題庫及完整答案詳解一套
- 中國人民銀行清算總中心所屬企業(yè)城銀清算服務有限責任公司2026年校園招聘16人備考題庫及1套完整答案詳解
- 2026年濱州渤中能源有限公司公開招聘工作人員備考題庫及參考答案詳解
- 大臺街道2026年第一次城市協(xié)管員招聘備考題庫及一套參考答案詳解
- 2026年武漢市中醫(yī)醫(yī)院醫(yī)師崗位招聘備考題庫及一套答案詳解
- 2026年龍巖市直機關幼兒園蓮東分園招聘備考題庫及一套完整答案詳解
- 2026年西安交通大學繼續(xù)教育學院招聘備考題庫及答案詳解參考
- 2026年桐廬縣供銷合作總社社屬企業(yè)公開招聘工作人員備考題庫及完整答案詳解一套
- 2026年重慶市九龍坡區(qū)實幼石橋鋪園招聘備考題庫及參考答案詳解一套
- 沈陽職業(yè)技術學院單招《職業(yè)技能測試》參考試題庫(含答案)
- 防職場性騷擾培訓課件
- 設備維護與管理培訓課件
- 印刷排版人員配置方案
- 放射科質控管理制度
- 《美容皮膚學》考試復習題庫(含答案)
- 01管道儀表流程圖中常用圖例符號
- 如何組織臨床小講課(全科師資培訓課程)
- 基本養(yǎng)老保險參保繳費證明
- 繼電保護課后習題答案第二版-張保會-尹項根
- 西方經濟學練習題1
評論
0/150
提交評論