版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
注:不含主觀題第1題下面關于機器學習與深度學習的描述錯誤的是:()。單選題A深度學習來源于人工神經(jīng)網(wǎng)絡B深度學習是機器學習的重要分支C深度學習是多層的人工神經(jīng)網(wǎng)絡,典型的模型包括卷積神經(jīng)網(wǎng)絡等D機器學習屬于深度學習的范疇第2題人工智能的目的是讓機器能夠(),以實現(xiàn)某些腦力勞動的機械化。單選題A具有和人類一樣的智能B和人一樣工作C完全代替人的大腦D模擬、延伸和擴展人的智能第3題機器學習可以用于哪些情形?()多選題A人類無法解釋的專業(yè)知識B模型需要基于大量數(shù)據(jù)C當人類專業(yè)知識不存在D模型必須定制正確答案:ABCD第4題從學習方法上來分,機器學習算法可以分為:()。多選題A監(jiān)督學習B無監(jiān)督學習C半監(jiān)督學習D集成學習E深度學習F強化學習正確答案:ABCDE第5題給人臉打上標簽再讓模型進行學習訓練的方法,屬于()。單選題A強化學習B無監(jiān)督學習C半監(jiān)督學習D監(jiān)督學習第6題機器學習進行的第一步是()。單選題A特征提取B交叉驗證C模型訓練D數(shù)據(jù)收集第2章課后作業(yè)第1題學習器在()上的誤差稱為“訓練誤差”或“經(jīng)驗誤差”。A訓練集B新樣本第2題學習器在()上的誤差稱為“泛化誤差”。A訓練集B新樣本第3題檢驗多個學習器性能的方法是()。A二項檢驗法Bt檢驗法C交叉驗證t檢驗法第4題學習器輸出與真實標記之間的差別是()A誤差B偏差第5題學習器期望輸出與真實標記之間的差別是()A誤差B偏差第6題檢驗單個學習器性能的方法有();A二項檢驗法Bt檢驗法C交叉驗證t檢驗法正確答案:AB第7題對模型的泛化誤差進行評估,需要確定訓練集和測試集,主要有哪兩種方法?()A二項檢驗法B留出法C交叉驗證t檢驗法D交叉驗證法正確答案:BD第8題交叉驗證法指將數(shù)據(jù)集D劃分為兩個互斥的集合,其中一個集合作為訓練集S,另一個作為測試集T,即D=SUT,S∩T=空。在S上訓練出模型后,用T來評估其測試誤差,作為對泛化誤差的估計的方法。()第9題使用留出法進行驗證時先將數(shù)據(jù)集D劃分為k個大小相似的互斥子集,即D=D1UD2υ...UDk,其中Di∩Dj=?(i不等于j).每個子集Di都盡可能保持數(shù)據(jù)分布的一致性,即從D中通過分層采樣得到.然后,每次用k-1個子集的并集作為訓練集,余下的那個子集作為測試集;這樣就可獲得k組訓練/測試集,從而可進行k次訓練和測試,最終返回的是這k個測試結果的均值。()第3章課后作業(yè)與討論第1題推薦方式一般有兩種,一種是基于內容的推薦,即通過對未評分項進行評分預測來實現(xiàn)推薦;另外一種是基于協(xié)同的,它是以關聯(lián)規(guī)則作為基礎,把已購商品作為規(guī)則頭,規(guī)則體為推薦對象。()第2題ALS推薦算法的基本步驟:第一步,首先得到用戶的評分矩陣;第二步,根據(jù)已有的評分數(shù)據(jù),利用ALS算法對矩陣中的空項進行打分最終得到完整的用戶評分矩陣;第三步,系統(tǒng)根據(jù)這個最終的用戶評分矩陣,對不同的用戶推薦對應行中打分高產(chǎn)品,來完成商品的推薦。()第3題推薦算法主要分成3步:第一步用戶評分,包括顯性評分和隱性評分;第二步尋找最佳鄰居,就是用距離算法,找到距離最小的項目;第三步就是推薦。()第4題FP樹算法需要掃描兩次數(shù)據(jù)集:第一次掃描數(shù)據(jù)集得到一維頻繁項集,第二次掃描數(shù)據(jù)集是利用一維頻繁項集過濾數(shù)據(jù)集中的非頻繁項,同時生產(chǎn)FP樹。()第5題FP樹是一棵后綴樹,按支持度升序排列,支持度越高的頻繁項離根節(jié)點越遠,從而使得更多的頻繁項可以共享后綴。()第6題基于內容的推薦,它是以關聯(lián)規(guī)則作為基礎,把已購商品作為規(guī)則頭,規(guī)則體為推薦對象。()第7題基于協(xié)同的推薦,是通過對未評分項進行評分預測來實現(xiàn)推薦。()第8題基于內容的推薦,它是以關聯(lián)規(guī)則作為基礎,把已購商品作為規(guī)則頭,規(guī)則體為推薦對FP樹是一棵前綴樹,按支持度降序排列,支持度越高的頻繁項離根節(jié)點越近,從而使得更多的頻繁項可以共享前綴。()第4章課后作業(yè)第1題以下對聚類說法錯誤的是()A將數(shù)據(jù)分成多個組B需要標簽進行訓練C屬于無監(jiān)督學習D結果不一定總是能反映數(shù)據(jù)的真實分類第2題以下()不是聚類算法。AK-means算法B層次聚類C密度聚類DFP樹算法第3題K-means算法的實現(xiàn)過程是()。①計算剩下的元素到k個簇中心的相異度。②將數(shù)據(jù)集合中全部元素按照新的中心重新聚類。③從數(shù)據(jù)集合中隨機取k個元素,作為k個簇的各自的中心。④根據(jù)聚類結果,重新計算k個簇各自的中心。⑤重復前面兩步,直到聚類結果不再變化。A①②③④⑤B③①②④⑤C③①④②⑤D②①③④⑤第4題K-means算法的缺點不包括()Ak必須事先給定B要選擇初始聚類中心C對于“噪聲”和孤立點數(shù)據(jù)是敏感的D可伸縮、高效第5題公式計算的是()A歐幾里得距離B曼哈頓距離C余弦距離D皮爾遜距離第6題K-means聚類中,對于確定k大小的方法錯誤的是()A按需選擇,按照建模的需求和目的來選擇聚類的個數(shù)B觀察法C隨機法D手肘法第7題以下對經(jīng)典K-means聚類算法解釋正確的是()A能自動識別類的個數(shù),隨機挑選初始點為中心點計算B能自動識別類的個數(shù),不是隨機挑選初始點為中心點計算C不能自動識別類的個數(shù),隨機挑選初始點為中心點計算D不能自動識別類的個數(shù),不是隨機挑選初始點為中心點計算第8題K-means只能收斂到局部最優(yōu),效果不受初始值的影響。()第9題K-means中的樣本點只能被劃分到單一的類中。()第10題對于一個簇來說,所有樣本點到質心的距離之和越小,就認為這個簇中的樣本越相似,簇內差異就越小。()第5章課后作業(yè)第1題已知變量x與y正相關,且由觀測數(shù)據(jù)算得x的樣本平均值為3,y的樣本平均值為3.5,則由該觀測數(shù)據(jù)算得的線性回歸方程可能是()。Ay=0.4x+2.3By=2x-2.4Cy=-2x+9.5Dy=-0.3x+4.4第2題在兩個變量的回歸分析中,作散點圖是為了()A直接求出回歸直線方程B直接求出回歸方程C根據(jù)經(jīng)驗選定回歸方程的類型D估計回歸方程的參數(shù)第3題在線性回歸方程y=a+bx中,回歸系數(shù)b表示()。A當x=0時,y的平均值Bx變動一個單位時,y的實際變動量Cy變動一個單位時,x的平均變動量Dx變動一個單位時,y的平均變動量第4題若每一噸鑄鐵成本y(元)與鑄件廢品率x%建立的回歸方程y=56+8x,下列說法正確的是()。A廢品率每增加1%,成本每噸增加64元B廢品率每增加1%,成本每噸增加8%C廢品率每增加1%,成本每噸增加8元D廢品率每增加1%,成本每噸增加56元第5題若根據(jù)x與y之間的一組數(shù)據(jù)求得兩個變量之間的線性回歸方程為y=a+bx,已知:數(shù)據(jù)x的平均值為2,數(shù)據(jù)y的平均值為3,則()。A回歸直線必過點(2,3)B回歸直線不一定過點(2,3)C點(2,3)在回歸直線上方D點(2,3)在回歸直線下方第6題本章在講解線性回歸時,是以____最小作為準則,來確定線性回歸方程的。正確答案::["損失函數(shù)"]第7題線性假設是指自變量x的變化對因變量y的影響與其他自變量的取值無關。()第8題回歸函數(shù)刻畫了平均意義下因變量與自變量的相依關系。()第9題回歸分析的研究對象是具有相關關系的變量。()第10題回歸的實質是平均。()第6章課后作業(yè)第1題以下公式()是貝葉斯公式。AP(AB)=P(A|B)P(B)BP(A)=P(A|B1)P(B1)+P(A|B2)P(B2)+…+P(A|Bn)P(Bn)CP(A|B)=P(B|A)P(A)/P(B)DP(A1+A2+…+An)=P(A1)+P(A2)+…+P(An)第2題以下對于樸素貝葉斯的說法正確的是()A對訓練數(shù)據(jù)的依賴性不強B適合多分類任務C在部分特征相關的情況下性能也很好D分類效率不穩(wěn)定第3題以下哪種不是貝葉斯分類器的應用場景()A文本分類B垃圾文本過濾C情感分析D氣象關聯(lián)分析第4題設某工廠有甲、乙、丙三個車間生產(chǎn)同一種產(chǎn)品,已知各車間的產(chǎn)量分別占全廠產(chǎn)量的25%,35%,40%,而且各車間的次品率依次為5%,4%,2%。現(xiàn)從待出廠的產(chǎn)品中檢查出一個次品,則它是甲車間生產(chǎn)的概率是()A0.362B0.406C0.232D0.174第5題已知某個醫(yī)院早上收了六個門診病人,如下表?,F(xiàn)在又來了第七個病人,是一個打噴嚏的建筑工人。假設各個屬性之間相互獨立,請問他患上感冒的概率是()A0.50B0.35C0.66D0.75第6題公司里面男性有60人,女性有40人,男性穿皮鞋的人數(shù)有25人,穿運動鞋的人數(shù)有35人,女性穿皮鞋的人數(shù)有10人,穿高跟鞋的人數(shù)有30人?,F(xiàn)在你只知道有一個人穿了皮鞋,推測一下他的性別是()A女性B男性C不確定D無法計算第7題以下是一組購買電腦的數(shù)據(jù),假設各個特征之間條件獨立。現(xiàn)在某個人的數(shù)據(jù)為X=(age>40,income=medium,student=yes,credit_rating=fair)。推測他是否會買電腦()A不會B會C不確定D無法計算第8題樸素貝葉斯對異常值敏感。()第9題樸素貝葉斯中的“樸素”是假設了特征之間是相互獨立的。()第10題貝葉斯分類器是根據(jù)給定樣本屬于某一個具體類的概率來對其進行分類。()第7章課后作業(yè)第1題關于決策樹的描述錯誤的是()A不能用于預測B是一種分類算法C屬于監(jiān)督算法D是一種高效的算法第2題決策樹上每個非葉節(jié)點表示的是()A特征屬性在某個值域上的輸出B一個類別C一個特征屬性上的測試D以上都不是第3題決策樹的基本流程遵循的策略是()A鄰近相似B分而治之C物以類聚D由果溯因第4題決策樹依據(jù)屬性對樣本集進行劃分所獲得的()來選擇最優(yōu)劃分屬性A剪枝次數(shù)B信息熵C類別個數(shù)D信息增益第5題第2節(jié)中的西瓜數(shù)據(jù)集中蜷縮的根蒂的信息熵的值是()A0B0.9852C0.9544D1.0第6題接上題可以計算出第2節(jié)中的西瓜數(shù)據(jù)集中根蒂的信息熵最高的分支是()A蜷縮B稍蜷C硬挺第7題第3節(jié)中的西瓜數(shù)據(jù)訓練集中蜷縮的紋理的信息增益是()A1.0B0.5283C0.3899D0.1715第8題熵表明了隨機變量X中事件發(fā)生的平均不確定性,即為了在觀測或者實驗之前確定X中發(fā)生一個事件平均所需要的信息。()第9題一般而言,后剪枝決策樹的泛化能力通常會比預剪枝決策樹要好一些。()第10題相對于決策樹,隨機森林算法一般來說能更好的減少過擬合現(xiàn)象對算法的影響。()第8章課后作業(yè)第1題以下哪個算法能有效進行數(shù)據(jù)降維()AFP樹BPCACK-MeansDALS第2題關于主成分分析算法描述正確的是()A算法期望所投影的維度上數(shù)據(jù)的方差最大B算法期望所投影的維度上數(shù)據(jù)的均值最大C算法期望所投影的維度上數(shù)據(jù)的方差最小D算法期望所投影的維度上數(shù)據(jù)的均值最小第3題KNN的原理就是當預測一個新的值x的時候,根據(jù)它距離最近的K個點是什么類別來判斷x屬于哪個類別。()第4題降維的方式無法有效的緩解維數(shù)災難。()第5題多維縮放的算法原理,其實就是想辦法去掉在原始數(shù)據(jù)集中最難以計算的那些維度,把整個數(shù)據(jù)集降到一個更低的維度再來進行計算。()第6題度量學習中若不同屬性的重要性不同,可以引入屬性權重來表示屬性的重要程度。()第7題多維縮放算法中,在新的維度空間d'中,任意兩個樣本在d'維空間中的距離一定小于原始空間中的距離。()第8題主成分分析算法目標是通過某種投影,將高維的數(shù)據(jù)映射到低維的空間中表示。()第9題主成分分析目標是通過投影將高維的數(shù)據(jù)映射到____的空間中表示,并且期望在所投影的維度上數(shù)據(jù)的____最大,以此使用較少的數(shù)據(jù)維度,同時保留較多的____的特性。正確答案::["低維"]正確答案::["方差"]正確答案::["原數(shù)據(jù)點"]第9章課后作業(yè)第1題你正在構建一個識別足球(y=1)與籃球(y=0)的二元分類器。你會使用哪一種激活函數(shù)用于輸出層?()ALeakyReLUBsigmoidCtanhDReLU第2題以下哪種策略不能防止過擬合。(
)A使用激活函數(shù)B加大訓練數(shù)據(jù)量CDropout對網(wǎng)絡進行裁剪D調整合適的學習率第3題梯度下降算法中主要是如何計算的?()。A求導數(shù)B求和C求平均D求對數(shù)第4題神經(jīng)網(wǎng)絡中常見的超參數(shù)有?()A梯度下降法迭代的步數(shù)B隱藏層數(shù)目C正則化參數(shù)D學習率正確答案:ABCD第5題多層感知器是感知器的推廣,克服了感知器不能對線性不可分數(shù)據(jù)進行識別的弱點。()第6題sigmoid函數(shù)不是關于原點中心對稱的,這會導致之后的網(wǎng)絡層的輸出也不是零中心的,進而影響梯度下降運作。tanh激活函數(shù)解決了這個不足。()第7題基于神經(jīng)網(wǎng)絡的機器學習主要分為兩個過程,即訓練過程和使用過程。()第8題全連接Fully-connected網(wǎng)絡指的是前一層中的每個神經(jīng)元都連接到下一層的每個神經(jīng)元。()第9題反向傳播的作用是訓練模型參數(shù),在所有參數(shù)上用梯度下降,使神經(jīng)網(wǎng)絡模型在訓練數(shù)據(jù)上的損失函數(shù)最大。()第10題準確率和損失函數(shù)都可以作為評價模型的優(yōu)劣指標。()第10章課后作業(yè)第1題在深度學習中,CNN是指()ACableNewsNetwork,電視新聞網(wǎng)絡BConvolutionalNeuralNetwork,卷積神經(jīng)網(wǎng)絡CCableNeuralNetwork,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學大三(食品質量安全)食品添加劑檢測綜合測試試題及答案
- 2025年大學大四(物流管理)逆向物流綜合測試試題及答案
- 2025年大學動物醫(yī)學(獸藥飼料生產(chǎn))試題及答案
- 2025年中職(電子商務運營)電商數(shù)據(jù)分析綜合試題及答案
- 2025年大學智能制造工程(智能制造)試題及答案
- 2025年中職西式烹飪工藝(海鮮烹飪)試題及答案
- 2025年高職機動車檢測維修(汽車檢測設備使用)試題及答案
- 2025年大學微電子科學與工程(微電子器件設計)試題及答案
- 湖北省武漢市東湖高新區(qū)2025年八年級上學期期末物理試題附答案
- 2026年莆田市秀嶼區(qū)市場監(jiān)督管理局關于招聘食品安全協(xié)管員的備考題庫完整參考答案詳解
- 雙擁培訓課件
- 飛行營地項目總體規(guī)劃
- GB/T 45494-2025項目、項目群和項目組合管理背景和概念
- DB36T-預防血管活性藥物外滲護理工作規(guī)范
- 牛羊肉銷售合同協(xié)議書
- 《無人機搭載紅外熱像設備檢測建筑外墻及屋面作業(yè)》
- 秦腔課件教學
- DB51-T 1959-2022 中小學校學生宿舍(公寓)管理服務規(guī)范
- 水利工程施工監(jiān)理規(guī)范(SL288-2014)用表填表說明及示例
- 妊娠合并膽汁淤積綜合征
- 新疆維吾爾自治區(qū)普通高校學生轉學申請(備案)表
評論
0/150
提交評論