R語言數(shù)據分析與挖掘智慧樹知到答案章節(jié)測試2023年中央財經大學_第1頁
R語言數(shù)據分析與挖掘智慧樹知到答案章節(jié)測試2023年中央財經大學_第2頁
R語言數(shù)據分析與挖掘智慧樹知到答案章節(jié)測試2023年中央財經大學_第3頁
R語言數(shù)據分析與挖掘智慧樹知到答案章節(jié)測試2023年中央財經大學_第4頁
R語言數(shù)據分析與挖掘智慧樹知到答案章節(jié)測試2023年中央財經大學_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第一章測試下面哪些是R可以存儲的數(shù)據對象?()。

A:列表框

B:數(shù)據框

C:其余選項都是

D:矩陣

答案:C關于

attach()函數(shù)說法正確的是?()。

A:把數(shù)據庫加載到R的搜索空間

B:

與detach()的功能不同

C:其余選項均正確

D:執(zhí)行

attach()加載數(shù)據庫后,可以直接訪問該數(shù)據庫中的一些對象

答案:C下面哪些方式可以查看到幫助文檔?()。

A:?mean和help(mean)都正確

B:?mean

C:help(mean)

D:?mean和help(mean)都不正確

答案:A假設

y<-c(1,2,3,-1,0,2),那么關于語句y[c(-2,-3)],說法正確的是___.()。

A:執(zhí)行該語句不會改變y的長度

B:該語句存在語法錯誤

C:執(zhí)行該語句將改變y的長度

D:該語句選取y的第2和第3個元素

答案:A下面關于修改向量

x<-c(1,2,-1,-3,-5)的說法錯誤的是___.()。

A:

執(zhí)行語句

x<-0后,x的值為0

B:執(zhí)行語句

x[1]<-0后,x的值為0,2,-1,-3,-5

C:執(zhí)行語句

x[c(1,5)]<-0后,x的值為0,2,-1,-3,0

D:執(zhí)行語句

x<-0后,x的值為0,0,0,0,0

答案:D第二章測試若從正態(tài)分布總體中抽樣得到一組樣本,樣本的值為1,-1,2,3,4,5,1,2,4,3,那么樣本的中位數(shù)為?()。

A:3

B:4

C:2

D:2.5

答案:D若從正態(tài)分布總體中抽樣得到一組樣本,樣本的值為7,7,5,2,5,4,7,9,4,8,那么樣本的眾數(shù)為?()。

A:4

B:5

C:8

D:7

答案:D最大值與最小值之間的差值稱為?()。

A:范圍

B:極差

C:四分位差

D:方差

答案:B關于變異系數(shù)的說法正確的是?()。

A:變異系數(shù)能夠反映數(shù)據的離散程度

B:變異系數(shù)越大,數(shù)據越分散

C:其余選項都正確

D:可以用樣本的變異系數(shù)來比較多個樣本的離散程度

答案:C若從正態(tài)分布總體中抽樣得到一組樣本,樣本的值為1,-1,2,3,4,5,1,2,4,3,4,4,那么下面哪些說法是正確的?.()。

A:該樣本的標準差為3.16(只保留兩位小數(shù))

B:該樣本只有一個眾數(shù)

C:若要計算該樣本的中位數(shù),需要先對其進行排序

D:該樣本的極差為6

答案:BCD第三章測試分類變量用下面哪些圖形來描述較為合適?()。

A:箱線圖

B:餅圖

C:條形圖

D:直方圖

答案:BC分類變量用哪些統(tǒng)計量來描述較為合適?()。

A:比率

B:比例

C:頻數(shù)

D:極差

答案:ABC下面哪些圖形用來描述數(shù)值變量的分布情況更為恰當?()。

A:直方圖

B:概率密度曲線

C:箱線圖

D:折線圖

答案:ABC下面哪些說法是正確的?()。

A:在對數(shù)值變量離散化處理的情況下,可以使用條形圖展示數(shù)值變量的分布形狀

B:可以用點圖展示數(shù)值變量的分布形狀

C:點圖不可以用來展示數(shù)值變量的分布形狀

D:在不對數(shù)值變量進行任何處理的情況下,使用條形圖展示數(shù)值變量的分布形狀是恰當?shù)?/p>

答案:AB下面關于table()函數(shù)說法正確的是?()。

A:table()函數(shù)本質是實現(xiàn)分類變量的頻數(shù)統(tǒng)計

B:table()函數(shù)能夠用來制作一維列聯(lián)表

C:table()函數(shù)可以用來制作交叉表

D:table()函數(shù)不能用來制作三維及以上的列聯(lián)表

答案:ABC下面哪些圖形用來描述分類變量的分布情況更為恰當?()。

A:散點圖

B:柱狀圖

C:扇形圖

D:餅圖

答案:BCD下面哪些圖形用來描述分類變量與分類變量的關系更為恰當?()。

A:箱線圖

B:散點圖

C:重疊直方圖

D:并排柱狀圖

答案:D下面哪些圖形用來描述分類變量與數(shù)值變量的關系更為恰當?()。

A:重疊扇形圖

B:箱線圖

C:并排柱狀圖

D:散點圖

答案:C下面哪些圖形用來描述數(shù)值變量與數(shù)值變量的關系更為恰當?()。

A:散點圖

B:重疊扇形圖

C:并排柱狀圖

D:箱線圖

答案:A下面哪些圖形用來描述三個數(shù)值變量之間的關系更為恰當?()。

A:箱線圖

B:柱狀圖

C:氣泡圖

D:直方圖

答案:C第四章測試合并連接是把兩個表格組合在一起的數(shù)據操作方式.()。

A:對

B:錯

答案:A主鍵是數(shù)據表中觀測樣本的唯一標識.()。

A:錯

B:對

答案:B外鍵是另外一個數(shù)據表中觀測樣本的唯一標識.()。

A:錯

B:對

答案:B內連接是一種最簡單的連接,內連接匹配兩個數(shù)據表中鍵值相等的觀測樣本.()。

A:錯

B:對

答案:B外連接包括:內連接、左連接、右連接、全連接.()。

A:對

B:錯

答案:B第五章測試當兩事件A和B互斥時,P(A∪B)有可能大于P(A)+P(B).()。

A:對

B:錯

答案:B設某地有甲乙兩種報紙,該地成年人中有30%讀甲報紙,15%讀乙報紙,10%兩種報紙都讀,則成年人中有5%至少讀一種報紙.()。

A:錯

B:對

答案:A設有1000件產品,其中850件是正品,150件是次品,從中依次抽取2件,2件都是次品的概率是0.025.()。

A:錯

B:對

答案:A隨機變量可分為連續(xù)型隨機變量和離散型隨機變量.()。

A:錯

B:對

答案:B設X~N(0,1),則P(X<1.5)<0.9.()。

A:對

B:錯

答案:B第六章測試設從一個均值μ=10、標準差σ=0.6的總體中隨機選取容量為n=36的樣本。假定總體不是很偏,則樣本均值在總體均值附近0.1范圍內的近似概率大于0.7.()。

A:錯

B:對

答案:A設XN(16,4),則10XN(160,40).()。

A:對

B:錯

答案:B假定某統(tǒng)計人員在其填寫的報表中有2%至少會有一處錯誤,如果我們檢查一個由600份報表組成的隨機樣本,其中至少有一處錯誤的報表所占的比例在0.025~0.070之間的概率大于20%.()。

A:錯

B:對

答案:A卡方分布和t分布都是由正態(tài)分布導出的.()。

A:對

B:錯

答案:A某汽車電瓶商聲稱其生產的電瓶具有均值為60個月,標準差為6個月的壽命分布?,F(xiàn)假設質檢部門決定檢驗該廠的說法是否準確,為此隨機抽取了50個該廠生產的電瓶進行壽命實驗。假設廠商聲稱是正確的,則50個電瓶的平均壽命的抽樣分布為N(60,6).()。

A:錯

B:對

答案:A第七章測試關于置信區(qū)間的構造,正確的是.()。

A:置信區(qū)間的寬度會受到樣本均值的影響

B:置信區(qū)間的寬度會受到總體方差或樣本方差的影響

C:置信區(qū)間的寬度不會受到樣本量的影響

D:置信區(qū)間的寬度不會受到置信水平的影響

答案:B關于兩個正態(tài)總體方差之比的置信區(qū)間,正確的是.()。

A:置信區(qū)間的形式為:點估計標準誤

B:置信區(qū)間有可能會包含0

C:置信區(qū)間的寬度不會受到樣本量的影響

D:置信區(qū)間不可能包含0

答案:D在構造總體均值的置信區(qū)間的過程中,首先需要確定分位數(shù),關于分位數(shù)確定正確的是.()。

A:分位數(shù)只由樣本量決定

B:分位數(shù)不由樣本量和總體方差是否已知決定

C:分位數(shù)同時由樣本量和總體方差是否已知決定

D:分位數(shù)只由總體方差是否已知決定

答案:C關于兩個總體均值之差的置信區(qū)間的形式說法正確的是.()。

A:兩個總體均值之差的點估計±標準誤

B:兩個總體均值之差的點估計±標準差

C:兩個總體均值之差的點估計±分位數(shù)×標準差

D:兩個總體均值之差的點估計±分位數(shù)×標準誤

答案:D關于配對的兩個總體均值之差的置信區(qū)間的說法正確的是.()。

A:要先求各個樣本的均值、標準差等統(tǒng)計量

B:要對配對樣本標準化,得到標準化序列

C:要先對配對樣本做差值,得到差值序列

D:要先對配對樣本求和,得到求和序列

答案:C矩估計和似然估計都可用來估計總體的未知參數(shù).()。

A:對

B:錯

答案:A無論樣本量大小,樣本比例的區(qū)間估計都是相同的.()。

A:錯

B:對

答案:A假設X是來自正態(tài)總體的一個樣本,在已知和未知的情況下,的置信區(qū)間估計的結果都是相同的.()。

A:錯

B:對

答案:A假設X和Y是分別來自正態(tài)總體的兩個樣本,總體均值都已知且相等,那么構成總體方差之比的置信區(qū)間的F分位數(shù)的第一自由度和第二自由度總是相等的.()。

A:對

B:錯

答案:B標準誤就是樣本的標準差.()。

A:錯

B:對

答案:A第八章測試下面關于假設檢驗兩類錯誤正確的是.()。

A:第一類錯誤是為真,拒絕

B:第一類錯誤是為真,拒絕

C:第一類錯誤是為假,接受

D:第一類錯誤是為假,接受

答案:C下面關于假設檢驗兩類錯誤正確的是.()。

A:降低第一類錯誤的概率,不會增加犯第二類錯誤的概率

B:顯著水平是第二類錯誤犯錯的概率

C:降低兩類錯誤的概率的方法是降低樣本量

D:降低第一類錯誤的概率,會增加犯第二類錯誤的概率

答案:D對于一個總體均值的假設檢驗,應該選用哪個統(tǒng)計量來檢驗(已知樣本量大于50).()。

A:統(tǒng)計量

B:T統(tǒng)計量

C:F統(tǒng)計量

D:Z統(tǒng)計量

答案:D假設X是來自正態(tài)總體N(μ,100)的一個樣本,樣本均值為4,樣本量為25,對于假設檢驗:μ=5的檢驗統(tǒng)計量的值為?()。

A:-0.5

B:-0.05

C:0.5

D:無法計算

答案:A假設X是來自正態(tài)總體N(μ,100)的一個樣本,樣本均值為4,樣本量為25,對于置信水平為0.05的假設檢驗:μ=5說法正確的是?已知(24)=-1.71。()。

A:拒絕原假設

B:該檢驗應該構造Z統(tǒng)計量來檢驗

C:接受原假設

D:該檢驗是單側檢驗

答案:C假設X是來自正態(tài)總體N(μ,)的一個樣本,樣本均值為16,樣本量為1000,對于置信水平為0.05的假設檢驗:μ=16說法正確的是?()。

A:該檢驗應該構造t統(tǒng)計量來檢驗

B:該檢驗應該構造Z統(tǒng)計量來檢驗

C:該檢驗是單側檢驗

D:該檢驗應該構造F統(tǒng)計量來檢驗

答案:A假設X是來自正態(tài)總體N(μ,)的一個樣本,樣本方差為1,樣本量為1000,對于置信水平為0.05的假設檢驗:1說法正確的是?()。

A:該檢驗是雙側檢驗

B:該檢驗的統(tǒng)計量可能會小于0

C:該檢驗應該構造統(tǒng)計量來檢驗

D:該檢驗應該構造F統(tǒng)計量來檢驗

答案:C假設X和Y是分別來自正態(tài)總體和的樣本,樣本量分別為1000和800,假設總體方差相等,對于置信水平為0.05的假設檢驗:說法正確的是?()。

A:該檢驗應該構造Z統(tǒng)計量來檢驗

B:該檢驗是雙側檢驗

C:該檢驗應該構造t統(tǒng)計量來檢驗

D:該檢驗的統(tǒng)計量不可能會小于0

答案:A假設X和Y是分別來自正態(tài)總體和的樣本,樣本量分別為25和30,對于置信水平為0.05的假設檢驗:說法正確的是?()。

A:檢驗前,要先檢驗方差是否相等

B:檢驗前,不需要檢驗方差是否相等

C:無需要做其他操作,可以直接用t檢驗來檢驗

D:無需要做其他操作,可以直接用Z檢驗來檢驗

答案:A假設X和Y是分別來自正態(tài)總體和的樣本,樣本量分別為和,和未知,對于置信水平為0.05的假設檢驗:說法正確的是?()。

A:用統(tǒng)計量檢驗,自由度為

B:用F統(tǒng)計量檢驗,自由度分別為和

C:用F統(tǒng)計量檢驗,自由度分別為和

D:用統(tǒng)計量檢驗,自由度為

答案:B第九章測試擬合優(yōu)度檢驗用來判斷各類別的觀察頻數(shù)與某一期望頻數(shù)或理論頻數(shù)是否一致.()。

A:對

B:錯

答案:A在應用獨立性檢驗時,要求樣本量應足夠大,特別是每個單元格的期望頻數(shù)不能太小,否則會得出錯誤的結論.()。

A:對

B:錯

答案:A擬合優(yōu)度檢驗可以檢驗分類變量是否服從某種分布律分布.()。

A:對

B:錯

答案:A擬合優(yōu)度檢驗又稱為___.()。

A:方差齊性檢驗

B:均值檢驗

C:分布檢驗

D:一致性檢驗

答案:D獨立性檢驗(testofindependence)可以用來檢驗___.()。

A:都不正確

B:一個數(shù)值變量與一個類別變量是否獨立

C:兩個數(shù)值變量是否獨立

D:兩個類別變量是否獨立

答案:D第十章測試方差分析對數(shù)據分布的假設前提___.()。

A:總體服從均勻分布

B:總體服從泊松分布

C:總體服從指數(shù)分布

D:總體服從正態(tài)分布

答案:D方差分析對各水平方差的假設條件應滿足___.()。

A:都不對

B:方差不等

C:方差可以相等,也可以不等

D:方差相等

答案:D設因素有k個水平,若每個水平的均值用表示,那么方差分析的原假設是___.()。

A:H0:各水平的均值相等和H0:自變量與因變量無關都可以

B:H0:自變量與因變量無關

C:H0:各水平的均值相等

D:H0:各水平的均值相等和H0:自變量與因變量無關都不可以

答案:A檢驗因素各水平是否服從正態(tài)分布的方法有__.()。

A:Q-Q或P-P圖

B:Shapiro-Wilk檢驗

C:K-S檢驗

D:都可以

答案:D單因素方差分析的效應量反應___.()。

A:總平方和SST與誤差平方和SSE的比例

B:處理效應平方和SSA與總平方和SST的比例

C:總平方和SST與處理效應平方和的SSA比例

D:誤差平方和SSE與總平方和SST的比例

答案:B無論總體是否服從正態(tài)分布,都可以使用非參數(shù)方差分析方法來實現(xiàn)方差分析.()。

A:錯

B:對

答案:B判斷總體是否服從正態(tài)分布的方法除了圖形法外,還可以使用檢驗的方法.()。

A:對

B:錯

答案:A在方差分析中,效應量是指隨機誤差與總體誤差之比.其值越大,擬合效果越差.()。

A:對

B:錯

答案:B對于方差分析而言,要比較任意兩個水平的均值是否相等,可以使用LSD多重比較或t檢驗.()。

A:對

B:錯

答案:A方差分析是分析數(shù)值變量與分類變量之間關系的統(tǒng)計方法,可以在一個模型中包括任意多的分類變量.()。

A:對

B:錯

答案:B第十一章測試將因變量的值擴大10,將自變量的值同時擴大100,則___.()。

A:回歸的不變

B:OLS估計量的方差不變

C:截距的估計值不變

D:斜率的估計值不變

答案:A估計量具有抽樣分布的原因是___.()。

A:在現(xiàn)實數(shù)據中你往往會重復得到多組樣本

B:不同的人可能有不同的估計結果

C:在給定X的情況下,誤差項的不同實現(xiàn)會導致Y的取值有所不同

D:經濟數(shù)據是不精確的

答案:C在其他因素相同的條件下,如果___,斜率估計量標準差較小.()。

A:解釋變量X有更多變差

B:誤差項的方差更大

C:截距估計值更小

D:樣本容量更小

答案:A誤差項的異方差會影響OLS估計量的___.()。

A:一致性

B:無偏性

C:最優(yōu)性

D:線性性

答案:C如果一個假設在5%的顯著水平下不能被拒絕,則它___.()。

A:在1%的顯著水平下可能被拒絕

B:在1%的顯著水平下一定不會被拒絕

C:在10%的顯著水平下一定不會被拒絕

D:在10%的顯著水平下一定被拒絕

答案:B一元線性回歸的基本假設有___.()。

A:隨機變量X與Y之間存在線性關系

B:任意兩個樣本的隨機誤差相互獨立

C:隨機誤差的方差相等

D:隨機誤差的期望為0

答案:ABCD若是一元線性回歸方程的回歸系數(shù)的最小二乘估計,那么下面說法正確的是___.()。

A:它的方差為:

B:的期望:

C:它的估計值為:

答案:C關于一元線性回歸模型的殘差項,說法正確的是___.()。

A:

B:,即任意兩個殘差之間的協(xié)方差為0,注意

C:

D:

答案:ABCD若,是一元線性回歸方程的回歸系數(shù)的最小二乘估計,那么下面說法正確的是___.()。

A:是截距項,它表示Y的平均水平

B:表示,X每變動一個單位,Y變動個單位

C:是截距項,它表示X的平均水平

D:表示,Y每變動一個單位,X變動個單位

答案:AB若,是一元線性回歸方程的回歸系數(shù)的最小二乘估計,若X標準化和Y標準化后的向量為和,且一元線性回歸方程為,那么下面說法正確的是___.()。

A:回歸方程穿過原點(0,0)

B:

C:

D:

答案:ACD回歸分析前,要先通過相關系數(shù)或散點圖觀察變量之間是否存在線性關系.()。

A:錯

B:對

答案:B散點圖也可以用來觀察樣本中是否存在離群點.()。

A:錯

B:對

答案:B判別一元線性回歸是否顯著不僅可以使用t檢驗,也可以使用F檢驗.()。

A:對

B:錯

答案:A在一元線性回歸中,如果因變量與自變量存在明顯的正相關關系,那么其回歸系數(shù)將顯著大于0()。

A:對

B:錯

答案:A用于建立回歸模型的樣本是否獨立不會影響OLS對回歸系數(shù)的估計結果()。

A:錯

B:對

答案:A第十二章測試虛擬變量陷阱(dummyvariabletrap)是以下哪個情形?()。

A:實際操作中不會發(fā)生的

B:不完全多重共線性

C:僅僅是理論所關心的

D:完全多重共線性

答案:D關于不完全共線性,如下哪個說法是正確的?()。

A:兩個或者多個自變量是高度相關的

B:即使樣本容量n>100,最小二乘估計量也是有偏的

C:回歸誤差項是高度相關的

D:無法計算最小二乘估計量

答案:A如果回歸模型中遺漏了能夠影響因變量的變量,會產生的后果是___.()。

A:雖然無法度量出遺漏變量的作用,但是對模型中現(xiàn)存的變量進行估計不受影響

B:既然其他變量沒有包括進來,所以當前模型的估計是正確的

C:如果遺漏的變量和現(xiàn)存的變量相關,會使得當前的最小二乘估計量有偏

D:一定會使得當前模型的最小二乘估計量有偏

答案:C如果模型有遺漏變量偏差,會使得哪一個最小二乘的假設條件不滿足?.()。

A:模型不存在完全共線性

B:是獨立同分布的

C:模型是同方差的

D:

答案:D考慮有兩個自變量X1和X2的回歸模型,這兩個自變量都是Y的影響因素。如果先使用X1對Y做回歸,估計得到的回歸系數(shù)很小,但是同時使用X1,X2做回歸,發(fā)現(xiàn)X1前面的回歸系數(shù)變大了很多。這意味的前面的一元線性回歸存在___.()。

A:異方差

B:遺漏變量偏差

C:虛擬變量陷阱

D:完全共線性

答案:B下述模型使用個人的收入和教育水平來解釋個人的儲蓄:.其中變量Edu是一個二元變量,如果是受過高等教育的個體,Edu=1,否則Edu=0。請問該研究中,基準組是___.()。

A:低收入群體

B:未受過高等教育的群體

C:高收入群體

D:受過高等教育的群體

答案:B下述模型使用個人的收入和教育水平來解釋個人的儲蓄:.其中變量Edu是一個二元變量,如果是受過高等教育的個體,Edu=1,否則Edu=0。如果,我們把該系數(shù)解釋為___.()。

A:給定收入水平,受過高等教育的群體的平均儲蓄比沒受過高等教育的群體高個單位

B:收入水平較低的群體儲蓄更高

C:給定收入水平,沒受過高等教育的群體的平均儲蓄比受過高等教育的群體高個單位

D:收入水平較高的群體儲蓄更高

答案:A多重共線性會導致回歸系數(shù)不顯著、回歸系數(shù)正負號顛倒等與常識違背的現(xiàn)象。()。

A:錯

B:對

答案:B在多元回歸分析中,回歸系數(shù)可以直接用來評價自變量的重要性。()。

A:對

B:錯

答案:B如果根據來選擇變量并建立多元線性回歸模型,那么我們可能會得到一個復雜的模型。()。

A:對

B:錯

答案:A第十三章測試Logistic回歸與多重線性回歸比較()

A:Logistic回歸的因變量為二分類變量

B:多重線性回歸的因變量為二分類變量

C:Logistic回歸的自變量必須為二分類變量

D:多重線性回歸的自變量必須為二分類變量

答案:ALogistic回歸適用于因變量為()

A:二分類變量

B:多分類有序變量

C:連續(xù)型定量變量

D:多分類無序變量

答案:ABDLogistic回歸可用于()

A:校正混雜因素

B:預測

C:均可

D:影響因素分析

答案:CLogistic回歸模型的參數(shù)估計為加權最小二乘估計。()

A:對

B:錯

答案:B當因變量的取值在[0,1]變化,而自變量的取值范圍超出了[0,1],甚至在整個實數(shù)軸上取值時,可以采用Logistic回歸模型解決這個問題。()

A:錯

B:對

答案:A篩選危險因素常用的方法有()

A:都可

B:逐步法

C:后退法

D:前進法

答案:ALogistic回歸中自變量若為多分類變量,宜將其按啞變量處理,與其他變量進行變量篩選時可用()

A:軟件自動篩選的后退法

B:軟件自動篩選的前進法

C:應將幾個啞變量作為一個因素,整體進入回歸方程

D:軟件自動篩選的逐步法

答案:C為研究低齡青少年吸煙的外在因素,研究者采用整群抽樣,在某中心城區(qū)和遠城區(qū)的初中學校,各選擇初一年級一個班的全部學生進行調查,針對上述問題,可采用Logistic回歸篩選影響因素。()

A:錯

B:對

答案:A為研究低齡青少年吸煙的外在因素,研究者采用整群抽樣,在某中心城區(qū)和遠城區(qū)的初中學校,各選擇初一年級一個班的全部學生進行調查,針對上述問題,可采用Logistic回歸篩選影響因素。()

A:對

B:錯

答案:BLogistic回歸中,若因變量交換賦值,則關于兩個Logistic回歸方程的下列解釋中錯誤的是()

A:優(yōu)勢比互為倒數(shù)

B:參數(shù)估計絕對值相等

C:參數(shù)估計符號相同

D:模型擬合檢驗與回歸系數(shù)的假設檢驗結果相同

答案:C第十四章測試某超市研究銷售紀錄數(shù)據后發(fā)現(xiàn),買啤酒的人很大概率也會購買尿布,這種屬于數(shù)據挖掘的哪類問題?()

A:聚類

B:自然語言處理

C:分類

D:關聯(lián)規(guī)則發(fā)現(xiàn)

答案:DWeb內容挖掘實現(xiàn)技術()

A:文本總結

B:關聯(lián)規(guī)則

C:文本聚類

D:文本分類

答案:ABCD以下哪些算法是分類算法()

A:K-Mean

B:C4.5

C:DBSCAN

D:EM

答案:B以下哪些算法是基于規(guī)則的分類器()

A:ANN

B:NaiveBayes

C:KNN

D:C4.5

答案:D對于SVM分類算法,待分樣本集中的大部分樣本不是支持向量,移去或者減少這些樣本對分類結果沒有影響。()

A:錯

B:對

答案:B分類規(guī)則的挖掘方法通常有:決策樹法、貝葉斯法、人工神經網絡法。()

A:對

B:錯

答案:A以下說法正確的是:()

A:如果增加模型復雜度,那么模型的訓練錯誤率總是會降低

B:如果增加模型復雜度,那么模型的測試錯誤率總是會降低

C:我們不可以使用聚類“類別id”作為一個新的特征項,然后再用監(jiān)督學習分別進行學習

D:一個機器學習模型,如果有較高準確率,總是說明這個分類器是好的

答案:D對于神經網絡的說法,下面正確的是:()

A:減少神經網絡層數(shù),總是能減小測試數(shù)據集的分類錯誤率

B:都不對

C:增加神經網絡層數(shù),可能會增加測試數(shù)據集的分類錯誤率

D:增加神經網絡層數(shù),總是能減小訓練數(shù)據集的分類錯誤率

答案:C對于一個分類任務,如果開始時神經網絡的權重不是隨機賦值的,二是都設成0,下面哪個敘述是正確的?()

A:神經網絡可以訓練,但是所有的神經元最后都會變成

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論