數(shù)據(jù)挖掘習(xí)題_第1頁
數(shù)據(jù)挖掘習(xí)題_第2頁
數(shù)據(jù)挖掘習(xí)題_第3頁
數(shù)據(jù)挖掘習(xí)題_第4頁
數(shù)據(jù)挖掘習(xí)題_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、一、選擇題1、數(shù)據(jù)倉庫是隨時(shí)間變化的,下面的描述不正確的是: A、數(shù)據(jù)倉庫隨時(shí)間變化不斷增加新的數(shù)據(jù)內(nèi)容。B、捕捉到的新數(shù)據(jù)會(huì)覆蓋原來的快照。C、數(shù)據(jù)倉庫隨時(shí)間變化不斷刪去舊的數(shù)據(jù)內(nèi)容。D、數(shù)據(jù)倉庫中包含大量的綜合數(shù)據(jù),這些綜合數(shù)據(jù)會(huì)隨著時(shí)間的變化不斷地進(jìn)行重新綜合。 答案: B 隱藏答案 2、關(guān)于基本數(shù)據(jù)的元數(shù)據(jù)是指: A、基本元數(shù)據(jù)包括與數(shù)據(jù)源、數(shù)據(jù)倉庫、數(shù)據(jù)集市和應(yīng)用程序等結(jié)構(gòu)相關(guān)的信息。B、基本元數(shù)據(jù)包括與企業(yè)相關(guān)的管理方面的數(shù)據(jù)和信息。C、基本元數(shù)據(jù)包括日志文件和建立執(zhí)行處理的時(shí)序調(diào)度信息。 D、基本元數(shù)據(jù)包括關(guān)于裝載和更新處理、分析處理以及管理方面的信息。答案: A 隱藏答案 3、

2、下面有關(guān)數(shù)據(jù)粒度的描述不正確的是: A、粒度是指數(shù)據(jù)倉庫小數(shù)據(jù)單元的詳細(xì)程度和級別。B、數(shù)據(jù)越詳細(xì),粒度就越小,級別也就越高。C、數(shù)據(jù)綜合度越高,粒度就越大,級別也就越高。D、粒度的具體劃分將直接影響數(shù)據(jù)倉庫中的數(shù)據(jù)量以及查詢質(zhì)量。答案: B 隱藏答案 4、有關(guān)數(shù)據(jù)倉庫的開發(fā)特點(diǎn),不正確的描述是: A、數(shù)據(jù)倉庫開發(fā)要從數(shù)據(jù)出發(fā)。B、數(shù)據(jù)倉庫使用的需求在開發(fā)出去就要明確。C、數(shù)據(jù)倉庫的開發(fā)是一個(gè)不斷循環(huán)的過程,是啟發(fā)式的開發(fā)。D、在數(shù)據(jù)倉庫環(huán)境中,并不存在操作型環(huán)境中所固定的和較確切的處理流,數(shù)據(jù)倉庫中數(shù)據(jù)的分析和處理更靈活,且沒有固定的模式。答案: B 隱藏答案 5、RAID技術(shù)具有容錯(cuò)能力,

3、能夠滿足對存儲(chǔ)能力、性能和可靠性不斷提高的要求。其實(shí),實(shí)現(xiàn)原理是將數(shù)據(jù)寫入多張磁盤中,如果張磁盤發(fā)生故障,就從其他存放冗余數(shù)據(jù)的磁盤上訪問數(shù)據(jù)。有關(guān)RAID不同級別的描述不正確的是:A、在RAID 0這一級別上,數(shù)據(jù)記錄通過在多組驅(qū)動(dòng)器的扇區(qū)上交錯(cuò)地分布著實(shí)現(xiàn),沒有奇偶校驗(yàn),不提供任何冗余。B、RAID 1稱為鏡像。在這一級別上,數(shù)據(jù)被冗余地寫入成對的驅(qū)動(dòng)器中,可以獨(dú)立地從每個(gè)驅(qū)動(dòng)器提取該數(shù)據(jù)。這種方法沒有什么缺點(diǎn),是備份時(shí)候經(jīng)常用到的技術(shù)。C、RAID 3數(shù)據(jù)記錄在成組驅(qū)動(dòng)器上,位交錯(cuò),只有一個(gè)驅(qū)動(dòng)器仍有奇偶校驗(yàn)信息。D、RAID 5如果采用這一水平的技術(shù),則數(shù)據(jù)記錄在成組的驅(qū)動(dòng)器上扇區(qū)交錯(cuò)

4、地存放著,所有驅(qū)動(dòng)器都有奇偶校驗(yàn)信息。 答案: B 隱藏答案 6、有關(guān)數(shù)據(jù)倉庫測試,下列說法不正確的是:A、在完成數(shù)據(jù)倉庫的實(shí)施階段中,需要對數(shù)據(jù)倉庫進(jìn)行各種測試。測試工作中要包括單元測試和系統(tǒng)集成測試。B、當(dāng)數(shù)據(jù)倉庫的每個(gè)單獨(dú)組件完成后,就需要對它們進(jìn)行單元測試。C、系統(tǒng)的集成測試需要對數(shù)據(jù)倉庫的所有組件進(jìn)行大量的功能測試和回歸測試。D、在測試之前沒必要制定詳細(xì)的測試計(jì)劃。答案: D 隱藏答案 7、OLAP技術(shù)的核心是:A、在線性B、對用戶的快速響應(yīng)C、互操作性D、多維分析 答案: D 隱藏答案 8、關(guān)于OLAP的特性,下面正確的是:快速性 可分析性 多維性 信息性 共享性A、B、C、D、答

5、案: D 隱藏答案 9、關(guān)于OLAP和OLTP的區(qū)別的描述,不正確的是:A、OLAP主要是關(guān)于如何理解聚集的大量不同的數(shù)據(jù)。它與OLAP應(yīng)用程序不同。B、與OLAP應(yīng)用程序不同,OLTP應(yīng)用程序包含大量相對簡單的事務(wù)。C、OLAP的特點(diǎn)在于事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高。D、OLAP是以數(shù)據(jù)倉庫為基礎(chǔ)的,其最終數(shù)據(jù)來源與OLTP一樣均來自底層的數(shù)據(jù)庫系統(tǒng),兩者面對的用戶是相同的。答案: D 隱藏答案 10、OLAM技術(shù)一般簡稱為“數(shù)據(jù)聯(lián)機(jī)分析挖掘”,下面說法正確的是:A、OLAP和OLAM都基于客戶機(jī)/服務(wù)器模式,只有后者有與用戶的交互性。B、由于OLAM的立方體和用于OLAP的立方體

6、有本質(zhì)的區(qū)別。C、基于Web的OLAM是Web技術(shù)與OLAM技術(shù)的結(jié)合。D、OLAM服務(wù)器通過用戶圖形接口接收用戶的分析指令,在元數(shù)據(jù)的指導(dǎo)下,對超級立方體作一定的操作。答案: D 隱藏答案 11、數(shù)據(jù)倉庫的數(shù)據(jù)具有四個(gè)基本特征,下列不正確的是: A、面向主題的。B、集成的。C、不可更新的。D、不隨時(shí)間變化的。答案: D 隱藏答案 12、下列是關(guān)于OLAP的描述,不正確的是:A、一個(gè)多維數(shù)組可以表示為:(維1,維2,維n)B、維的一個(gè)取值稱為該維的一個(gè)維成員C、OLAP是聯(lián)機(jī)分析處理D、OLAP是以數(shù)據(jù)倉庫進(jìn)行分析決策的基礎(chǔ)答案: A 隱藏答案 13、關(guān)于OLAP和OLTP的說法,下列不正確的

7、是:A、OLTP事務(wù)量大,但事務(wù)內(nèi)容比較簡單且重復(fù)率高B、OLAP的最終數(shù)據(jù)來源與OLTP不一樣C、OLTP面對的是決策人員和高層管理人員D、OLTP以應(yīng)用為核心,是應(yīng)用驅(qū)動(dòng)的答案: B 隱藏答案 14、關(guān)于數(shù)據(jù)倉庫元數(shù)據(jù)的描述,下列不正確的是:A、元數(shù)據(jù)描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、索引等項(xiàng)內(nèi)容。B、元數(shù)據(jù)內(nèi)容在設(shè)計(jì)數(shù)據(jù)倉庫時(shí)確定后,就不應(yīng)該再改變。C、元數(shù)據(jù)包含對數(shù)據(jù)轉(zhuǎn)換的描述。D、元數(shù)據(jù)是有效管理數(shù)據(jù)倉庫的重要前提。答案: B 隱藏答案 15、下列描述不正確的是:A、模型輔助決策系統(tǒng)一般可以使用若干個(gè)模型來解決同一問題。B、人機(jī)交互系統(tǒng)是決策支持系統(tǒng)的一個(gè)組成部分。C、決策支持系統(tǒng)包含模型

8、庫和模型庫管理系統(tǒng)。D、智能決策支持系統(tǒng)包含知識庫系統(tǒng)。答案: A 隱藏答案 16、決策支持系統(tǒng)可以用不同的方法進(jìn)行構(gòu)造,下列的說法不正確的是A、可以用生命周期法和原型法構(gòu)造決策支持系統(tǒng)。B、原型法是一個(gè)迭代過程。C、原型法中不存在對用戶的反饋。D、SDLC即是系統(tǒng)開發(fā)的生命周期法答案: C 隱藏答案 17、數(shù)據(jù)清洗是數(shù)據(jù)轉(zhuǎn)移的一種基本類型,它不能通過下列的那種方法來完成:A、范圍檢驗(yàn)B、枚舉清單C、相關(guān)檢驗(yàn)D、刪除不合格的數(shù)據(jù)答案: D 隱藏答案 18、下列不是數(shù)據(jù)轉(zhuǎn)移的基本類型的是:A、簡單轉(zhuǎn)移B、清洗C、集成D、繼承答案: D 隱藏答案 19、開展數(shù)據(jù)挖掘的基本目的是:A、建立數(shù)據(jù)倉庫。

9、B、幫助用戶作決策。C、從大量數(shù)據(jù)中提取有用信息。D、對數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析。答案: C 隱藏答案 20、產(chǎn)生數(shù)據(jù)挖掘的根本原因是:A、數(shù)據(jù)統(tǒng)計(jì)分析。B、技術(shù)的發(fā)展。C、商業(yè)推動(dòng)。D、數(shù)據(jù)倉庫的產(chǎn)生。答案: A 隱藏答案 21、()是通過數(shù)據(jù)庫中的一些屬性來預(yù)測另一個(gè)屬性,它在驗(yàn)證用戶提出的假設(shè)的過程中提取信息。A、文本數(shù)據(jù)挖掘B、發(fā)現(xiàn)驅(qū)動(dòng)的數(shù)據(jù)挖掘C、驗(yàn)證驅(qū)動(dòng)的數(shù)據(jù)挖掘D、Web數(shù)據(jù)挖掘答案: C 隱藏答案 22、對于在數(shù)據(jù)倉庫中設(shè)計(jì)、使用OLAP的用戶來說,下面不屬于OLAP的衡量標(biāo)準(zhǔn)的是:A、解釋性批處理提取。B、彈性報(bào)告和一致性能報(bào)告。C、對物理層的自動(dòng)調(diào)整。D、體系結(jié)構(gòu)。答案: D 隱

10、藏答案 23、對MOLAP和ROLAP的比較,不正確的說法是:A、MOLAP的查詢能力一般較好,而在ROLAP中進(jìn)行查詢,往往很難預(yù)料查詢結(jié)果。B、MOLAP所需要的數(shù)據(jù)加載時(shí)間比較長,而ROLAP的加載時(shí)間要比MOLAP短。C、ROLAP比MOLAP的查詢速度都要快很多。D、MOLAP在分析過程中的精度較高,具有分析的優(yōu)勢。答案: C 隱藏答案 24、關(guān)于OLAP服務(wù)器及其工具,說法正確的是:A、只有Oracle提供了OLAP功能。B、評價(jià)OLAP服務(wù)器的標(biāo)準(zhǔn)不包括全局結(jié)構(gòu)視圖。C、OLAP的服務(wù)引擎都應(yīng)滿足分析模型及應(yīng)用在功能、規(guī)模和技術(shù)特征上的要求。D、對OLAP服務(wù)器的管理能力沒有特別

11、的要求。答案: C 隱藏答案 25、數(shù)據(jù)挖掘工具按照使用方式分類,可以分為:A、分為基于神經(jīng)網(wǎng)絡(luò)的工具,基于規(guī)則和決策樹的工具,基于模糊邏輯的工具和綜合性數(shù)據(jù)挖掘工具等。B、分成決策方案生成工具,商業(yè)分析工具和研究分析工具三類。C、分成專用型數(shù)據(jù)挖掘工具和通用型數(shù)據(jù)挖掘工具兩大。D、分成基于神經(jīng)網(wǎng)絡(luò)的工具和研究分析工具。答案: B 隱藏答案 二、填空題1、數(shù)據(jù)倉庫是_、_、_、_有組織的數(shù)據(jù)集合,支持管理的決策過程。 答案: 面向主題、集成的、時(shí)變的、非易失的隱藏答案 2、一般來說,可將數(shù)據(jù)倉庫的開發(fā)和應(yīng)用過程細(xì)分為_、_、_、_。 答案: 設(shè)想階段、規(guī)劃和成長階段、控制階段和穩(wěn)定階段 隱藏答

12、案 3、_是對現(xiàn)實(shí)世界進(jìn)行抽象的工具,需要將現(xiàn)實(shí)世界的事物及其有關(guān)特征轉(zhuǎn)換為信息世界的數(shù)據(jù),才能對信 息進(jìn)行處理與管理,這就需要依靠_作為這種轉(zhuǎn)換的橋梁。這種轉(zhuǎn)換經(jīng)歷了從現(xiàn)實(shí)到_,從_到_,最后從_到物理模 型的轉(zhuǎn)換。 答案: 數(shù)據(jù)模型、數(shù)據(jù)模型、概念模型、概念模型、邏輯模型、邏輯模型 隱藏答案 4、元數(shù)據(jù)是關(guān)于數(shù)據(jù)、_和應(yīng)用程序的結(jié)構(gòu)和意義的描述信息,其主要目標(biāo)是_。其范圍可以是某個(gè)特別的數(shù)據(jù)庫管理系統(tǒng)中從現(xiàn)實(shí)世界的概念上的一般概括,到_。 答案: 操縱數(shù)據(jù)的進(jìn)程、提供數(shù)據(jù)資源的全面指南、詳細(xì)的物理說明 隱藏答案 5、按對象級別對元數(shù)據(jù)進(jìn)行分類,可以從三個(gè)抽象級別上來認(rèn)識:_、邏輯級和_。答

13、案: 概念級、物理級 隱藏答案 6、數(shù)據(jù)庫系統(tǒng)的特點(diǎn)主要體現(xiàn)在下面幾個(gè)方面:_、數(shù)據(jù)的共享性、_和_。答案: 數(shù)據(jù)的結(jié)構(gòu)化、數(shù)據(jù)的獨(dú)立性、數(shù)據(jù)統(tǒng)一由DBMS管理和控制。 隱藏答案 7、依據(jù)數(shù)據(jù)倉庫數(shù)據(jù)量大但是操作單一的特點(diǎn),可以采取一些技術(shù)來進(jìn)行數(shù)據(jù)倉庫的物理數(shù)據(jù)模型設(shè)計(jì),如:合并表、_、引入冗余、_、建立廣義索引等等。答案: 建立數(shù)據(jù)序列、表的物理分割、生成導(dǎo)出數(shù)據(jù) 隱藏答案 8、數(shù)據(jù)倉庫的接口技術(shù)包含多技術(shù)接口技術(shù)、_和數(shù)據(jù)的高效率加載技術(shù)。答案: 語言接口技術(shù) 隱藏答案 9、數(shù)據(jù)倉庫中數(shù)據(jù)的組織方式與數(shù)據(jù)庫不同,通常采用_分級的方式進(jìn)行組織。般包括早期細(xì)節(jié)數(shù)據(jù)、_、輕度綜合數(shù)據(jù)、_以及_

14、五部分。答案: 當(dāng)前細(xì)節(jié)數(shù)據(jù)、高度綜合數(shù)據(jù)、元數(shù)據(jù) 隱藏答案 10、數(shù)據(jù)倉庫的需求分析根據(jù)不同領(lǐng)域可以劃分為_、設(shè)計(jì)的需求、_和最終用戶的需求等方面。答案: 業(yè)主(投資者)的需求、開發(fā)者的需求 隱藏答案 11、數(shù)據(jù)倉庫雖然是從數(shù)據(jù)庫發(fā)展而來的,但兩者存在大的差異,從數(shù)據(jù)存儲(chǔ)內(nèi)容看,數(shù)據(jù)庫只存放_,而數(shù)據(jù)倉庫則存放_,數(shù)據(jù)庫中的數(shù)據(jù)的目標(biāo)是面向_,而數(shù)據(jù)倉庫則面向_。答案: 當(dāng)前值、歷史值、業(yè)務(wù)操作人員、高層管理人員 隱藏答案 12、數(shù)據(jù)庫內(nèi)的數(shù)據(jù)是_的,只要有業(yè)務(wù)發(fā)生,數(shù)據(jù)就會(huì)更新,而數(shù)據(jù)倉庫則是_的歷史數(shù)據(jù),只能定期添加、刷新。答案: 動(dòng)態(tài)變化、靜態(tài) 隱藏答案 13、數(shù)據(jù)倉庫主要是供決策分析

15、用的,所涉及的數(shù)據(jù)操作主要是_,一般情況并不進(jìn)行_答案: 數(shù)據(jù)查詢、修改操作 隱藏答案 14、數(shù)據(jù)倉庫創(chuàng)建后,首先從_中抽取所需要的數(shù)據(jù)到數(shù)據(jù)準(zhǔn)備區(qū),在數(shù)據(jù)準(zhǔn)備區(qū)中經(jīng)過_的凈化處理,再加載到數(shù)據(jù)倉庫數(shù)據(jù)庫中,最后根據(jù)用戶的需求將數(shù)據(jù)發(fā)布到_。答案: 數(shù)據(jù)源、數(shù)據(jù)、數(shù)據(jù)集市/知識挖掘庫中 隱藏答案 15、“主題”在數(shù)據(jù)倉庫中由一系列_實(shí)現(xiàn)的。一個(gè)主題之下表的劃分可按_、數(shù)據(jù)所屬時(shí)間段進(jìn)行劃分。主題在數(shù)據(jù)倉庫中可用_方式進(jìn)行存儲(chǔ),如果主題存量大為提高處理效率可采用_方式進(jìn)行存儲(chǔ)。答案: 列表、數(shù)據(jù)的綜合、多維數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫 隱藏答案 三、簡答題1、 什么是數(shù)據(jù)挖掘(Data Mining)?

16、答案: 數(shù)據(jù)挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過 程。挖掘的數(shù)據(jù)源必須是真實(shí)的、大量的、含噪聲的;發(fā)現(xiàn)的是用戶感興趣的知識;發(fā)現(xiàn)的知識要可接受、可理解、可運(yùn)用;并不要求發(fā)現(xiàn)放之四海皆準(zhǔn)的知識,僅 支持特定的發(fā)現(xiàn)問題。 隱藏答案 2、數(shù)據(jù)挖掘研究內(nèi)容是什么? 答案: 主要研究內(nèi)容包括基礎(chǔ)理論、發(fā)現(xiàn)算法、數(shù)據(jù)倉庫、可視化技術(shù)、定性定量互換模型、知識表示方法、發(fā)現(xiàn)知識的維護(hù)和再利用、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)中的知識發(fā)現(xiàn)以及網(wǎng)上數(shù)據(jù)挖掘等。 隱藏 答案 3、數(shù)據(jù)挖掘提取出的知識主要

17、由哪些類型? 答案: 數(shù)據(jù)挖掘所發(fā)現(xiàn)的知識最常見的有以下四類:廣義知識(Generalization), 關(guān)聯(lián)知識(Association),分類知識(ClassificationClustering), 預(yù)測型知識(Prediction),偏差型知識(Deviation)。隱藏答案 4、什么是專家系統(tǒng)? 答案: 專家系統(tǒng)是一個(gè)智能計(jì)算機(jī)程序系統(tǒng),其內(nèi)部含有大量的某一個(gè)領(lǐng)域?qū)<宜降闹R與以驗(yàn),能夠利用人類專家的知識和解決問題的方法來處理領(lǐng)域問題,專家系統(tǒng)是一種模擬人類專家解決領(lǐng)域問題的計(jì)算機(jī)程序系統(tǒng)。隱藏答案 5、簡述數(shù)據(jù)倉庫的組成。答案: 數(shù)據(jù)倉庫管理部分的組成包括:定義部件。這一部件用于

18、定義和建立數(shù)據(jù)倉庫系統(tǒng),設(shè)計(jì)和定義數(shù)據(jù)倉庫的數(shù)據(jù)庫。定義數(shù)據(jù)來源。確定數(shù)據(jù)源向數(shù)據(jù)倉庫復(fù)制數(shù)據(jù)的轉(zhuǎn)換、清理規(guī)則。數(shù)據(jù)獲取部件。依據(jù)數(shù)據(jù)定義部件定義的規(guī)則從數(shù)據(jù)源中指數(shù)據(jù)抽取到數(shù)據(jù)倉庫中,完成清洗、變換和集成工作,將數(shù)據(jù)裝載到數(shù)據(jù)倉庫中,定期清理數(shù)據(jù)倉庫, 消除數(shù)據(jù)倉庫與源數(shù)據(jù)庫的不一致,清除失效數(shù)據(jù)等。一般情況下可以通過一些通用工具完成,但是由于數(shù)據(jù)源中的數(shù)據(jù)類型、格式非常復(fù)雜,因此有些情況下需要 編制特定的工具完成數(shù)據(jù)獲取工作。管理部件。主要包括對數(shù)據(jù)倉庫中數(shù)據(jù)的維護(hù)、安全、備份、恢復(fù)、日志等工作。這些工作需要借助數(shù)據(jù)庫管理系統(tǒng)的功能實(shí)現(xiàn)。元數(shù)據(jù)管理,也可稱為信息目錄管理。它主要完成元數(shù)據(jù)的管理、存儲(chǔ)以及對整個(gè)數(shù)據(jù)倉庫數(shù)據(jù)的檢測和管理,由以下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論