商務(wù)數(shù)據(jù)分析技術(shù) 補充習(xí)題及答案 項目一 數(shù)據(jù)分析概述習(xí)題集_第1頁
商務(wù)數(shù)據(jù)分析技術(shù) 補充習(xí)題及答案 項目一 數(shù)據(jù)分析概述習(xí)題集_第2頁
商務(wù)數(shù)據(jù)分析技術(shù) 補充習(xí)題及答案 項目一 數(shù)據(jù)分析概述習(xí)題集_第3頁
商務(wù)數(shù)據(jù)分析技術(shù) 補充習(xí)題及答案 項目一 數(shù)據(jù)分析概述習(xí)題集_第4頁
商務(wù)數(shù)據(jù)分析技術(shù) 補充習(xí)題及答案 項目一 數(shù)據(jù)分析概述習(xí)題集_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

一、單項選擇題1.在大數(shù)據(jù)時代,數(shù)據(jù)被視為一種可以被反復(fù)利用的()。A.最終產(chǎn)品B.技術(shù)專利C.生產(chǎn)資料D.商業(yè)機(jī)密2.數(shù)據(jù)分析的根本目的是()。A.收集和存儲海量數(shù)據(jù)B.使用最復(fù)雜的算法模型C.提取有價值的信息并形成結(jié)論以支持決策D.制作出精美的數(shù)據(jù)圖表3.在DIKW金字塔模型中,位于最底層的是()。A.信息B.數(shù)據(jù)C.知識D.智慧4.按照計量尺度分類,“客戶滿意度評分(非常滿意、滿意、一般、不滿意)”屬于()。A.數(shù)值型數(shù)據(jù)B.分類數(shù)據(jù)C.順序數(shù)據(jù)D.橫截面數(shù)據(jù)5.為其他目的而收集,需要重新加工整理才能使用的數(shù)據(jù)被稱為()。A.直接數(shù)據(jù)B.觀測數(shù)據(jù)C.實驗數(shù)據(jù)D.間接數(shù)據(jù)6.數(shù)據(jù)分析流程的起點和前提是()。A.數(shù)據(jù)收集B.問題定義C.數(shù)據(jù)預(yù)處理D.描述性分析7.數(shù)據(jù)預(yù)處理中,將數(shù)據(jù)按比例縮放,使之落入一個特定區(qū)間(如[0,1])的方法稱為()。A.數(shù)據(jù)離散化B.數(shù)據(jù)清理C.數(shù)據(jù)規(guī)范化D.數(shù)據(jù)集成8.用于檢測和處理數(shù)據(jù)中損壞或不準(zhǔn)確記錄(如缺失值、異常值)的預(yù)處理步驟是()。A.數(shù)據(jù)集成B.數(shù)據(jù)歸約C.數(shù)據(jù)清理D.數(shù)據(jù)變換9.在數(shù)據(jù)變換中,將連續(xù)年齡轉(zhuǎn)換為“兒童、青年、中年、老年”類別,這個過程叫做()。A.數(shù)據(jù)規(guī)范化B.數(shù)據(jù)離散化C.類別編碼D.特征歸約10.描述性分析中,用于反映數(shù)據(jù)水平中心值的指標(biāo)是()。A.離中趨勢指標(biāo)B.集中趨勢指標(biāo)C.分布形狀指標(biāo)D.方差分析11.一種不依賴于任何分布假設(shè),完全從數(shù)據(jù)出發(fā),通過可視化探索數(shù)據(jù)內(nèi)在規(guī)律的分析方法是()。A.描述性分析B.推斷性分析C.探索性分析D.預(yù)測性分析12.根據(jù)已知的樣本數(shù)據(jù)對未知的總體特征做出科學(xué)判斷的分析方法是()。A.描述性分析B.推斷性分析C.探索性分析D.回顧性分析13.以下哪項不屬于常見的推斷性分析方法?()A.參數(shù)估計B.假設(shè)檢驗C.方差分析D.數(shù)據(jù)可視化14.數(shù)據(jù)分析報告中,用于說明“為什么要進(jìn)行此次數(shù)據(jù)分析”的部分是()。A.問題定義B.研究背景C.數(shù)據(jù)說明D.分析方法15.以下哪款軟件被描述為“免費、開源,并集統(tǒng)計分析與圖形顯示于一體”?()A.MicrosoftExcelB.SPSSC.R語言D.EViews16.SPSS軟件最突出的特點是()。A.免費和開源B.操作界面極為友好,輸出結(jié)果美觀C.專門用于時間序列分析D.是一種“膠水語言”17.Python的設(shè)計理念不包括()。A.優(yōu)雅B.明確C.簡單D.有多種方法做一件事18.網(wǎng)飛公司(Netflix)通過分析用戶數(shù)據(jù)翻拍《紙牌屋》是數(shù)據(jù)分析在()領(lǐng)域的應(yīng)用。A.電商B.交通C.文化傳媒D.金融19.UPS公司通過分析車輛傳感器數(shù)據(jù)來優(yōu)化物流路線,是數(shù)據(jù)分析在()領(lǐng)域的應(yīng)用。A.電商B.交通C.能源D.金融20.詹姆斯·西蒙斯運用“壁虎式投資法”獲得高額收益,是數(shù)據(jù)分析在()領(lǐng)域的應(yīng)用。A.電商B.交通C.能源D.金融二、多項選擇題1.以下關(guān)于數(shù)據(jù)、信息、知識、智慧(DIKW)關(guān)系的描述,正確的有()。A.數(shù)據(jù)是信息的原材料B.信息是數(shù)據(jù)的提煉和解釋C.知識是信息的系統(tǒng)化整合D.智慧是知識的創(chuàng)造性應(yīng)用2.數(shù)據(jù)分類的基本原則包括()。A.穩(wěn)定性和系統(tǒng)性B.可擴(kuò)充性C.綜合實用性D.兼容性3.按照收集方法分類,數(shù)據(jù)可以分為()。A.數(shù)值型數(shù)據(jù)B.觀測數(shù)據(jù)C.直接數(shù)據(jù)D.實驗數(shù)據(jù)4.一個完整的數(shù)據(jù)分析流程通常包括()。A.問題定義與數(shù)據(jù)收集B.數(shù)據(jù)預(yù)處理C.描述性、探索性與推斷性分析D.數(shù)據(jù)分析報告與應(yīng)用5.數(shù)據(jù)預(yù)處理的主要方法包括()。A.數(shù)據(jù)清理B.數(shù)據(jù)集成C.數(shù)據(jù)歸約D.數(shù)據(jù)變換6.以下屬于數(shù)據(jù)清理任務(wù)的有()。A.缺失值處理B.異常值檢測與處理C.不一致性糾正D.數(shù)據(jù)規(guī)范化7.探索性分析的主要目標(biāo)有()。A.檢驗數(shù)據(jù)預(yù)處理結(jié)果B.理解數(shù)據(jù)的內(nèi)在規(guī)律C.確定有效的指標(biāo)及模型D.對總體進(jìn)行參數(shù)估計8.以下關(guān)于R語言的描述,正確的有()。A.是自由軟件,完全免費且開源B.是一種可編程的語言,語法通俗易懂C.操作結(jié)果輸出非常豐富,類似SPSSD.具有很強的互動性9.數(shù)據(jù)分析在電商領(lǐng)域的典型應(yīng)用包括()。A.個性化推薦系統(tǒng)B.預(yù)測式發(fā)貨C.優(yōu)化物流路線D.用戶畫像10.教材中強調(diào)的數(shù)據(jù)分析人員應(yīng)具備的“工匠精神”包括()。A.專注和耐心B.精確性C.團(tuán)隊合作精神D.責(zé)任感和職業(yè)道德三、判斷題1.()數(shù)據(jù)本身就是信息和知識,無需分析即可直接產(chǎn)生價值。2.()分類數(shù)據(jù)和順序數(shù)據(jù)都屬于定性數(shù)據(jù),一般用文字表示。3.()橫截面數(shù)據(jù)是指在多個時間點上收集的反映總體特征的數(shù)據(jù)。4.()問題定義是數(shù)據(jù)分析流程中可有可無的環(huán)節(jié),只要數(shù)據(jù)量大就能得出好結(jié)果。5.()數(shù)據(jù)預(yù)處理的目的是為了提高數(shù)據(jù)質(zhì)量,使之更適合后續(xù)分析。6.()在數(shù)據(jù)集成中,將來自不同數(shù)據(jù)源的“學(xué)號”和“學(xué)生ID”映射為同一字段的過程稱為實體對齊。7.()數(shù)據(jù)歸約只減少樣本數(shù)量,不減少特征數(shù)量。8.()獨熱編碼(One-HotEncoding)是一種常用的類別編碼方法。9.()描述性分析主要用于根據(jù)樣本數(shù)據(jù)推斷總體特征。10.()探索性分析是一種理論驅(qū)動而非數(shù)據(jù)驅(qū)動的分析方法。11.()方差分析是一種用于研究不同因素對觀測變量是否有顯著影響的推斷性分析方法。12.()MicrosoftExcel是一款入門級的數(shù)據(jù)分析軟件,具有直觀的界面和出色的計算功能。13.()Python語言的設(shè)計哲學(xué)是“用一種方法,最好是只有一種方法來做一件事”。14.()EViews是一款專門用于處理橫截面數(shù)據(jù)的軟件。15.()數(shù)據(jù)分析的應(yīng)用僅限于互聯(lián)網(wǎng)和高科技行業(yè),傳統(tǒng)行業(yè)無法受益。四、簡答題1.請簡述DIKW金字塔模型中數(shù)據(jù)、信息、知識和智慧四者之間的關(guān)系,并舉例說明。2.數(shù)據(jù)預(yù)處理包含哪些主要步驟?請簡要說明每個步驟的目的。3.描述性分析、探索性分析和推斷性分析三者之間有何區(qū)別與聯(lián)系?4.請列舉教材中介紹的三種數(shù)據(jù)分析軟件(Excel、R、Python、SPSS中任選三種),并簡述它們各自的特點和主要適用場景。5.請結(jié)合教材內(nèi)容,談?wù)剶?shù)據(jù)分析在金融領(lǐng)域的兩類具體應(yīng)用(例如量化投資和風(fēng)險管控),并說明其帶來的價值。參考答案單項選擇題答案1.C2.C3.B4.C5.D6.B7.C8.C9.B10.B11.C12.B13.D14.B15.C16.B17.D18.C19.B20.D多項選擇題答案A,B,C,D2.A,B,C,D3.B,D4.A,B,C,D5.A,B,C,D6.A,B,C7.A,B,C8.A,B,D9.A,B,D10.A,B,C,D判斷題答案1.×2.√3.×4.×5.√6.×7.×8.√9.×10.×11.√12.√13.√14.×15.×簡答題答案要點1.DIKW關(guān)系簡述數(shù)據(jù):原始的、未經(jīng)處理的符號和記錄。例如,用戶的瀏覽記錄“A,B,C”。信息:經(jīng)過處理和組織的有上下文的數(shù)據(jù)。例如,“用戶在一分鐘內(nèi)連續(xù)瀏覽了三種不同價格的商品A、B、C”。知識:對信息的深入理解,形成的模式、規(guī)律和原則。例如,“該用戶行為符合‘比價’模式”。智慧:運用知識做出明智決策和采取行動的能力。例如,根據(jù)“比價”模式,系統(tǒng)向該用戶推送性價比最高的商品B的優(yōu)惠券,以促成交易。關(guān)系:從底層到頂層,逐層遞進(jìn),價值密度不斷增加。2.數(shù)據(jù)預(yù)處理主要步驟及目的數(shù)據(jù)清理:檢測并糾正數(shù)據(jù)中的錯誤,包括處理缺失值、異常值和不一致數(shù)據(jù),以提高數(shù)據(jù)的準(zhǔn)確性和一致性。數(shù)據(jù)集成:將來自不同來源的數(shù)據(jù)合并成一個一致的數(shù)據(jù)存儲,解決模式映射和實體對齊問題,以提供完整的數(shù)據(jù)視圖。數(shù)據(jù)歸約:在盡可能保持原有信息的前提下,減少數(shù)據(jù)量,包括特征歸約和樣本歸約,以降低計算成本和提高分析效率。數(shù)據(jù)變換:將數(shù)據(jù)轉(zhuǎn)換為適合挖掘的形式,包括規(guī)范化、離散化和類別編碼,以使數(shù)據(jù)適應(yīng)特定算法和分析方法的要求。3.三類分析的區(qū)別與聯(lián)系區(qū)別描述性分析:回答“發(fā)生了什么?”,用概括性指標(biāo)(如均值、標(biāo)準(zhǔn)差)總結(jié)數(shù)據(jù)現(xiàn)狀。探索性分析:回答“數(shù)據(jù)中有什么規(guī)律?”,通過可視化等手段,不受假設(shè)限制地探索數(shù)據(jù)內(nèi)在結(jié)構(gòu)和模式。推斷性分析:回答“總體的情況如何?”,根據(jù)樣本數(shù)據(jù),利用統(tǒng)計模型對總體進(jìn)行推斷和預(yù)測(如參數(shù)估計、假設(shè)檢驗)。聯(lián)系三者是數(shù)據(jù)分析流程中環(huán)環(huán)相扣的步驟。描述性分析是基礎(chǔ),提供了數(shù)據(jù)的初步概覽;探索性分析在此基礎(chǔ)上深入挖掘,可能發(fā)現(xiàn)新的線索并提出假設(shè);推斷性分析則對這些假設(shè)進(jìn)行嚴(yán)格的統(tǒng)計檢驗,從而得出具有普遍意義的結(jié)論。探索性分析的結(jié)果可以指導(dǎo)描述性指標(biāo)的選擇和推斷性分析模型的建立。4.三種數(shù)據(jù)分析軟件特點及適用場景Excel特點:界面直觀,操作簡單,圖表功能強大,普及度高。適用場景:小型數(shù)據(jù)集的基本處理、快速計算、簡單的統(tǒng)計分析、制作圖表和報表,適合入門級和非專業(yè)數(shù)據(jù)分析人員。R語言特點:免費、開源,擁有強大的統(tǒng)計分析和圖形展示能力,社區(qū)活躍,包生態(tài)系統(tǒng)豐富。適用場景:復(fù)雜的統(tǒng)計分析、學(xué)術(shù)研究、數(shù)據(jù)挖掘、統(tǒng)計制圖,深受統(tǒng)計學(xué)家和科研人員喜愛。Python:特點:語法簡潔優(yōu)雅,通用編程語言,擁有龐大且強大的科算庫(如NumPy,Pandas,Scikit-learn),被稱為“膠水語言”。適用場景:大規(guī)模數(shù)據(jù)處理、機(jī)器學(xué)習(xí)、人工智能、Web開發(fā)、自動化腳本,適用于從數(shù)據(jù)分析到產(chǎn)品開發(fā)的整個流程。SPSS特點:圖形化菜單操作界面極為友好,輸出結(jié)果美觀,易于學(xué)習(xí)和使用。適用場景:社會科學(xué)、市場調(diào)研等領(lǐng)域的數(shù)據(jù)分析,適合進(jìn)行常見的統(tǒng)計檢驗、方差分析、回歸分析等

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論