2025春國開《電子商務數據分析與應用》形考任務1-5答案_第1頁
2025春國開《電子商務數據分析與應用》形考任務1-5答案_第2頁
2025春國開《電子商務數據分析與應用》形考任務1-5答案_第3頁
2025春國開《電子商務數據分析與應用》形考任務1-5答案_第4頁
2025春國開《電子商務數據分析與應用》形考任務1-5答案_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2025春國開《電子商務數據分析與應用》形考任務1答案一、單選題1、電子商務數據的獲取途徑不包括()A.產品自有數據B.調查問卷C.互聯網數據導入D.從別人數據庫竊取2、請判斷下面各項數據的結構化類型:()A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對3、請判斷下面各項數據的結構化類型:()A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對4、請判斷下面各項數據的結構化類型:A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對5、請判斷下面各項數據的結構化類型:A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對6、請判斷下面各項數據的結構化類型:A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對7、請判斷下面各項數據的結構化類型:A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對8、以下哪個不是基于電商平臺的基礎數據?A.商品數據B.客戶基本信息數據C.客戶評價數據D.互聯網金融數據9、隨著電子商務的發(fā)展,國內電子商務研究性網站也隨著增多,比較典型的有()A.中國電子商務研究中心B.阿里研究院C.艾瑞咨詢D.以上全部10、下列可以導入Python模塊的語句是A.importmoduleB.inputmoduleC.printmoduleD.defmodule11、以下屬于內部數據獲取渠道的是A.多多參謀B.店偵探C.百度統(tǒng)計D.店數據12、數據采集的基本方法包括()、網絡數據采集法和其他數據采集法。A.數據庫采集法B.訪問記錄采集法C.數據目錄采集法D.系統(tǒng)日志采集法13、商務數據包括()A.電子商務平臺的基礎數據B.電子商務專業(yè)網站的研究數據C.電子商務媒體報道D.以上全部14、以下關于數據采集說法正確的是()A.爬蟲類采集工具可以采集所有類型的數據B.淘寶網店的運營數據可以通過使用友盟等統(tǒng)計工具進行采集C.第三方電商網站可以使用百度統(tǒng)計采集店鋪運營數據D.店偵探可以獲取店鋪的詳細銷售數據15、電子商務數據的主要來源包括()A.電子商務平臺B.社交電商平臺C.O2O數據D.以上全部16、()指企業(yè)針對個人開展電子商務活動的平臺,如企業(yè)通過平臺為個人提供在線醫(yī)療咨詢、在線商品購買等服務。企業(yè)或商家機構通過平臺不消費者進行各種商務活動、交易活動、金融活動和綜合服務活動,是消費者利用互聯網直接參與經濟活動的形式。A.B2B平臺B.社交零售電商C.B2C平臺D.C2C平臺17、數據處理一般指對數據進行()、()、()、和()的過程。A.采集、分析、分析、可視化表達B.整理、采集、分析、可視化表達C.采集、整理、分析、可視化表達D.整理、可視化表達、分析、采集18、數據采集可為數據處理()的數據。A.準備必要B.整理必要C.分析必要D.匯報必要19、以下關于數據采集說法正確的()A.同一數據如果有多個來源途徑,可以選擇其中的任一個來源進行采集B.數據采集人員需要針對數據采集需求、背景等對數據采集渠道進行可信度劃分,優(yōu)先選擇可信度更高的數據采集渠道C.數據采集渠道可信度與數據采集的背景和指標無關,屬于獨立的體系D.數據采集渠道無所謂優(yōu)劣,主要看能否獲取到所需數據20、以下屬于客戶流量屬性的是()A.來源頁面B.常用設備C.客戶下載D.客戶性別21、下列數據指標中不屬于客戶行為的是()。A.購買時間B.瀏覽路徑C.支付金額D.收貨地址22、某網店準備按照店鋪產品的引流能力及盈利能力兩項數據分別對產品進行排序,將兩項數據指標排名均靠后的5款產品進行下架處理。根據以上情景可確定數據分析目標為()A.分析店鋪商品的引流能力和盈利能力B.分店鋪商品中能夠穩(wěn)定獲利的商品C.分析店鋪商品的展現量D.分析店鋪商品的推廣效果23、在數據采集過程中并非所有需要的數據指標都可以采集到,在這種情況下以下做法正確的是()。A.可以使用能夠反映該指標的其他數據替代B.不需要采集C.想盡一切辦法尋找可以采集到該指標的數據數據渠道D.忽略該數據的采集任務24、選項中關于爬蟲知識的說法錯誤的是:A.爬蟲是一個獲取網頁數據,并提取、保存信息的自動化程序B.爬蟲工作通常分為三步:獲取網頁-解析網頁-存儲數據C.使用爬蟲時應遵循Robots協(xié)議D.爬蟲可以隨意抓取Robots協(xié)議中標注Disallow的數據二、判斷題1、電子商務數據是對電子商務活動中客觀事物的邏輯歸納,可以用符號和字母等方式對客觀事物進行直觀描述。A.是B.否2、評論數據主要以圖片形式出現。A.是B.否3、通過大數據進行維度分析展現品牌印象關鍵詞,和產品的運營方式,幫助企業(yè)更好的掌握發(fā)展趨勢。A.是B.否4、通過大數據技術,可以實現企業(yè)的客戶資源進行精準鎖定,在企業(yè)在運營過程中,客戶資源的挖掘方式、具體情況和分布情況等,企業(yè)都可以進行搜集分析,形成基于企業(yè)的資源分布可視圖,就如同“電子地圖”一般。A.是B.否5、數據采集時需要數據采集人員不惜任何手段獲取所有需要的數據。A.是B.否6、在分析全店某段時間內的客單價時,需要采集的數據指標有該段時間內店鋪成交客戶數及成交總額。A.是B.否7、某網店準備分析一段時間內的全店轉化率,需要采集的數據指標有該段時間內的店鋪訪客數及成交訪客數。A.是B.否8、在數據采集工具選擇過程中需要注意工具的功能及適用范圍。A.是B.否9、電子商務數據采集時對于一些無法使用采集工具采集的數據,可以對其進行摘錄。A.是B.否10、電子商務數據采集渠道包含權威網站、數據機構、個人網站。A.是B.否11、價格會或價格決策關系到企業(yè)的利潤、成本補償、以及是否有利于產品銷售、促銷等問題,可以說價格在一定程度上影響著產品的生命力。A.是B.否12、把實際完成值與目標值進行對比,屬于縱比。A.是B.否13、企業(yè)與行業(yè)中的標桿企業(yè)、競爭對手或行業(yè)平均水平進行對比,這屬于橫比。A.是B.否14、AB測試是指設計兩個版本(A和B),A為目前的版本,B是猜想更好的版本或者新的版本。然后,通過測試比較這兩個版本之間你所關心的數據,最后選擇效果最好的版本。A.是B.否15、杜邦分析法利用幾種主要的財務比率之間的關系綜合地分析企業(yè)的財務狀況。具體來說,它是一種用來評價公司盈利能力和股東權益回報水平,從財務角度評價企業(yè)績效的經典方法。A.是B.否16、對比分析法在做淘寶數據分析過程中是常用的,例如競爭對手分析通過把我們的實際數據和競爭對手的數據進行比較,了解之間的差異并分析原因。A.是B.否17、用漏斗圖分析法不能直觀地看到每個環(huán)節(jié)的情況,不能看到每個環(huán)節(jié)的轉化情況、流失情況。A.是B.否18、問題樹分析法是將問題的所有子問題分層羅列,從最高層開始,并逐步向下擴展,把一個已知問題當成樹干,然后開始考慮這個問題和哪些相關問題或者子任務有關。每想到一點,就給這個問題(也就是樹干)加一個“樹枝”,并標明這個“樹枝”代表什么問題。一個大的“樹枝”上還可以有小的“樹枝”,以此類推,找出問題的所有相關聯項目。A.是B.否19、像賬號密碼這種私密的信息,網站基本不會使用GET請求去處理,而更多會使用POST請求去提交這些數據。GET請求更多用于獲取網頁內容。A.是B.否20、requests庫主要作用是從網站服務器獲取請求的數據,requests庫可直接使用,無需進行任何安裝A.是B.否21、是誰來做屬于5W2H中why的范疇。A.是B.否22、下列選項中,與目標對比、行業(yè)內對比、不同時期對比、活動效果對比屬于對比分析法分析維度。A.是B.否23、想要采集某獨立商城上行業(yè)竟品商品銷售價格,可以使用百度指數數據采集工具進行采集。A.是B.否24、數據分析的方法有AB測試法、杜邦分析法、對比分析法、5W2H分析法。A.是B.否25、數據分析中市場類指標主要用于描述行業(yè)情況和企業(yè)在行業(yè)中的發(fā)展情況,平均購買次數、活躍客戶比率屬于市場類指標。A.是B.否26、下列選項中,哪些屬于5W2H中Howmuch的范疇()?A.是誰來做?B.做到什么程度?C.在哪里做?D.是什么時候做?

2025春國開《電子商務數據分析與應用》形考任務2答案單選題1、下列關于為什么要做數據清理描述錯誤的是()A.數據有重復B.數據有錯誤C.數據有缺失D.數據量太大2、下列關于數據清理描述錯誤的是()A.數據清理能完全解決數據質量差的問題B.數據清理在數據分析過程中是不可或缺的一個環(huán)節(jié)C.數據清理的目的是提高數據質量D.可以借助Kettle來完成大量的數據清理工作3、下列關于使用參照表清洗數據說法錯誤的是()A.有些數據無法從內部發(fā)現錯誤,需要結合外部的數據進行參照B.只要方法得當,數據內部是可以發(fā)現錯誤的,不需要借助參照表C.使用參數表可以校驗數據的準確性D、使用參照表可以處理數據的一致性4、某店鋪2019年度會員信息表中,某會員的出生年份是1990年,但年齡卻記錄為25歲,此類錯誤需要進行()。A.缺失值清洗B.重復值清洗C.邏輯值清洗D.無價值數據清洗5、關于數據清洗的作用,下列說法正確的是()。A.去重、補漏、計算B.去重、補漏、糾錯C.補漏、糾錯、計算D.去重、計算、糾錯6、數據清洗時,運營數據中出現“下單時間2088-12-12”,屬于()。A.缺失值清洗B.格式內容清洗C.邏輯錯誤清洗D.重復數據清洗7、以下說法錯誤的是()A.數據預處理的主要流程為數據清理、數據集成、數據變換與數據歸約B.數據清理、數據集成、數據變換、數據歸約這些步驟在數據預處理活動中必須順序使用C.冗余數據的刪除既是一種數據清理形式,也是一種數據歸約D.整個預處理過程要盡量人機結合,尤其要注重和客戶以及專家多交流8、處理噪聲的方法一般有()A.分箱B.回歸C.聚類D.以上都是9、數據集成的過程中需要處理的問題有()A.實體識別B.冗余與相關性分析。C.數據沖突和檢測D.以上都是10、數據歸約的方法有()A.維度歸約B.數量歸約C.數據壓縮D.以上都是11、關于數據重塑的說法中,下列選項描述錯誤的是()。A.數據重塑可以將DataFrame轉換為SeriesB.stack()方法可以將列索引轉換為行索引C.對一個DataFrame使用stack()方法后返回的一定是一個SeriesD..unstack()方法可以將行索引轉換為列索引12.12.請閱讀下面的程序:執(zhí)行上述程序后,最終輸出的結果為()。A.0False1False2TrueB..0True1True2FalseC..0False1False2FalseD..0True1True2True13、下列選項中,關于drop_duplicates()方法描述錯誤的是()。A.僅支持單一特征數據的去重B..僅對Series和DataFrame對象有效C.數據去重時默認保留第一個數據D.該方法不會改變原始數據排列14、下列選項中,關于dropna()方法描述正確的是()。A.dropna()方法只會刪除值為NaN的數據B.dropna()方法不會刪除值為None的數據C.dropna()方法會刪除值為None和NaN的數據D.dropna()方法只會檢測缺失數據和空值15、下列選項中,關于duplicated()方法描述正確的是()。A.duplicate()方法用于刪除重復值B.duplicate()方法用于標記重復值C.duplicate()方法會改變原始數據D.duplicate()方法會將重復的數據標記為False16、下列選項中,屬于數據處理的目的是()A.使數據更加適用于分析B.對無意義的數據進行清洗C.整合數據D.以上全部17、數據清洗的主要內容包括()。A.缺失值清洗B.格式內容清洗C.邏輯錯誤清洗D.以上全部18、在數據表里,缺失值常見的表現形式是()。A.空值B.錯誤標識符C.#DIV/0!D.119、數據清洗時,處理缺失值的方法不包括()。A.刪除單元格B.刪除記錄C.數據補齊D.不處理20、數據邏輯錯誤不包括()。A.數據不合理B.數據自相矛盾C.數據不符合規(guī)則D.數據格式錯誤21、下列選項中,關于數據預處理說法正確的是()。A.數據清洗包含了數據標準化、數據合并和缺失值處理B.數據合并按照合并軸的方向主要分為左連接、右連接、內連接和外連接C.數據分析的預處理過程包括數據清洗、數據合并、數據標準化和數據轉換,它們之間存在交叉,沒有嚴格的先后關系D.數據標準化的主要對象是類別型特征22、檢測出異常值之后,通常會采用哪些方式處理它們?()A.直接將含有異常值的記錄刪除B.用具體的值來進行替換,可用前后兩個觀測值的平均值修正該異常值C.不處理,直接在具有異常值的數據集上進行統(tǒng)計分析D.以上全部23、下列函數中,可以對數據進行的合并的是()。A.concat()B..join()C..merge()D.以上全部24、下列方法中,可以修改數據類型的是()。A.desc()B.to_numberic()C.dim()D.type()25、下列關于重復值處理的說法中,錯誤的是()。A.duplicated()方法可以標記重復數據B.drop_duplicates()方法用于刪除重復數據C.重復數據的判斷標準是兩個數據中所有條目的值都相等D.duplicated()方法支持從前向后和從后向前兩種查找模式二、判斷題1、數據預處理是數據挖掘中必不可少的關鍵一步,更是進行數據挖掘前的準備工作。它一方面保證挖掘數據的正確性和有效性,另一方面通過對數據格式和內容的調整,使數據更符合挖掘的需要。A.是B.否2、重復數據會影響數據處理結果的正確性,從而導致數據分析出現偏差,因此需要將其刪除。A.是B.否3、具有多層索引的DataFrame對象經過stack()重塑后,返回的是一個Series對象。A.是B.否4、使用merge()函數進行數據合并時,不需要指定合并鍵。A.是B.否5、fillna()方法處理缺失數據時可以使用Series對象填充,但不可以使用DataFrame對象填充。A.是B.否6、dropna()方法可以刪除數據中所有的缺失值。A.是B.否7、drop_duplicated()方法可以刪除重復值。A.是B.否8、rename()方法可以重命名索引名。A.是B.否9、通過merge()函數合并數據時可以指定多個鍵。A.是B.否10、join()方法可以使用左連接和右連接兩種方式連接數據。A.是B.否11、關于Pandas中的數據重塑,stack()方法可以將列索引轉換為行索引。A.是B.否12、關于預處理中的數據合并,concat()函數是最常用的主鍵合并函數,可以通過內連接和外連接的方式堆疊合并數據。A.是B.否13、關于預處理中的數據合并,merge()函數是最常用的主鍵合并的函數,但不能夠通過左連接和右連接的方式合并數據。A.是B.否14、關于預處理中的數據合并,join()方法是最常用的主鍵合并方法之一,但不能夠通過左連接和右連接的方式合并數據。A.是B.否15、Pandas中可以使用boxplot()方法繪制箱形圖,以實現對數據中的異常值進行檢測。A.是B.否16、關于空值和缺失值,NaN和None是完全一樣的。A.是B.否17、notnull()與isnull()方法都可以判斷數據中是否存在空值或缺失值。A.是B.否18、dropna()方法可以刪除空值和缺失值A.是B.否19、異常值處理中可以基于不同字段的均值和標準差求出異常數據分布范圍,然后再對異常范圍外的數據做處理,例如填充為均值A.是B.否20、數據處理中,大多數情況下重復值是需要去除的,使用數據框的drop_duplicates方法即可實現。A.是B.否21、隨機抽樣即隨機的抽取樣本,可使用數據框的sample實現,并可通過參數n設置指定抽樣數量,或通過frac指定抽樣比例。A.是B.否22、字符串和日期的轉換,可通過time或datetime庫的strptime和strftime實現。A.是B.否23、數據標準化通過將數據按比例縮放,使之落入一個小的特定區(qū)間對象的操作。A.是B.否24、MaxMin方法則是根據原始數據的最大值和最小值做數據處理,它將數據縮放為特定范圍[0,1]內。A.是B.否25、丟棄缺失值是直接將含有NA值的記錄丟棄,適用于NA值的記錄較少,且整體樣本量較大的情況。A.是B.否

2025春國開《電子商務數據分析與應用》形考任務3答案1.安裝Kettle。答:安裝基礎環(huán)境Kettle是一個Java程序,因此,運行此工具,必須安裝Sun公司(已被Oracle公司收購)的Java運行環(huán)境1.4或者更高版本。Java的安裝登錄Java的官網后,進入下載頁面,選擇當前最新的Java版本下載安裝。安裝KettleKettle的下載安裝與Spoon的啟動Kettle是作為一個獨立的壓縮包被發(fā)布的,我們可以從官網選擇最新的版本下載安裝。下載完畢后,解壓下載的文件,雙擊spoon.bat即可使用。為了方便使用,我們可以為spoon.bat創(chuàng)建一個Windows桌面快捷方式。創(chuàng)建快捷方式后,在新創(chuàng)建的快捷文件上單擊鼠標右鍵,在彈出的快捷菜單中選擇“屬性”命令,系統(tǒng)打開的屬性對話框里顯示了快捷方式選項卡。在這個選項卡下單擊“更改圖標”按鈕,可以為這個快捷方式選中一個容易識別的圖標,一般選擇Kettle目錄下的spoon.ico文件。2.安裝MySQL數據庫所需的jar包。答:要安裝MySQL數據庫所需的jar包,您可以按照以下步驟進行操作:首先,您需要下載MySQL的JDBC驅動程序,也稱為Connector/J。您可以從MySQL官方網站下載最新版本的JDBC驅動程序。打開MySQL官方網站(/downloads/connector/j/)。在下載頁面上,選擇適合您操作系統(tǒng)的版本并點擊下載按鈕。下載完成后,將下載的jar文件保存在您的項目目錄中的lib文件夾下(如果沒有l(wèi)ib文件夾,可以創(chuàng)建一個)。在您的Java項目中,將jar文件添加到您的項目的構建路徑中。具體步驟取決于您使用的集成開發(fā)環(huán)境(IDE)。以下是一些常見的IDE的步驟:對于Eclipse:右擊您的項目,選擇”BuildPath”->”ConfigureBuildPath”。在彈出的窗口中,選擇”Libraries”選項卡,然后點擊”AddJARs”按鈕,選擇您下載的MySQL驅動程序的jar文件,最后點擊”O(jiān)K”按鈕。對于IntelliJIDEA:在項目視圖中,右擊您的項目,選擇”O(jiān)penModuleSettings”。在彈出的窗口中,選擇”Libraries”選項卡,然后點擊”+”按鈕,選擇”Java”->”JARsordirectories”,選擇您下載的MySQL驅動程序的jar文件,最后點擊”O(jiān)K”按鈕。對于NetBeans:右擊您的項目,選擇”Properties”。在彈出的窗口中,選擇”Libraries”選項,然后點擊”AddJAR/Folder”按鈕,選擇您下載的MySQL驅動程序的jar文件,最后點擊”O(jiān)K”按鈕?,F在,您已經成功安裝了MySQL數據庫所需的jar包。您可以在您的Java代碼中使用這些jar包來連接和操作MySQL數據庫。希望這些步驟對您有幫助!如果您有任何其他問題,請隨時提問。

3.實現數據轉換,從MySQL數據庫中讀取表格內容并輸出到Excel表格。答:見附件

4.在Kettle中,實現文本文件的導入與導出。讀入student.csv文件,輸出固定寬度為12字節(jié)的student.txt文件。student.csv文件以逗號為分隔符,內容如圖所示。期望輸出的student.txt文件的內容如圖所示。答:要在Kettle中實現文本文件的導入和導出,可以按照以下步驟進行操作:打開Kettle并創(chuàng)建一個新的轉換。在轉換中添加一個”文本文件輸入”步驟。在該步驟的設置中,選擇CSV文件作為文件類型,并指定student.csv文件的路徑。設置逗號作為字段分隔符。添加一個”文本文件輸出”步驟。在該步驟的設置中,選擇固定寬度作為文件類型,并指定student.txt文件的路徑。設置固定寬度為12個字節(jié)。將”文本文件輸入”步驟連接到”文本文件輸出”步驟。為”文本文件輸出”步驟定義字段映射,以將輸入字段映射到輸出字段。根據期望的輸出,可以設置如下映射:學號字段映射到輸出的前兩個字節(jié)。姓名字段映射到輸出的下一個字節(jié)。性別字段映射到輸出的下一個字節(jié)。班級字段映射到輸出的下一個字節(jié)。年齡字段映射到輸出的下一個字節(jié)。成績字段映射到輸出的下一個字節(jié)。身高字段映射到輸出的下一個字節(jié)。手機字段映射到輸出的剩余字節(jié)。運行轉換,將會生成期望的student.txt文件。請注意,根據輸入文件的內容,可能需要根據實際情況進行一些調整和處理,以確保正確的導入和導出。

5.在Kettle中,實現MySQL數據庫的數據導入與導出。讀入student表格數據,輸出滿足身高大于等于185,成績大于等于85的學生數據。輸出的數據存儲在StuOut表中。期望輸出的StuOut表的內容如圖所示。答:首先,您需要在Kettle中創(chuàng)建一個轉換來實現MySQL數據庫的數據導入和導出。以下是一些步驟:創(chuàng)建一個新的轉換,命名為”導入數據”。在轉換中添加一個”Tableinput”步驟,用于從MySQL數據庫中讀取數據。配置步驟以連接到您的MySQL數據庫,并選擇”student”表作為輸入表。添加一個”Filterrows”步驟,用于篩選出身高大于等于185和成績大于等于85的學生數據。配置步驟以選擇”身高”字段大于等于185和”成績”字段大于等于85。添加一個”Textfileoutput”步驟,用于將篩選后的數據導出到文本文件。配置步驟以選擇輸出文件的路徑和文件名,以及固定寬度為12字節(jié)。運行轉換,將MySQL數據庫中滿足條件的學生數據導出到文本文件中。請注意,上述步驟僅為指導。您可能需要根據您的實際情況進行適當的調整和配置。

6.在Kettle中,實現HTML數據的數據導入與導出。讀入“/1_1094/5403177.html”數據,輸出HTML源碼存在webout.html文件中。其中,我們需要注意網頁的字符編碼為GBK。webout.html用瀏覽器打開的部分內容如圖所示。答:要在Kettle中實現HTML數據的導入和導出,您可以按照以下步驟進行操作:創(chuàng)建一個新的轉換,命名為”導入導出HTML數據”。在轉換中添加一個”HTTP”步驟,用于從指定的URL讀取HTML數據。配置步驟以選擇GET請求方法和輸入URL為”/1_1094/5403177.html”。添加一個”Textfileoutput”步驟,用于將HTML源碼導出到文件。配置步驟以選擇輸出文件的路徑和文件名為”webout.html”,并設置文件編碼為”GBK”。運行轉換,將HTML數據導出到指定的文件中。7.在Kettle中,實現基于HTTPGET請求的導入與導出。/v2/movie/in_theaters是豆瓣電影提供的API接口,該接口返回的是當前熱映電影的JSON格式。發(fā)送HTTPGET請求到該地址,獲取當前熱映的電影,并將電影名稱、分類、分數、主演數據存儲在httpGetJson.xls文件中。期望輸出的httpGetJson.xls文件的內容如圖所示。答:在Kettle中實現基于HTTPGET請求的導入與導出,可以按照以下步驟進行操作:創(chuàng)建一個新的Kettle作業(yè)(Job)。在作業(yè)中添加一個HTTP請求(HTTPClient)的步驟。配置HTTP請求的相關參數:輸入URL:/v2/movie/in_theaters請求方法:GET添加一個JSON輸入(JsonInput)的步驟。將HTTP請求的結果連接到JSON輸入步驟。在JSON輸入步驟中,配置數據源和字段映射。數據源:從上一步驟的HTTP請求中選擇“返回的結果”字段映射:根據返回的JSON數據結構,將電影名稱、分類、分數、主演等字段映射到對應的列。添加一個MicrosoftExcel輸出(MicrosoftExcelOutput)的步驟。連接JSON輸入步驟到MicrosoftExcel輸出步驟。配置MicrosoftExcel輸出的相關參數:文件名:httpGetJson.xls工作表名稱:Sheet1字段映射:將電影名稱、分類、分數、主演等字段映射到對應的列。運行作業(yè),即可將豆瓣電影API返回的熱映電影數據導入到httpGetJson.xls文件中。

2025春國開《電子商務數據分析與應用》形考任務4答案單選題1、下列關于數據分析概念的描述錯誤的是()D.數據分析不能夠在雜亂無章的數據中提取有用的數據2、數據分析的一般流程為()A.明確目的和思路、數據收集、數據處理、數據分析、數據展現3、關于數據分析的說法,下列描述錯誤的是()C.數據分析沒有實際的使用意義D.在大數據環(huán)境下,數據分析能夠挖掘出更有價值的信息4、數據分析可以分為()D.以上全部5、消費者價值通常由()組成。D.以上全部6、在搭建用戶體系時,運營者可以借助RFM模型()A.調整指標B.設計管理層級C.調整級別D.重要挽留用戶7、()越大表示客戶越久沒有發(fā)生交易,客戶越可能流失。A.RFMB.RC.FD.M8、對于()的客戶,如果企業(yè)能分析、了解、滿足他們的需求,采用有針對性的營銷手段吸引他們。提高他們的購買頻率,將會給企業(yè)帶來更多利潤。A.R越小F越大M越大B.R越小F越小M越大C.R越小F越大M越小D.R越小F越小M越小9、對于()客戶,企業(yè)應盡量挽留,通過營銷手段提高客戶忠誠度。因此,可視其為企業(yè)的重要挽留客戶,是企業(yè)利潤的潛在來源之一。A.R越大F越大M越大B.R越大F越小M越大C.R越小F越大M越小D.R越小F越小M越小10、這類()客戶,有可能購買力有限,可能購買力強,但對企業(yè)的一些產品不感興趣。加大對這類客戶的營銷投人存在一定的風險,但適當維持與這類客戶的關系又能使企業(yè)獲得一定的利潤。A.R越大F越大M越大B.R越大F越大M越小C.R越小F越大M越小D.R越小F越小M越小11、這類()客戶,企業(yè)已很難從他們身上獲取更多利潤。因此只能看作企業(yè)的一般客戶。A.R越大F越大M越大B.R越大F越大M越小C.R越小F越小M越大D.R越小F越小M越小12、關于Anaconda的組件中,可以編輯文檔且展示數據分析過程的是()A.AnacondaNavigatorB.AnacondaPromptC.SpyderD.JupyterNotebook13、Python不支持的數據類型有()A.charB.NumbersC.StringD.List14、以下不是Python保留字的是()A.andB.lambdaC.orD.where15、python使用哪個關鍵字導入包()A.defB.packageC.importD.class16、以下哪個是不可變數據類型()A.listB.DictionaryC.TupleD.Set17、Python中,以下哪個變量的賦值是正確的?()A.vara=2B.inta=2C.a=2D.variablea=218、Python腳本s=‘abcdef’,那么s[1:5]的值是()A.abcdefB.bcde19、Python標準庫math中用來計算平方根的函數是()D.sqrt20、列表a=[1,3,4],b=[4,5,6]那么a+b是()D.[1,3,4,4,5,6]21、列表a=[‘Google’,‘Python’,1979,2000],a[2]=2001,更新列表后a是()A.[‘Google’,‘Python’,1979,2000]22、元組tuple=(‘runoob’,786,2.23,’john’,70.2),tuple[2]=1000是()D.非法操作23、tinydict={‘name’:‘john’,’code’:6734,‘dept’:‘sales’},tinydict[‘code’]為()A.johnB.673424、以下哪個是不合格的比較運算符()A.a==bB.a>bC.a=bD.a>=b25、下列那個不是Numpy多維數組的屬性()D.columns二、判斷題1、數據分析是一個有目的地收集和整合數據的過程。()A.是B.否2、CDA-驗證性數據分析,用于找到數據間的模式,相關性。是一種“參考答案”的獲取。場景包括典型的“啤酒尿布”這類數據挖掘應用,工具包括SAS,SPSS這類數據挖掘軟件以及python語言這類語言工具。A.是B.否3、數據生態(tài)系統(tǒng)逐漸豐富并影響企業(yè)商業(yè)模式。目前國內整個數據分析產業(yè)鏈的布局相對完整,但局部環(huán)節(jié)的競爭程度差異化明顯。A.是B.否4、生意參謀中的“交易”功能版塊可以顯示店鋪的各項交易數據,能夠清楚顯示店鋪的運營情況和出現的問題。A.是B.否5、轉化漏斗模型可以在消費者訪問店鋪到最終成交的各個環(huán)節(jié),一層層過濾轉化人數,分析各個環(huán)節(jié)的轉化情況。A.是B.否6、商家獲取會員數據后,可以充分利用這些數據對會員的情況進行分析,包括會員的分布情況,如年齡分布、性別分布、地區(qū)分布,各地區(qū)會員的增長、流失情況,以及挖掘每一位會員的價值潛力等。A.是B.否7、conda是一個在Windows、MacOS、和Linux上運行的開源軟件包管理系統(tǒng)和環(huán)境管理系統(tǒng)。A.是B.否8、JupyterNotebook的優(yōu)點是可以重現整個分析過程,并將說明文字、代碼、圖表、公式和結論都整合在一個文檔中。A.是B.否9、使用requests庫為URL的查詢字符串(querystring)傳遞某種數據時,如果你是手工構建URL,那么數據會以鍵/值對的形式置于URL中,跟在一個問號的后面。假如傳遞的參數為payload={‘key1’:‘value1’,‘key2’:‘value2’}。那么應該使用r=requests.get(“url”,params=payload)語句。A.是B.否10、BeautifulSoup自帶的解析器為html.parser。A.是B.否11、數據分析隱藏的風險和困境包括用戶隱私、管理困難、數據交易、大數據人才缺乏。A.是B.否12、電子商務領域的銷售業(yè)績指標主要分為總銷售額指標、有效訂單指標。A.是B.否13、轉化漏斗模型包括有效入店率、咨詢轉化率、靜默轉化率、訂單支付率。A.是B.否14、商品的流量轉化直接影響店鋪的最終銷量。因此當商品具有合格的引流能力時,商家一定要關注流量的轉化情況,并對轉化效果不佳的方面進行優(yōu)化。實際上,影響轉化的因素有很多,包括商品主圖、首頁、詳情頁、評價。A.是B.否15、JupyterNotebook不可以將文件保存為html格式。A.是B.否16、Anconda不支持Python3.x以上的版本。A.是B.否17、this屬于Python的保留關鍵字。A.是B.否18、在循環(huán)體內使用break語句或continue語句的作用相同。A.是B.否19、catch是Python異常處理關鍵字。A.是B.否20、進程就是一個應用程序在處理機上的一次執(zhí)行過程,它是一個動態(tài)的概念,而線程是進程中的一部分,進程包含多個線程在運行。A.是B.否21、Python中,使用socket模塊的socket()方法來創(chuàng)建套接字。A.是B.否22、計算機通信時,負責在兩臺計算機之間建立可靠連接,保證數據包按順序到達的協(xié)議是UDP。A.是B.否23、SciPy可用于python爬蟲開發(fā)。A.是B.否24、Python中,創(chuàng)建線程的方式有多種,可以使用threading模塊的Thread類創(chuàng)建線程。A.是B.否25、計算機通信時,服務器的套接字方法中用于TCP監(jiān)聽的方法是bind()。A.是B.否

2025春國開《電子商務數據分析與應用》形考任務5答案1、電子商務數據的獲取途徑不包括()A.產品自有數據B.調查問卷C.互聯網數據導入D.從別人數據庫竊取2、請判斷下面各項數據的結構化類型:()A.結構化數據B.半結構化數據C.非結構化數據D.以上都不對3、以下哪個不是基于電商平臺的基礎數據?A.商品數據B.客戶基本信息數據C.客戶評價數據D.互聯網金融數據4、電子商務數據的主要來源包括()A.電子商務平臺B.社交電商平臺C.O2O數據D.以上全部5、數據處理一般指對數據進行()、()、()、和()的過程。A.采集、分析、分析、可視化表達B.整理、采集、分析、可視化表達C.采集、整理、分析、可視化表達D.整理、可視化表達、分析、采集6、數據有不同的表現形式,數據的來源也多種多樣,因此數據采集的()、采集的()、和采集后的()也不盡相同。A.工具、方法、存儲方式B.方法、工具、存儲方式C.方法、過程、存儲方式D.工具、過程、存儲方式7、以下關于數據采集說法正確的()A.同一數據如果有多個來源途徑,可以選擇其中的任一個來源進行采集B.數據采集人員需要針對數據采集需求、背景等對數據采集渠道進行可信度劃分,優(yōu)先選擇可信度更高的數據采集渠道C.數據采集渠道可信度與數據采集的背景和指標無關,屬于獨立的體系D.數據采集渠道無所謂優(yōu)劣,主要看能否獲取到所需數據8、某網店準備按照店鋪產品的引流能力及盈利能力兩項數據分別對產品進行排序,將兩項數據指標排名均靠后的5款產品進行下架處理。根據以上情景可確定數據分析目標為()A.分析店鋪商品的引流能力和盈利能力B.分店鋪商品中能夠穩(wěn)定獲利的商品C.分析店鋪商品的展現量D.分析店鋪商品的推廣效果9、在數據采集過程中并非所有需要的數據指標都可以采集到,在這種情況下以下做法正確的是()。A.可以使用能夠反映該指標的其他數據替代B.不需要采集C.想盡一切辦法尋找可以采集到該指標的數據數據渠道D.忽略該數據的采集任務10、通過網站公開的API接口采集數據屬于()。A.網絡數據采集法B.傳感器采集法C.訪問記錄采集法D.系統(tǒng)日志采集法11、下列關于為什么要做數據清理描述錯誤的是()A.數據有重復B.數據有錯誤C.數據有缺失D.數據量太大12、下列關于數據清理描述錯誤的是()A.數據清理能完全解決數據質量差的問題B.數據清理在數據分析過程中是不可或缺的一個環(huán)節(jié)C.數據清理的目的是提高數據質量D.可以借助Kettle來完成大量的數據清理工作13、某店鋪2019年度會員信息表中,某會員的出生年份是1990年,但年齡卻記錄為25歲,此類錯誤需要進行()。A.缺失值清洗B.重復值清洗C.邏輯值清洗D.無價值數據清洗14、數據清洗時,運營數據中出現“下單時間2088-12-12”,屬于()。A.缺失值清洗B.格式內容清洗C.邏輯錯誤清洗D.重復數據清洗15、以下說法錯誤的是()A.數據預處理的主要流程為數據清理、數據集成、數據變換與數據歸約B.數據清理、數據集成、數據變換、數據歸約這些步驟在數據預處理活動中必須順序使用C.冗余數據的刪除既是一種數據清理形式,也是一種數據歸約D.整個預處理過程要盡量人機結合,尤其要注重和客戶以及專家多交流16、kettle是什么編程語言編寫的?A.CB.JAVAC.PythonD.以上都不對17、如何在window操作系統(tǒng)上啟動kettle?()A.雙擊Spoon.batB.Pan.batC.runSamples.bat18、kettle轉換的核心對象,下面哪項不正確?A.輸入B.輸出C.流程D.DB連接19、數據分析的一般流程為()A.明確目的和思路、數據收集、數據處理、數據分析、數據展現B.明確目的和思路、數據收集、數據分析、數據展現C.數據收集、數據處理、數據分析、數據展現D.明確目的和思路、數據處理、數據分析、數據展現20、s=list(“壯麗七十年奮斗新時代”),給出如下代碼以下選項中能輸出字符“奮”第一次出現的索引位置的A.print(s.index(“奮”),1,len(s))B.print(s.index(“奮”))C.print(s.count(“奮”))D.print(s.index(“奮”),1)二、多選題1、電子商務數據具有以下哪些作用?多選題(2分)A.電子商務數據具有診斷作用B.電子商務數據具有預測作用C.電子商務數據具有決定作用D.電子商務數據具有傳播作用2、下列選項中,關于數據預處理說法錯誤的是()。多選題(2分)A.數據清洗包含了數據標準化、數據合并和缺失值處理B.數據合并按照合并軸的方向主要分為左連接、右連接、內連接和外連接C.數據分析的預處理過程包括數據清洗、數據合并、數據標準化和數據轉換,它們之間存在交叉,沒有嚴格的先后關系D.數據標準化的主要對象是類別型特征3、檢測出異常值之后,通常會采用哪些方式處理它們?()多選題(2分)A.直接將含有異常值的記錄刪除B.用具體的值來進行替換,可用前后兩個觀測值的平均值修正該異常值C.不處理,直接在具有異常值的數據集上進行統(tǒng)計分析D.視為缺失值,利用缺失值的處理方法修正該異常值4、商務數據包括()多選題(2分)A.電子商務平臺的基礎數據B.電子商務專業(yè)網站的研究數據C.電子商務媒體報道D.評論數據5、數據分析中市場類指標主要用于描述行業(yè)情況和企業(yè)在行業(yè)中的發(fā)展情況,下列屬于市場類指標的是()多選題(2分)A.行業(yè)增長率B.平均購買次數C.競爭對手銷售額D.活躍客戶比率6、以下屬于產品類數據指標的是()?多選題(2分)A.SKUB.商品數C.商品訪客數D.跳失率7、對淘寶平臺某類商品銷量數據進行分析,以下數據采集方式可行的是()多選題

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論