版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
搭建開發(fā)環(huán)境填空題數(shù)據(jù)分析按照復(fù)雜度和深度可以分為、診斷性分析、預(yù)測性分析和規(guī)范性分析共4個層次。包含了Conda、Python在內(nèi)的超過180個科學(xué)計算包及其依賴項。是一個支持實時代碼、數(shù)學(xué)方程、可視化和Markdown的Web應(yīng)用程序。JupyterNotebook支持Code、和Raw共三種類型的單元格。是Python開源的科學(xué)計算庫,能夠?qū)崿F(xiàn)高維數(shù)組與矩陣運算。判斷題數(shù)據(jù)分析是一個有目的地收集和整合數(shù)據(jù)的過程。()Python能夠“粘連”其它語言的組件,便于開發(fā)人員操作其它語言編寫的庫。()如果要刪除指定環(huán)境中的包,則可以直接使用condaremove命令刪除。()數(shù)據(jù)預(yù)處理在一定程度上保證了數(shù)據(jù)的質(zhì)量。()Anaconda工具默認(rèn)已經(jīng)安裝了數(shù)據(jù)分析用到的全部庫,無需另行安裝。()選擇題下列選項中,哪個環(huán)節(jié)是數(shù)據(jù)分析中負(fù)責(zé)搭接數(shù)據(jù)倉庫和保證數(shù)據(jù)質(zhì)量的?()數(shù)據(jù)收集數(shù)據(jù)處理數(shù)據(jù)分析數(shù)據(jù)展現(xiàn)關(guān)于Anaconda工具的說法中,下列描述錯誤的是()。Anaconda是一個可以對包和環(huán)境進(jìn)行統(tǒng)一管理的工具。Anaconda是完全開源的、付費的Anaconda支持Linux、Windows、macOS操作系統(tǒng)Anaconda避免了單獨安裝包時需要配置或兼容等各種問題下列選項中,關(guān)于JupyterNotebook的描述正確的是()。安裝Anaconda工具后會自動擁有JupyterNotebookJupyterNotebook只能通過命令行的方式啟動JupyterNotebook首頁的根目錄是不能修改的JupyterNotebook不能將文檔導(dǎo)出為HTML文件下列選項中,用于實現(xiàn)數(shù)據(jù)可視化功能的庫是()。(多選)NumPypandasMatplotlibscikit-learn下列選項中,用于查看當(dāng)前環(huán)境下所有包信息的命令是()。conda--versioncondalistcondainstalljiebacondaupdate--all簡答題什么是數(shù)據(jù)分析?請簡述數(shù)據(jù)分析的基本流程。科學(xué)計算庫NumPy填空題在NumPy中,可以使用數(shù)組對象________執(zhí)行一些科學(xué)計算。如果ndarray.ndim執(zhí)行的結(jié)果為2,則表示創(chuàng)建的是_____維數(shù)組。如果ndarray.shape執(zhí)行的結(jié)果為(2,3),則表示數(shù)組中總共有________個元素。如果兩個數(shù)組的形狀不同,則它們進(jìn)行算術(shù)運算時可能會觸發(fā)________機(jī)制。NumPy中________是指用整數(shù)數(shù)組或整數(shù)列表作為數(shù)組的索引。判斷題通過empty()函數(shù)創(chuàng)建的數(shù)組,該數(shù)組中沒有任何的元素。()若使用ones()函數(shù)創(chuàng)建數(shù)組時沒有明確地指明元素的數(shù)據(jù)類型,則默認(rèn)數(shù)據(jù)類型為float64。()數(shù)組之間的任何算術(shù)運算都會將運算應(yīng)用到數(shù)組的每個元素上。()多維數(shù)組操作索引時,可以將切片與整數(shù)索引混合使用。()當(dāng)通過布爾索引操作數(shù)組時,返回的數(shù)據(jù)是布爾數(shù)組中False對應(yīng)位置的值。()選擇題下列選項中,用來表示數(shù)組維度元組的屬性是()。ndimshapesizedtype下面選項中,哪個代碼創(chuàng)建的數(shù)組是3行3列的?()arr=np.array([1,2,3])arr=np.array([[1,2,3],[4,5,6]])arr=np.array([[1,2],[3,4]])np.ones((3,3))請閱讀下面一段程序:arr_2d=np.array([[11,20,13],[14,25,16],[27,18,9]])print(arr_2d[1,:1])執(zhí)行上述程序后,最終輸出的結(jié)果為()。[14][25][14,25][20,25]請閱讀下面一段程序:arr=np.arange(6).reshape(1,2,3)print(arr.transpose(2,0,1))執(zhí)行上述程序后,最終輸出的結(jié)果為()。[[[25]][[03]][[14]]][[[14]][[03]][[25]]][[[03]][[14]][[25]]][[[0][3]][[1][4]][[2][5]]]下列選項中,哪個函數(shù)或方法的功能相當(dāng)于矢量化三元表達(dá)式?()where()cumsum()sort()unique()簡答題請簡要描述NumPy數(shù)組的軸。請簡述判斷數(shù)組形狀兼容的規(guī)則。數(shù)據(jù)分析庫pandas基礎(chǔ)填空題pandas中主要有DataFrame和兩種數(shù)據(jù)結(jié)構(gòu)。pandas中通過屬性可以獲取DataFrame的列索引。pandas中方法用于預(yù)覽前N行數(shù)據(jù)。函數(shù)用于從CSV或TXT文件中讀取數(shù)據(jù)。是在一個軸方向上具有兩層或兩層以上的索引。判斷題DataFrame的每列數(shù)據(jù)可以看作一個Series類的對象。()使用describe()方法可以描述多個統(tǒng)計指標(biāo)。()from_arrays()方法用于根據(jù)元組列表創(chuàng)建MultiIndex類的對象。()read_csv()和read_table()沒有任何區(qū)別,可以隨意替換使用。()DataFrame類的對象不能有分層索引。()選擇題下列選項中,用于重命名索引的方法是()。rename()reindex()describe()swaplevel()下列關(guān)于索引對象的描述,錯誤的是()。位置索引或標(biāo)簽索引都屬于Index類的對象索引對象一旦創(chuàng)建是不可以被修改的索引對象的值是可以重復(fù)的DataFrame默認(rèn)的索引是標(biāo)簽索引下列方法中,用于根據(jù)元組創(chuàng)建MultiIndex類對象的是()。from_tuples()from_arrays()from_product()from_list()下列選項中,哪個方法可以一次性輸出DataFrame類對象的多個統(tǒng)計指標(biāo)?()describe()mean()median()sum()請閱讀下面一段程序:importpandasaspdser_obj=pd.Series(range(1,6),index=[5,3,0,4,2])ser_obj.sort_index()執(zhí)行上述程序后,最終輸出的結(jié)果為()。5132034425032532445151443225032544033251簡答題簡述兩種數(shù)據(jù)結(jié)構(gòu)各自的特點。簡述什么是分層索引。數(shù)據(jù)預(yù)處理填空題pandas中缺失值一般使用None或np.nan表示,統(tǒng)一標(biāo)記為________。________指的是沿著某個軸的方向?qū)蓚€或兩個以上的對象按照一定的邏輯關(guān)系進(jìn)行合并。________又稱虛擬變量,用來反映某個變量的不同類別。________是指數(shù)據(jù)集中的個別值明顯偏離它所屬數(shù)據(jù)集的其余值。________方法用于將DataFrame的列索引旋轉(zhuǎn)為行索引。判斷題使用dropna()方法可以刪除缺失值。()3σ原則只適用于符合或近似正態(tài)分布的數(shù)據(jù)集。()to_numeric()函數(shù)轉(zhuǎn)換字符串時一定會導(dǎo)致程序報錯。()包含分層索引的DataFrame經(jīng)過stack()重塑后一定會得到一個Series。()當(dāng)使用merge()函數(shù)合并兩個DataFrame類的對象時,不需要指定合并鍵。()選擇題下列選項中,描述錯誤的是。()數(shù)據(jù)清洗的目的是提高數(shù)據(jù)的質(zhì)量異常值被檢測出來無需確認(rèn)可以直接刪除使用drop_duplicates()方法可以刪除重復(fù)值concat()函數(shù)可以沿著一條軸將多個對象進(jìn)行堆疊合并請閱讀下面一段程序:frompandasimportSeriesimportpandasaspdfromnumpyimportNaNseries_obj=Series([None,4,NaN])pd.isnull(series_obj)執(zhí)行上述程序后,最終輸出的結(jié)果為()。0True1False2True0True1True2False0False1True2True0True1True2True下列選項中,可以刪除缺失值的是()。isnull()notnull()dropna()fillna()下列選項中,描述錯誤是()。concat()函數(shù)可以沿著一條軸將多個對象進(jìn)行堆疊merge()函數(shù)可以根據(jù)一個或多個鍵將不同DataFrame進(jìn)行合并使用rename()方法對索引進(jìn)行重命名操作unstack()方法用于DataFrame的行索引轉(zhuǎn)換為列索引請閱讀下面一段程序:importnumpyasnpimportpandasaspdser_obj=pd.Series([4,np.nan,6,5,-3,2])ser_obj.sort_values()執(zhí)行上述程序后,最終輸出的結(jié)果為()。4-3.052.004.035.026.01NaN1NaN26.035.004.052.04-3.052.004.035.026.04-3.01NaN04.01NaN26.035.04-3.052.0簡答題請簡述什么是異常值。請簡述數(shù)據(jù)合并的幾種方式。數(shù)據(jù)的分組與聚合填空題分組與聚合的基本過程包括、應(yīng)用和合并。在groupby()方法中,參數(shù)決定了按照什么樣的標(biāo)準(zhǔn)對數(shù)據(jù)進(jìn)行分組。GroupBy對象是一個對象。使用GroupBy對象的屬性可以查看分組的具體信息。當(dāng)對DataFrame對象進(jìn)行分組后會返回一個對象。判斷題分組應(yīng)用的函數(shù)只能是用戶自定義的函數(shù)。()使用print()函數(shù)可以直接查看GroupBy對象的具體信息。()使用agg()方法進(jìn)行聚合運算會對產(chǎn)生的標(biāo)量值進(jìn)行廣播。()使用transform()方法聚合后產(chǎn)生的結(jié)果與原對象的形狀可以相同。()apply()方法不能實現(xiàn)數(shù)據(jù)聚合的功能。()選擇題下列關(guān)于groupby()方法的說法,錯誤的是()。分組鍵可以是列表或數(shù)組,但長度不需要與待分組軸的長度相同可以根據(jù)DataFrame類對象的列標(biāo)簽進(jìn)行分組可以根據(jù)函數(shù)進(jìn)行分組可以根據(jù)Series或字典進(jìn)行分組下列關(guān)于agg()方法的描述,錯誤的是()。agg()方法中func參數(shù)只能傳入一個函數(shù)agg()方法中func參數(shù)可以傳入多個函數(shù)agg()方法中func參數(shù)可以傳入自定義函數(shù)agg()方法不能對聚合后產(chǎn)生的標(biāo)量值進(jìn)行廣播下列關(guān)于transform()方法的說法,正確的是()。該方法返回的結(jié)果不會與原始對象保持相同形狀該方法會對分組內(nèi)產(chǎn)生的標(biāo)量值進(jìn)行廣播func參數(shù)只能接收內(nèi)置函數(shù)func參數(shù)可以接收多個內(nèi)置函數(shù)下列關(guān)于apply()方法的說法,錯誤的是()。該方法可以將用戶自定義的函數(shù)應(yīng)用到分組該方法可以同時將多個函數(shù)應(yīng)用到分組該方法可以實現(xiàn)數(shù)據(jù)聚合功能該方法返回的結(jié)果一定與分組前對象的形狀完全相同請閱讀下面一段程序:importpandasaspdpd.DataFrame([[2,3],]*3,columns=['A','B']).apply(lambdax:x+1)執(zhí)行上述程序后,最終輸出的結(jié)果為()。AB032132232AB023123223AB034134234AB043143243簡答題請簡述分組聚合的流程。請簡述常用的分組方式。數(shù)據(jù)可視化填空題由一系列寬度相等、高度不等的矩形組成,用于反映數(shù)據(jù)的分布情況。箱形圖利用最小值、第一四分位數(shù)、、第三四分位數(shù)和最大值這幾個統(tǒng)計量描述一組數(shù)據(jù)。Matplotlib中的模塊封裝了快速繪制圖表的函數(shù)。在圖表中,是額外添加的文本,用于對圖表或者圖形元素提供說明。是一個用于生成Echarts圖表的開源庫。判斷題Seaborn是基于Matplotlib的數(shù)據(jù)可視化庫。()直方圖與柱形圖都使用矩形表示數(shù)據(jù),它們之間沒有任何區(qū)別。()餅圖在識別異常值方面有一定的優(yōu)越性。()Matplotlib默認(rèn)支持在圖表中顯示中文文本。()通過load_dataset()
函數(shù)可以在線加載
Seaborn庫自帶的數(shù)據(jù)集。()選擇題在Matplotlib中,用于展示圖表的函數(shù)是()。plot()bar()hist()show()下列選項中,關(guān)于Pyecharts庫的描述正確的是()。Pyecharts庫生成的圖表不能與用戶交互Pyecharts庫無需安裝便可以直接使用Pyecharts庫是基于Seaborn進(jìn)行封裝的使用Pyecharts庫可以繪制柱形圖下列選項中,關(guān)于Seaborn庫的繪圖函數(shù)說法錯誤的是。()distplot()函數(shù)用于繪制直方圖和核密度估計曲線distplot()函數(shù)默認(rèn)不使用密度觀察條stripplot()函數(shù)用于繪制直方圖swarmplot()函數(shù)用于繪制數(shù)據(jù)點不重疊的散點圖在Matplotlib中,用于給圖表添加標(biāo)題的函數(shù)是()。xlabel()title()legend()text()下列選項中,哪個方法在Pyecharts中用于為圖表設(shè)置全局配置項?()render_notebook()render()set_global_opts()set_series_opts()簡答題請簡述使用Pyecharts繪制圖表的基本過程。請列舉6種圖表類型,并簡要描述這些圖表的特點。時間序列分析填空題________是指將同一統(tǒng)計指標(biāo)的數(shù)值按其發(fā)生的時間先后順序排列而成的數(shù)列。pandas中的________表示日期和時間索引。pandas中的頻率可以由________和倍數(shù)組成。pandas.tseries.offsets模塊提供了表示日期偏移量的________類。pandas中使用________類表示一個標(biāo)準(zhǔn)的時期。判斷題pandas中的時間序列就是以日期時間為索引的Series或DataFrame。()如果兩個Period類對象的頻率相同,那么它們相減的結(jié)果為它們的單位數(shù)量。()任何類型的pandas對象都可以進(jìn)行重采樣。()DatetimeIndex是由一組時期組成的索引。()當(dāng)對時間序列進(jìn)行降采樣時,可能會導(dǎo)致部分日期時間沒有對應(yīng)的數(shù)據(jù)。()選擇題下列選項中,不能作為Series或DataFrame對象索引的是()。PeriodDatetimeIndexPeriodIndexMultiIndex請閱讀下面一段程序:importpandasaspdperiod1=pd.Period('2024/6/1')print(period1+50)執(zhí)行上述程序,最終輸出的結(jié)果為()。2024-07-182024-07-192024-07-202024-07-21請閱讀下面一段程序:importpandasaspdimportnumpyasnpdate_index=pd.date_range(start="2024/08/10",periods=5)date_se=pd.Series(np.arange(5),index=date_index)sorted_se=date_se.sort_index()print(sorted_se.truncate(after='2024-8-11'))執(zhí)行上述程序,最終輸出的結(jié)果為()。2024-08-1222024-08-1332024-08-1222024-08-1332024-08-1442024-08-1002024-08-1112024-08-1222024-08-1002024-08-111下列函數(shù)中,哪個創(chuàng)建有固定頻率的DatetimeIndex對象?()shift()date_range()period_range()asfreq()關(guān)于重采樣的說法中,下列描述錯誤的是()。重采樣是將時間序列從一個頻率轉(zhuǎn)到另一個頻率當(dāng)對時間序列進(jìn)行升采樣時,它的時間顆粒是變小的時間序列在降采樣時,總體的數(shù)據(jù)量是增
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 纖維碳化裝置操作工崗前基礎(chǔ)在崗考核試卷含答案
- 大型藻類栽培工安全強(qiáng)化評優(yōu)考核試卷含答案
- 味精微生物菌種工崗前流程考核試卷含答案
- 電子絕緣材料上膠工復(fù)測知識考核試卷含答案
- 發(fā)電集控值班員安全知識宣貫水平考核試卷含答案
- 電動輪自卸車機(jī)械裝配工誠信道德知識考核試卷含答案
- 機(jī)繡工安全操作水平考核試卷含答案
- 排巖機(jī)操作工安全文明能力考核試卷含答案
- 軋鋼精整工崗前安全宣教考核試卷含答案
- 低壓成套設(shè)備裝配配線工安全檢查測試考核試卷含答案
- 江蘇省淮安市2025年中考英語真題附真題答案
- 辦公軟件銷售協(xié)議書
- 國家基本公共衛(wèi)生服務(wù)項目培訓(xùn)居民健康檔案課后試題及答案
- 急性高甘油三酯血癥胰腺炎康復(fù)期管理2025
- 景區(qū)冬季安全培訓(xùn)課件
- 新的教育政策分析
- 鋪面轉(zhuǎn)讓合同
- 神志判斷課件
- 2025年9月廣東深圳市福田區(qū)事業(yè)單位選聘博士11人考試參考試題及答案解析
- 調(diào)度安全生產(chǎn)培訓(xùn)課件
- 2025年甘肅省蘭州建設(shè)投資(控股)集團(tuán)有限公司招聘15人考試參考題庫及答案解析
評論
0/150
提交評論