Python數(shù)據(jù)任務(wù)教程- 答案_第1頁(yè)
Python數(shù)據(jù)任務(wù)教程- 答案_第2頁(yè)
Python數(shù)據(jù)任務(wù)教程- 答案_第3頁(yè)
Python數(shù)據(jù)任務(wù)教程- 答案_第4頁(yè)
Python數(shù)據(jù)任務(wù)教程- 答案_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

搭建開(kāi)發(fā)環(huán)境填空題描述性分析AnacondaJupyterNotebookMarkdownNumPy判斷題×√√√×選擇題BBAB,CB簡(jiǎn)答題答案:數(shù)據(jù)分析是指使用適當(dāng)?shù)腬t"/item/%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90/_blank"統(tǒng)計(jì)分析方法對(duì)收集到的大量數(shù)據(jù)進(jìn)行分析,從這些數(shù)據(jù)中提取有用信息和形成結(jié)論,并加以詳細(xì)研究和概括總結(jié)的過(guò)程。答案:數(shù)據(jù)分析大致分為五個(gè)階段,分別是明確目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)??茖W(xué)計(jì)算庫(kù)NumPy一、填空題ndarray。二6廣播花式索引二、判斷題×√√√×三、選擇題BDACA四、簡(jiǎn)答題答案:軸是NumPy數(shù)組中十分重要的概念,它其實(shí)就代表數(shù)組的維度。數(shù)組的維度不同,它對(duì)應(yīng)的軸的數(shù)量也不同。一維數(shù)組只有一個(gè)軸,軸的編號(hào)為0;二維數(shù)組有行列方向的兩個(gè)軸,軸編號(hào)分別是0、1;三維數(shù)組有沿著層、行和列方向的三個(gè)軸,軸的編號(hào)分別為0、1、2。依此類推,N維數(shù)組有N個(gè)軸,軸的編號(hào)為0到N-1。答案:以兩個(gè)數(shù)組為例,這兩個(gè)數(shù)組的形狀右對(duì)齊,之后按照從右向左(從最后一個(gè)維度開(kāi)始往前)的順序逐個(gè)比較對(duì)應(yīng)緯度是否滿足以下任意一種情況:(1)兩個(gè)數(shù)組在該維度的長(zhǎng)度相等。(2)其中一個(gè)數(shù)組在該維度的長(zhǎng)度為1。如果數(shù)組的形狀在每個(gè)維度都滿足上述任意一種情況,說(shuō)明兩個(gè)數(shù)組的形狀兼容,否則會(huì)拋出不能觸發(fā)廣播機(jī)制的異常。需要注意的是,如果兩個(gè)數(shù)組的維度不同,較小維度數(shù)組會(huì)缺失某些維度,在這種情況下,缺失的維度會(huì)被假定為大小為1。數(shù)據(jù)分析庫(kù)pandas基礎(chǔ)填空題Seriescolumnshead()read_csv()分層索引判斷題√√×××選擇題ADAAB簡(jiǎn)答題答案:Series是類似于一維數(shù)組的數(shù)據(jù)結(jié)構(gòu),主要由一組數(shù)據(jù)和與之相關(guān)的索引兩部分組成,其中數(shù)據(jù)可以是任意類型的;DataFrame是一個(gè)類似于二維數(shù)組或表格的數(shù)據(jù)結(jié)構(gòu),它由索引和數(shù)據(jù)兩部分組成,既有行索引又有列索引,每列數(shù)據(jù)可以是不同的數(shù)據(jù)類型。答案:分層索引可以理解為單層索引的延伸,即在一個(gè)軸方向上具有兩層或兩層以上的索引。數(shù)據(jù)預(yù)處理填空題NaN堆疊合并啞變量異常值pivot()判斷題√√×××選擇題BACDA簡(jiǎn)答題答案:異常值是指數(shù)據(jù)集中的個(gè)別值明顯偏離它所屬數(shù)據(jù)集的其余值,這些數(shù)值是不合理的或錯(cuò)誤的。答案:pandas中提供了幾種數(shù)據(jù)合并的方式,分別是堆疊合并、主鍵合并、根據(jù)索引合并、合并重疊數(shù)據(jù)。數(shù)據(jù)的分組與聚合填空題拆分by可迭代groupsDataFrameBy判斷題×××√×選擇題AABDC簡(jiǎn)答題答案:分組與聚合主要根據(jù)一定的拆分標(biāo)準(zhǔn)將原數(shù)據(jù)拆分成若干個(gè)分組,然后對(duì)每個(gè)分組應(yīng)用統(tǒng)計(jì)運(yùn)算,并把運(yùn)算后的結(jié)果合并到一起。答案:按照列標(biāo)簽分組、按照Series類的對(duì)象分組、按照字典分組、按照函數(shù)分組。數(shù)據(jù)可視化填空題直方圖中位數(shù)pyplot注釋文本Pyecharts判斷題√×××√選擇題DDCBC簡(jiǎn)答題答案:盡管Pyecharts支持眾多圖表類型,但使用Pyecharts繪制圖表的基本過(guò)程大致相同,可以分為以下幾步:(1)導(dǎo)入所需的模塊或類。(2)創(chuàng)建圖表類的對(duì)象。(3)添加數(shù)據(jù)和設(shè)置配置項(xiàng)。(4)渲染圖表。答案:(1)直方圖由一系列寬度相等但高度不等的矩形組成,用于展示數(shù)據(jù)的分布情況。(2)折線圖用于展示數(shù)據(jù)隨時(shí)間或其他連續(xù)變量的變化趨勢(shì),它包含一條或多條連接了數(shù)據(jù)點(diǎn)的折線,這些折線能夠清晰地展示數(shù)據(jù)隨變量的變化情況。同時(shí),折線圖上方通常會(huì)顯示數(shù)據(jù)標(biāo)簽,幫助標(biāo)識(shí)每個(gè)數(shù)據(jù)點(diǎn)的具體數(shù)值,增強(qiáng)圖表的信息呈現(xiàn)能力。(3)柱形圖用于比較不同類別之間的數(shù)據(jù)大小。在柱形圖中,通過(guò)等寬的矩形來(lái)表示每個(gè)類別的數(shù)據(jù)量,矩形的高度直接反映了數(shù)據(jù)的數(shù)值大小,使得數(shù)據(jù)的相對(duì)大小和趨勢(shì)變化一目了然。(4)餅圖是一種用于了解數(shù)據(jù)中各分類占比情況的圖表,它使用圓表示數(shù)據(jù)的總量,組成圓的扇面表示數(shù)據(jù)各項(xiàng)占總量的比例大小。(5)散點(diǎn)圖主要用于展示兩個(gè)變量之間的關(guān)系(正相關(guān)、負(fù)相關(guān)、不相關(guān))或趨勢(shì),例如身高與體重、經(jīng)度與緯度等。在散點(diǎn)圖中,以點(diǎn)的形式表示數(shù)據(jù),每個(gè)數(shù)據(jù)點(diǎn)的位置是由兩個(gè)變量的值確定的。(6)箱形圖又稱盒須圖、箱線圖,因形狀如箱子而得名。它利用數(shù)據(jù)中的5個(gè)統(tǒng)計(jì)量——最小值、第一四分位數(shù)、中位數(shù)、第三四分位數(shù)和最大值——描述數(shù)據(jù),主要用于反映一組或多組數(shù)據(jù)的對(duì)稱性、分布程度等信息。時(shí)間序列分析填空題時(shí)間序列DatetimeIndex基礎(chǔ)頻率DateOffsetPeriod判斷題√√×√×選擇題ADDBC簡(jiǎn)答題答案:DatetimeIndex

PeriodIndex

都是pandas中的兩種時(shí)間序列索引類型,它們有以下主要區(qū)別:(1)DatetimeIndex定義:表示具體的時(shí)間點(diǎn),例如某一特定的日期和時(shí)間。精度:支持到秒、毫秒甚至微秒級(jí)的精度。用途:適用于需要精確時(shí)間點(diǎn)的場(chǎng)景,如詳細(xì)的時(shí)間序列分析和數(shù)據(jù)切片。特性:可以表示任意的日期和時(shí)間,支持時(shí)區(qū)轉(zhuǎn)換和時(shí)間上的各種操作。(2)PeriodIndex定義:表示時(shí)間段,例如某個(gè)月、季度或年份,而不是具體的時(shí)間點(diǎn)。精度:關(guān)注時(shí)間段的開(kāi)始和結(jié)束,通常以天、月、季度或年為單位。用途:適用于周期性數(shù)據(jù)的分析,如按月、季度或年進(jìn)行匯總和統(tǒng)計(jì)。特性:適合處理周期性時(shí)間數(shù)據(jù),方便進(jìn)行周期性操作和匯總。答案:(1)降采樣是將時(shí)間序列從高頻率轉(zhuǎn)換為低頻率。例如,將每日的數(shù)據(jù)轉(zhuǎn)換為每月的數(shù)據(jù)。當(dāng)對(duì)時(shí)間序列進(jìn)行降采樣后,時(shí)間序列的時(shí)間顆粒度會(huì)變大,相應(yīng)的數(shù)據(jù)總量會(huì)減少。由于數(shù)據(jù)的總量減少,所以通常需要使用聚合函數(shù)來(lái)合并原始時(shí)間序列中部分時(shí)間點(diǎn)上的數(shù)據(jù)。(2)升采樣是將時(shí)間序列從低頻率轉(zhuǎn)換為高頻率。例如,將每月的數(shù)據(jù)轉(zhuǎn)換為每天的數(shù)據(jù)。當(dāng)對(duì)時(shí)間序列進(jìn)行升采樣后,時(shí)間序列的時(shí)間顆粒度會(huì)變小,相應(yīng)的數(shù)據(jù)總量會(huì)增多。由于數(shù)據(jù)的總量增多,所以會(huì)造成有些新增的時(shí)間點(diǎn)上因沒(méi)有數(shù)據(jù)而顯示為NaN,通常情況下需要使用填充缺失值的方法來(lái)處理新增的時(shí)間點(diǎn)上的NaN。機(jī)器學(xué)習(xí)入門填空題機(jī)器學(xué)習(xí)樣本監(jiān)督學(xué)習(xí)最值歸一化網(wǎng)格搜索判斷題√××√×選擇題DAACA簡(jiǎn)答題根據(jù)數(shù)據(jù)集組成不同,可以把機(jī)器學(xué)習(xí)的算法主要分為監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。監(jiān)督學(xué)習(xí)指的是利用一組已知類別的樣本作為訓(xùn)練集,調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過(guò)程,也稱為監(jiān)督訓(xùn)練;根據(jù)類別未知的訓(xùn)練樣本解

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論