版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
Python基礎——分析數據目錄2.數值分析庫numpy3.數據分析庫pandas21.了解數據了解數據3
數據基本類型說明:python的基本數據類型包括數值型、邏輯型、復數型,也可能是缺失值。(1)數值型Python支持4種不同的數字類型:int(有符號整型);long(長整型,也可以表示八進制和十六進制);float(浮點型);complex(復數);4了解數據In[4]n=10#整數n#無格式輸出,相當于print(n)print(“n=”,n)#有格式輸出x=10.234#實數print(x)print(“x=%10.5f”%x)Out[4]10n=1010.234“x=10.23400”5了解數據(2)邏輯型邏輯型數據只能取True或False值。In[5]a=True;ab=False;bOut[5]TrueFale可以通過比較獲得邏輯型數據,如下所示。In[6]10>310<3Out[6]TrueFale6了解數據(3)字符型一般形式為:
s='IlovePython'xi它是編程語言中表達文本的數據類型。7了解數據加號(+)是字符串連接運算符,星號(*)是重復操作In[7]s='WelovePython';s[2:6]s+ss*2Out[7]'love''WelovePythonWelovePython''WelovePythonWelovePython'了解數據8(4)缺失值有些統(tǒng)計資料是不完整的。當一個元素或者值在統(tǒng)計的時候是“不可得到”或“缺失值”的時候,相關位置可能會被保留并且賦予一個特定的nan值。如float(‘nan’)。了解數據9(5)數據類型轉換int(x,[,base])#將x轉換為一個整數float(x)#將x轉換到一個浮點數str(x)#將對象x轉換為字符串chr(x)#將一個整數轉換為一個字符10數據分析庫numpyNumpy庫簡介:一個強大的N維數組對象ndarray廣播功能函數整合c/c++/Fortran代碼的工具線性代數,傅里葉變換、隨機數生成等功能NumPy是一個運行速度非??斓臄祵W庫,主要用于數組計算,包含:11數據分析庫numpy一維數組In[12]importnumpyasnp#加載數組包np.array([1,2,3,4,5])#一維數組Out[12]array([1,2,3,4,5])In[13]np.array([1,2,3,np.nan,5])#包含缺失值的數組Out[13]array([1.,2.,3.,nan,5.])In[14]np.arange(9)#數組序列np.arange(1,9,0.5)#等差數列np.linspace(1,9,5)#等距數列Out[14]array([0,1,2,4,5,6,7,8])array([1,1.5,2.,2.5,3.,3.5,4.,4.5,5.,5.5,6.,6.5,7.,7.5,8.,8.5])array([1.,3.,5.,7.,9.,])12數據分析庫numpy二維數組(矩陣)In[15]np.array([[1,2],[3,4],[5,6]])#二維數組Out[15]array([[1,2],[3,4],[5,6]])In[16]A=np.arange(9).reshape((3,3));A#形成3*3矩陣Out[16]array([[0,1,2],[3,4,5],[6,7,8]])13數據分析庫numpy數組的操作In[17]A.shapeOut[17](3,3)#元組類型(1)數組的維度(2)空數組In[18]np.empty([3,3])Out[18]array([[0.00000000e+000,9.56511090e-321,2.47032823e-323],[1.13844130e-311,0.00000000e+000,2.47032823e-323],[1.13844129e-311,0.00000000e+000,3.23815565e-319]])(3)零數組In[19]np.zeros((3,3))#零矩陣Out[19]array([[0.,0.,0,],[0.,0.,0.],[0.,0.,0.]])數據分析庫pandas14Pandas
是Python的一個數據分析包,目前由專注于Python數據包開發(fā)的PyData開發(fā)team繼續(xù)開發(fā)和維護,屬于PyData項目的一部分。Pandas最初被作為金融數據分析工具而開發(fā)出來,因此,pandas為時間序列分析提供了很好的支持。Pandas簡介:數據分析庫pandas15序列:series(1)創(chuàng)建序列(向量、一維數組)假如要創(chuàng)建一個含有n個數值的向量X=(x1,x2,x3......,xn),Python中創(chuàng)建列表的函數是列表。數據分析庫pandas16In[22]importpandasaspdpd.Series()(2)生成序列(3)根據列表構建序列In[23]X=[1,3,6,4,9]S1=pd.Series(X);S1S2=pd.Series(weight);S2S3=pd.Series(sex);S3Out[17]0女1男2男3女17數據分析庫pandasIn[24]pd.concat([S2,S3],axis=0)pd.concat([S2,S3],axis=1)Out[24]01067女166男283男368女470男590男......(4)序列合并18數據分析庫pandasIn[25]S1[2]S3[1:4]Out[25]601166男283男368女(5)序列切片數據分析庫pandas數據框:DataFrame19Pandas中用函數SataFrame()生成數據框。DataFrame()命令可用序列構成一個數據框。數據框相當于關系數據庫中的結構化數據類型,傳統(tǒng)的數據大都以結構化數據存儲于關系數據庫中,因而傳統(tǒng)的數據分析是以數據框為基礎的。數據分析庫pandas20(1)生成數據框In[26]pd.DataFrame()#生成空數據框Out[26]EmptyDataFrameColumns:[]Index:[]21數據分析庫pandasIn[27]pd.DataFrame(X)pd.DataFrame(X,columns=['X'],index=range(5))pd.DataFrame(weight,columns=['weight'],index=['A','B','C','D','E'])Out[27]weightA67B66C83D68E70(2)根據列表創(chuàng)建數據框22數據分析庫pandasIn[28]df1=pd.DataFrame({'S1':S1,'S2':S2,'S3':S3});df1Out[28]S1S2S301.067女13.066男26.083男34.068女49.070男(3)根據字典創(chuàng)建數據框23數據分析庫pandas數據框的讀寫:大的數據對象常常是從外部
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年7月國開電大行管專科《社會調查研究與方法》期末紙質考試試題及答案
- 論考試試題及答案
- 電子商務期末考試題及答案sem
- 網店經營與管理沈欽課后習題答案
- 《寫給中學生的心理學》閱讀測試題及參考答案
- 醫(yī)學臨床三基醫(yī)師考試題庫及答案詳解
- 沈陽校招面試題庫及答案
- 食品藥品安全普法試題及答案
- 二建考試簡答題及答案
- 建設法規(guī)機考試題及答案
- 供應商管理績效綜合評價表
- 危重病人的院前急救課件
- 警用偵查無人機偵查技術在反偷獵中的應用分析報告
- 礦井突水機理研究-洞察及研究
- 2025-2026秋“1530”安全教育記錄表
- 骨密度檢測的臨床意義
- 鉆探原始班報表試行版
- 腸菌移植治療炎癥性腸病專家共識(2025)解讀
- T/CPPC 1032-2021建筑生產資源分供商評價規(guī)范
- 機耕合同協(xié)議書范本簡單
- 送車免責合同協(xié)議書模板
評論
0/150
提交評論