Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營 (第二版) 課件 第1章 Python入門指南_第1頁
Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營 (第二版) 課件 第1章 Python入門指南_第2頁
Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營 (第二版) 課件 第1章 Python入門指南_第3頁
Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營 (第二版) 課件 第1章 Python入門指南_第4頁
Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營 (第二版) 課件 第1章 Python入門指南_第5頁
已閱讀5頁,還剩36頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

Python入門指南Python數(shù)據(jù)處理、分析、可視化與數(shù)據(jù)化運(yùn)營(第二版)01本章學(xué)習(xí)目標(biāo)掌握Python基本概念及其在數(shù)據(jù)分析中的應(yīng)用理解并運(yùn)用Anaconda和pip工具,構(gòu)建Python開發(fā)環(huán)境熟悉主要Python數(shù)據(jù)分析工具,如Pandas、NumPy、Matplotlib等掌握J(rèn)upyterNotebook的基本操作學(xué)會在JupyterNotebook環(huán)境下進(jìn)行Python編程和互動學(xué)習(xí)1.1Python與數(shù)據(jù)分析Python的基本概念Python在數(shù)據(jù)分析中的作用使用Anaconda輕松安裝Python環(huán)境使用pip管理第三方庫1.1Python與數(shù)據(jù)分析Python是一種面向?qū)ο蟮慕忉屝愿呒壘幊陶Z言。1989年的圣誕節(jié),荷蘭人Guido開始編寫Python語言的編譯器。1991年,第一個Python編譯器誕生,這標(biāo)志著Python的第一個版本正式誕生。Python的基本概念1.1Python與數(shù)據(jù)分析(1)開源/免費(fèi)。(2)可移植性:Windows、Linux、Mac等多平臺運(yùn)行。(3)豐富的第三方庫:適用于數(shù)據(jù)庫連接、數(shù)據(jù)科學(xué)計(jì)算、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)等眾多領(lǐng)域。(4)與其他語言集成:Python能夠直接調(diào)用Java、C、C++、MATLAB、R等語言開發(fā)的應(yīng)用程序或系統(tǒng)功能。Python語言的特點(diǎn)Python的基本概念1.1Python與數(shù)據(jù)分析(5)強(qiáng)大的學(xué)習(xí)交流和培訓(xùn)資源:作為全球最主流的編程語言之一,Python擁有豐富的社區(qū)支持、博客、論壇及培訓(xùn)教育資源。(6)高開發(fā)效率:Python語法簡潔規(guī)范,有效提升開發(fā)效率。(7)簡單易學(xué):Python語法易于學(xué)習(xí),適合編程初學(xué)者,大幅降低了數(shù)據(jù)分析的學(xué)習(xí)門檻。Python語言的特點(diǎn)Python的基本概念1.1Python與數(shù)據(jù)分析數(shù)據(jù)分析指通過處理和分析特定數(shù)據(jù)集,提取有價值信息、挖掘規(guī)律、得出有效結(jié)論和洞察的方法。這一過程在輔助決策、提供科學(xué)建議的實(shí)際應(yīng)用中發(fā)揮重要作用。數(shù)據(jù)分析不僅限于傳統(tǒng)統(tǒng)計(jì)方法,還包括機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等與數(shù)據(jù)相關(guān)的多種方法和算法,應(yīng)用于解決各行各業(yè)的問題。Python在數(shù)據(jù)分析中的作用數(shù)據(jù)分析的基本概念1.1Python與數(shù)據(jù)分析(1)數(shù)據(jù)清洗與準(zhǔn)備(2)統(tǒng)計(jì)分析與數(shù)據(jù)建模(3)文本處理與自然語言處理(NLP)(4)深度學(xué)習(xí)與人工智能(5)大數(shù)據(jù)處理(6)數(shù)據(jù)可視化Python在數(shù)據(jù)分析中的作用Python在數(shù)據(jù)分析中的作用1.1Python與數(shù)據(jù)分析Python標(biāo)準(zhǔn)程序:官方發(fā)布的標(biāo)準(zhǔn)Python編程環(huán)境,包含Python解釋器和核心功能、庫、包,是Python編程的基礎(chǔ)設(shè)施。Python第三方庫:它們由社區(qū)和開發(fā)者創(chuàng)建,用于擴(kuò)展Python在特定領(lǐng)域的功能,例如數(shù)據(jù)分析、科學(xué)計(jì)算、機(jī)器學(xué)習(xí)等場景功能增強(qiáng)。使用Anaconda輕松安裝Python環(huán)境Python環(huán)境的構(gòu)成1.1Python與數(shù)據(jù)分析手動安裝:從官網(wǎng)下載Python標(biāo)準(zhǔn)程序,手動安裝所需第三方庫,這種方法雖靈活,但配置和管理庫的依賴關(guān)系可能較為繁瑣。使用Anaconda:Anaconda是一個集成Python環(huán)境,主要用于簡化和加速數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)和科學(xué)計(jì)算的開發(fā)部署。核心特點(diǎn):內(nèi)置Python環(huán)境、豐富的三方庫、依賴管理、跨平臺支持、多種交互方式、環(huán)境隔離。使用Anaconda輕松安裝Python環(huán)境安裝Python環(huán)境的常見方法1.1Python與數(shù)據(jù)分析1.登錄Anaconda官網(wǎng)下載對應(yīng)系統(tǒng)和對應(yīng)版本即可選擇對應(yīng)系統(tǒng),找到下載鏈接2.運(yùn)行安裝程序,完成安裝根據(jù)操作系統(tǒng),打開下載的Anaconda安裝程序,Windows為.exe文件,macOS和Linux為.sh文件。運(yùn)行安裝程序,安裝過程中,跟隨安裝向?qū)褂媚J(rèn)配置即可。使用Anaconda輕松安裝Python環(huán)境使用Anaconda準(zhǔn)備Python環(huán)境1.2如何準(zhǔn)備Python程序環(huán)境pip是Python包管理工具,提供了對Python包的查找、下載、安裝、更新、卸載等功能。conda是Anaconda的Python包管理工具,提供的功能與pip基本類似,區(qū)別僅在于僅適用于anaconda安裝環(huán)境,pip則是通用任何環(huán)境。使用pip管理第三方庫Anaconda管理第三方庫的工具1.2如何準(zhǔn)備Python程序環(huán)境#示例,安裝結(jié)巴分詞庫使用pipinstalljieba#示例,安裝特定版本的庫則可以指定版本號pipinstalljieba==0.42.1安裝庫:使用命令pipinstall庫名安裝第三方庫使用pip管理第三方庫1.2如何準(zhǔn)備Python程序環(huán)境#示例,更新結(jié)巴分詞庫pipinstall-Ujiebapipinstall--upgradejieba更新庫:使用pipinstall-U庫名或pipinstall--upgrade庫名升級已安裝的庫使用pip管理第三方庫1.2如何準(zhǔn)備Python程序環(huán)境#示例,查看結(jié)巴分詞庫的版本、路徑等信息使用pipshowjieba查看庫:使用piplist查看所有已安裝庫,或pipshow庫名查看特定庫的詳細(xì)信息使用pip管理第三方庫1.2如何準(zhǔn)備Python程序環(huán)境#示例,卸載結(jié)巴分詞庫pipuninstalljieba卸載庫:使用pipuninstall庫名從Python環(huán)境中卸載不再需要的庫使用pip管理第三方庫1.2Python數(shù)據(jù)分析工具數(shù)據(jù)分析的得力助手統(tǒng)計(jì)分析與建模工具文本處理與分析的利器走進(jìn)深度學(xué)習(xí)與人工智能新潮的數(shù)據(jù)分析方法1.2Python數(shù)據(jù)分析工具Pandas是PythonDataAnalysisLibrary的簡稱主要應(yīng)用于數(shù)據(jù)預(yù)處理、數(shù)據(jù)探索、特征工程、數(shù)據(jù)可視化。提供用于進(jìn)行結(jié)構(gòu)化數(shù)據(jù)分析的二維的表格。Pandas還提供了時間序列的功能,用于金融行業(yè)的數(shù)據(jù)分析。Anaconda默認(rèn)已經(jīng)安裝了該包。數(shù)據(jù)分析的得力助手:Pandas、NumPy、MatplotlibPandas1.2Python數(shù)據(jù)分析工具NumPy是Python的數(shù)值計(jì)算庫。核心價值點(diǎn)在于數(shù)學(xué)函數(shù)、運(yùn)算符、廣播、索引和切片功能等數(shù)據(jù)處理能力更加高效。在科學(xué)計(jì)算、線性代數(shù)、統(tǒng)計(jì)分析等領(lǐng)域應(yīng)用較多。Anaconda默認(rèn)已經(jīng)安裝了該包。數(shù)據(jù)分析的得力助手:Pandas、NumPy、MatplotlibNumPy1.2Python數(shù)據(jù)分析工具最受歡迎的數(shù)據(jù)可視化庫之一。主要用于創(chuàng)建圖表,也是其他很多數(shù)據(jù)可視化庫的基礎(chǔ)庫它提供豐富的繪圖選項(xiàng),包括折線圖、散點(diǎn)圖、柱狀圖、餅圖、3D圖等。主要適用于數(shù)據(jù)探索、傳達(dá)發(fā)現(xiàn)和生成專業(yè)圖形報告。Anaconda默認(rèn)已安裝Matplotlib數(shù)據(jù)分析的得力助手:Pandas、NumPy、MatplotlibMatplotlib1.2Python數(shù)據(jù)分析工具數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的主要庫。它提供監(jiān)督式學(xué)習(xí)和非監(jiān)督式學(xué)習(xí)方法,包括回歸、K近鄰、貝葉斯、決策樹、混合高斯模型、聚類、分類等算法。該庫支持?jǐn)?shù)據(jù)預(yù)處理、模型選擇和評估,是全面的機(jī)器學(xué)習(xí)的工具庫。Anaconda默認(rèn)已安裝sklearn。統(tǒng)計(jì)分析與建模工具:scikit-learn、Statsmodelsscikit-learn1.2Python數(shù)據(jù)分析工具統(tǒng)計(jì)建模和計(jì)量經(jīng)濟(jì)學(xué)工具包。它提供了描述性統(tǒng)計(jì)、統(tǒng)計(jì)模型估計(jì)、統(tǒng)計(jì)測試等功能。它集成了多種線性回歸模型、廣義線性模型、離散數(shù)據(jù)分布模型、時間序列分析模型等。Statsmodels是進(jìn)行統(tǒng)計(jì)分析和建模的重要工具。Anaconda默認(rèn)已安裝Statsmodels。統(tǒng)計(jì)分析與建模工具:scikit-learn、StatsmodelsStatsmodels1.2Python數(shù)據(jù)分析工具專用于中文文本處理的Python庫。它提供了分詞、關(guān)鍵字提取、詞性標(biāo)注等自然語言處理功能。它支持精確模式、全模式和搜索引擎模式分詞,適用于中文文本挖掘、自然語言處理和信息檢索。jieba分詞是處理中文文本的首選工具。Anaconda未集成jieba分詞,可通過pipinstalljieba安裝。文本處理與分析的利器:jieba分詞、Gensimjieba分詞1.2Python數(shù)據(jù)分析工具主題建模和文本分析的Python庫。它支持文本主題建模,如LatentDirichletAllocation(LDA)和LatentSemanticAnalysis(LSA)。Gensim是大規(guī)模文本數(shù)據(jù)處理、文本聚類和信息檢索的關(guān)鍵工具。Anaconda未集成Gensim,可通過pipinstallgensim安裝。文本處理與分析的利器:jieba分詞、GensimGensim1.2Python數(shù)據(jù)分析工具它是Google開發(fā)的開源機(jī)器學(xué)習(xí)框架。廣泛應(yīng)用于深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)。它提供靈活的計(jì)算圖模型構(gòu)建各類神經(jīng)網(wǎng)絡(luò),如CNN、RNN、自動編碼器等。TensorFlow具高度優(yōu)化的計(jì)算性能和硬件加速支持,是大規(guī)模深度學(xué)習(xí)項(xiàng)目的首選框架。走進(jìn)深度學(xué)習(xí)與人工智能:Tensorflow、pytorchTensorFlow1.2Python數(shù)據(jù)分析工具它由Facebook開發(fā)的深度學(xué)習(xí)框架。支持模型構(gòu)建和修改,快速迭代實(shí)驗(yàn)。提供自動微分、模型并行處理、遷移學(xué)習(xí)等高級功能。PyTorch有活躍社區(qū)和豐富生態(tài)系統(tǒng),包括擴(kuò)展庫、預(yù)訓(xùn)練模型等。該庫在學(xué)術(shù)研究領(lǐng)域應(yīng)用比較廣泛。走進(jìn)深度學(xué)習(xí)與人工智能:Tensorflow、pytorchPytorch1.2Python數(shù)據(jù)分析工具它是OpenAI提供的基于GPT技術(shù)的智能聊天機(jī)器人。ChatGPT允許用戶以自然語言提出數(shù)據(jù)分析問題,然后生成相應(yīng)的回答和建議。ChatGPT支持上傳文件,自動進(jìn)行數(shù)據(jù)分析和處理。新潮的數(shù)據(jù)分析方法:基于大語言模型的分析——ChatGPT、Auto-GPT、pandas-aiChatGPT1.2Python數(shù)據(jù)分析工具它是基于GPT技術(shù)(例如ChatGPT)的自主AI代理,能夠根據(jù)用戶設(shè)定的目標(biāo)和規(guī)則進(jìn)行決策和執(zhí)行任務(wù)。Auto-GPT結(jié)合了AI的強(qiáng)大代碼邏輯、文件處理和開發(fā)流程能力,以及與其他語言和服務(wù)的集成能力。它能自動完成特定任務(wù),如根據(jù)用戶用自然語言描述的數(shù)據(jù)分析目標(biāo),自動執(zhí)行數(shù)據(jù)分析任務(wù)。新潮的數(shù)據(jù)分析方法:基于大語言模型的分析——ChatGPT、Auto-GPT、pandas-aiAuto-GPT1.2Python數(shù)據(jù)分析工具它是一個集成了GPT技術(shù)的Python庫,專為增強(qiáng)pandasDataFrame的操作而設(shè)計(jì)。它允許用戶使用ChatGPT風(fēng)格的自然語言提示來執(zhí)行pandasDataFrame上的各種操作。pandas-ai的優(yōu)勢在于簡化數(shù)據(jù)處理流程,用戶可以通過自然語言指令進(jìn)行數(shù)據(jù)轉(zhuǎn)換、查詢、繪圖等任務(wù),而無需編寫復(fù)雜的pandas代碼。新潮的數(shù)據(jù)分析方法:基于大語言模型的分析——ChatGPT、Auto-GPT、pandas-aiPandas-ai1.3互動學(xué)習(xí)環(huán)境:JupyterNotebook啟動JupyterJupyter的功能介紹Jupyter的常用操作技巧Jupyter的特殊命令個性化配置Jupyter1.3互動學(xué)習(xí)環(huán)境:JupyterNotebook(1)通過程序快捷入口啟動(2)使用命令行啟動(3)通過AnacondaNavigator啟動啟動Jupyter有3種方式啟動JupyterNotebook1.3互動學(xué)習(xí)環(huán)境:JupyterNotebook啟動Jupyter有3種方式啟動JupyterNotebook1.3互動學(xué)習(xí)環(huán)境:JupyterNotebookJupyter的功能介紹主功能區(qū):圖中①展示的是File(文件,默認(rèn)視圖)功能區(qū),這里可以查看并管理該空間下所有文件和目錄文件和目錄功能區(qū):在圖中②,用戶可以在此區(qū)域?qū)ξ募湍夸涍M(jìn)行新增、刪除、移動、上傳等操作。文件和目錄列表:圖中③展示了特定目錄和文件,用戶可以直接單擊以查看文件詳情。1.3互動學(xué)習(xí)環(huán)境:JupyterNotebookJupyter的常用操作技巧新建Python文件編輯Python文件保存與恢復(fù)導(dǎo)出文件單元格輸入和輸出單元格常用編輯功能執(zhí)行Python程序1.3互動學(xué)習(xí)環(huán)境:JupyterNotebookJupyter的特殊命令魔術(shù)命令(MagicCommands)是IPython及其交互式計(jì)算環(huán)境JupyterNotebook中的一種特殊功能。它們是以百分號(%)為前綴的命令,這些命令覆蓋了各種常用功能,如文件和目錄操作、交互式數(shù)據(jù)可視化、性能分析、環(huán)境管理等。什么是魔術(shù)命令1.3互動學(xué)習(xí)環(huán)境:JupyterNotebookJupyter的特殊命令常用魔術(shù)命令%matplotlibinline:把matplotlib庫的可視化結(jié)果%ls:查看當(dāng)前目錄下的文件或文件夾詳細(xì)列表信息%cd:切換工作路徑%run:執(zhí)行特定Python文件。要中斷程序,按Ctrl+C組合健%paste和%cpaste:粘貼在剪切板中的內(nèi)容%pwd:查看當(dāng)前Python工作路徑和目錄1.3互動學(xué)習(xí)環(huán)境:JupyterNotebook個性化配置Jupyter生成配置文件命令:jupyternotebook--generate-config完成之后,系統(tǒng)會有如下提示:Writingdefaultconfigto:C:\Users\Administrator\.jupyter\jupyter_not

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論