版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
Python文件和數(shù)據(jù)格式化編程實例匯報人:XX2024-01-12文件操作基礎(chǔ)數(shù)據(jù)格式化基礎(chǔ)CSV文件處理實例JSON文件處理實例XML文件處理實例Excel文件處理實例文件操作基礎(chǔ)01打開與關(guān)閉文件打開文件使用`open()`函數(shù)打開文件,指定文件名和打開模式(如讀取、寫入等)。關(guān)閉文件使用`close()`方法關(guān)閉文件,釋放資源。123使用`read()`方法一次性讀取整個文件內(nèi)容。讀取整個文件使用`readlines()`方法或循環(huán)遍歷文件對象逐行讀取。逐行讀取使用`read(size)`方法讀取指定數(shù)量的字符。讀取指定字符讀取文件內(nèi)容寫入字符串使用`write()`方法將字符串寫入文件。寫入行使用`writelines()`方法將字符串列表寫入文件,每個字符串代表一行。追加內(nèi)容以追加模式打開文件,使用`write()`方法將內(nèi)容追加到文件末尾。寫入文件內(nèi)容030201使用`os.getcwd()`函數(shù)獲取當(dāng)前工作目錄。獲取當(dāng)前工作目錄使用`os.path.join()`函數(shù)拼接路徑,確??缙脚_兼容性。拼接路徑使用`os.path.splitext()`函數(shù)獲取文件擴展名。獲取文件擴展名使用`os.path.exists()`函數(shù)判斷路徑是否存在。判斷路徑是否存在文件路徑處理數(shù)據(jù)格式化基礎(chǔ)0203f-string使用f-string進行字符串格式化,例如`f"Hello,{name}!"`。01%操作符使用`%`操作符進行字符串格式化,例如`"Hello,%s!"%name`。02str.format()方法使用`str.format()`方法進行字符串格式化,例如`"Hello,{}!".format(name)`。字符串格式化使用列表推導(dǎo)式快速生成格式化后的列表,例如`[f"Item{i}"foriinrange(1,6)]`。使用`join()`方法將格式化后的字符串連接成列表或元組,例如`",".join([f"Item{i}"foriinrange(1,6)])`。列表與元組格式化join()方法列表推導(dǎo)式字典推導(dǎo)式使用字典推導(dǎo)式快速生成格式化后的字典,例如`{f"Key{i}":f"Value{i}"foriinrange(1,4)}`。json.dumps()方法使用`json.dumps()`方法將字典格式化為JSON字符串,例如`importjson;json.dumps({"key":"value"})`。字典格式化集合推導(dǎo)式使用集合推導(dǎo)式快速生成格式化后的集合,例如`{f"Item{i}"foriinrange(1,6)}`。join()方法使用`join()`方法將格式化后的字符串連接成集合,例如`",".join([f"Item{i}"foriinrange(1,6)])`。注意,由于集合是無序的,因此連接后的字符串順序可能與預(yù)期不同。集合格式化CSV文件處理實例03使用Python內(nèi)置csv模塊通過csv.reader()函數(shù)讀取CSV文件內(nèi)容,逐行解析數(shù)據(jù)。使用pandas庫通過pandas.read_csv()函數(shù)讀取CSV文件,將數(shù)據(jù)加載到DataFrame對象中,方便進行數(shù)據(jù)處理和分析。讀取CSV文件內(nèi)容通過csv.writer()函數(shù)將數(shù)據(jù)寫入CSV文件,可以自定義分隔符、引號等參數(shù)。使用Python內(nèi)置csv模塊將DataFrame對象中的數(shù)據(jù)通過pandas.to_csv()函數(shù)寫入CSV文件,支持多種數(shù)據(jù)格式和選項。使用pandas庫寫入CSV文件內(nèi)容通過Python對CSV文件中的數(shù)據(jù)進行清洗,如去除重復(fù)行、空值處理、異常值處理等。數(shù)據(jù)清洗將CSV文件中的數(shù)據(jù)進行轉(zhuǎn)換,如數(shù)據(jù)類型轉(zhuǎn)換、日期格式轉(zhuǎn)換、編碼轉(zhuǎn)換等。數(shù)據(jù)轉(zhuǎn)換CSV文件數(shù)據(jù)清洗與轉(zhuǎn)換將CSV文件數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫使用Python連接數(shù)據(jù)庫,將CSV文件中的數(shù)據(jù)逐行讀取并插入到數(shù)據(jù)庫中。要點一要點二從數(shù)據(jù)庫導(dǎo)出數(shù)據(jù)到CSV文件通過Python查詢數(shù)據(jù)庫,將查詢結(jié)果以CSV格式導(dǎo)出到文件中。CSV文件與數(shù)據(jù)庫交互JSON文件處理實例04讀取JSON文件內(nèi)容Python內(nèi)置的`json`模塊提供了讀取JSON文件的功能。通過`json.load()`函數(shù),可以將JSON文件內(nèi)容加載為Python對象。使用`json`模塊首先,使用`open()`函數(shù)打開JSON文件,并指定打開模式為讀取模式('r')。然后,調(diào)用`json.load()`函數(shù)讀取文件內(nèi)容,并將其轉(zhuǎn)換為Python對象。最后,記得關(guān)閉文件。讀取步驟VS同樣地,Python內(nèi)置的`json`模塊也提供了寫入JSON文件的功能。通過`json.dump()`函數(shù),可以將Python對象寫入JSON文件。寫入步驟首先,使用`open()`函數(shù)打開JSON文件,并指定打開模式為寫入模式('w')。然后,調(diào)用`json.dump()`函數(shù)將Python對象轉(zhuǎn)換為JSON格式,并寫入文件。最后,記得關(guān)閉文件。使用`json`模塊寫入JSON文件內(nèi)容在讀取JSON文件后,可能需要對數(shù)據(jù)進行清洗,例如刪除重復(fù)項、處理缺失值、轉(zhuǎn)換數(shù)據(jù)類型等??梢允褂肞ython的列表推導(dǎo)式、字典推導(dǎo)式等技巧進行數(shù)據(jù)清洗。有時需要將JSON數(shù)據(jù)轉(zhuǎn)換為其他格式,例如將JSON對象轉(zhuǎn)換為Python字典或列表,或者將JSON數(shù)據(jù)轉(zhuǎn)換為CSV或XML格式??梢允褂孟鄳?yīng)的Python庫(如`csv`、`xml.etree.ElementTree`)進行轉(zhuǎn)換。數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換JSON數(shù)據(jù)清洗與轉(zhuǎn)換可以使用Python的數(shù)據(jù)庫API(如`sqlite3`、`pymysql`等)將JSON數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫。首先,需要將JSON數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)庫能夠處理的格式(如SQL語句),然后執(zhí)行導(dǎo)入操作。將JSON數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫同樣地,可以使用Python的數(shù)據(jù)庫API從數(shù)據(jù)庫中查詢數(shù)據(jù),并將查詢結(jié)果轉(zhuǎn)換為JSON格式。然后,可以使用`json.dump()`函數(shù)將JSON數(shù)據(jù)寫入文件。從數(shù)據(jù)庫導(dǎo)出JSON數(shù)據(jù)JSON文件與數(shù)據(jù)庫交互XML文件處理實例05使用`xml.etree.ElementTree`模塊Python標準庫中的`xml.etree.ElementTree`模塊提供了輕量級且高效的XML解析功能。通過該模塊,可以方便地讀取XML文件內(nèi)容,并將其轉(zhuǎn)換為易于處理的Element對象。要點一要點二讀取XML文件的基本步驟首先,導(dǎo)入`xml.etree.ElementTree`模塊;然后,使用`parse()`函數(shù)解析XML文件,并返回一個ElementTree對象;最后,通過ElementTree對象的`getroot()`方法獲取XML文檔的根元素。讀取XML文件內(nèi)容創(chuàng)建Element對象使用`xml.etree.ElementTree`模塊中的`Element`類可以創(chuàng)建XML元素。通過指定元素標簽和屬性,可以構(gòu)建出完整的XML結(jié)構(gòu)。將Element對象寫入文件創(chuàng)建好Element對象后,可以使用`xml.etree.ElementTree.SubElement()`方法添加子元素。然后,通過`xml.etree.ElementTree.tostring()`函數(shù)將Element對象轉(zhuǎn)換為字符串表示形式。最后,使用文件操作將字符串寫入XML文件中。寫入XML文件內(nèi)容清洗XML數(shù)據(jù)在讀取XML文件后,可能需要對數(shù)據(jù)進行清洗和處理,以去除不必要的空白、注釋或其他無效內(nèi)容??梢允褂肵Path或正則表達式等技術(shù)來提取所需的數(shù)據(jù)部分。轉(zhuǎn)換XML數(shù)據(jù)有時需要將XML數(shù)據(jù)轉(zhuǎn)換為其他格式(如JSON、CSV等)以便進一步處理或分析??梢允褂孟鄳?yīng)的庫或工具來實現(xiàn)不同格式之間的轉(zhuǎn)換。XML數(shù)據(jù)清洗與轉(zhuǎn)換將XML數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫可以使用Python中的數(shù)據(jù)庫連接庫(如`sqlite3`、`pymysql`等)將清洗和轉(zhuǎn)換后的XML數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中。根據(jù)數(shù)據(jù)庫類型和表結(jié)構(gòu),編寫相應(yīng)的SQL語句來實現(xiàn)數(shù)據(jù)的插入、更新或刪除操作。從數(shù)據(jù)庫導(dǎo)出XML數(shù)據(jù)同樣地,可以使用數(shù)據(jù)庫查詢語句從數(shù)據(jù)庫中檢索數(shù)據(jù),并使用`xml.etree.ElementTree`模塊將數(shù)據(jù)轉(zhuǎn)換為XML格式。然后,將生成的XML字符串寫入文件中,實現(xiàn)數(shù)據(jù)的導(dǎo)出功能。XML文件與數(shù)據(jù)庫交互Excel文件處理實例06使用pandas庫讀取Excel文件pandas是Python中用于數(shù)據(jù)處理和分析的強大庫,可以輕松讀取Excel文件內(nèi)容。通過指定文件路徑和sheet名稱,可以將Excel文件中的數(shù)據(jù)讀取為DataFrame對象。讀取特定列或行通過指定列名或行索引,可以選擇性地讀取Excel文件中的特定列或行。這對于處理大型Excel文件時,只關(guān)注部分數(shù)據(jù)的情況非常有用。處理日期和時間數(shù)據(jù)Excel中的日期和時間數(shù)據(jù)通常以特定的格式存儲。pandas可以自動識別并處理這些日期和時間數(shù)據(jù),將其轉(zhuǎn)換為Python中的datetime對象,方便進行后續(xù)的數(shù)據(jù)分析和處理。讀取Excel文件內(nèi)容010203使用pandas庫寫入Excel文件pandas不僅支持讀取Excel文件,還支持將數(shù)據(jù)寫入Excel文件。通過創(chuàng)建DataFrame對象,并將其導(dǎo)出為Excel文件,可以輕松地將數(shù)據(jù)保存到磁盤上。自定義輸出格式在將數(shù)據(jù)寫入Excel文件時,可以自定義輸出格式,包括設(shè)置單元格格式、調(diào)整列寬和行高等。這使得輸出的Excel文件更加美觀和易于閱讀。批量寫入多個sheet如果需要在一個Excel文件中創(chuàng)建多個sheet,并分別寫入不同的數(shù)據(jù),可以使用pandas的ExcelWriter對象。通過指定不同的sheet名稱和數(shù)據(jù),可以一次性將數(shù)據(jù)寫入多個sheet中。寫入Excel文件內(nèi)容數(shù)據(jù)清洗在讀取Excel文件后,通常需要對數(shù)據(jù)進行清洗和處理,以去除重復(fù)值、缺失值和異常值等。pandas提供了豐富的數(shù)據(jù)清洗功能,如drop_duplicates()、fillna()和replace()等函數(shù),可以方便地進行數(shù)據(jù)清洗操作。數(shù)據(jù)轉(zhuǎn)換有時需要將Excel文件中的數(shù)據(jù)進行轉(zhuǎn)換或計算,以滿足特定的分析需求。pandas支持各種數(shù)據(jù)轉(zhuǎn)換操作,如數(shù)據(jù)分組(groupby)、數(shù)據(jù)透視表(pivot_table)和數(shù)據(jù)合并(merge)等。這些功能可以幫助用戶對數(shù)據(jù)進行更深入的分析和挖掘。Excel數(shù)據(jù)清洗與轉(zhuǎn)換如果需要將Excel文件中的數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中,可以使用pandas結(jié)合SQLAlchemy庫實現(xiàn)。首先,將Excel文件
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 水安ABC考前密訓(xùn)+水利安管考試真題+答案解析
- CCAA - 2021年05月環(huán)境管理體系基礎(chǔ)答案及解析 - 詳解版(80題)
- 2025-2026學(xué)年廣西桂林市高一(上)期末英語試卷(含答案)
- 養(yǎng)老院老人健康監(jiān)測人員考核獎懲制度
- 企業(yè)員工培訓(xùn)與素質(zhì)發(fā)展路徑制度
- 空氣源熱泵安裝施工組織設(shè)計模板
- 寬帶接入裝維員測試驗證能力考核試卷含答案
- 乳品配料工崗前流程優(yōu)化考核試卷含答案
- 電力機車鉗工崗前操作技能考核試卷含答案
- 富集工誠信強化考核試卷含答案
- 2026貴州省黔晟國有資產(chǎn)經(jīng)營有限責(zé)任公司面向社會招聘中層管理人員2人備考考試試題及答案解析
- 2025年營養(yǎng)師考試練習(xí)題及答案
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會成熟人才招聘備考題庫及答案詳解一套
- 消費者權(quán)益保護與投訴處理手冊(標準版)
- 南京航空航天大學(xué)飛行器制造工程考試試題及答案
- 陶瓷工藝品彩繪師改進水平考核試卷含答案
- 2025廣東百萬英才匯南粵惠州市市直事業(yè)單位招聘急需緊缺人才31人(公共基礎(chǔ)知識)測試題附答案
- 粉塵防護知識課件
- 注塑模具調(diào)試員聘用協(xié)議
- (2025年)糧食和物資儲備局招聘考試題庫(答案+解析)
- 2026年樂陵市市屬國有企業(yè)公開招聘工作人員6名備考題庫及答案詳解一套
評論
0/150
提交評論