Python文件和數(shù)據(jù)格式化編程實例_第1頁
Python文件和數(shù)據(jù)格式化編程實例_第2頁
Python文件和數(shù)據(jù)格式化編程實例_第3頁
Python文件和數(shù)據(jù)格式化編程實例_第4頁
Python文件和數(shù)據(jù)格式化編程實例_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

Python文件和數(shù)據(jù)格式化編程實例匯報人:XX2024-01-12文件操作基礎(chǔ)數(shù)據(jù)格式化基礎(chǔ)CSV文件處理實例JSON文件處理實例XML文件處理實例Excel文件處理實例文件操作基礎(chǔ)01打開與關(guān)閉文件打開文件使用`open()`函數(shù)打開文件,指定文件名和打開模式(如讀取、寫入等)。關(guān)閉文件使用`close()`方法關(guān)閉文件,釋放資源。123使用`read()`方法一次性讀取整個文件內(nèi)容。讀取整個文件使用`readlines()`方法或循環(huán)遍歷文件對象逐行讀取。逐行讀取使用`read(size)`方法讀取指定數(shù)量的字符。讀取指定字符讀取文件內(nèi)容寫入字符串使用`write()`方法將字符串寫入文件。寫入行使用`writelines()`方法將字符串列表寫入文件,每個字符串代表一行。追加內(nèi)容以追加模式打開文件,使用`write()`方法將內(nèi)容追加到文件末尾。寫入文件內(nèi)容030201使用`os.getcwd()`函數(shù)獲取當(dāng)前工作目錄。獲取當(dāng)前工作目錄使用`os.path.join()`函數(shù)拼接路徑,確??缙脚_兼容性。拼接路徑使用`os.path.splitext()`函數(shù)獲取文件擴展名。獲取文件擴展名使用`os.path.exists()`函數(shù)判斷路徑是否存在。判斷路徑是否存在文件路徑處理數(shù)據(jù)格式化基礎(chǔ)0203f-string使用f-string進行字符串格式化,例如`f"Hello,{name}!"`。01%操作符使用`%`操作符進行字符串格式化,例如`"Hello,%s!"%name`。02str.format()方法使用`str.format()`方法進行字符串格式化,例如`"Hello,{}!".format(name)`。字符串格式化使用列表推導(dǎo)式快速生成格式化后的列表,例如`[f"Item{i}"foriinrange(1,6)]`。使用`join()`方法將格式化后的字符串連接成列表或元組,例如`",".join([f"Item{i}"foriinrange(1,6)])`。列表與元組格式化join()方法列表推導(dǎo)式字典推導(dǎo)式使用字典推導(dǎo)式快速生成格式化后的字典,例如`{f"Key{i}":f"Value{i}"foriinrange(1,4)}`。json.dumps()方法使用`json.dumps()`方法將字典格式化為JSON字符串,例如`importjson;json.dumps({"key":"value"})`。字典格式化集合推導(dǎo)式使用集合推導(dǎo)式快速生成格式化后的集合,例如`{f"Item{i}"foriinrange(1,6)}`。join()方法使用`join()`方法將格式化后的字符串連接成集合,例如`",".join([f"Item{i}"foriinrange(1,6)])`。注意,由于集合是無序的,因此連接后的字符串順序可能與預(yù)期不同。集合格式化CSV文件處理實例03使用Python內(nèi)置csv模塊通過csv.reader()函數(shù)讀取CSV文件內(nèi)容,逐行解析數(shù)據(jù)。使用pandas庫通過pandas.read_csv()函數(shù)讀取CSV文件,將數(shù)據(jù)加載到DataFrame對象中,方便進行數(shù)據(jù)處理和分析。讀取CSV文件內(nèi)容通過csv.writer()函數(shù)將數(shù)據(jù)寫入CSV文件,可以自定義分隔符、引號等參數(shù)。使用Python內(nèi)置csv模塊將DataFrame對象中的數(shù)據(jù)通過pandas.to_csv()函數(shù)寫入CSV文件,支持多種數(shù)據(jù)格式和選項。使用pandas庫寫入CSV文件內(nèi)容通過Python對CSV文件中的數(shù)據(jù)進行清洗,如去除重復(fù)行、空值處理、異常值處理等。數(shù)據(jù)清洗將CSV文件中的數(shù)據(jù)進行轉(zhuǎn)換,如數(shù)據(jù)類型轉(zhuǎn)換、日期格式轉(zhuǎn)換、編碼轉(zhuǎn)換等。數(shù)據(jù)轉(zhuǎn)換CSV文件數(shù)據(jù)清洗與轉(zhuǎn)換將CSV文件數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫使用Python連接數(shù)據(jù)庫,將CSV文件中的數(shù)據(jù)逐行讀取并插入到數(shù)據(jù)庫中。要點一要點二從數(shù)據(jù)庫導(dǎo)出數(shù)據(jù)到CSV文件通過Python查詢數(shù)據(jù)庫,將查詢結(jié)果以CSV格式導(dǎo)出到文件中。CSV文件與數(shù)據(jù)庫交互JSON文件處理實例04讀取JSON文件內(nèi)容Python內(nèi)置的`json`模塊提供了讀取JSON文件的功能。通過`json.load()`函數(shù),可以將JSON文件內(nèi)容加載為Python對象。使用`json`模塊首先,使用`open()`函數(shù)打開JSON文件,并指定打開模式為讀取模式('r')。然后,調(diào)用`json.load()`函數(shù)讀取文件內(nèi)容,并將其轉(zhuǎn)換為Python對象。最后,記得關(guān)閉文件。讀取步驟VS同樣地,Python內(nèi)置的`json`模塊也提供了寫入JSON文件的功能。通過`json.dump()`函數(shù),可以將Python對象寫入JSON文件。寫入步驟首先,使用`open()`函數(shù)打開JSON文件,并指定打開模式為寫入模式('w')。然后,調(diào)用`json.dump()`函數(shù)將Python對象轉(zhuǎn)換為JSON格式,并寫入文件。最后,記得關(guān)閉文件。使用`json`模塊寫入JSON文件內(nèi)容在讀取JSON文件后,可能需要對數(shù)據(jù)進行清洗,例如刪除重復(fù)項、處理缺失值、轉(zhuǎn)換數(shù)據(jù)類型等??梢允褂肞ython的列表推導(dǎo)式、字典推導(dǎo)式等技巧進行數(shù)據(jù)清洗。有時需要將JSON數(shù)據(jù)轉(zhuǎn)換為其他格式,例如將JSON對象轉(zhuǎn)換為Python字典或列表,或者將JSON數(shù)據(jù)轉(zhuǎn)換為CSV或XML格式??梢允褂孟鄳?yīng)的Python庫(如`csv`、`xml.etree.ElementTree`)進行轉(zhuǎn)換。數(shù)據(jù)清洗數(shù)據(jù)轉(zhuǎn)換JSON數(shù)據(jù)清洗與轉(zhuǎn)換可以使用Python的數(shù)據(jù)庫API(如`sqlite3`、`pymysql`等)將JSON數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫。首先,需要將JSON數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)庫能夠處理的格式(如SQL語句),然后執(zhí)行導(dǎo)入操作。將JSON數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫同樣地,可以使用Python的數(shù)據(jù)庫API從數(shù)據(jù)庫中查詢數(shù)據(jù),并將查詢結(jié)果轉(zhuǎn)換為JSON格式。然后,可以使用`json.dump()`函數(shù)將JSON數(shù)據(jù)寫入文件。從數(shù)據(jù)庫導(dǎo)出JSON數(shù)據(jù)JSON文件與數(shù)據(jù)庫交互XML文件處理實例05使用`xml.etree.ElementTree`模塊Python標準庫中的`xml.etree.ElementTree`模塊提供了輕量級且高效的XML解析功能。通過該模塊,可以方便地讀取XML文件內(nèi)容,并將其轉(zhuǎn)換為易于處理的Element對象。要點一要點二讀取XML文件的基本步驟首先,導(dǎo)入`xml.etree.ElementTree`模塊;然后,使用`parse()`函數(shù)解析XML文件,并返回一個ElementTree對象;最后,通過ElementTree對象的`getroot()`方法獲取XML文檔的根元素。讀取XML文件內(nèi)容創(chuàng)建Element對象使用`xml.etree.ElementTree`模塊中的`Element`類可以創(chuàng)建XML元素。通過指定元素標簽和屬性,可以構(gòu)建出完整的XML結(jié)構(gòu)。將Element對象寫入文件創(chuàng)建好Element對象后,可以使用`xml.etree.ElementTree.SubElement()`方法添加子元素。然后,通過`xml.etree.ElementTree.tostring()`函數(shù)將Element對象轉(zhuǎn)換為字符串表示形式。最后,使用文件操作將字符串寫入XML文件中。寫入XML文件內(nèi)容清洗XML數(shù)據(jù)在讀取XML文件后,可能需要對數(shù)據(jù)進行清洗和處理,以去除不必要的空白、注釋或其他無效內(nèi)容??梢允褂肵Path或正則表達式等技術(shù)來提取所需的數(shù)據(jù)部分。轉(zhuǎn)換XML數(shù)據(jù)有時需要將XML數(shù)據(jù)轉(zhuǎn)換為其他格式(如JSON、CSV等)以便進一步處理或分析??梢允褂孟鄳?yīng)的庫或工具來實現(xiàn)不同格式之間的轉(zhuǎn)換。XML數(shù)據(jù)清洗與轉(zhuǎn)換將XML數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫可以使用Python中的數(shù)據(jù)庫連接庫(如`sqlite3`、`pymysql`等)將清洗和轉(zhuǎn)換后的XML數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中。根據(jù)數(shù)據(jù)庫類型和表結(jié)構(gòu),編寫相應(yīng)的SQL語句來實現(xiàn)數(shù)據(jù)的插入、更新或刪除操作。從數(shù)據(jù)庫導(dǎo)出XML數(shù)據(jù)同樣地,可以使用數(shù)據(jù)庫查詢語句從數(shù)據(jù)庫中檢索數(shù)據(jù),并使用`xml.etree.ElementTree`模塊將數(shù)據(jù)轉(zhuǎn)換為XML格式。然后,將生成的XML字符串寫入文件中,實現(xiàn)數(shù)據(jù)的導(dǎo)出功能。XML文件與數(shù)據(jù)庫交互Excel文件處理實例06使用pandas庫讀取Excel文件pandas是Python中用于數(shù)據(jù)處理和分析的強大庫,可以輕松讀取Excel文件內(nèi)容。通過指定文件路徑和sheet名稱,可以將Excel文件中的數(shù)據(jù)讀取為DataFrame對象。讀取特定列或行通過指定列名或行索引,可以選擇性地讀取Excel文件中的特定列或行。這對于處理大型Excel文件時,只關(guān)注部分數(shù)據(jù)的情況非常有用。處理日期和時間數(shù)據(jù)Excel中的日期和時間數(shù)據(jù)通常以特定的格式存儲。pandas可以自動識別并處理這些日期和時間數(shù)據(jù),將其轉(zhuǎn)換為Python中的datetime對象,方便進行后續(xù)的數(shù)據(jù)分析和處理。讀取Excel文件內(nèi)容010203使用pandas庫寫入Excel文件pandas不僅支持讀取Excel文件,還支持將數(shù)據(jù)寫入Excel文件。通過創(chuàng)建DataFrame對象,并將其導(dǎo)出為Excel文件,可以輕松地將數(shù)據(jù)保存到磁盤上。自定義輸出格式在將數(shù)據(jù)寫入Excel文件時,可以自定義輸出格式,包括設(shè)置單元格格式、調(diào)整列寬和行高等。這使得輸出的Excel文件更加美觀和易于閱讀。批量寫入多個sheet如果需要在一個Excel文件中創(chuàng)建多個sheet,并分別寫入不同的數(shù)據(jù),可以使用pandas的ExcelWriter對象。通過指定不同的sheet名稱和數(shù)據(jù),可以一次性將數(shù)據(jù)寫入多個sheet中。寫入Excel文件內(nèi)容數(shù)據(jù)清洗在讀取Excel文件后,通常需要對數(shù)據(jù)進行清洗和處理,以去除重復(fù)值、缺失值和異常值等。pandas提供了豐富的數(shù)據(jù)清洗功能,如drop_duplicates()、fillna()和replace()等函數(shù),可以方便地進行數(shù)據(jù)清洗操作。數(shù)據(jù)轉(zhuǎn)換有時需要將Excel文件中的數(shù)據(jù)進行轉(zhuǎn)換或計算,以滿足特定的分析需求。pandas支持各種數(shù)據(jù)轉(zhuǎn)換操作,如數(shù)據(jù)分組(groupby)、數(shù)據(jù)透視表(pivot_table)和數(shù)據(jù)合并(merge)等。這些功能可以幫助用戶對數(shù)據(jù)進行更深入的分析和挖掘。Excel數(shù)據(jù)清洗與轉(zhuǎn)換如果需要將Excel文件中的數(shù)據(jù)導(dǎo)入到數(shù)據(jù)庫中,可以使用pandas結(jié)合SQLAlchemy庫實現(xiàn)。首先,將Excel文件

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論