Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解_第1頁
Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解_第2頁
Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解_第3頁
Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解_第4頁
Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解_第5頁
已閱讀5頁,還剩29頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

匯報人:XX2024-01-10Python文件和數(shù)據(jù)格式化核心要點(diǎn)詳解目錄Python文件操作基礎(chǔ)數(shù)據(jù)格式化之字符串處理數(shù)據(jù)格式化之JSON處理目錄數(shù)據(jù)格式化之XML處理數(shù)據(jù)格式化之CSV處理數(shù)據(jù)格式化之Excel處理01Python文件操作基礎(chǔ)使用`open()`函數(shù)打開文件,需要指定文件路徑和打開模式。打開文件關(guān)閉文件上下文管理器使用`close()`方法關(guān)閉文件,釋放資源。使用`with`語句可以自動管理文件的打開和關(guān)閉,確保文件在使用后被正確關(guān)閉。030201文件打開與關(guān)閉文本模式默認(rèn)模式,用于以文本方式讀寫文件。二進(jìn)制模式'b',用于以二進(jìn)制方式讀寫文件。追加模式'a',用于在文件末尾追加內(nèi)容,如果文件不存在則創(chuàng)建。讀取模式'r',用于讀取文件內(nèi)容。寫入模式'w',用于寫入文件內(nèi)容,如果文件不存在則創(chuàng)建,如果文件存在則覆蓋原有內(nèi)容。文件讀寫模式指向當(dāng)前讀寫位置的標(biāo)記。文件指針seek()方法用于移動文件指針到指定位置,tell()方法用于返回當(dāng)前文件指針的位置。定位函數(shù)可以指定相對于文件開頭、當(dāng)前位置或文件末尾的位置進(jìn)行讀寫操作。讀寫位置文件指針與定位常見異常FileNotFoundError(文件未找到)、IOError(輸入/輸出錯誤)等。異常處理使用`try...except`語句塊捕獲并處理異常,確保程序穩(wěn)定運(yùn)行。文件不存在處理在打開文件前可以檢查文件是否存在,如果不存在則給出提示或創(chuàng)建新文件。文件讀寫錯誤處理在讀寫過程中遇到錯誤時,可以給出提示或采取其他措施進(jìn)行處理。文件異常處理02數(shù)據(jù)格式化之字符串處理使用7位二進(jìn)制數(shù)表示字符,共128個字符。ASCII編碼統(tǒng)一不同語言的字符編碼標(biāo)準(zhǔn),采用16位二進(jìn)制數(shù)表示一個字符。Unicode編碼可變長度的Unicode編碼方式,用1到4個字節(jié)表示一個字符,兼容ASCII編碼。UTF-8編碼使用`encode()`方法進(jìn)行編碼,`decode()`方法進(jìn)行解碼。編碼轉(zhuǎn)換字符串編碼與解碼03f-string格式化在Python3.6及以上版本,使用f-string(格式化字符串字面值)進(jìn)行字符串格式化。01%格式化使用`%`占位符和格式化字符串進(jìn)行字符串格式化。02str.format()方法使用`{}`占位符和`format()`方法進(jìn)行字符串格式化。字符串格式化方法使用`+`運(yùn)算符連接兩個字符串。字符串連接使用`lower()`、`upper()`、`capitalize()`等方法進(jìn)行大小寫轉(zhuǎn)換。字符串大小寫轉(zhuǎn)換使用切片操作截取字符串的一部分。字符串截取使用`replace()`方法替換字符串中的指定子串。字符串替換使用`split()`方法將字符串分割成列表。字符串分割0201030405字符串常用操作正則表達(dá)式簡介正則表達(dá)式是一種用于匹配字符串模式的強(qiáng)大工具。re模塊Python標(biāo)準(zhǔn)庫中的re模塊提供了正則表達(dá)式的相關(guān)功能。正則表達(dá)式語法掌握正則表達(dá)式的基本語法,如字符類、選擇符、量詞等。正則表達(dá)式應(yīng)用示例使用正則表達(dá)式進(jìn)行字符串匹配、替換、分割等操作。正則表達(dá)式應(yīng)用03數(shù)據(jù)格式化之JSON處理JSON定義JSON數(shù)據(jù)以鍵值對的形式表示,數(shù)據(jù)結(jié)構(gòu)包括對象、數(shù)組、字符串、數(shù)字、布爾值和null。JSON數(shù)據(jù)結(jié)構(gòu)JSON語法規(guī)則JSON語法規(guī)則包括數(shù)據(jù)為鍵值對、數(shù)據(jù)由逗號分隔、花括號保存對象、方括號保存數(shù)組等。JSON(JavaScriptObjectNotation)是一種輕量級的數(shù)據(jù)交換格式,易于閱讀和編寫。JSON數(shù)據(jù)結(jié)構(gòu)概述Python中JSON模塊使用json模塊導(dǎo)入在Python中,通過importjson語句導(dǎo)入json模塊。json.dumps()將Python對象編碼成JSON字符串。json.loads()將已編碼的JSON字符串解碼為Python對象。json.dump()和json.loa…將Python對象編碼成JSON格式文件,或從JSON格式文件中解碼Python對象。編碼過程使用json.dumps()將Python對象轉(zhuǎn)換為JSON格式的字符串,通過指定indent參數(shù)可設(shè)置縮進(jìn)空格數(shù),使得輸出的JSON字符串更易于閱讀。解碼過程使用json.loads()將JSON格式的字符串轉(zhuǎn)換為Python對象,可以處理包含數(shù)組、對象、數(shù)字、字符串、布爾值和null的JSON數(shù)據(jù)。JSON數(shù)據(jù)編碼與解碼JSON數(shù)據(jù)格式校驗(yàn)校驗(yàn)?zāi)康拇_保JSON數(shù)據(jù)格式的正確性,避免出現(xiàn)解析錯誤或數(shù)據(jù)不一致的情況。校驗(yàn)方法可以使用try-except語句塊捕獲json.loads()函數(shù)拋出的異常,從而判斷JSON數(shù)據(jù)格式是否正確。同時,也可以使用第三方庫如jsonschema對JSON數(shù)據(jù)進(jìn)行更加嚴(yán)格的格式校驗(yàn)。04數(shù)據(jù)格式化之XML處理XML是一種標(biāo)記語言,用于描述和傳輸數(shù)據(jù)。標(biāo)記語言XML數(shù)據(jù)由元素構(gòu)成,每個元素通過開始標(biāo)簽和結(jié)束標(biāo)簽進(jìn)行標(biāo)識。元素與標(biāo)簽元素可以包含屬性,用于提供元素的額外信息。屬性元素的標(biāo)簽之間可以包含文本內(nèi)容,表示元素的值。文本內(nèi)容XML數(shù)據(jù)結(jié)構(gòu)概述lxml第三方庫,提供了更豐富的功能和更好的性能。使用方法導(dǎo)入相應(yīng)的模塊,然后利用模塊中提供的函數(shù)和方法進(jìn)行XML數(shù)據(jù)的處理。xml.etree.ElementTreePython標(biāo)準(zhǔn)庫中的模塊,用于解析和創(chuàng)建XML文檔。Python中XML模塊使用編碼將Python對象轉(zhuǎn)換為XML格式的過程稱為編碼??梢允褂肵ML模塊中的函數(shù)將Python數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換為XML字符串。解碼將XML格式的數(shù)據(jù)轉(zhuǎn)換為Python對象的過程稱為解碼。可以使用XML模塊中的函數(shù)將XML字符串解析為Python數(shù)據(jù)結(jié)構(gòu)。XML數(shù)據(jù)編碼與解碼XMLSchema驗(yàn)證使用XMLSchema定義(XSD)進(jìn)行XML數(shù)據(jù)格式的驗(yàn)證。XSD提供了更強(qiáng)大和靈活的驗(yàn)證功能。驗(yàn)證方法使用XML模塊中的驗(yàn)證函數(shù),將XML數(shù)據(jù)與相應(yīng)的DTD或XSD進(jìn)行比對,以驗(yàn)證數(shù)據(jù)的合法性。DTD驗(yàn)證使用文檔類型定義(DTD)進(jìn)行XML數(shù)據(jù)格式的驗(yàn)證。DTD定義了XML文檔的結(jié)構(gòu)和元素類型。XML數(shù)據(jù)格式校驗(yàn)05數(shù)據(jù)格式化之CSV處理CSV(CommaSeparatedValues)即逗號分隔值,是一種簡單的文件格式,用于存儲表格數(shù)據(jù),如電子表格或數(shù)據(jù)庫。CSV通常用于數(shù)據(jù)交換,因?yàn)樗且环N純文本格式,任何支持文本讀取和寫入的程序都可以處理它。CSV文件由任意數(shù)量的記錄組成,記錄之間以某種換行符分隔;每條記錄由字段組成,字段之間的分隔符是其他字符或字符串,最常見的是逗號或制表符。CSV數(shù)據(jù)結(jié)構(gòu)概述Python標(biāo)準(zhǔn)庫中的csv模塊提供了用于讀寫CSV文件的功能。使用csv.reader對象讀取CSV文件,可以逐行迭代文件內(nèi)容,并將每行內(nèi)容解析為一個字段列表。使用csv.writer對象寫入CSV文件,可以將字段列表轉(zhuǎn)換為CSV格式的字符串,并寫入文件。010203Python中CSV模塊使用使用open()函數(shù)打開CSV文件,并創(chuàng)建csv.reader對象進(jìn)行讀取。通過for循環(huán)逐行讀取數(shù)據(jù),每行數(shù)據(jù)是一個列表形式。讀取CSV文件使用open()函數(shù)創(chuàng)建或打開CSV文件,并創(chuàng)建csv.writer對象進(jìn)行寫入。通過writerow()方法寫入單行數(shù)據(jù),或通過writerows()方法寫入多行數(shù)據(jù)。寫入CSV文件CSV數(shù)據(jù)讀寫操作123在處理CSV數(shù)據(jù)時,經(jīng)常需要進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,如將字符串轉(zhuǎn)換為數(shù)字、日期等。Python提供了多種內(nèi)置函數(shù)和方法進(jìn)行數(shù)據(jù)類型轉(zhuǎn)換,如int()、float()、datetime.strptime()等。在讀取CSV數(shù)據(jù)時,可以使用這些函數(shù)和方法對字段進(jìn)行轉(zhuǎn)換;在寫入CSV數(shù)據(jù)時,也可以將轉(zhuǎn)換后的數(shù)據(jù)寫入文件。CSV數(shù)據(jù)格式轉(zhuǎn)換06數(shù)據(jù)格式化之Excel處理工作簿(Workbook)01一個Excel文件就是一個工作簿,可以包含多個工作表。工作表(Worksheet)02工作表是Excel文件中的主要組成部分,用于存儲和處理數(shù)據(jù)。單元格(Cell)03單元格是工作表的基本單位,用于存儲數(shù)據(jù),可以通過行號和列號進(jìn)行定位。Excel數(shù)據(jù)結(jié)構(gòu)概述openpyxl用于讀寫Excel2010xlsx/xlsm/xltx/xltm文件的Python庫。xlrd/xlwt用于讀寫Excel97-2003xls文件的Python庫。pandas提供強(qiáng)大的數(shù)據(jù)處理功能,支持Excel文件的讀寫操作。Python中Excel模塊使用寫入Excel文件使用openpyxl、xlwt或pandas庫中的函數(shù)將數(shù)據(jù)寫入Excel文件中。操作工作表和單元格通過指定工作表名稱或索引,以及單元格的行號和列號,可以對工作表和單元格進(jìn)行讀寫操作。讀取Excel文件使用openpyxl、xlrd或pandas庫中的函數(shù)讀取Excel文件中的數(shù)據(jù)。Exc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論