Python序列化模塊之pickle與json詳解

上傳人：搞*** IP屬地：四川上傳時(shí)間：2025-05-11 格式：DOCX 頁數(shù)：7 大小：18.25KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩2頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第Python序列化模塊之pickle與json詳解序列化后的數(shù)據(jù)，如果想在多種語言中都可以流通怎么辦？每種語言都有自己的語言特性，有些語言中的數(shù)據(jù)是特有的，那么序列化后的數(shù)據(jù)該怎么流通呢？

每種語言雖然各有自己的特點(diǎn)，但是幾乎所以的語言都是師出同門，天下語言無不出C者。所以將每種語言共同存在的數(shù)據(jù)格式按照統(tǒng)一的標(biāo)準(zhǔn)去序列化就可以了，JSON誕生了。

json一般存儲(chǔ)為json文件。

支持的數(shù)據(jù)類型

python中支持JSON序列化的數(shù)據(jù)一共有八種類型：

int、float、bool、str、list、tuple、dict、None

JSON序列化支持這幾種數(shù)據(jù)類型是因?yàn)镴SON中就只支持這幾種數(shù)據(jù)類型：

如下為python中的數(shù)據(jù)類型對(duì)應(yīng)json中的數(shù)據(jù)類型；

python數(shù)據(jù)類型JSON數(shù)據(jù)類型intintfloatfloatbool（True，F(xiàn)alse）bool（true，false）Nonenullstrstr（必須雙引號(hào)）list（[]）、tuple（()）Array（[]）dict（{}）Object（{}）（鍵必須是雙引號(hào)）

注意：

JSON中沒有元組類型，所以會(huì)變成列表；

JSON中的對(duì)象必須使用字符串作為鍵，所以python中的字典數(shù)據(jù)中的非字符串鍵，會(huì)變成對(duì)應(yīng)的JSON數(shù)據(jù)然后強(qiáng)轉(zhuǎn)成為字符串；

importjson

dict_var={1:1,2.2:2.2,False:True,'123':'123',"234":"234",None:None}

json_obj=json.dumps(dict_var)

dict_var=json.loads(json_obj)

print(dict_var)

#{'1':1,'2.2':2.2,'false':True,'123':'123','234':'234','null':None}

JSON和pickle的區(qū)別

JSON可以序列化python八種數(shù)據(jù)，序列化為字符串。

pickle可以序列化python所有的數(shù)據(jù)類型，序列化為字節(jié)流。

序列化函數(shù)

JSON序列化函數(shù)和pickle的一樣，名稱和使用方法基本一樣：

方法含義dumps序列化loads反序列化dump序列化寫入文件load讀取文件反序列化

這里注意一下序列化方法的幾個(gè)常用參數(shù)：

ensure_asscii默認(rèn)為True，以ACSII格式編碼，以Unicode顯示；

sort_keys默認(rèn)為True，對(duì)字典的鍵進(jìn)行排序；

indent默認(rèn)為None，json格式化默認(rèn)是一行不加縮進(jìn)的，如果indent是一個(gè)正整數(shù)，就以該縮進(jìn)級(jí)別進(jìn)行換行，增強(qiáng)可視化。

importjson

#開啟排序

dict_var={'B':'2','A':'1'}

print(dict_var)#{'B':'2','A':'1'}

json_char=json.dumps(dict_var,ensure_ascii=False,sort_keys=True)

dict_var=json.loads(json_char)

print(dict_var)#{'A':'1','B':'2'}

#關(guān)閉排序

dict_var={'B':'2','A':'1'}

print(dict_var)#{'B':'2','A':'1'}

json_char=json.dumps(dict_var,ensure_ascii=False,sort_keys=False)

dict_var=json.loads(json_char)

print(dict_var)#{'B':'2','A':'1'}

#dump也一樣哦

json和pickle實(shí)際使用過程中的一些問題

在對(duì)文件進(jìn)行操作的時(shí)候：

json可以連續(xù)dump，但是不能連續(xù)loadpickle可以連續(xù)dump和load

如下解釋：

#json可以連續(xù)dump，但是不能連續(xù)load

importjson

#序列化數(shù)據(jù)

lst1=[1,2,3]

lst2=[4,5,6]

lst3=[7,8,9]

#序列化寫入文件

withopen('test.json','w',encoding='UTF-8')asfp:

json.dump(lst1,fp)

json.dump(lst2,fp)

json.dump(lst3,fp)

#讀取文件反序列化

withopen('test.json','r',encoding='UTF-8')asfp:

data1=json.load(fp)#ERROR

data2=json.load(fp)

data3=json.load(fp)

#！??！json.decoder.JSONDecodeError:Extradata:line1column10(char9)

因?yàn)閖son.dump方法序列化寫入文件的時(shí)候，寫入了兩個(gè)及以上的數(shù)據(jù)，之后json.load方法在讀的時(shí)候又是一次性將整個(gè)文件中的數(shù)據(jù)讀取出來，這個(gè)時(shí)候，反序列化的數(shù)據(jù)成了[1,2,3][4,5,6][7,8,9]，這明顯不是一個(gè)json支持的數(shù)據(jù)格式，所以json.load失敗了。

再來看pickle是怎么樣的：

#pickle可以連續(xù)dump，也可以連續(xù)load

importpickle

#序列化數(shù)據(jù)

lst1=[1,2,3]

lst2=[4,5,6]

lst3=[7,8,9]

#序列化寫入文件

withopen('pickle.txt','wb')asfp:

pickle.dump(lst1,fp)

pickle.dump(lst2,fp)

pickle.dump(lst3,fp)

#讀取文件反序列化

withopen('pickle.txt','rb')asfp:

data1=pickle.load(fp)#[1,2,3]

print(data1)

data2=pickle.load(fp)#[4,5,6]

print(data2)

data3=pickle.load(fp)#[7,8,9]

print(data3)

#嘗試先逐行讀取，再反序列化

withopen('pickle.txt','rb')asfp:

datum=fp.readlines()

print(len(datum))#1

fordataindatum:

data=pickle.loads(data)

print(data)#[1,2,3]#只能讀出一個(gè)

可以看到pickle.load將數(shù)據(jù)都讀出來了，這是因?yàn)閜ickle.dump在寫入數(shù)據(jù)的時(shí)候在每條數(shù)據(jù)后都加上了一個(gè)標(biāo)記（有些人解釋說是換行，但是文件中并沒有換行，逐行使用fp.readlines逐行讀取的時(shí)候也只能獲取一條，但是在文件中所有的數(shù)據(jù)都是在同一行的，我也不太懂了(無奈)），然后pickle.load每次就只會(huì)讀一條數(shù)據(jù)，從IO指針讀到每條數(shù)據(jù)后的那個(gè)標(biāo)記為止，所以，pickle可以連續(xù)的load。

怎么解決json的這個(gè)問題？

其實(shí)上面的這個(gè)問題，我個(gè)人認(rèn)為是一種不規(guī)范的操作。因?yàn)閖son.load會(huì)一次性的讀取整個(gè)文件中的內(nèi)容，你卻在一個(gè)文件中寫入了不止一條的數(shù)據(jù)，那么在反序列化的時(shí)候當(dāng)然會(huì)報(bào)錯(cuò)了。所以我認(rèn)為：

json的主要作用多語言之前的數(shù)據(jù)傳遞和數(shù)據(jù)存儲(chǔ)，每個(gè)JSON文件中最好只儲(chǔ)存一條完整的數(shù)據(jù)。

但是我就想在一個(gè)json文件中存多個(gè)數(shù)據(jù)呢？

其實(shí)思路很簡(jiǎn)單，關(guān)鍵就是讀取文件然后反序列化的時(shí)候，必須是一條數(shù)據(jù)、一條數(shù)據(jù)的反序列化，類似如下：

importjson

#序列化數(shù)據(jù)

lst1=[1,2,3]

lst2=[4,5,6]

lst3=[7,8,9]

#序列化寫入文件，每寫入一條數(shù)據(jù)插一個(gè)換行

withopen('test.json','w',encoding='UTF-8')asfp:

json.dump(lst1,fp)

fp.write('\n')

json.dump(lst2,fp)

fp.write('\n')

json.dump(lst3,fp)

#讀取文件反序列化（逐行讀取數(shù)據(jù)，然后反序列化）

withopen('test.json','r',encoding='UTF-8')asfp:

datum=fp.readlines()

print(len(datum))#3

fordataindatum:

data=json.loads(data)

print(data)#[1,2,3]

#[4,5,6]

#[7,8,9]

pickle和json的區(qū)別總結(jié)

json序列化后的數(shù)據(jù)為字符串，pickle序列

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Python序列化模塊之pickle與json詳解

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

Python序列化模塊之pickle與json詳解

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔