理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021_第1頁
理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021_第2頁
理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021_第3頁
理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021_第4頁
理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

理解大數(shù)據(jù):數(shù)字時代的數(shù)據(jù)與隱私2021報告綜述1.1.

一個由數(shù)字信息定義的時代大部分經濟活動,其背后的機制設計,本

質上都是“為了降低交易成本,或彌補過高交易成本引發(fā)的交易失敗,從而讓個人可以自由地協(xié)商交易,受益于信息的擴散。一方面,為了促進信息的收集

和擴散,人類進行了諸多努力,設計不同的機制來減少交易成本。另一方面,當經濟主

體面臨不充分或不對稱信息時,我們設置不同的激勵措施來鼓勵主體之間進行協(xié)作。所以,在理論

和實踐中,人類社會都一直在致力于打破信息的牢籠,推進信息的交互。數(shù)據(jù)被數(shù)字化,再加

上新興的半導體技術被大規(guī)模用于數(shù)據(jù)計算和儲存,推動了數(shù)據(jù)的爆炸式增長。以至于

在各類文本中“數(shù)據(jù)”一詞的出現(xiàn)頻率超越了“信息”一詞。數(shù)

字革命徹底改變了信息在社會和經濟中扮演的角色。它一方面讓信息獲取前所未有地簡

單,人類使用信息并從中獲益的難度大大降低,數(shù)據(jù)日益成為重要的生產要素。另一方

面也加大了濫用信息的風險。因為數(shù)據(jù)、信息、大數(shù)據(jù)等概念被頻繁使用,在進一步論述之前,有必要建立對這

些概念的共識。首先要注意的是,數(shù)據(jù)不等同于信息。數(shù)據(jù)是對事物的一系列觀察,而

“大數(shù)據(jù)”則是對大量“(?。?shù)據(jù)”進行組合、存儲和計算處理的過程?!皵?shù)據(jù)科學”中

很重要的步驟是“數(shù)據(jù)壓縮”,即將大量數(shù)據(jù)集壓縮成小規(guī)模,同時保留大部分有效信

息的數(shù)據(jù)集,并將其轉換成易于存儲和解讀的形式。信息是基于數(shù)據(jù)的洞見,所以信息

的價值往往取決于需要回答什么問題,也就和具體的使用場景相關。人類社會正處于一個關鍵的十字路

口,一方面數(shù)據(jù)的重要性達到前所未有的高度,另一方面我們在如何治理,從而充分發(fā)

揮數(shù)據(jù)的作用,并同時降低數(shù)據(jù)濫用的風險這些關鍵問題上,鮮有共識。要發(fā)揮數(shù)據(jù)的

最大效用,需要我們更好地理解數(shù)據(jù)的本質,理解數(shù)據(jù)在真實世界是如何使用的,以及

在治理數(shù)據(jù)時應該如何權衡取舍。為此,我們要區(qū)分事實和臆斷、求真與恐懼。

數(shù)據(jù)經濟學就是數(shù)字時代的信息經濟學。1.2.1

從理解隱私悖論開始1.2.2

數(shù)據(jù)的價值來自何處?具體而言,在今天的線上購物環(huán)境中,匹配用戶數(shù)據(jù)與產品,可以大大降低搜索成本,尤其是當

市場存在海量產品的時候。當個人數(shù)據(jù)這一重要的信息源被切斷時,消費者在選擇潛在

商品時只能依靠傳統(tǒng)的供給側的信息源:品牌、信譽和商品一般特征。因為這些來自傳統(tǒng)渠道信息的有效性不足,市場規(guī)模大幅萎縮。這一結論與搜索領域的學術研究不謀而

合。大量論文證明,即使較小的搜索或匹配成本也會導致商品和勞動力市場的厚度和廣

度產生劇烈變化。1.2.3

如何緩解隱私風險?在這個維度上,全球很多行業(yè)和企業(yè)已經在做大量的探索。有效保護隱私的邏輯,是將隱私工程化

(privacyengineering)和隱私增強技術(privacy-enhancingtechnologies,PETs)結合起

來。隱私保護工程化,是指將個人隱私保護的法規(guī)和原則,融入到產品設計中來開發(fā)和

使用軟件應用。例如在用戶交互設計上,隱私工程可以加強用戶對隱私條款的理解,增

強對敏感信息的控制。隱私工程化可以應用到大數(shù)據(jù)生命周期的各個階段。在信息收集階段,企業(yè)必須獲

得用戶的許可,并且必須遵循收集數(shù)據(jù)的必要性原則。在集成和存儲階段,企業(yè)處理數(shù)

據(jù)前要可以過濾敏感信息。這些信息還可以加密,這樣即便出現(xiàn)數(shù)據(jù)泄露的情況,個人

信息也不會被濫用。脫敏和加密后的數(shù)據(jù),可以用于分析,了解消費者及其需求,并且

在嚴密且持續(xù)的風險管理之下進行。最后,要可持續(xù)且高效地使用數(shù)據(jù),企業(yè)要在隱私

保護需求和用戶數(shù)據(jù)許可最小化之間取得合理的平衡,這樣才能既保護隱私,也不至于

因為過分許可打攪用戶。最后,用戶還應該保有個人信息的刪除權。1.2.4

如何從數(shù)據(jù)的本質看數(shù)據(jù)的權屬、利益分配和保護責任問題?這個數(shù)據(jù)權衡框架包含數(shù)據(jù)的兩個本質特征、三個視角,以及一個基本原則。1.

數(shù)據(jù)的

2

個本質特征:非競爭性和不可分離性。首先,數(shù)據(jù)和物理商品不同,據(jù)

有非競爭性,可以被無數(shù)次生產和使用,而不會消耗數(shù)據(jù)相關的對象。其次,不管數(shù)據(jù)

的使用者是誰,都可能對數(shù)據(jù)相關的主體帶來潛在影響;數(shù)據(jù)使用和數(shù)據(jù)主體存在不可

分離性。2.

數(shù)據(jù)生產和使用的三個視角:數(shù)據(jù)生產者、數(shù)據(jù)主體和使用場景。這里數(shù)據(jù)生產

者(在商業(yè)環(huán)境下)是指觀察、收集和處理數(shù)據(jù)的機構和個體。數(shù)據(jù)主體是指數(shù)據(jù)描述

的個體(個人數(shù)據(jù))或對象(非個人數(shù)據(jù))。使用場景是指使用數(shù)據(jù)的經濟或社會活動。數(shù)據(jù)需要被觀察才能產生,所以數(shù)據(jù)相關主體并不一定是數(shù)據(jù)的生產者。基于數(shù)據(jù)

的兩個本質特征,數(shù)據(jù)生產者和數(shù)據(jù)主體的利益是相互關聯(lián)的。從數(shù)據(jù)主體的角度出發(fā),使用數(shù)據(jù)會對他們造成影響,因此他們的權益必須得到保

護。

從使用場景的角度看,數(shù)據(jù)不應被簡單地類比為一種有固定價值的商品。在實踐中,數(shù)據(jù)需要歸集、存儲、分析,形成對場景需求有價值的信息洞見。一方面,這個過程需

要消耗成本和能力。另一方面,數(shù)據(jù)的價值是變動的,取決于基于數(shù)據(jù)的信息能在多大

程度上提高經濟和社會活動中交互的效率。所以,數(shù)據(jù)的使用是經濟活動中不可分離的

部分,其價值也隨著具體的場景需求而變化。數(shù)據(jù)的兩個本質特征,和數(shù)據(jù)生產者、數(shù)據(jù)相關主體、使用場景三個視角,可以幫

助我們理解數(shù)據(jù)和其他商品或生產要素有什么不同,數(shù)據(jù)是如何產生、如何發(fā)揮價值的,

以及牽涉到的相關方。基于這個權衡框架,我們可以得出三個結論:首先,將數(shù)據(jù)等同

于一般商品那樣擁有唯一所有權的觀點是不合理的。第二,隱私保護的重點應該是在數(shù)

據(jù)使用中尊重和保護數(shù)據(jù)主體的隱私權,而不是將數(shù)據(jù)獨有權給予數(shù)據(jù)相關主體,否則

難以發(fā)揮數(shù)據(jù)作為生產要素的價值,最終讓所有的相關方受損。最后,數(shù)據(jù)生產者和數(shù)

據(jù)相關主體之間應在平等、自愿的基礎上達成協(xié)議,從而雙方都可以從數(shù)據(jù)的生產和使

用中受益。

總結起來,數(shù)據(jù)治理的核心原則應該是在促進數(shù)據(jù)流動的同時保護數(shù)據(jù)主體的權

利。1.3.

數(shù)據(jù)治理問題1.3.1

數(shù)據(jù)治理的演進邏輯數(shù)據(jù)權衡框架有助于更好地理解數(shù)據(jù)隱私監(jiān)管和治理的演進。上世紀

70

代,美國頒布了《公平信息實踐》(FIPS),為現(xiàn)代隱私保護的治理法規(guī)和監(jiān)管奠定了基

礎?!秾嵺`》基于五大原則包括:(1)通知/知情;(2)選擇/許可;(3)接入/參與;(4)

完整/安全;以及(5)執(zhí)行/糾正(美國聯(lián)邦交易委員會,1998)。1.3.2

數(shù)據(jù)和競爭的關系數(shù)據(jù)驅動的商業(yè)行為在競爭中會扮演越來越重要的角色,因此我們需要理解數(shù)據(jù)驅

動的市場行為會如何影響競爭。競爭法的核心目標是確保消費者可以從競爭的力量

中受益。要判斷競爭是否被扭曲,消費者的利益是否受損,我們要用

事實說話,深入理解行業(yè)結構、企業(yè)的商業(yè)行為,并評估其市場表現(xiàn)。在中

國,線上市場的出現(xiàn)讓買賣雙方的平均距離從

10

公里上升至

1000

公里。在

1776

年出

版的《國富論》中,亞當·斯密指出,壟斷力量是“良好管理的大敵”,而交易范圍的擴

展會打破這種壟斷:“狀況良好的公路、運河、船只往來的河流,這些大大降低了貨運的開支,將一國

偏遠的地方與城鎮(zhèn)周邊置于同一發(fā)展水平上。它們都得到了最好的交通改善。這將刺激

邊遠地區(qū)——一國最偏遠一環(huán)的發(fā)展。通過打破本地商人的壟斷,對城鎮(zhèn)的發(fā)展多有裨

益,也對國家的其他地區(qū)有益。盡管交易擴張在舊市場中引入競爭性的商品,但也為舊

產品帶來了新的市場。此外,壟斷是良好管理的大敵。只有在自由和全面的競爭下,市

場中的每個人為了自我防御都要遵循規(guī)則,好的管理制度才能建立起來?!比缤瑏啴敗に姑軙r代的“公路和運河”延伸了貿易距離,打破了壟斷,提升了偏遠

地區(qū)商家的競爭,21

世紀出現(xiàn)的平臺數(shù)字網絡也打破了本地壟斷力量,建立了一個更健全、更具競爭性的商業(yè)環(huán)境,只不過兩者的速度和效率無法同日而

語。

另一方面,數(shù)字經濟中可能妨礙競爭的商業(yè)行為在全球范圍內正在引起越來越多的

關注和爭議。首先,企業(yè)在多大程度上利用大數(shù)據(jù)技術歧視性對待消費者?商家今天獲得關于客戶的信息前所未有,無論數(shù)據(jù)量還是數(shù)據(jù)種類都遠超前人想

象。從理論上講,企業(yè)通過數(shù)據(jù)更懂消費者,是有可能成體系地對消費者采取價格歧視,

攫取消費者利益。數(shù)字技術改變了生產者和消費者的關系。隨著

累積這些高顆粒度的數(shù)據(jù),商家已經不再追求從單獨的產品或服務中獲取最大利潤,而

是追求提供一個以客戶需求為中心的綜合服務,建立更高的客戶忠誠度。普惠性就是

盡可能擴大客戶的多樣性和數(shù)量,今天已經成為越來越多企業(yè)核心的商業(yè)目標。很多數(shù)字平臺希望向平臺上的賣方公開買方的特征信息,而不是將買家隔離開,進行經濟學家所謂的“價格歧視”——以不同的價格向不同

的群體出售類似的產品,以便從支付意愿最高的消費者身上獲取最大的利潤。實際上,

要成功地進行價格歧視,賣方需要有能力將不同群體的消費者隔絕開。而今天的互聯(lián)網

讓信息隔離越來越難,消費者可以在非常廣闊的范圍內搜索不同的賣家和價格,讓競爭

越來越激烈。其次,大數(shù)據(jù)是否在妨礙競爭,讓市場出現(xiàn)贏者通吃的局面?關于數(shù)據(jù)競爭的一個普遍擔憂是,網絡平臺的外部性(直接和間接的)和規(guī)模經濟

可能帶來市場進入障礙,從而引發(fā)贏者通吃的結果。大數(shù)據(jù)只是商業(yè)競爭的一個要素,并不必然決定行業(yè)的格局和

企業(yè)的命運。首先,在數(shù)字經濟中,數(shù)據(jù)的使用只是商業(yè)模式運行的一部分。盡管在今

天的商業(yè)模式中,數(shù)據(jù)扮演了比以前更加重要的角色,但企業(yè)間的競爭仍舊由商業(yè)模式

及其執(zhí)行決定。另外,與傳統(tǒng)經濟不同,數(shù)字服務的消費者可以選擇多個平臺——用戶。再次,大數(shù)據(jù)在多大程度上在給創(chuàng)新帶來障礙?從事實上看,幾乎每一個行業(yè)都有新的商業(yè)模式和新的市場

進入者。在數(shù)字技術和數(shù)據(jù)的幫助下,這些新的商業(yè)模式為行業(yè)帶來了“破壞性創(chuàng)新”,

也逼迫那些墨守成規(guī)的成熟企業(yè)做出改變。在全球幾乎所有市場,帶來激進創(chuàng)新的企業(yè)

都是那些資金和資源非常有限,但擁有無限想象力和雄心壯志的初創(chuàng)企業(yè)。大數(shù)據(jù)天然會推動產

品和生產流程的創(chuàng)新:第一,大數(shù)據(jù)的三個

V已經成為重要的生產模式和商業(yè)模式的創(chuàng)新引擎。企業(yè)連

接和了解客戶的能力大大加強,因此可進行更明智的決策,并進行創(chuàng)新試驗。這是在數(shù)

字技術深度改變的行業(yè)中,創(chuàng)新層出不窮的重要原因。第二,大數(shù)據(jù)的三個

V帶來了前所未見的大規(guī)模、深度合作,這也大大加速了創(chuàng)新

在市場中的部署和應用。平臺作為連接供給和需求的載體,成為創(chuàng)新擴散的重要推動力

量。平臺處于競爭壓力,會愿意改進商業(yè)基礎設施,推動平臺上企業(yè)的創(chuàng)新發(fā)展。實際

上平臺上的創(chuàng)新非?;钴S,例如新品牌和小眾品牌在各類平臺上的爆發(fā)式增長,就是顯

著證據(jù)。第

2

從消費者權益的視角理解隱私悖論2.1.

讓人費解的隱私悖論2.2.

通過大數(shù)據(jù)研究揭示用戶的隱私決策第

3

數(shù)據(jù)的價值3.1.

信息在數(shù)字時代的變革性意義3.2.

數(shù)據(jù)在數(shù)字時代的價值數(shù)據(jù)只有在使用時,在經濟生產和社會活動中流動時產生價值。隨著人們對數(shù)據(jù)的

處理、傳輸速度大大提高,人類協(xié)作的三個基石——連接、決策和信任正在信息革命中

發(fā)生著根本性轉變。以下討論將對這三大要素進行詳細分析。3.2.1

數(shù)字化連接:

普惠性參與和協(xié)作達到前所未有的水平海量、多種類的數(shù)據(jù),再加上快速連接,讓無數(shù)客戶和生產商做出更明智的決策,

從而促成更快速、有益的產品創(chuàng)新,更具創(chuàng)新性的銷售和服務,以及新商業(yè)模式。除了使用搜索和店鋪列表等傳統(tǒng)工具外,電商平臺利用越來越多的推薦系統(tǒng),能更

有效率地幫助消費者找到自己想要的產品。而這個推薦系統(tǒng)則依賴一些大數(shù)據(jù)信息,電

商推薦系統(tǒng)依據(jù)的消費者數(shù)據(jù)包括購買歷史、搜索活動和個人特征(但不是個人的具體

身份信息)等,匹配的推薦通過算法完成,因此供應商可以“感知到自己的客戶群,但

不知道他們具體是誰”。盡管這些匹配算法非常有效,但買賣雙方都是最近幾年才開始

探索其潛力。到目前為止,只有少量相關數(shù)據(jù)被用于幫助匹配買家和賣家、用戶和供應

商。在金融領域,大數(shù)據(jù)讓小額貸款的規(guī)?;蔀楝F(xiàn)實,而這在以前根本不可能實現(xiàn)。

在金融領域中,“了解你的客戶”(Know-Your-Customer,簡稱

KYC)從來都扮演

了重要角色。從歷史上看,正是因為缺乏信息,大多數(shù)企業(yè)貸款都是以抵押為基礎,而

大多數(shù)中小微企業(yè)由于缺乏抵押品而無法獲得貸款。這造成了中小微企業(yè)的巨大資金缺

口,如何為這些企業(yè)提供有效的金融服務一直是世界性難題。

金融科技的出現(xiàn)扭轉了困局。金融科技貸款利用大數(shù)據(jù),服務于擔保額度低、但具

有高增長潛力的中小企業(yè),而傳統(tǒng)金融中介更多依靠信息不敏感的抵押品提供貸款,這

樣的模式主要為有抵押品的大公司提供貸款?!皵?shù)字足跡”是消費

者在注冊或瀏覽網站時在網上留下的信息。他們發(fā)現(xiàn)即使是簡單的數(shù)字足跡信息也可以

成為傳統(tǒng)征信機構評價信息的有益補充。銀行結合使用征信機構和數(shù)字足跡信息,已經

能夠將違約率降低大約三分之一。因此數(shù)字足跡可以增加沒有銀行賬戶的人口獲得信貸

的機會。3.2.3

數(shù)字化建立信任“信息流”“資金流”和“商品流”常常被用來衡量經濟活動。信息流動是所有基

于協(xié)同的經濟活動中不可或缺的部分;沒有信息流動,資本和消費品就不能從一方流向

另外一方。用哈耶克的話來說,經濟問題就是信息問題。信息將人們連接在一起,使生

產商知道如何為客戶服務,建立信任,并做出更明智的決定。數(shù)字革命將數(shù)據(jù)總量、種

類和速度提升到了前所未有的水平,大數(shù)據(jù)成功改變了消費者和生產者之間的聯(lián)系,進

一步增強了買方和賣方之間的信任,并促進了更好和更快的決策。第

4

隱私風險、隱私保護和數(shù)據(jù)安全技術4.1.

數(shù)字時代隱私風險源于何處?4.2.

隱私工程化和隱私加強技術隱私保護的關鍵在于用好數(shù)字技術,開發(fā)出更強的保護機制和更有效的保護技術。

比如數(shù)字支付系統(tǒng)通過利用多維信息、實時風險甄別,以及人工智能算法,讓支付中的欺詐行為大大降低。我們接下來主要介紹在隱私保護實踐中近些年的兩個有潛力且互補

的核心方向:隱私工程化(“隱私設計”)和隱私增強技術。隱私增強技術(PET)主要針對不可信和潛在有害的數(shù)據(jù)收集者,作為隱私工程化的有效補充。一般把隱私增強技術分為“硬

PET技術”和“軟

PET技術”。硬

PET技術利用各種“硬核”技術來降低誤判可信第三方的風險。這些

技術包括匿名通信渠道(對服務提供商隱藏用戶的

IP地址,同時允許通信),選擇性披

露憑證(允許用戶對自己進行認證,并證明他們有權使用系統(tǒng),而無須披露其他信息),

零知識證明(允許一方向另一方證明一項陳述是真實的,但除了陳述的真實性之外無須

透露任何信息),和多方安全計算等(在多方同時計算時通過機密算法只輸出結果,并

且不可回溯)。4.3.

數(shù)據(jù)安全第

5

全面理解數(shù)據(jù)本質的框架數(shù)據(jù)的兩個本質特征決定了數(shù)據(jù)不同于其他生產要素的權益和責任機制。如果沒有數(shù)據(jù)主體的活動,當然也不會有數(shù)據(jù)的產生;但是無論從生產意愿還是生產成本來說,數(shù)據(jù)主體都不見得是數(shù)據(jù)的生產者,數(shù)據(jù)不等于信息。數(shù)據(jù)的兩個本質特征決定了數(shù)據(jù)不同于其他生產要素的權益和責任機制。如果沒有數(shù)據(jù)主體的活動,當然也不會有數(shù)據(jù)的產生;但是無論從生產意愿還是生產成本來說,數(shù)據(jù)主體都不見得是數(shù)據(jù)的生產者,數(shù)據(jù)不等于信息。數(shù)據(jù)的第二個本質特征是不可分離性(non-separability),即數(shù)據(jù)使用的效果

無法和數(shù)據(jù)主體完全分離。雖然數(shù)據(jù)共享會帶來隱私風險,但如果有恰當?shù)臋C制設計和技術保障,風險和收益之間的權衡可以變得可控。信息處理和共享一直是人類進步的核心基石之一。第

6

關于數(shù)據(jù)治理的幾個核心問題6.1

隱私保護面臨的挑戰(zhàn)即便原則清晰,F(xiàn)IPs在執(zhí)行過程中也面臨很多現(xiàn)實挑戰(zhàn)。不理解這些真實的挑戰(zhàn),

隱私保護可能只是紙上談兵。

FIPs最初被引入到國家法律時,往往變成流程中的一些簡化規(guī)定,如獲得消費者

知情同意的“通知和同意”制度7

。信息透明原則簡化為“通知”,要求數(shù)據(jù)主體須了解

自己個人信息被使用的內容和方式?!笆褂孟拗啤焙喕癁檫^于寬泛且實際上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論