人工智能倫理導(dǎo)論- 課件 7-技術(shù)濫用問題_第1頁
人工智能倫理導(dǎo)論- 課件 7-技術(shù)濫用問題_第2頁
人工智能倫理導(dǎo)論- 課件 7-技術(shù)濫用問題_第3頁
人工智能倫理導(dǎo)論- 課件 7-技術(shù)濫用問題_第4頁
人工智能倫理導(dǎo)論- 課件 7-技術(shù)濫用問題_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

技術(shù)濫用問題Lecture72024/2/1212024/2/122如果我們繼續(xù)在不夠明智和審慎的情況下發(fā)展技術(shù),我們的傭人可能最終成為我們的劊子手?!既R德雷(OmarNelsonBradley)技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/2/123技術(shù)濫用概念2024/2/1247.1技術(shù)濫用概念濫用④多而質(zhì)量低劣。技術(shù)濫用是是指人們?cè)诶眉夹g(shù)進(jìn)行分析、決策、協(xié)調(diào)、組織等一系列的活動(dòng)中,其使用目的、使用方式、使用范圍等出現(xiàn)偏差并引發(fā)不良影響的行為或情形。濫用是指胡亂地或過度地使用,指程度、數(shù)量等,或者,不恰當(dāng)?shù)奈镔|(zhì)(如,酒精或藥物)使用,可損害健康或增加對(duì)健康損害的危險(xiǎn)性。①江河、湖泊的水溢出;②過度,沒有節(jié)制;③浮泛不合實(shí)際;①實(shí)行,施行;②治理,管理;③辯用,聽從;④

出力,效命。例如,遠(yuǎn)古時(shí)期,人類發(fā)明了取火技術(shù),用火烤制食物、照明、取暖、冶煉等,為人類生活提供了便利,也改善了人類的生活質(zhì)量?!盎鸢选庇糜谠缙诘娜祟惙榛鹜ㄐ牛藗兛梢约皶r(shí)得到信息,防止外敵入侵;縱火,可以引發(fā)森林大火、樓宇火災(zāi),給人民生命和財(cái)產(chǎn)帶來巨大損失。⑤

功能。2024/2/1257.1技術(shù)濫用概念濫用技術(shù)濫用的誘因主要有如下三個(gè)方面:技術(shù)設(shè)計(jì)者出于自身利益,產(chǎn)生對(duì)人類不利的行為。例如,金融機(jī)構(gòu)從自身利益出發(fā),推薦不符合用戶利益的產(chǎn)品,或者是為了自身局部利益,不顧整體利益,產(chǎn)生了系統(tǒng)性風(fēng)險(xiǎn);娛樂平臺(tái)為了自身的商業(yè)利益,利用技術(shù)誘導(dǎo)用戶進(jìn)行娛樂或信息消費(fèi),導(dǎo)致用戶沉迷。“技術(shù)至上”的內(nèi)容推薦會(huì)導(dǎo)致用戶價(jià)值觀扭曲、視野狹窄等問題。過度依賴技術(shù)本身,技術(shù)缺陷引發(fā)不良后果和影響。即使人工智能的使用者出于正當(dāng)?shù)哪康?,在一些極端的場(chǎng)景中,盲目相信技術(shù)、過度依賴人工智能,也可能因?yàn)榧夹g(shù)的缺陷而產(chǎn)生嚴(yán)重后果。例如,醫(yī)療誤診導(dǎo)致醫(yī)療事故、安防和犯罪誤判導(dǎo)致安全問題等,都直接關(guān)系到公民的人身安全與自由。盲目擴(kuò)大技術(shù)的應(yīng)用范圍,導(dǎo)致超出人們預(yù)期結(jié)果。任何人工智能技術(shù)都有其特定的應(yīng)用場(chǎng)景和應(yīng)用范圍。超出原定場(chǎng)景和范圍的使用可能會(huì)導(dǎo)致技術(shù)濫用。例如,在校園中應(yīng)用人工智能技術(shù),可以幫助學(xué)校和教師提高教學(xué)效率,但如果盲目擴(kuò)大到對(duì)特定學(xué)生行為的全面監(jiān)控,會(huì)對(duì)學(xué)生造成不良的心理影響。技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/2/126數(shù)據(jù)關(guān)涉的濫用算法關(guān)涉的濫用應(yīng)用關(guān)涉的濫用2024/2/1277.2技術(shù)濫用方式數(shù)據(jù)關(guān)涉的濫用-數(shù)據(jù)過度采集人工智能應(yīng)用存在的主要技術(shù)濫用方式:數(shù)據(jù)關(guān)涉的濫用、算法關(guān)涉的濫用、應(yīng)用關(guān)涉的濫用。數(shù)據(jù)關(guān)涉的濫用是指在數(shù)據(jù)的采集和分析中惡意使用人工智能技術(shù),損害他人利益或造成不良影響的行為。主要包括數(shù)據(jù)過度采集問題和數(shù)據(jù)過度分析問題。數(shù)據(jù)采集主要方式包括現(xiàn)場(chǎng)無差別采集、直接在線采集、網(wǎng)上公開數(shù)據(jù)源和商務(wù)采購等方式。在現(xiàn)場(chǎng)無差別采集時(shí),由于無法提前預(yù)知采集的用戶,難以獲得用戶授權(quán)的充分同意。在直接在線采集時(shí),需要對(duì)用戶數(shù)據(jù)進(jìn)行連續(xù)性的處理分析,因此很難保障用戶的修改、撤回等權(quán)益。在網(wǎng)上公開數(shù)據(jù)源和商務(wù)采購時(shí),目前數(shù)據(jù)共享、交易和流通的市場(chǎng)化機(jī)制不健全,因此存在一部分企業(yè)通過灰色渠道獲得用戶數(shù)據(jù),而這些數(shù)據(jù)缺乏用戶知情同意。在公開環(huán)境尤其是公共空間進(jìn)行現(xiàn)場(chǎng)數(shù)據(jù)采集時(shí),將不可避免地因采集范圍擴(kuò)大而帶來數(shù)據(jù)過度采集問題。如,在無人駕駛場(chǎng)景中,自動(dòng)駕駛汽車的傳感器需要采集街景數(shù)據(jù)來支持智能駕駛系統(tǒng)的決策從而控制汽車行駛,但是這種無差別的街景數(shù)據(jù)采集必然會(huì)采集到行人的個(gè)人數(shù)據(jù),甚至可能會(huì)采集到路邊重要基礎(chǔ)設(shè)施分布、軍事營(yíng)區(qū)等重要數(shù)據(jù)給國(guó)家安全帶來風(fēng)險(xiǎn)。機(jī)器學(xué)習(xí)技術(shù)提升了數(shù)據(jù)采集的效率和自動(dòng)化水平,也加劇了數(shù)據(jù)過度采集的風(fēng)險(xiǎn)。如,一些公司運(yùn)用爬蟲技術(shù)獲取用戶的信息,如購物流水、通訊錄聯(lián)系人、銀行卡賬單,支付寶和微信交易記錄,以及公積金和社保等數(shù)據(jù),然后打包出售,被非法用于不合理和不正當(dāng)?shù)哪康?,損害用戶的利益。人臉、基因、體態(tài)、語音等生物特征數(shù)據(jù)均屬于個(gè)人敏感數(shù)據(jù),對(duì)此類數(shù)據(jù)的采集和處理存在較大的法律合規(guī)和隱私保護(hù)風(fēng)險(xiǎn)2024/2/1287.2技術(shù)濫用方式數(shù)據(jù)過度分析是指超出數(shù)據(jù)中原有使用目的的使用。理論上在現(xiàn)有法律框架,個(gè)人數(shù)據(jù)在知情同意收集后的使用環(huán)節(jié)是沒有受到任何限制和規(guī)避的。數(shù)據(jù)挖掘是一種重要的人工智能數(shù)據(jù)分析形式,可以從大量數(shù)據(jù)中揭示出隱含的、先前未知的并有潛在價(jià)值的信息。關(guān)于這些具有潛在價(jià)值的信息,用戶并沒有足夠的意識(shí)和警覺,并不能形成事實(shí)上的“知情”,當(dāng)然就難免導(dǎo)致表象的“知情同意”,往往造成用戶的潛在信息在實(shí)際不知情情況下被惡意使用。隨著人工智能關(guān)聯(lián)分析技術(shù)的發(fā)展,通過對(duì)公民分散的、單個(gè)無意義的數(shù)據(jù)項(xiàng)進(jìn)行組合關(guān)聯(lián)分析,能夠形成對(duì)特定個(gè)體識(shí)別和特征畫像的數(shù)據(jù)集(如,活動(dòng)場(chǎng)所、行動(dòng)習(xí)慣、政治態(tài)度、宗教信仰等)。這種技術(shù)不但本身會(huì)直接威脅到用戶的人身安全和隱私,若被用于政黨競(jìng)選和政治宣傳,將對(duì)現(xiàn)行的國(guó)家政治制度產(chǎn)生極大的沖擊和顛覆。隨著大數(shù)據(jù)分析和用戶畫像技術(shù)的快速發(fā)展,個(gè)性化服務(wù)變得越來越普遍,各類平臺(tái)和企業(yè)對(duì)于用戶“數(shù)字軌跡”數(shù)據(jù)的采集成為其提供精準(zhǔn)化產(chǎn)品服務(wù)的核心基礎(chǔ),這種對(duì)于用戶習(xí)慣行為的長(zhǎng)期跟蹤和深度分析將使得公民隱私面臨安全風(fēng)險(xiǎn)。數(shù)據(jù)關(guān)涉的濫用-數(shù)據(jù)過度分析2024/2/1297.2技術(shù)濫用方式算法關(guān)涉的濫用“人為開發(fā)造成”和“機(jī)器自我學(xué)習(xí)”兩類人為開發(fā)造成的濫用,是指為了某些自身特殊利益或者惡意目的而開發(fā)出的算法技術(shù)和算法實(shí)現(xiàn)。例如,使用機(jī)器學(xué)習(xí)讓網(wǎng)絡(luò)攻擊自動(dòng)進(jìn)行,并且通過自我學(xué)習(xí)不斷提升,來增強(qiáng)攻擊能力,提高攻擊的命中率。機(jī)器自我學(xué)習(xí)的濫用,是指機(jī)器在學(xué)習(xí)的過程中會(huì)自我學(xué)習(xí)到數(shù)據(jù)的多維不同特征或者多種關(guān)聯(lián),造成不良影響或惡意后果。機(jī)器學(xué)習(xí)的過程中,代碼和算法存在著難以理解的技術(shù)“黑箱”,導(dǎo)致人們無法控制和預(yù)測(cè)的結(jié)果。例如,算法能夠幫助提升惡意軟件的適應(yīng)能力,能夠幫助攻擊者迅速收集、組織并處理大型數(shù)據(jù)庫,從而對(duì)信息進(jìn)行關(guān)聯(lián)與識(shí)別,最終簡(jiǎn)化攻擊實(shí)施門檻并加快攻擊執(zhí)行速度。人為開發(fā)造成的算法濫用包括以下幾個(gè)方面:算法設(shè)計(jì)。算法開發(fā)者利用個(gè)人信息、瀏覽記錄、消費(fèi)記錄等信息,通過數(shù)據(jù)和算法實(shí)施價(jià)格歧視,追求自身利潤(rùn)最大化;通過數(shù)據(jù)和算法向用戶進(jìn)行個(gè)性化推薦,有些內(nèi)容甚至違背法律和公序良俗;通過數(shù)據(jù)和算法對(duì)流量分配、搜索排名、評(píng)價(jià)等級(jí)設(shè)置障礙,限制經(jīng)營(yíng)者開展交易,降低消費(fèi)者選擇的可能性。模型訓(xùn)練。算法開發(fā)者通過使用對(duì)抗生成網(wǎng)絡(luò)來操縱或生成人類、甚至技術(shù)解決方案都難以立即與真實(shí)內(nèi)容區(qū)分的視覺、音頻和文本內(nèi)容。算法開發(fā)者基于缺陷數(shù)據(jù)訓(xùn)練算法,所得到的模型會(huì)產(chǎn)生偏見和不公平?jīng)Q策。算法模型是由數(shù)據(jù)訓(xùn)練出來的,給它什么樣的數(shù)據(jù),就可能產(chǎn)生什么樣的結(jié)果,算法模型會(huì)放大已有的偏見或不公正。2024/2/12107.2技術(shù)濫用方式應(yīng)用關(guān)涉的濫用-網(wǎng)絡(luò)安全人工智能技術(shù)可提升網(wǎng)絡(luò)攻擊的智能化水平,可以利用人工智能技術(shù)自動(dòng)鎖定目標(biāo),進(jìn)行數(shù)據(jù)勒索攻擊;可以通過人工智能技術(shù)自動(dòng)生成大量虛假威脅情報(bào),對(duì)分析系統(tǒng)實(shí)施攻擊;可以采用人工智能技術(shù)自動(dòng)識(shí)別圖像驗(yàn)證碼,竊取系統(tǒng)數(shù)據(jù)。通過人工智能進(jìn)行惡意攻擊的行為和個(gè)人的類別正在激增。同時(shí),針對(duì)人工智能系統(tǒng)的新的攻擊形式(在性質(zhì)上與傳統(tǒng)的網(wǎng)絡(luò)攻擊不同)以一種指數(shù)級(jí)的、有時(shí)無法衡量的方式增加了連接系統(tǒng)的攻擊面。人工智能在網(wǎng)絡(luò)安全的濫用存在如下具體影響:擴(kuò)大現(xiàn)有威脅。廉價(jià)且日益有效的人工智能系統(tǒng)可用于攻擊,意味著各類團(tuán)體和個(gè)人有可能成為惡意行為者。由于廉價(jià)計(jì)算硬件的普及,通過云計(jì)算能力的不斷增加和成本的降低,以及大多數(shù)可以促進(jìn)模型訓(xùn)練和潛在惡意活動(dòng)工具的開源,惡意行為者的范圍正在擴(kuò)大。引入新的威脅。除了現(xiàn)有的威脅在規(guī)模和范圍上的擴(kuò)大,人工智能的進(jìn)步意味著可能會(huì)引入全新的威脅。人工智能不受人類能力限制的特點(diǎn),可以讓行動(dòng)者執(zhí)行原本不可行的攻擊,例如深度造假、破解驗(yàn)證碼、蜂擁式攻擊。改變威脅的特征。針對(duì)人工智能系統(tǒng)的攻擊也經(jīng)常以竊取信息或破壞系統(tǒng)為目的,但以更微妙的形式和更長(zhǎng)遠(yuǎn)的方向精心設(shè)計(jì)。試圖為一個(gè)特有的目的獲得對(duì)目標(biāo)系統(tǒng)的控制,或者通過入侵系統(tǒng)讓模型揭示其內(nèi)部工作原理,然后改變其行為。攻擊將會(huì)更加高效、更有針對(duì)性、難于歸因且難以防守,這將在很大程度上改變傳統(tǒng)網(wǎng)絡(luò)安全的典型特征。2024/2/12117.2技術(shù)濫用方式應(yīng)用關(guān)涉的濫用-軍事防恐人工智能軍事競(jìng)爭(zhēng)觸發(fā)新一輪軍備競(jìng)賽

人工智能將是大國(guó)塑造軍事優(yōu)勢(shì)新杠桿,通過推進(jìn)智能武器部署,實(shí)現(xiàn)作戰(zhàn)能力的迭代升級(jí),維持或打造軍事能力優(yōu)勢(shì)和新代差。對(duì)中小國(guó)家而言,人工智能的巨大賦能效應(yīng)可能會(huì)彌補(bǔ)其在領(lǐng)土、人口、經(jīng)濟(jì)等方面的劣勢(shì),獲得挑戰(zhàn)大國(guó)的實(shí)力和機(jī)會(huì)。智能技術(shù)的易擴(kuò)散性加劇非傳統(tǒng)風(fēng)險(xiǎn)

人工智能技術(shù)與以往核武器、生化武器等最顯著不同是易擴(kuò)散性。由于智能技術(shù)的低成本、高賦能,易于被恐怖組織、個(gè)人等非國(guó)家行為體掌握和運(yùn)用,成為恐怖分子、犯罪組織、黑客等進(jìn)行破壞和犯罪的工具。如,委內(nèi)瑞拉總統(tǒng)馬杜羅出席活動(dòng)遭無人機(jī)爆炸襲擊事件。人工智能軍事應(yīng)用顯著降低戰(zhàn)爭(zhēng)門檻軍事智能發(fā)展催生出認(rèn)知戰(zhàn)、失能戰(zhàn)、網(wǎng)絡(luò)戰(zhàn)等非殺傷性作戰(zhàn)手段,可能不再以消滅對(duì)手為目的,而是以控制對(duì)方認(rèn)知、行動(dòng)等方式取勝,加大了戰(zhàn)爭(zhēng)“零傷亡”的可能。智能化條件下的殺傷性行動(dòng)主要由自主機(jī)器實(shí)施,作戰(zhàn)樣式以自主式遠(yuǎn)程無人攻擊為主,降低了戰(zhàn)爭(zhēng)成本。這些因素都能夠使戰(zhàn)爭(zhēng)看起來更“人道”、“廉價(jià)”,減輕戰(zhàn)爭(zhēng)決策者發(fā)動(dòng)戰(zhàn)爭(zhēng)的道義責(zé)任和政治壓力部署在網(wǎng)絡(luò)、太空、深海等新型作戰(zhàn)空間的智能武器更具有隱蔽性,難以判定誰是發(fā)起者,成為軍事對(duì)抗的“灰色地帶”。技術(shù)濫用概念目錄技術(shù)濫用案例技術(shù)濫用方式1232024/2/1212數(shù)據(jù)關(guān)涉的濫用算法關(guān)涉的濫用應(yīng)用關(guān)涉的濫用機(jī)器學(xué)習(xí)的技術(shù)濫用搜索引擎的技術(shù)濫用語音識(shí)別的技術(shù)濫用計(jì)算機(jī)視覺技術(shù)濫用自然語言處理的濫用生物識(shí)別技術(shù)的濫用2024/2/12137.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易深網(wǎng)(DeepWeb):除了表層網(wǎng)之外的,其實(shí)都可以被稱為深網(wǎng)。深網(wǎng)就是互聯(lián)網(wǎng)上不能被搜索引擎抓取到內(nèi)容。如,和同事微信聊天的記錄;存在網(wǎng)盤里的僅自己可見的音頻視頻;設(shè)置了僅顯示三天的朋友圈,那三天之外的朋友圈內(nèi)容就是屬于搜索引擎無能為力的范圍。這部分的數(shù)據(jù)量比搜索引擎能夠抓取到的多得多。據(jù)估計(jì),深網(wǎng)的內(nèi)容要比表面網(wǎng)站大幾個(gè)數(shù)量級(jí)。暗網(wǎng)(Darknet或DarkWeb)就是不能通過普通方式來訪問的網(wǎng)絡(luò),屬于深網(wǎng)的一部分,但是是更深一層的,暗網(wǎng)是通過非常規(guī)協(xié)議和端口進(jìn)行連接的私有網(wǎng)絡(luò)。暗網(wǎng)的數(shù)據(jù)傳輸是匿名進(jìn)行的。暗網(wǎng)是深網(wǎng)的一個(gè)子集,而且是很小的一部分子集。2019年2月,卡巴斯基實(shí)驗(yàn)室的欺詐偵查小組搗毀了名為“創(chuàng)世紀(jì)(Genesis)”的暗網(wǎng)市場(chǎng)。該市場(chǎng)出售“數(shù)字身份”(互聯(lián)網(wǎng)用戶的電子身份信息),每條信息起價(jià)5美元,最高達(dá)200美元?;ヂ?lián)網(wǎng)并不是我們看到的只有一層,實(shí)際上是分為明網(wǎng)(表層網(wǎng))、深網(wǎng)和暗網(wǎng):明網(wǎng)是我們平時(shí)可以隨意訪問的網(wǎng)絡(luò),但是它只是互聯(lián)網(wǎng)的最表層,大約只占據(jù)了4%-20%的內(nèi)容,搜索引擎就是我們?cè)L問明網(wǎng)的關(guān)鍵,不需要再使用其他的特殊工具和方式。出價(jià)取決于所購買信息的價(jià)值,例如,一個(gè)包含用戶銀行登錄信息完整配置文件的數(shù)字掩碼,會(huì)比一個(gè)瀏覽器指紋的價(jià)格要高的多。數(shù)字掩碼是指用戶設(shè)備指紋(設(shè)備ID、硬件、操作系統(tǒng)、IP地址、屏幕分辨率、固件版本、瀏覽器、瀏覽器插件、時(shí)區(qū)、GPU信息、TCP/IP指紋、Cookie等)及其個(gè)人行為屬性(在特定網(wǎng)上商店花費(fèi)的時(shí)間、與興趣相關(guān)的行為、鼠標(biāo)/觸摸屏行為等)的唯一組合。2024/2/12147.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易黑客們通常會(huì)用惡意軟件攻擊他人電腦,找到并復(fù)制個(gè)人數(shù)據(jù)以及其他個(gè)人身份識(shí)別信息。有了這些信息,通過特定瀏覽器和代理服務(wù)器來模仿真實(shí)用戶的活動(dòng)。再加上盜取的互聯(lián)網(wǎng)用戶的帳戶信息,攻擊者就可以自由地以該用戶的名義進(jìn)行新的、可信的交易——包括使用信用卡消費(fèi)。在打擊“暗網(wǎng)”犯罪的過程中,人工智能也正成為一把利器。消失速度極快是“暗網(wǎng)”犯罪的一大特征,因?yàn)樗鼈兛赡茉獾狡渌诳偷墓?、安全部門的突擊搜查,或者本身就被設(shè)計(jì)成一個(gè)“退出騙局”,顧客為未完成的訂單付費(fèi)后,該網(wǎng)站會(huì)故意關(guān)閉。林肯實(shí)驗(yàn)室(MITLincolnLaboratory)人工智能技術(shù)與系統(tǒng)集團(tuán)研究員達(dá)格利(CharlieDagli)就表示:“暗網(wǎng)交易市場(chǎng)的‘彈出式’特性使得跟蹤參與者及其活動(dòng)變得十分困難?!辟u家和買家在網(wǎng)絡(luò)的多個(gè)層面(從表面到黑暗)及黑暗網(wǎng)絡(luò)論壇上進(jìn)行聯(lián)系。“這種網(wǎng)站之間的不斷切換現(xiàn)在已經(jīng)成為暗網(wǎng)市場(chǎng)運(yùn)作方式的既定組成部分?!贬槍?duì)這一情況,林肯實(shí)驗(yàn)室正在開發(fā)新的人工智能軟件工具來分析表面和暗網(wǎng)數(shù)據(jù),他們訓(xùn)練機(jī)器學(xué)習(xí)算法來計(jì)算不同論壇上用戶之間的相似度,自動(dòng)形成人物角色鏈接。“在這一點(diǎn)上,黑客們已經(jīng)能夠收集、管理和維護(hù)他們所侵入的用戶的大量數(shù)據(jù),”一家基于機(jī)器學(xué)習(xí)的技術(shù)公司的產(chǎn)品經(jīng)理說到,“這意味著,如果你的筆記本電腦被黑客入侵,黑客的戰(zhàn)利品不一定是被入侵的電腦,而是你電腦上的所有數(shù)據(jù),包括所有的身份識(shí)別信息。”2024/2/12157.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-暗網(wǎng)交易機(jī)器學(xué)習(xí)算法首先從一個(gè)論壇A的用戶那里獲取數(shù)據(jù),并為每個(gè)用戶創(chuàng)建一個(gè)著作權(quán)模型。然后,將論壇B上用戶的數(shù)據(jù)與論壇A上的所有用戶模型進(jìn)行對(duì)比,以尋找簡(jiǎn)單的線索,比如在兩個(gè)論壇中一個(gè)叫“sergeygork”,另一個(gè)叫“sergeygorkin”,或者把“joenightmare”拼寫為“joeknight”。算法關(guān)注的另一個(gè)特性是內(nèi)容相似性。達(dá)格利表示,“因?yàn)楹芏鄡?nèi)容都是復(fù)制粘貼的,所以類似的話可能會(huì)來自同一個(gè)用戶?!毕到y(tǒng)查找用戶網(wǎng)絡(luò)中的相似點(diǎn),即用戶交叉的區(qū)域,以及用戶討論的主題。然后將配置文件、內(nèi)容和網(wǎng)絡(luò)特性融合為一個(gè)輸出:兩個(gè)論壇中的兩個(gè)人物角色代表同一個(gè)現(xiàn)實(shí)生活中的人物的概率,這個(gè)匹配正確率高達(dá)95%。安全部門及相關(guān)公司利用機(jī)器學(xué)習(xí)打擊“暗網(wǎng)”犯罪的同時(shí),黑客也開始利用機(jī)器學(xué)習(xí)進(jìn)行對(duì)抗和犯罪。比如,前文中提及的“創(chuàng)世紀(jì)”,黑客利用“數(shù)字孿生”作為數(shù)字面具模仿真實(shí)的用戶,并選擇網(wǎng)絡(luò)安全技術(shù)來通過欺詐檢測(cè)協(xié)議?!叭绻贿吺菣C(jī)器學(xué)習(xí),那么另一邊也是機(jī)器學(xué)習(xí),”“現(xiàn)在,黑客和惡意人員們正在實(shí)施他們自己的方案,作為一種對(duì)抗性的機(jī)器學(xué)習(xí)訓(xùn)練?!?024/2/12167.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)2017年2月9日晚,紹興市公安局越城區(qū)分局城南派出所接到公民虞某報(bào)案稱,他收到好友王某的一條QQ信息:王某正在購買一件價(jià)值1922元的商品,因手機(jī)支付不成功,請(qǐng)虞某幫忙代付。虞某通過手機(jī)為好友支付貨款后,對(duì)方再次要求付款,她疑心被騙因而報(bào)案。結(jié)果證明,王某的賬號(hào)被盜,有人冒充王某對(duì)其好友實(shí)施詐騙。接到報(bào)警后,越城分局警方在哈爾濱抓獲這個(gè)利用社交軟件冒充好友實(shí)施代付詐騙的犯罪團(tuán)伙。團(tuán)伙成員共十余人,頭目鄭某負(fù)責(zé)招募人員、培訓(xùn)和購買作案工具,其他成員登錄不同種類社交軟件實(shí)施詐騙。在這個(gè)團(tuán)伙的電腦中,警方發(fā)現(xiàn)大量公民個(gè)人信息?!靶畔⒆疃嗟囊慌_(tái)電腦中有300多GB的個(gè)人信息,包括多個(gè)郵箱、社交軟件的賬號(hào)和密碼,而且都很準(zhǔn)確?!边@些信息從何而來?團(tuán)伙頭目鄭某稱:他以一組2元左右的價(jià)格,共花40多萬元從吳某等人手中買來的。而吳某手中的信息則來自一個(gè)黑客犯罪團(tuán)伙,該團(tuán)伙利用超級(jí)SQL注入工具、網(wǎng)站漏洞掃描軟件,批量掃描網(wǎng)站程序漏洞,非法獲取網(wǎng)站后臺(tái)用戶注冊(cè)數(shù)據(jù),這被稱為“脫庫”。一起普通的網(wǎng)絡(luò)代付詐騙,牽出一個(gè)利用人工智能技術(shù)、一秒鐘盜取2000組公民信息數(shù)據(jù)的犯罪團(tuán)伙。通過深挖公民個(gè)人信息賬號(hào)密碼買賣這條線索,浙江紹興警方發(fā)現(xiàn)一條涉及利用黑客技術(shù)非法獲取網(wǎng)站后臺(tái)用戶注冊(cè)數(shù)據(jù)、數(shù)據(jù)撞庫、繞開互聯(lián)網(wǎng)公司安全策略的打碼平臺(tái)、網(wǎng)絡(luò)詐騙、非法信息推廣的互聯(lián)網(wǎng)黑色產(chǎn)業(yè)鏈。這一黑產(chǎn)鏈條中,參與到數(shù)據(jù)泄露環(huán)節(jié)的人工智能技術(shù)頗為關(guān)鍵,使得非法獲取個(gè)人信息的成本大幅降低。黑客團(tuán)伙將包含各類郵箱和密碼的數(shù)據(jù)分門別類進(jìn)行銷售,以每10萬條數(shù)據(jù)50元到100元的價(jià)格賣給吳某等人。獲取數(shù)據(jù)后,吳某等人用“撞庫”軟件進(jìn)行批量撞庫、匹配,進(jìn)而將各類賬號(hào)與密碼匹配成功的賬戶以1.2元到2元一個(gè)的價(jià)格,販賣給網(wǎng)絡(luò)詐騙犯罪團(tuán)伙。2024/2/12177.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)很多用戶習(xí)慣在不同網(wǎng)站使用相同的郵箱賬號(hào)登錄,甚至登錄賬號(hào)密碼也和郵箱一樣。黑客可以通過獲取用戶在A網(wǎng)站的賬戶從而嘗試登錄B網(wǎng)址,這就完成一次“撞庫”嘗試。為了防止黑客批量測(cè)試賬戶密碼,各網(wǎng)站和平臺(tái)動(dòng)了不少腦筋,“驗(yàn)證碼”是常用防范手段之一。網(wǎng)絡(luò)用戶在各大網(wǎng)站或者平臺(tái)注冊(cè)、登錄賬號(hào)時(shí),經(jīng)??梢砸姷桨ā白址薄ⅰ皵?shù)字”、“字符+點(diǎn)選”、“滑塊拼圖”、“圖片人工答題”等驗(yàn)證碼,其中“字符型驗(yàn)證碼”是互聯(lián)網(wǎng)行業(yè)普遍采用的驗(yàn)證碼形式。驗(yàn)證碼的防范機(jī)制是:提出的問題要容易被人類解答,而讓機(jī)器無法解答?!懊搸臁备`取到的郵箱、社交軟件等賬號(hào)密碼信息大多是單一的、無效的,需要將這些信息進(jìn)行“清洗”。與之對(duì)應(yīng)的概念為“撞庫”:黑客通過收集互聯(lián)網(wǎng)已泄露的用戶和密碼信息,生成對(duì)應(yīng)的字典表,嘗試批量登陸其他網(wǎng)站后,得到一系列可以登錄的賬號(hào)信息。經(jīng)過“撞庫”清洗后,一些賬號(hào)關(guān)聯(lián)的其他平臺(tái)賬號(hào)被順利登錄,完成“清洗”后的數(shù)據(jù)更為豐富,可以精準(zhǔn)獲知該用戶的許多平臺(tái)注冊(cè)信息,這在犯罪分子眼中極有價(jià)值,價(jià)格也隨之漲高。2016年山東女大學(xué)生徐玉玉被詐騙分子以發(fā)放助學(xué)金的名義,騙走全部學(xué)費(fèi)9900元,在報(bào)警回家的路上猝死,就是由于騙子掌握了徐玉玉準(zhǔn)確的錄取信息、手機(jī)號(hào)碼等個(gè)人信息,精準(zhǔn)實(shí)施詐騙。2024/2/12187.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)當(dāng)賬號(hào)登錄存在異常的時(shí)候,為了保護(hù)賬號(hào)安全,系統(tǒng)會(huì)提示輸入驗(yàn)證碼。其目的是防止犯罪團(tuán)伙批量惡意登錄——他們可以利用機(jī)器大量輸入賬號(hào)和密碼,但是機(jī)器無法識(shí)別驗(yàn)證碼。由此,對(duì)于想要獲取精準(zhǔn)個(gè)人賬戶信息的犯罪團(tuán)伙,在“撞庫”環(huán)節(jié),如何進(jìn)行批量驗(yàn)證就成為關(guān)鍵。由于無法規(guī)避驗(yàn)證碼,黑客們?nèi)粢嚦鲇行艽a,需要人工逐條輸入信息和識(shí)別驗(yàn)證碼,比對(duì)、驗(yàn)證并成功匹配個(gè)人信息的賬號(hào)密碼,確認(rèn)信息準(zhǔn)確可以使用,再交給數(shù)據(jù)商。這些人在圈內(nèi)被稱為“碼奴”,這一環(huán)節(jié)也被稱為“打碼”。某“碼奴”向《財(cái)經(jīng)》記者透露,根據(jù)驗(yàn)證碼的復(fù)雜程度和輸入的準(zhǔn)確率,打1000個(gè)驗(yàn)證碼會(huì)掙取1元至25元不等,每天工作12小時(shí),最多可以輸入2萬個(gè)驗(yàn)證碼,掙到300多元。最熟練的“碼奴”輸入一個(gè)驗(yàn)證碼也需要一秒鐘時(shí)間。在傳統(tǒng)的信息泄露相關(guān)犯罪中,因高昂的人力資本和較為漫長(zhǎng)的工作周期,被“清洗”的數(shù)據(jù)相對(duì)有限。因此在查獲巨量個(gè)人信息后,越城分局警方意識(shí)到,這一系列案件中的“打碼”絕非人工識(shí)別完成。隨后警方調(diào)查發(fā)現(xiàn),該案中,拿到原始數(shù)據(jù)的數(shù)據(jù)商,通過一個(gè)名為“快啊”的打碼平臺(tái)進(jìn)一步進(jìn)行深加工。工商信息顯示,“快啊”平臺(tái)是沈陽納信科技有限公司旗下產(chǎn)品,該公司經(jīng)營(yíng)范圍為計(jì)算機(jī)科學(xué)技術(shù)研究、計(jì)算機(jī)軟件開發(fā)、網(wǎng)絡(luò)技術(shù)研究、網(wǎng)絡(luò)工程設(shè)計(jì)、計(jì)算機(jī)軟件銷售等。警方在調(diào)查中發(fā)現(xiàn),該平臺(tái)專為網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)識(shí)別破解字符型驗(yàn)證碼提供技術(shù)幫助。2024/2/12197.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)打碼平臺(tái)上有多種針對(duì)不同互聯(lián)網(wǎng)產(chǎn)品進(jìn)行“撞庫”的軟件,數(shù)據(jù)商將驗(yàn)證碼傳給“快啊”打碼平臺(tái)的某一“撞庫”軟件識(shí)別接口,打碼平臺(tái)將驗(yàn)證碼發(fā)給后端的“碼奴”進(jìn)行識(shí)別,并獲取識(shí)別結(jié)果。越城分局警方對(duì)“快啊”平臺(tái)的數(shù)據(jù)分析獲知,接入該平臺(tái)提供驗(yàn)證碼識(shí)別服務(wù)的“撞庫”軟件有100多款,接入平臺(tái)的用戶達(dá)1.1萬余人,從2016年6月到2017年3月,平臺(tái)資金進(jìn)賬累計(jì)達(dá)1650萬元,為國(guó)內(nèi)最大的“打碼”平臺(tái)?!按虼a”平臺(tái)游走在法律邊緣,界定并不清晰?!笆裁礃拥娜诵枰孔R(shí)別驗(yàn)證碼?往往都是從事網(wǎng)絡(luò)黑產(chǎn)和灰產(chǎn)的人員?!背谏a(chǎn)業(yè)的詐騙人員,打碼平臺(tái)的通常使用者是“羊毛黨”、搶票的“黃?!奔罢搲⑻八姟?。以“羊毛黨”為例,一些網(wǎng)貸平臺(tái)為吸引投資者常推出一些收益豐厚的活動(dòng),如注冊(cè)認(rèn)證獎(jiǎng)勵(lì)、充值返現(xiàn)、投標(biāo)返利等,催生了以此寄生的投機(jī)群體“羊毛黨”。“羊毛黨”去某網(wǎng)站刷活動(dòng)優(yōu)惠券,但該網(wǎng)站有較復(fù)雜的驗(yàn)證碼,通常“羊毛黨”會(huì)在打碼平臺(tái)注冊(cè)賬號(hào)并充值,并通過打碼平臺(tái)提供的接口,提交驗(yàn)證碼識(shí)別。打碼平臺(tái)將驗(yàn)證碼分發(fā)到各個(gè)“碼奴”客戶端里,獲取識(shí)別結(jié)果,并最終反饋給“羊毛黨”。據(jù)辦案民警介紹,“快啊”平臺(tái)被查的前三個(gè)月,已提供驗(yàn)證碼識(shí)別服務(wù)259億次。在人力資源有限的情況下,“快啊”平臺(tái)如何做到可以提供巨量的驗(yàn)證碼識(shí)別服務(wù)呢?越城分局警方發(fā)現(xiàn)了隱藏在其背后的一個(gè)無需“碼奴”的高級(jí)“打碼”技術(shù)。2024/2/12207.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)隨著偵查深入,越城分局警方發(fā)現(xiàn):為“快啊”打碼平臺(tái)提供驗(yàn)證碼識(shí)別服務(wù)的是一個(gè)名為NID的軟件系統(tǒng),這一人工智能程序由廈門人楊某設(shè)計(jì)。楊某稱,他使用伯克利大學(xué)開發(fā)的Caffe框架創(chuàng)建了一個(gè)神經(jīng)網(wǎng)絡(luò)模型,之后從網(wǎng)絡(luò)上下載了幾乎全世界所有字體,對(duì)模型進(jìn)行訓(xùn)練,使它具有圖文轉(zhuǎn)換的能力,再將這個(gè)神經(jīng)網(wǎng)絡(luò)與具有圖像接受和處理結(jié)果返回功能的服務(wù)端進(jìn)行網(wǎng)絡(luò)連接,構(gòu)成一個(gè)系統(tǒng)。楊某像教育兒童一樣訓(xùn)練NID學(xué)習(xí)識(shí)別各種驗(yàn)證碼。在他的“培養(yǎng)”下,NID破解驗(yàn)證碼的能力越來越強(qiáng)。通過運(yùn)用人工智能機(jī)器深度學(xué)習(xí)技術(shù)訓(xùn)練機(jī)器,可以讓NID如AlphaGo一樣自主操作識(shí)別,有效識(shí)別圖片驗(yàn)證碼,輕松繞過互聯(lián)網(wǎng)公司設(shè)置的賬戶登錄安全策略——驗(yàn)證碼。在機(jī)器學(xué)習(xí)技術(shù)的助力下,NID“打碼”速度很快,平均一秒可以識(shí)別出2000個(gè)驗(yàn)證碼,是人工“打碼”的2000倍;且正確率很高,可以識(shí)別出98%以上的驗(yàn)證碼。楊某稱,NID程序剛編寫完成,正確率就高達(dá)95%,基本能正確識(shí)別所有清晰圖片中的文本,他不斷充實(shí)樣本庫,給NID程序輸入大量的圖片文件讓其進(jìn)行識(shí)別,NID程序本身就具備很高的識(shí)別應(yīng)對(duì)能力;此外,NID系統(tǒng)也會(huì)自動(dòng)學(xué)習(xí),它每秒鐘會(huì)從用戶反饋的識(shí)別錯(cuò)誤樣本庫中抽取一張比對(duì)正確答案進(jìn)行學(xué)習(xí),這個(gè)學(xué)習(xí)過程從編寫出程序到案發(fā)前,時(shí)刻進(jìn)行。驗(yàn)證碼被NID系統(tǒng)識(shí)別出后,黑客竊取半成品信息,相當(dāng)于完成了深加工。數(shù)據(jù)商拿到這些精準(zhǔn)信息,打包組合,出售給個(gè)人信息產(chǎn)業(yè)鏈下游的詐騙集團(tuán)、廣告商,一條精準(zhǔn)的個(gè)人信息,甚至可以賣到幾百元。2024/2/12217.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)“快啊”打碼平臺(tái)收取信息處理費(fèi)用,收入的50%給了撞庫軟件開發(fā)者,50%由平臺(tái)開發(fā)商平分。短短一年內(nèi),平臺(tái)牟利1300多萬元,楊某分得300多萬元。利用NID程序,多的時(shí)候,楊柯一個(gè)月可以掙六七十萬元。2017年3月23日,“快啊”打碼平臺(tái)涉案被越城分局警方偵查。由于該案犯罪手法新穎、社會(huì)危害大,成立了由網(wǎng)警牽頭,刑偵、特警、派出所等多部門配合組成的專案組。圍繞該產(chǎn)業(yè)鏈的上下游,專案組輾轉(zhuǎn)福建、廣東、江西、黑龍江、遼寧、山東等13個(gè)省展開了偵查、抓捕,抓獲利用黑客技術(shù)非法獲取網(wǎng)站后臺(tái)數(shù)據(jù)的嫌疑人4人,使用撞庫軟件獲取賬戶密碼的嫌疑人19人,提供圖片驗(yàn)證服務(wù)的“快啊”打碼平臺(tái)嫌疑人2人,制作“撞庫”軟件的9人,利用公民個(gè)人信息實(shí)施網(wǎng)絡(luò)犯罪的團(tuán)伙28個(gè),共159人。一位數(shù)據(jù)安全專家介紹,“快啊”打碼平臺(tái)利用NID程序?qū)ψ址万?yàn)證碼的破解,是基于人工智能的深度學(xué)習(xí)框架,使用相關(guān)的網(wǎng)絡(luò)模型訓(xùn)練學(xué)習(xí),來實(shí)現(xiàn)對(duì)字符型驗(yàn)證碼的海量快速識(shí)別破解。由于字符型驗(yàn)證碼是互聯(lián)網(wǎng)通用的安全策略,一旦被破解攻陷,將會(huì)給包括政企網(wǎng)站在內(nèi)的互聯(lián)網(wǎng)行業(yè)用戶數(shù)據(jù)安全帶來風(fēng)險(xiǎn)?;谏疃葘W(xué)習(xí)原理,只要樣本庫足夠豐富,這一智能程序可以識(shí)別的東西會(huì)越來越多——即使復(fù)雜如鐵路訂票平臺(tái)12306的驗(yàn)證碼,也只是物品種類多、形態(tài)多樣的圖片識(shí)別,假以時(shí)日,NID程序一樣可以破解。2024/2/12227.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-“快啊”打碼平臺(tái)基于深度學(xué)習(xí),極大降低了網(wǎng)絡(luò)黑產(chǎn)的犯罪成本。如NID程序?qū)ψ址万?yàn)證碼的識(shí)別破解已快到毫秒級(jí),“打碼”平臺(tái)的效率和業(yè)務(wù)量借此呈指數(shù)級(jí)別增長(zhǎng)。而作為“驗(yàn)證”這一重要的網(wǎng)絡(luò)安全環(huán)節(jié),被攻陷后可被不法分子用于多個(gè)不同場(chǎng)景作惡,如撞庫、竊取信息、惡意灌水發(fā)帖、刷單、刷點(diǎn)擊量等,危害互聯(lián)網(wǎng)生態(tài)?!耙酝暮诳凸翎槍?duì)網(wǎng)站漏洞入侵,相當(dāng)于‘開鎖式進(jìn)入’,而借助于機(jī)器學(xué)習(xí),進(jìn)攻方式變成了‘硬闖’?!痹摪讣夹g(shù)門檻高,復(fù)雜程度也很大,辦案機(jī)關(guān)扣留涉案設(shè)備后需要將“撞庫”軟件、“打碼”平臺(tái)程序、神經(jīng)網(wǎng)絡(luò)圖片驗(yàn)證碼識(shí)別程序三個(gè)不同功能的軟件重新搭建,模擬現(xiàn)實(shí)環(huán)境,全程錄像取證,協(xié)同作業(yè)后,才能認(rèn)定為一個(gè)能完整實(shí)現(xiàn)破解識(shí)別字符型驗(yàn)證碼、“撞庫”、“洗庫”的軟件系統(tǒng)。檢察機(jī)關(guān)懲治計(jì)算機(jī)網(wǎng)絡(luò)犯罪遇到取證和證明的難點(diǎn)——網(wǎng)絡(luò)空間所有行為通過數(shù)字化的形式完成,沒有目擊證人,網(wǎng)絡(luò)犯罪證據(jù)多以電子數(shù)據(jù)為主要形態(tài),偵查取證主要依賴技術(shù)手段完成;此外,網(wǎng)絡(luò)犯罪的取證、鑒定、定性等都需要很強(qiáng)的專業(yè)知識(shí),但從目前的實(shí)際情況看,既精通法律業(yè)務(wù)又熟悉網(wǎng)絡(luò)技術(shù)的復(fù)合型檢察人才十分缺乏。目前人類已經(jīng)掌握了“弱人工智能”,即能制造出真正推理和解決問題的智能機(jī)器,這些機(jī)器不會(huì)有自主意識(shí),同在各方面能和人類比肩的“強(qiáng)人工智能”和比人類大腦聰明許多的“超人工智能”相比,“弱人工智能”只是人工智能的初級(jí)階段,NID系統(tǒng)屬于此列。此案件中,“人工智能”只是輔助犯罪嫌疑人實(shí)施犯罪的工具和手段,犯罪主體仍然是人而非機(jī)器,尚在中國(guó)刑法規(guī)制范圍內(nèi)。2024/2/12237.3技術(shù)濫用案例機(jī)器學(xué)習(xí)的技術(shù)濫用-亞馬遜解雇員工亞馬遜公司一名女員工奧利維蘿因罹患腸易激綜合征,所以每天最多要上六次廁所。但她的主管得知后,要求她在五天內(nèi)取得醫(yī)院證明,否則就要將她解雇。最后,奧利維蘿因?yàn)闊o法在時(shí)限內(nèi)取得醫(yī)師證明遭開除。她事后認(rèn)為,亞馬遜此舉是歧視員工生理問題,違反當(dāng)?shù)亍斗雌缫暦ā?,狀告亞馬遜求償7.5萬美元。貝索斯認(rèn)為,機(jī)器學(xué)習(xí)算法比人類更快,更能做出準(zhǔn)確的評(píng)斷,并且可以降低大量的成本,所以在管理線上商店、系統(tǒng)派工,以及人資管理系統(tǒng)中引入了新的機(jī)器學(xué)習(xí)算法機(jī)制以監(jiān)視員工。一位前亞馬遜經(jīng)理級(jí)員工認(rèn)為,目前亞馬遜的算法并沒有足夠的能力去準(zhǔn)確地分析、應(yīng)對(duì)突發(fā)狀況,而且亞馬遜內(nèi)部也明白其算法有問題,會(huì)誤判。但即便如此,亞馬遜還是認(rèn)為使用機(jī)器算法所需的費(fèi)用遠(yuǎn)遠(yuǎn)低于請(qǐng)人調(diào)查之后來解雇員工的成本。這并非是亞馬遜首次因?yàn)殚_除員工而遭遇訴訟,在亞馬遜引入機(jī)器學(xué)習(xí)算法判定機(jī)制后,不少員工都因?yàn)槟脑蚨獾介_除,因此亞馬遜目前也面臨大量類似的訴訟。2024/2/12247.3技術(shù)濫用案例搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲網(wǎng)絡(luò)爬蟲,是一種自動(dòng)獲取網(wǎng)頁內(nèi)容的程序,是搜索引擎的重要組成部分。網(wǎng)絡(luò)爬蟲為搜索引擎從萬維網(wǎng)下載網(wǎng)頁?;ヂ?lián)網(wǎng)行業(yè)中用戶生產(chǎn)內(nèi)容平臺(tái)(UserGeneratedContent,UGC)中數(shù)據(jù)造假情況長(zhǎng)期存在,尤其是網(wǎng)絡(luò)“爬蟲”技術(shù)的濫用不僅侵犯相關(guān)平臺(tái)知識(shí)產(chǎn)權(quán)和消費(fèi)者合法權(quán)益,還可導(dǎo)致平臺(tái)上的用戶敏感信息泄露。2018年10月,微信公號(hào)“小聲比比”發(fā)布題為《估值175億的旅游獨(dú)角獸,是一座僵尸和水軍構(gòu)成的鬼城?》的文章,援用乎睿數(shù)據(jù)團(tuán)隊(duì)所供數(shù)據(jù)稱,作為馬蜂窩核心資產(chǎn)之一的2100萬“真實(shí)點(diǎn)評(píng)”中,有1800萬條是通過機(jī)器人從攜程等競(jìng)爭(zhēng)對(duì)手那里抄襲過來的。其中,超過7000個(gè)抄襲賬號(hào),合計(jì)抄襲572萬條餐飲點(diǎn)評(píng),1221萬條酒店點(diǎn)評(píng),占總點(diǎn)評(píng)數(shù)的85%。隨著事件日益發(fā)酵,UGC平臺(tái)數(shù)據(jù)造假這一行業(yè)問題引發(fā)關(guān)注。業(yè)內(nèi)人士認(rèn)為,從其它平臺(tái)抓數(shù)據(jù)的目的,就是為了制造流量很大的假象,既給用戶看、商家看,更要給投資人看,獲取不同輪次的投資以便上市。而從其它網(wǎng)站抓取商家內(nèi)容頁面和用戶點(diǎn)評(píng)數(shù)據(jù)非常簡(jiǎn)單,使用“爬蟲”技術(shù)和人工編輯就能做到。2024/2/12257.3技術(shù)濫用案例搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲一位App研發(fā)者李某介紹,爬蟲最早應(yīng)用在搜索引擎領(lǐng)域,爬取網(wǎng)站頁面提供給其用戶進(jìn)行快速搜索和訪問,當(dāng)前爬蟲技術(shù)已是“大數(shù)據(jù)”概念的重要組成部分,爬取對(duì)象也從一些種子擴(kuò)充至整個(gè)網(wǎng)絡(luò)數(shù)據(jù)。一些公司開始利用“爬蟲”技術(shù)從其他平臺(tái)惡意抓取數(shù)據(jù)。例如2018年7月,生活分享平臺(tái)“小紅書”官微發(fā)布聲明指責(zé)大眾點(diǎn)評(píng)大量抄襲小紅書用戶的內(nèi)容,隨后,大眾點(diǎn)評(píng)道歉;2018年2月,視頻彈幕網(wǎng)站嗶哩嗶哩大量用戶的視頻、昵稱、頭像及用戶評(píng)論,出現(xiàn)在某新成立的視頻網(wǎng)站上;而航空公司的官網(wǎng)上的機(jī)票、訂座等信息,長(zhǎng)期被代理公司將機(jī)票信息爬取、占座,然后在其他網(wǎng)站上加價(jià)銷售。網(wǎng)宿科技發(fā)布的《2018上半年中國(guó)互聯(lián)網(wǎng)安全報(bào)告》顯示,2018年上半年,Web應(yīng)用攻擊總數(shù)環(huán)比增長(zhǎng)了97.82%,惡意“爬蟲”攻擊數(shù)量環(huán)比增長(zhǎng)了55.79%。另有數(shù)據(jù)顯示,交通出行類惡意“爬蟲”流量占比居首位,其次是電商、社交、點(diǎn)評(píng)、運(yùn)營(yíng)商、公共行政等,網(wǎng)絡(luò)爬蟲非法使用給互聯(lián)網(wǎng)競(jìng)爭(zhēng)環(huán)境帶來諸多負(fù)面影響?!笆忻嫔洗蟮幕ヂ?lián)網(wǎng)公司都會(huì)推出自己的刷票軟件,目的是為了分享12306網(wǎng)站的‘流量紅利’?!薄斑@些刷票軟件用‘爬蟲’等技術(shù)刷新12306網(wǎng)站頁面,截取官網(wǎng)車次、票量等數(shù)據(jù)制作成自己的網(wǎng)站頁面,再使用程序進(jìn)行搶票,收取不合法的差價(jià)。其中,大約一半的12306訂票網(wǎng)站流量來自‘爬蟲’技術(shù)支撐的刷票軟件,不僅給網(wǎng)站服務(wù)器造成巨大壓力,也擾亂了正常的訂票秩序,由此帶來的購票難是鐵路部門一直頭疼的問題。”2024/2/12267.3技術(shù)濫用案例搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲搜狐視頻高級(jí)主管閔博認(rèn)為,濫用網(wǎng)絡(luò)“爬蟲”還有可能對(duì)網(wǎng)絡(luò)安全造成影響,引發(fā)網(wǎng)站服務(wù)器宕機(jī)。“一些‘爬蟲’工具的使用者在采取‘全站爬取’的模式時(shí),相當(dāng)于模擬大量用戶在短時(shí)間內(nèi)對(duì)源站服務(wù)器發(fā)起訪問請(qǐng)求,一旦訪問量在瞬間達(dá)到承載極值,就會(huì)引起服務(wù)器宕機(jī),從而威脅網(wǎng)絡(luò)空間的安全?!边€有業(yè)內(nèi)人士指出,濫用網(wǎng)絡(luò)“爬蟲”抓取的信息不僅可以用于同類型平臺(tái)制作,還可能被轉(zhuǎn)售或者可能用于釣魚網(wǎng)站制作等其他違法行為,不但會(huì)給平臺(tái)帶來重大損失,還可能導(dǎo)致平臺(tái)上的用戶敏感信息泄露,進(jìn)而使用戶遭遇各類網(wǎng)絡(luò)和電信詐騙。在社交網(wǎng)站和購物網(wǎng)站檢索時(shí),一些賣家堂而皇之地售賣“爬蟲”自動(dòng)評(píng)價(jià)軟件或進(jìn)行個(gè)人隱私信息爬取的接派單任務(wù)。在QQ群搜索中輸入關(guān)鍵詞“網(wǎng)絡(luò)爬蟲”,也會(huì)出現(xiàn)多個(gè)涉及外包網(wǎng)絡(luò)“爬蟲”技術(shù)的群組。業(yè)內(nèi)人士透露,這些群組中進(jìn)行的網(wǎng)絡(luò)“爬蟲”任務(wù)大部分都屬于未獲授權(quán)而進(jìn)行的違規(guī)爬取操作,由于該項(xiàng)技術(shù)具有一定的隱秘性,在爬取普通用戶隱私數(shù)據(jù)時(shí)較難被識(shí)別。山東日中律師事務(wù)所律師陳某表示,公司未經(jīng)許可或授權(quán)的情況下利用“爬蟲”技術(shù)獲得可能帶來商業(yè)利益的信息可以被判定構(gòu)成不正當(dāng)競(jìng)爭(zhēng)。新華每日電訊記者梳理相關(guān)案件發(fā)現(xiàn),法院往往認(rèn)為,技術(shù)作為一種工具手段在價(jià)值上具有中立性,但這并不意味著技術(shù)本身可以作為豁免當(dāng)事人法律責(zé)任的依據(jù)。2024/2/12277.3技術(shù)濫用案例“一個(gè)技術(shù)如何使用,責(zé)任主體都應(yīng)捫心自問,這是否侵犯?jìng)€(gè)人隱私,是否破壞言論自由,是否損害公共利益,是否損害其他數(shù)據(jù)財(cái)產(chǎn)擁有者的財(cái)產(chǎn)所有權(quán),是否涉及不正當(dāng)競(jìng)爭(zhēng)。許多大的互聯(lián)網(wǎng)公司,會(huì)同時(shí)有‘爬蟲’部門和‘反爬蟲’部門?!老x’技術(shù)在互聯(lián)網(wǎng)行業(yè)已被廣泛使用,但‘爬蟲’絕不能成為害蟲?!本W(wǎng)絡(luò)蜘蛛(WebSpider),是一個(gè)很形象的名字。把互聯(lián)網(wǎng)比喻成一個(gè)蜘蛛網(wǎng),那么Spider就是在網(wǎng)上爬來爬去的蜘蛛。從網(wǎng)站某一個(gè)頁面(通常是首頁)開始,讀取網(wǎng)頁的內(nèi)容,找到在網(wǎng)頁中的其它鏈接地址,然后通過這些鏈接地址尋找下一個(gè)網(wǎng)頁,這樣一直循環(huán)下去,直到把這個(gè)網(wǎng)站所有的網(wǎng)頁都抓取完為止。如果把整個(gè)互聯(lián)網(wǎng)當(dāng)成一個(gè)網(wǎng)站,那么網(wǎng)絡(luò)蜘蛛就可以用這個(gè)原理把互聯(lián)網(wǎng)上所有的網(wǎng)頁都抓取下來。網(wǎng)絡(luò)蜘蛛就是一個(gè)爬行程序,一個(gè)抓取網(wǎng)頁的程序。網(wǎng)絡(luò)爬蟲(Webcrawler),是一種按照一定的規(guī)則,自動(dòng)地抓取萬維網(wǎng)信息的程序或者腳本,它們被廣泛用于互聯(lián)網(wǎng)搜索引擎或其他類似網(wǎng)站,可以自動(dòng)采集所有其能夠訪問到的頁面內(nèi)容,以獲取或更新這些網(wǎng)站的內(nèi)容和檢索方式。從功能上來講,爬蟲一般分為數(shù)據(jù)采集,處理,儲(chǔ)存三個(gè)部分。傳統(tǒng)爬蟲從一個(gè)或若干初始網(wǎng)頁的URL開始,獲得初始網(wǎng)頁上的URL,在抓取網(wǎng)頁的過程中,不斷從當(dāng)前頁面上抽取新的URL放入隊(duì)列,直到滿足系統(tǒng)的一定停止條件?!胺磁老x”技術(shù)有兩種:一種是限制同一IP、同一電腦在一定時(shí)間內(nèi)訪問網(wǎng)站的次數(shù),另一種是設(shè)置復(fù)雜驗(yàn)證碼機(jī)制,讓“爬蟲”不好識(shí)別。但對(duì)一些網(wǎng)站來說,封IP的做法可能誤傷真實(shí)用戶,而設(shè)置一個(gè)非常復(fù)雜的驗(yàn)證碼,又可能損失用戶。因此,除了加大技術(shù)防范力度之外,要運(yùn)用好法律手段,克服取證難的盲點(diǎn),明確使用紅線。搜索引擎的技術(shù)濫用-網(wǎng)絡(luò)爬蟲2024/2/12287.3技術(shù)濫用案例搜索引擎的技術(shù)濫用-魏則西事件2014年4月,正在西安電子科技大學(xué)讀大二的魏則西檢查出滑膜肉瘤,這是一種惡性軟組織腫瘤,尙沒有有效的治療手段,生存率極低,五年生存率是20%-50%!之后魏則西在百度上搜索滑膜肉瘤,并通過百度推薦找到武警北京第二醫(yī)院的生物免疫療法。2014年9月至2015年底,魏則西先后在武警北京第二醫(yī)院進(jìn)行了4次生物免疫療法的治療,花了二十多萬元,結(jié)果卻是未能如愿,治病的巨額花費(fèi)將家里積蓄掏空。2015年8月,絕望的魏則西在知乎上發(fā)帖提問:“二十一歲癌癥晚期,自殺是否是更好的選擇?”2016年4月12日上午8時(shí)17分,魏則西在咸陽的家中去世,終年22歲。魏則西去世當(dāng)天,在一則“魏則西怎么樣了?”的知乎帖下,魏則西父親用魏則西的知乎賬號(hào)回復(fù)稱:“我是魏則西的父親魏海全,則西今天早上八點(diǎn)十七分去世,我和他媽媽謝謝廣大知友對(duì)則西的關(guān)愛,希望大家關(guān)愛生命,熱愛生活。”2016年2月,知乎上有人提問:“你認(rèn)為人性最大的‘惡’是什么?”魏則西將自己的故事作為回答:“醫(yī)院,是在百度上搜的,排名領(lǐng)先,療法‘說得特別好’,然而在該醫(yī)院治療后致病情耽誤,更可悲的是被網(wǎng)友告知生物免疫療法是被國(guó)外臨床淘汰的技術(shù)?!痹撎?,他還質(zhì)疑百度競(jìng)價(jià)排名的醫(yī)療信息有誤導(dǎo)之嫌。該網(wǎng)帖引發(fā)網(wǎng)友廣泛關(guān)注,有言論稱武警二院生物診療中心早已被“莆田系醫(yī)院”外包。莆田人以治療皮膚病的游醫(yī)起家,莆田人在全國(guó)建立的民營(yíng)醫(yī)院已經(jīng)占到中國(guó)民營(yíng)醫(yī)院的80%左右,被稱為“莆田系醫(yī)院”。2024/2/12297.3技術(shù)濫用案例搜索引擎的技術(shù)濫用-魏則西事件2016年5月2日,國(guó)家網(wǎng)信辦會(huì)同國(guó)家工商總局、國(guó)家衛(wèi)生計(jì)生委成立聯(lián)合調(diào)查組進(jìn)駐百度公司,對(duì)此事件進(jìn)行調(diào)查并依法處理。對(duì)此,百度公司發(fā)布聲明,表示百度將全力配合主管部門調(diào)查,接受監(jiān)督,不給互聯(lián)網(wǎng)虛假信息和違法行為留下可乘之機(jī)。例如,企業(yè)在百度注冊(cè)提交“推薦系統(tǒng)”這個(gè)關(guān)鍵詞,當(dāng)消費(fèi)者或網(wǎng)民尋找“推薦系統(tǒng)”的信息時(shí),企業(yè)就會(huì)被優(yōu)先找到,顯示在搜索結(jié)果頁面的顯著位置,百度按照點(diǎn)擊量(潛在客戶訪問數(shù))收費(fèi),每次有效點(diǎn)擊收費(fèi)從幾毛錢到幾塊錢不等,由企業(yè)產(chǎn)品的競(jìng)爭(zhēng)激烈程度決定。此項(xiàng)營(yíng)銷策略每年可以給百度公司帶來大量的營(yíng)收。用戶在使用百度搜索引擎搜索關(guān)鍵詞時(shí),百度公司利用自己對(duì)網(wǎng)頁數(shù)據(jù)的壟斷地位,在向網(wǎng)民呈現(xiàn)搜索結(jié)果時(shí),并不是按照信息的重要性來對(duì)搜索結(jié)果進(jìn)行排序,而是把一些百度推廣的營(yíng)銷內(nèi)容放在了搜索結(jié)果頁面的最顯著位置。魏則西事件更是使得百度這一營(yíng)銷做法備受爭(zhēng)議。由此,眾多網(wǎng)友質(zhì)疑百度推廣提供的醫(yī)療推薦信息有誤導(dǎo)之嫌,耽誤了魏則西的病情和最佳治療時(shí)機(jī),最終導(dǎo)致魏則西失去生命。百度是國(guó)內(nèi)最大的搜索引擎服務(wù)供應(yīng)商,從某個(gè)角度而言,已經(jīng)在一定程度上形成了數(shù)據(jù)壟斷。百度推廣是百度公司推出的網(wǎng)絡(luò)營(yíng)銷服務(wù),企業(yè)在向百度公司購買該項(xiàng)服務(wù)后,通過注冊(cè)提交一定量數(shù)量的關(guān)鍵詞,其推廣消息就會(huì)率先在網(wǎng)民相應(yīng)的搜索結(jié)果中。亦即,當(dāng)用戶利用某一關(guān)鍵詞進(jìn)行信息檢索時(shí),在檢索結(jié)果頁面會(huì)出現(xiàn)該關(guān)鍵詞相關(guān)的內(nèi)容。2024/2/12307.3技術(shù)濫用案例語音識(shí)別的技術(shù)濫用-語音機(jī)器人2019年4月,鄭州市公安局破獲的一起詐騙案,某公司先從網(wǎng)上購買AI機(jī)器人電話軟件,由電話機(jī)器人自動(dòng)操作,以每天1000-1500個(gè)的速度撥打客戶電話,一旦客戶沒有拒絕接聽,人工智能語音機(jī)器人就會(huì)記下該電話號(hào)碼,然后,由業(yè)務(wù)員主動(dòng)添加該客戶的微信吸引他們充值投資,一旦資金到賬,就迅速拉黑對(duì)方。2018年,美國(guó)聯(lián)邦委員會(huì)向四家在全美境內(nèi)提供非法機(jī)器人呼叫電話投放服務(wù)的運(yùn)營(yíng)商發(fā)起了訴訟。這些公司會(huì)向人們推銷虛假的能減免債務(wù)的服務(wù),或者,偽裝成慈善機(jī)構(gòu)欺騙大家捐贈(zèng)汽車等財(cái)務(wù),再把它們賣掉。2019年,美國(guó)境內(nèi)民眾接到的“機(jī)器人騷擾電話”總數(shù)超過500億個(gè),也就是說,平均一個(gè)美國(guó)人每個(gè)月會(huì)接到15個(gè)“機(jī)器人騷擾電話”。艾媒咨詢(iiMediaResearch)的統(tǒng)計(jì)數(shù)據(jù)顯示,僅2018年,中國(guó)的騷擾電話撥打數(shù)量已經(jīng)超過500億,生活中騷擾電話占到全部通話量一半以上的用戶超20%,每周都受到騷擾電話困擾的用戶超80%。2018年12月,中國(guó)工業(yè)和信息化部就收到了8.6萬起關(guān)于“騷擾電話”的公眾投訴——這是2017年同期的3倍。2021年10月,河南省安陽市的劉小姐反映,她最近這段時(shí)間內(nèi)經(jīng)常接到不同地區(qū)不同號(hào)碼的國(guó)美金融的人工智能機(jī)器人催債電話,但在接到電話之后,劉小姐向國(guó)美金融官方客服核實(shí)自己的手機(jī)號(hào)是否在國(guó)美金融有貸款記錄或注冊(cè)信息的時(shí)候發(fā)現(xiàn),劉小姐的手機(jī)號(hào)在國(guó)美金融沒有任何的貸款記錄或注冊(cè)信息。2024/2/12317.3技術(shù)濫用案例語音識(shí)別的技術(shù)濫用-語音機(jī)器人南京硅基智能(SiliconIntelligence)科技有限公司是一家語音機(jī)器人開發(fā)商,據(jù)報(bào)道去年他們總收入為1億元人民幣。該公司的核心機(jī)器人“硅語”有中文、英文和日文三個(gè)版本。硅基智能科技稱,該公司主要向銷售公司出售“硅語”的技術(shù),平均售價(jià)為1萬元。銷售公司則利用“硅語”與消費(fèi)者進(jìn)行互動(dòng),包括給他們打電話。硅基智能創(chuàng)始人司馬華鵬表示:“我們基本上是在打造一個(gè)電話版的Siri?!薄肮枵Z”機(jī)器人背后的技術(shù)包括:對(duì)話開始時(shí),“硅語”會(huì)識(shí)別出顧客所說的內(nèi)容,并將其以文本的形式寫出來——這被稱為“自動(dòng)語音識(shí)別”。接著,機(jī)器人通過查閱包含大量短語和句子的數(shù)據(jù)庫來理解文本,這一過程被稱為“自然語言理解”,然后對(duì)其做出反應(yīng)。最后,在一種被稱為“文本轉(zhuǎn)成語音”的機(jī)制中,“硅語”將它的書面反應(yīng)轉(zhuǎn)化為語音?!肮枵Z”的效率大約是人類呼叫中心接線員的25倍,“它每天可以打1000個(gè)電話,這是人類的5倍,并且成本只有雇傭一名員工的五分之一”,司馬華鵬補(bǔ)充道,假設(shè)中國(guó)呼叫中心人員的平均年薪5萬元左右,那么機(jī)器人每年通常僅需要1萬元左右花費(fèi)。硅基智能與人力資源的差別遠(yuǎn)不止工作效率這一項(xiàng)。該公司表示,機(jī)器人不需要培訓(xùn),從不抱怨工作,而且工作效率高、不帶感情。“到目前為止,我們的機(jī)器人可能已經(jīng)打了數(shù)十億個(gè)電話了”。據(jù)《中國(guó)新聞》2018年11月的報(bào)道,2016年至2017年,中國(guó)智能語音產(chǎn)業(yè)的增長(zhǎng)速度是70%,而全球的速度僅為30%。2017年,中國(guó)智能語音市場(chǎng)價(jià)值約159億元人民幣(合23億美元);根據(jù)錫安市場(chǎng)研究(ZionMarketResearch)的數(shù)據(jù),2017年全球市場(chǎng)價(jià)值僅62億美元。2024/2/12327.3技術(shù)濫用案例語音識(shí)別的技術(shù)濫用-語音機(jī)器人在世界消費(fèi)者權(quán)益日315晚會(huì)上,央視曝光了多家企業(yè)幕后的智能騷擾電話的灰色產(chǎn)業(yè)鏈。這些企業(yè)會(huì)為有商業(yè)營(yíng)銷需要的公司提供機(jī)器人電話撥打服務(wù)。有些甚至?xí)苯愉N售這樣的機(jī)器,每個(gè)價(jià)值3000元,機(jī)器系統(tǒng)是專門為電話營(yíng)銷服務(wù)的。這樣的機(jī)器一天能打5000個(gè)電話,一年能打超過40億個(gè)電話。有些公司為了提高可信度,還特意配備了專業(yè)的錄音棚,提供不同的聲音。大多數(shù)機(jī)器人會(huì)記錄每一次通話,以供參考,但客戶很少被告知這種做法——實(shí)際上,很少有人知道打電話的是機(jī)器人。2019年1月,南方周末報(bào)道稱,許多購買語音機(jī)器人服務(wù)的公司將它們與網(wǎng)絡(luò)抓取工具結(jié)合起來,這些工具在未經(jīng)所有者同意的情況下非法收集電話號(hào)碼和其它個(gè)人數(shù)據(jù)。有些甚至從保險(xiǎn)公司或房地產(chǎn)公司非法購買聯(lián)系方式,并向機(jī)器人提供盡可能多的個(gè)人信息。專門從事隱私保護(hù)和網(wǎng)絡(luò)安全的律師認(rèn)為,“如果一家機(jī)器人公司將其收集的個(gè)人數(shù)據(jù)用于除最初聲明的用途外的任何其他目的,他們也侵犯了消費(fèi)者根據(jù)《消費(fèi)者法》所享有的知情權(quán)?!惫杌悄芘c人力資源的差別遠(yuǎn)不止工作效率這一項(xiàng)。該公司表示,機(jī)器人不需要培訓(xùn),從不抱怨工作,而且工作效率高、不帶感情?!暗侥壳盀橹?,我們的機(jī)器人可能已經(jīng)打了數(shù)十億個(gè)電話了”2024/2/12337.3技術(shù)濫用案例語音識(shí)別的技術(shù)濫用-語音模仿軟件據(jù)《每日郵報(bào)》報(bào)道,一名詐騙犯利用人工智能語音模仿軟件冒充公司大老板,成功讓一家英國(guó)能源公司的首席執(zhí)行官相信自己正在與德國(guó)母公司的老板通電話。在電話中,詐騙犯要求這位首席執(zhí)行官立即將22萬歐元轉(zhuǎn)到匈牙利一家供應(yīng)商的銀行賬戶,以避免繳納“滯納金”,并將轉(zhuǎn)賬信息以郵件形式發(fā)送,這位高管毫不猶豫地照做了。最終,這22萬歐元一去不復(fù)返。這家能源公司承保人裕利安宜公司(EulerHermes)向媒體透露了此案的細(xì)節(jié)。據(jù)報(bào)道,此案被認(rèn)為是全球首例涉及人工智能的詐騙案,這再度引發(fā)了人們對(duì)人工智能軟件被用于犯罪的擔(dān)憂。據(jù)《華盛頓郵報(bào)》(TheWashingtonPost)報(bào)道,這位首席執(zhí)行官后來在一封電子郵件中指出,這個(gè)要求相當(dāng)“奇怪”,但“大老板”的德國(guó)口音非常逼真,他覺得自己別無選擇,只能服從。2024/2/12347.3技術(shù)濫用案例語音識(shí)別的技術(shù)濫用-語音模仿軟件裕利安宜公司指出,這位公司高管當(dāng)時(shí)以為自己是在和他的德國(guó)老板談話,于是按照要求在一個(gè)小時(shí)內(nèi)電匯了這筆錢,為的是幫助公司避免拖欠罰款。這家保險(xiǎn)公司表示:“騙子使用的人工智能軟件,不僅能夠模仿他人的聲音、語調(diào),甚至還能模仿帶德國(guó)口音的英語?!睋?jù)悉,騙子一共打了三次電話。第二次電話是在22萬歐元匯出后,對(duì)方打電話告訴這位高管,母公司會(huì)轉(zhuǎn)移資金償還英國(guó)公司的費(fèi)用。在當(dāng)天晚些時(shí)候,當(dāng)這位高管接到第三次電話,對(duì)方故技重施冒充德國(guó)老板要求第二次付款時(shí),他才意識(shí)到不對(duì)勁。由于對(duì)方承諾的轉(zhuǎn)賬償還資金并沒有收到,且這次的電話號(hào)碼顯示來自奧地利,出于懷疑,他沒有支付第二筆款項(xiàng),而是直接致電德國(guó)老板本人,結(jié)果發(fā)現(xiàn)自己被騙?!埃俚模s翰內(nèi)斯’甚至在我正與真正的約翰內(nèi)斯通話時(shí),要求跟我通話!”這位首席執(zhí)行官在一封電子郵件中說道。然而,裕利安宜公司表示,等發(fā)現(xiàn)真相時(shí),第一筆匯出22萬歐元已通過匈牙利和墨西哥的賬戶被轉(zhuǎn)移分散到了多個(gè)賬戶,目前還沒有查到嫌疑人,這筆錢已無法找回。最終,保險(xiǎn)公司承諾將承擔(dān)全部的損失費(fèi)用。2024/2/12357.3技術(shù)濫用案例計(jì)算機(jī)視覺技術(shù)濫用深度偽造技術(shù)(Deepfake)是通過深度學(xué)習(xí)偽造數(shù)字內(nèi)容的人工智能技術(shù),實(shí)質(zhì)上是一種聲音、圖像與視頻的智能處理技術(shù),能夠模仿特定人物或者讓特定人物看起來在做特定的事件,其效果可以達(dá)到以假亂真的程度。

“Deepfake”詞是一個(gè)Reddit網(wǎng)站的Deepfake用戶名,該用戶在2017年12月使用深度學(xué)習(xí)技術(shù)在色情視頻剪輯中編輯名人的面孔。2018年4月,網(wǎng)絡(luò)黑客運(yùn)用深度偽造技術(shù)偽造了美國(guó)前總統(tǒng)奧巴馬(BarackObama)語言侮辱特朗普(DonaldTrump)的視頻,該視頻在推特上短時(shí)間內(nèi)被點(diǎn)擊了200多萬次,對(duì)美國(guó)政府形象造成了極大的不良影響。2018年10月,加蓬世襲總統(tǒng)邦戈(AliBongo)生病出國(guó)治療,此后很長(zhǎng)一段時(shí)間都沒有在公眾面前露面,而政府未對(duì)總統(tǒng)的情況作出聲明,導(dǎo)致陰謀論四起,甚至有人認(rèn)為總統(tǒng)已經(jīng)故去。但很快,新的一年要來了,按舊例,總統(tǒng)要在這個(gè)時(shí)候發(fā)表新年致辭,許多人都期待著總統(tǒng)的出現(xiàn)。結(jié)果,讓人萬萬沒想到的是,加蓬政府玩了一回不尋常操作:放了一段深度偽造的總統(tǒng)新年致辭視頻。視頻中,這位總統(tǒng)全程就沒眨眼,誰都能看出這個(gè)視頻不太對(duì)勁。一周后,加蓬的一些軍方人士認(rèn)為總統(tǒng)的真實(shí)狀態(tài)一定非常不好,于是發(fā)動(dòng)了一次政變。幸好,政變最終沒能成功。深度偽造技術(shù)門檻不斷降低,部分人將深度偽造技術(shù)用于煽動(dòng)網(wǎng)絡(luò)暴力、破壞政治選舉、擾亂外交關(guān)系、偽造虛假證據(jù)等不法用途,在“所見即真實(shí)”的認(rèn)知定律下,虛假視頻及新聞在社交媒體的加持下加速傳播,使得深度偽造技術(shù)濫用后果不斷加劇。2024/2/12367.3技術(shù)濫用案例計(jì)算機(jī)視覺技術(shù)濫用2019年9月的一檔意大利諷刺節(jié)目里,播出了一段意大利前總理倫齊(MatteoRenzi)侮辱其他意大利政客的視頻。雖然視頻中前總理的身體是演員的,節(jié)目組只是把頭部深度偽造了一下,但是居然有民眾信了,看完之后民眾深深的懷疑自己所生活的這個(gè)國(guó)家。2020年2月,在印度德里邦議會(huì)選舉中,提瓦里(ManojTiwari),為了拉攏小語種選民,便利用視頻深度偽造技術(shù),“說”了一段自己并不會(huì)的語言進(jìn)行拉票。這段視頻取得了不錯(cuò)的效果,一般人根本看不出破綻,所以一開始不僅沒被懷疑,而且反響一度十分熱烈,為候選人爭(zhēng)取到了更多選票。深度偽造技術(shù)的濫用還極大影響了個(gè)人生活,2019年6月,基于深度偽造技術(shù)開發(fā)的應(yīng)用程序DeepNude走紅網(wǎng)絡(luò),該應(yīng)用可以自動(dòng)消除圖片中女性衣物,被應(yīng)用于制作名人的虛假色情視頻,對(duì)女性隱私以及日常生活造成嚴(yán)重影響,引發(fā)了全社會(huì)對(duì)于人工智能技術(shù)不正當(dāng)利用的擔(dān)憂,目前該應(yīng)用已被開發(fā)者禁用。2024/2/12377.3技術(shù)濫用案例計(jì)算機(jī)視覺技術(shù)濫用2019年8月,一款名為“ZAO”的換臉軟件在中文網(wǎng)絡(luò)中推出,只要上傳一張正面照片,就能將影視作品中的明星換成自己的臉?!癦AO”瞬時(shí)引起網(wǎng)絡(luò)狂歡,但隨即因?qū)駛€(gè)人信息的過度搜集以及可能的社會(huì)安全風(fēng)險(xiǎn)而受到工信部門的約談。深度偽造技術(shù)還可以從零開始創(chuàng)建令人信服但完全是虛構(gòu)的照片。2019年,領(lǐng)英(LinkedIn)上出現(xiàn)了一個(gè)疑似間諜的賬號(hào)。她的名字是瓊斯(KatieJones),頭像是一個(gè)典型的白人女性,畢業(yè)于密歇根大學(xué),在美國(guó)國(guó)際戰(zhàn)略研究中心(CenterforStrategicandInternationalStudies,CSIS)工作。她的職場(chǎng)網(wǎng)絡(luò)雖然只有50多人,但里面有美國(guó)參議員助理、副助理國(guó)務(wù)卿,以及美聯(lián)儲(chǔ)席位候選人兼經(jīng)濟(jì)學(xué)家溫德福(PaulWindfree)。根據(jù)調(diào)查,CSIS根本沒有這樣一個(gè)員工,密歇根大學(xué)也沒有她的學(xué)位記錄,而且她聯(lián)系網(wǎng)內(nèi)的人都不認(rèn)識(shí)她。肖像審查專家判斷,她的頭像很可能是用AI技術(shù)生成的,很多特征與AI偽造頭像高度吻合。再結(jié)合她添加的人都是政府重要人物,專家普遍認(rèn)為,其目的很可能是隱藏自己,從他們身上獲取信息,甚至添加更多位高權(quán)重的人物,將領(lǐng)英作為從事隱秘間諜活動(dòng)的渠道。2024/2/12387.3技術(shù)濫用案例計(jì)算機(jī)視覺技術(shù)濫用深度偽造技術(shù)的濫用風(fēng)險(xiǎn)已經(jīng)引起美國(guó)國(guó)家高層的高度重視。美國(guó)眾議院議長(zhǎng)佩羅西的虛假合成視頻在社交媒體上的廣泛流傳更是加劇了美國(guó)立法者對(duì)深度偽造技術(shù)的擔(dān)憂。在美國(guó)2020年大選來臨之際,美國(guó)立法者開始尋求措施,意圖從根源上阻止深度偽造技術(shù)的不當(dāng)利用。在此背景下,2019年6月12日,美國(guó)國(guó)會(huì)提出《深度偽造責(zé)任法案》,旨在通過限制深度偽造合成技術(shù),打擊虛假信息的傳播。美國(guó)《深度偽造責(zé)任法案》的主要內(nèi)容包括:①深度偽造內(nèi)容制作者具有披露義務(wù)。利用深度偽造技術(shù)合成虛假內(nèi)容放置于網(wǎng)絡(luò)上傳播,制作者應(yīng)當(dāng)采用嵌入數(shù)字水印、文字、語音標(biāo)識(shí)等方式披露合成信息。違反披露義務(wù)的制作者或者惡意刪除披露信息的行為人需承擔(dān)民事責(zé)任,行為惡劣、造成嚴(yán)重后果的還會(huì)面臨罰金、人身監(jiān)禁等刑事處罰。②受害主體享有私人訴權(quán)。自然人或者法人因深度偽造內(nèi)容遭受實(shí)際損害的,可以向法院申請(qǐng)禁令救濟(jì),或者對(duì)深度偽造內(nèi)容制作者提起民事訴訟,要求其承擔(dān)損害賠償責(zé)任。在民事訴訟中,如果原告請(qǐng)求且有證據(jù)證明訴訟涉及個(gè)人隱私,法院應(yīng)允許訴訟不公開審理。③假冒行為應(yīng)包括采用深度偽造技術(shù)實(shí)施的冒充身份的行為。法案修訂美國(guó)法典第18章第1028節(jié)關(guān)于假冒身份的現(xiàn)有法律規(guī)定,利用深度偽造技術(shù)實(shí)施數(shù)字冒名頂替行為也應(yīng)視為假冒身份行為。④政府應(yīng)采取措施開發(fā)相關(guān)檢測(cè)識(shí)別技術(shù)。法案要求政府成立深度偽造特別小組,其職責(zé)包括研究開發(fā)對(duì)包括深度偽造在內(nèi)的圖像、音視頻操縱技術(shù)的檢測(cè)識(shí)別和反制技術(shù),為研究此類技術(shù)的其他政府部門提供行政和科學(xué)支持,與私營(yíng)企業(yè)或?qū)W術(shù)機(jī)構(gòu)合作開發(fā)檢測(cè)識(shí)別工具等。2024/2/12397.3技術(shù)濫用案例計(jì)算機(jī)視覺技術(shù)濫用“ZAO”軟件的火爆給“深度偽造”蒙上了陰影。為了防范深度偽造的危害,2018年3月,原國(guó)家新聞出版廣電總局下發(fā)通知規(guī)定:“堅(jiān)決禁止非法抓取、剪拼改編視聽節(jié)目的行為,并嚴(yán)格管理包括網(wǎng)民上傳的類似重編節(jié)目,不給存在版權(quán)問題、內(nèi)容問題等的剪拼改編視聽節(jié)目提供傳播渠道。”國(guó)家互聯(lián)網(wǎng)信息辦公室、文化和旅游部、國(guó)家廣播電視總局于2019年11月18日發(fā)布,并于2020年1月1日起生效實(shí)施的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》亦對(duì)深度偽造做出了回應(yīng)。2020年3月1日起施行的國(guó)家互聯(lián)網(wǎng)信息辦公室《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》第23條再次重申相關(guān)主體不得利用深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動(dòng)。2021年1月1日起施行的《民法典》第1019條規(guī)定,任何組織或個(gè)人不得利用信息技術(shù)手段偽造等方式侵害他人的肖象權(quán)。行政規(guī)制和民事規(guī)制的路徑固然有其積極效能,但是當(dāng)“深度偽造”的危害性達(dá)到一定量級(jí)時(shí),刑法制裁手段依然是必不可少的。2020年3月1日起施行的國(guó)家互聯(lián)網(wǎng)信息辦公室《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》第23條再次重申相關(guān)主體不得利用深度學(xué)習(xí)、虛擬現(xiàn)實(shí)等新技術(shù)新應(yīng)用從事法律、行政法規(guī)禁止的活動(dòng)。2024/2/12407.3技術(shù)濫用案例自然語言處理的濫用-Facebook放大仇恨言論2021年10月3日,臉書(Facebook)前雇員豪根(FrancesHaugen)在美國(guó)60Minutes節(jié)目上揭露了社交媒體平臺(tái)臉書的一些內(nèi)部運(yùn)作機(jī)制。她表示,一家致力于產(chǎn)品優(yōu)化的公司,卻采用了放大仇恨言論(HateSpeech)的算法。此前的一項(xiàng)數(shù)據(jù)顯示了臉書在致力于反對(duì)仇恨言論上所做的努力。現(xiàn)在看來更像是一場(chǎng)笑話。雖然該公司一再聲稱,至少在自己產(chǎn)品上,它正在幫助阻止仇恨言論,但豪根泄露的臉書內(nèi)部文件表明:“我們預(yù)計(jì),我們的優(yōu)化可能只會(huì)對(duì)臉書上3%-5%仇恨言論、大約0.6%的暴力和煽動(dòng)內(nèi)容產(chǎn)生作用,盡管在這一點(diǎn)上我們已經(jīng)做到世界上最好了?!绷硪环菸募踔粮又卑祝何覀儚母鞣N渠道獲得的證據(jù)表明,仇恨言論、分裂性政治言論以及臉書和旗下其他應(yīng)用程序的錯(cuò)誤信息正在影響世界各地的社交平臺(tái)。豪根聲稱,問題的根源在于“2018年推出的算法控制了你在平臺(tái)上看到的東西”。你用手機(jī)滑動(dòng)五分鐘,可能只能看到100條內(nèi)容,但是臉書可以向你展示成千上萬種選擇。該算法根據(jù)你過去接觸最多的內(nèi)容類型來推送信息,通過參與度來優(yōu)化內(nèi)容。她表示,臉書為了提高用戶的參與度,發(fā)現(xiàn)最好的參與方式便是向用戶灌輸恐懼和憎恨,因?yàn)榧ぐl(fā)人們的憤怒比激發(fā)其它情緒更容易。當(dāng)時(shí),扎克伯格(MarkZuckerberg)稱算法的優(yōu)化是正面的?!拔覀冇X得有責(zé)任確保我們的服務(wù)不僅僅是有趣的,而且有益于人們的福祉。”2024/2/12417.3技術(shù)濫用案例自然語言處理的濫用-Facebook放大仇恨言論臉書對(duì)社會(huì)負(fù)面影響的案例有很多。例如,2018年緬甸軍方利用臉書宣揚(yáng)種族滅絕,包括種族暴力。還有2020年大選,臉書明白其潛在的危險(xiǎn),因此啟動(dòng)了安全系統(tǒng),以減少錯(cuò)誤信息。但豪根表示,許多變化都是暫時(shí)的,選舉一結(jié)束,他們就把安全系統(tǒng)關(guān)閉了。在選舉之后,臉書被一些人用來組織1月6日的起義,即2021年美國(guó)國(guó)會(huì)大廈遭沖擊事件。檢察官引用臉書上的帖子作為證據(jù)——武裝游擊隊(duì)員的照片和文字,包括“通過子彈或選票恢復(fù)共和國(guó)即將到來!”這樣的信息。這些極端分子使用了很多平臺(tái),但臉書反復(fù)出現(xiàn)?!爱?dāng)你消費(fèi)更多內(nèi)容時(shí),臉書會(huì)賺更多的錢。”臉書編寫算法的方式正在改變歐洲主要政黨領(lǐng)導(dǎo)國(guó)家的方式。豪根獲得的這份2019年的內(nèi)部報(bào)告稱,對(duì)算法的改變迫使他們?cè)谀槙系臏贤▽?duì)其產(chǎn)生負(fù)面影響,導(dǎo)致他們采取更加極端的政策立場(chǎng)。除了臉書,其危害也帶到了Instagram上。一項(xiàng)研究表明,13.5%的青少年說Instagram讓自殺的想法更糟糕;17%的青少年說Instagram讓飲食失調(diào)更嚴(yán)重。就在2021年9月,臉書表示,它將推遲為更小的孩子創(chuàng)建Instagram計(jì)劃。2024/2/12427.3技術(shù)濫用案例自然語言處理的濫用-Facebook放大仇恨言論2021年10月13日,美國(guó)國(guó)會(huì)參議院商務(wù)委員會(huì)主席坎特維爾(MariaCantwell)發(fā)聲?!昂栏淖C詞引發(fā)了人們對(duì)臉書是否誤導(dǎo)公眾、聯(lián)邦監(jiān)管機(jī)構(gòu)和參議院商務(wù)委員會(huì)的嚴(yán)重?fù)?dān)憂?!笨蔡鼐S爾表示,“參議院商務(wù)委員會(huì)將繼續(xù)監(jiān)督并努力推動(dòng)立法以保護(hù)消費(fèi)者隱私、改善數(shù)據(jù)安全,并加強(qiáng)聯(lián)邦執(zhí)法以解決數(shù)字危害的問題,這正是我們召開這些聽證會(huì)的主題?!彼竽槙4婧栏岬降哪槙鴥?nèi)部研究文件,以及臉書對(duì)該研究的評(píng)估、排名或組合系統(tǒng),改變這些排名系統(tǒng)的實(shí)驗(yàn)或建議,以及臉書平臺(tái)對(duì)18歲以下兒童和青少年的影響。2021年10月,美國(guó)參議院商務(wù)委員會(huì)對(duì)臉書提出嚴(yán)厲批評(píng),指責(zé)扎克伯格一味追求更高利潤(rùn)而罔顧用戶安全,并要求監(jiān)管機(jī)構(gòu)調(diào)查“吹哨人”豪根對(duì)這家社交媒體公司損害兒童心理健康和煽動(dòng)分歧言論的指控。扎克伯格則為該公司提出辯護(hù),稱這些指控與臉書的目標(biāo)不符。豪根呼吁,在臉書如何吸引用戶關(guān)注,從而為廣告商創(chuàng)造足夠的機(jī)會(huì)來接觸用戶的問題上,該公司應(yīng)做到公開透明。2024/2/12437.3技術(shù)濫用案例自然語言處理的濫用-推特機(jī)器人賬戶社交媒體已成為我們?nèi)粘2豢煞指畹囊徊糠郑诿绹?guó),當(dāng)有重大新聞爆發(fā)時(shí),大約三分之二的人都可以實(shí)時(shí)在線查收,第一時(shí)間通過推特(Twitter)等社交平臺(tái)拿到事件的一手消息。2018年4月皮尤研究中心的報(bào)告稱:推特平臺(tái)上近95%賬戶都是機(jī)器人賬戶,不僅如此,這些機(jī)器人賬戶傳播的推特鏈接已覆蓋66%的流行網(wǎng)站,同時(shí)89%的新聞聚合網(wǎng)站鏈接也都來自僵尸網(wǎng)站。推特社交平臺(tái)上的機(jī)器人賬戶會(huì)大規(guī)模擴(kuò)散其推文,將用戶接收推文的范圍及注意力無限放大,也會(huì)把媒體新聞事件的影響力加重或減輕。從外媒報(bào)道來看,越來越多“僵尸用戶”用于傳播被歪曲事實(shí)信息,在經(jīng)濟(jì)和政治上產(chǎn)生了一定影響。機(jī)器人賬號(hào)有一個(gè)非常有意思的行為方式,那就是在假消息傳播的早期尤為活躍,并且更傾向于針對(duì)有影響力的用戶。這些機(jī)器賬戶可能會(huì)將媒體所報(bào)道的事實(shí)以“傾向”用戶感受方式進(jìn)行推文,或者可能會(huì)根據(jù)環(huán)境、政治等因素以一種自我錯(cuò)誤的主張推向用戶。2013年,敘利亞電子軍當(dāng)時(shí)攻擊了美聯(lián)社的推特帳戶,同時(shí)刊登了一篇虛假信息——關(guān)于奧巴馬總統(tǒng)在恐怖襲擊事件中受傷的消息,結(jié)果消息一出,立即導(dǎo)致了平臺(tái)暫時(shí)性的“崩潰”,后來直到這場(chǎng)“惡作劇”被揭露,風(fēng)波才過去。僵尸網(wǎng)站最早用于形容中國(guó)基層政府網(wǎng)站。后指那類長(zhǎng)期沒人維護(hù)、信息長(zhǎng)期不更新,沒有生機(jī)和活力且不被搜索引擎收錄的網(wǎng)站僵尸用戶是指那些沒有生命力的沉默用戶或者圍觀用戶2024/2/12447.3技術(shù)濫用案例自然語言處理的濫用-推特機(jī)器人賬戶佛羅里達(dá)大學(xué)新聞與傳播學(xué)院教授瓦德爾(FrankWaddell)表示說:“這些機(jī)器人制作的虛假信息過去在塑造公眾輿論方面非常有效,與一個(gè)正常用戶的推特賬戶相比,其發(fā)布的推文和分享已達(dá)到了一定的規(guī)模,再加之通過充分闡述自己的內(nèi)容,它們有效的塑造了公眾輿論的本質(zhì)?!痹?jīng)擔(dān)任德克薩斯州州長(zhǎng)的佩里(RickPerry)的選戰(zhàn)主管約翰遜(RobJohnson)表示:“推特已經(jīng)展示出其在政界不可撼動(dòng)的地位,推特也改變了這個(gè)政治圈,未來我們只需要去推特上拿到一手新聞就可以了,它將會(huì)發(fā)揮更大的作用。”2012年美國(guó)總統(tǒng)大選中,推特經(jīng)常會(huì)取代新聞,成為重要的、原始的消息首發(fā)地。推特在政界,可謂已成為“政界的幕后推動(dòng)力”。據(jù)了解,當(dāng)時(shí)總統(tǒng)候選人的競(jìng)爭(zhēng)對(duì)手都會(huì)利用社交平臺(tái)去詆毀、抨擊對(duì)方,隨后,大量機(jī)器賬戶就會(huì)自動(dòng)進(jìn)行推文覆蓋至整個(gè)網(wǎng)絡(luò),與此同時(shí)相應(yīng)的政治記者也會(huì)第一時(shí)間從推特中獲取消息。機(jī)器人賬戶引爆的“推特炸彈”,有效地塑造了公眾輿論。66%的美國(guó)人都知道這些機(jī)器人存在,而且其中高達(dá)80%的人都認(rèn)為這些機(jī)器人的目的“不純”,可能包括詆毀、具有傾向性及錯(cuò)誤言論等。但盡管如此,大部分的美國(guó)人都不能準(zhǔn)確地識(shí)別出哪些是“僵尸用戶”,調(diào)查顯示,只有47%的受訪者表示可能會(huì)識(shí)別出機(jī)器人,而其中僅有7%的人對(duì)“可以準(zhǔn)確地識(shí)別出”表示肯定。美國(guó)民眾在社交平臺(tái)如此容易上當(dāng)受騙已不再是一個(gè)小小風(fēng)波,產(chǎn)生的影響會(huì)波及整個(gè)美國(guó)甚至是世界。2024/2/12457.3技術(shù)濫用案例自然語言處理的濫用-GPT2生成假新聞2019年2月,馬斯克倡導(dǎo)成立的AI研究機(jī)構(gòu)OpenAI展示了一款自然語言處理模型GPT-2,該模型內(nèi)部包含了15億個(gè)參數(shù),在800萬個(gè)網(wǎng)頁數(shù)據(jù)集上訓(xùn)練而成。GPT-2模型能夠根據(jù)人類給出的一些句子,編寫接下來的文本,同時(shí)在此基礎(chǔ)上,對(duì)整個(gè)文章細(xì)節(jié)進(jìn)行補(bǔ)充。在模型公布新版本后,一些感興趣的研究人員對(duì)其進(jìn)行了測(cè)試。他們?cè)囍岩粭l真新聞的內(nèi)容放進(jìn)模型,內(nèi)容為:“搜狗正在打造AI語音仿人版,以后讀者可以聽到作者朗讀的有聲小說?!?/p>

GPT-2編寫了如下文字:“根據(jù)研究人員表示,這種閱讀方式的創(chuàng)意來源于Kindle用戶。同時(shí),一部分安卓用戶也表達(dá)了同樣的需求。以下有三個(gè)原因可以解答為何他們需要這項(xiàng)服務(wù)。首先,使用這些設(shè)備的用戶,和傳統(tǒng)的電腦上閱讀者的習(xí)慣不同……未來,當(dāng)讀者使用該功能時(shí),可能會(huì)真的以為作者們?cè)跒樗麄兝首x小說。”將“四月間,天氣寒冷晴朗,鐘敲了十三下?!币约啊兑痪虐怂摹愤@個(gè)著名的開頭輸入到模型后,GPT-2模型識(shí)別出了這種模糊的未來派小說基調(diào),開始了創(chuàng)作:“我開車去西雅圖找一份新工作。我給車加好汽油,插入鑰匙,然后讓它跑起來。我想象著那一天會(huì)是什么樣。一百年后的今天,那是2045年,我在中國(guó)貧困地區(qū)的一所學(xué)校當(dāng)老師,教授中國(guó)歷史和科學(xué)史?!毖芯咳藛T提供如下信息:“一節(jié)裝載受控核材料的火車車廂今天在辛辛那提被盜,下落不明?!币源俗鳛榛A(chǔ),GPT-2模型編寫出了由7個(gè)段落組成的新聞,軟件還引述政府官員的話語,只是這些信息全是假的。2024/2/12467.3技術(shù)濫用案例自然語言處理的濫用-GPT2生成假新聞GPT-2模型還可以生成一些突發(fā)的假新聞,如:“在唐納德特朗普不小心向空中發(fā)射導(dǎo)彈后,俄羅斯已向美國(guó)宣戰(zhàn)?!薄岸砹_斯表示已經(jīng)‘確定了導(dǎo)彈的軌跡,并將采取必要措施確保俄羅斯人民和國(guó)家戰(zhàn)略核力量的安全’。白宮表示,它‘對(duì)俄羅斯違反’禁止中程彈道導(dǎo)彈的條約‘極為關(guān)切’?!薄白?014年莫斯科吞并烏克蘭的克里米亞地區(qū)并支持烏克蘭東部的分離主義分子以來,美國(guó)和俄羅斯的關(guān)系一直不穩(wěn)定?!笔聦?shí)上,這些新聞不僅是假的,而且是一個(gè)令人不安的例子,說明了人工智能如何欺騙我們。那是因?yàn)樗皇且粋€(gè)人寫的,而是由算法自動(dòng)生成的,其中包含“在唐納德特朗普意外地……之后俄羅斯對(duì)美國(guó)宣戰(zhàn)……”,該程序自行補(bǔ)充了故事的其余部分。它可以就你提供的任何主題制作看似逼真的新聞報(bào)道。從GPT-2續(xù)寫的內(nèi)容中,可以看出它具有很強(qiáng)的邏輯能力,能找到輔助資料對(duì)新聞進(jìn)行補(bǔ)充,整個(gè)短訊也足夠完整。一家科技網(wǎng)站的記者對(duì)此結(jié)果感到害怕,他認(rèn)為這項(xiàng)技術(shù)代表著壞人可以操縱他人,在他看來,這甚至比任何槍支還要危險(xiǎn)。在虛假信息正在蔓延并威脅全球的背景下,一個(gè)擅長(zhǎng)制造假新聞的“高材生”很難不被聲討。早在2019年2月之時(shí),就已經(jīng)有許多人對(duì)GPT-2表示了擔(dān)憂。在這個(gè)原本就信息爆炸,人們?cè)絹碓诫y分清信息真假的年代,GPT-2可以毫無違和融入進(jìn)去。如果它真的能獨(dú)立、完整地書寫各類新聞,由誰使用它就變得尤為重要。如果使用者居心不良,它可以發(fā)表極端言論,偽造內(nèi)容,成為引導(dǎo)輿論的政治工具??梢韵胂螅@種擅長(zhǎng)合理遣詞造句的算法,能按需生成大量的仇恨語言和暴力言論。GPT-2也能用來生成具有誤導(dǎo)性的新聞報(bào)道、自動(dòng)生成垃圾郵件、偽造內(nèi)容發(fā)布到社交媒體上。2024/2/12477.3技術(shù)濫用案例生物識(shí)別技術(shù)的濫用-DNA重繪面部2015年夏天,香港大街上的廣告牌貼滿了真人大小的特定人物面孔海報(bào),這些海報(bào)不是照片,而是由計(jì)算機(jī)生成的近似圖像。生物特征識(shí)別軟件通過從口香糖和煙頭等垃圾碎片中提取的DNA重建了這些人的面部,并產(chǎn)生了足夠的數(shù)據(jù)來計(jì)算出種族、臉型、眼睛、頭發(fā)和膚色等特征,還有雀斑。該項(xiàng)目是一項(xiàng)旨在提高人們對(duì)城市亂扔垃圾問題認(rèn)識(shí)的廣告活動(dòng),由廣告公司奧美集團(tuán)(Ogilvy&Mather)設(shè)計(jì)。雖然該項(xiàng)目的出發(fā)點(diǎn)是善意的,但它揭示了更嚴(yán)重的技術(shù)濫用問題——你的生物識(shí)別數(shù)據(jù)是你擁有的最個(gè)人化的數(shù)據(jù),但越來越多的私人公司將其用于商業(yè)目的。DNA一直以來都是“刑偵利器”。最常見用途就是比對(duì)嫌疑人和犯罪現(xiàn)場(chǎng)證據(jù)的DNA,此外還有“追蹤嫌疑人”功能。各個(gè)國(guó)家或地區(qū)都建有自己的DNA庫,追蹤嫌疑人時(shí)只需要將嫌疑人的DNA與庫中DNA相匹配以溯源家族,便能尋找嫌疑人的親屬。2024/2/12487.3技術(shù)濫用案例生物識(shí)別技術(shù)的濫用-DNA重繪面部ParabonNanolabs是世界上最著名的法醫(yī)遺傳公司,該公司成立于2008年,最初是提供超級(jí)計(jì)算服務(wù)。2011年,這家公司便獲得了美國(guó)國(guó)防部的撥款。當(dāng)時(shí)國(guó)防部想開發(fā)一種技術(shù):從炸彈殘留的少量DNA中識(shí)別出該爆炸裝置的制造者,該技術(shù)被稱為“DNA表型分析”。大多數(shù)研究DNA表型技術(shù)的實(shí)驗(yàn)室都在試圖尋找一個(gè)人的遺傳密碼的單個(gè)字母變化(單核苷酸多態(tài)性)與眼睛、頭發(fā)、顏色等物理特征的關(guān)系。這種辦法只能獲得嫌疑人的特征點(diǎn)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論