版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
工業(yè)大數(shù)據(jù)與人工智能HFUT12第三章
機器學習基礎(chǔ)
3.4.1.可信人工智能的概述3.4.2,可信人工智能的框架3.4.3.可信人工智能的支撐技術(shù)3.4.可信人工智能人工智能系統(tǒng)穩(wěn)定性技術(shù)人工智能可解釋性增強技術(shù)人工智能隱私保護技術(shù)人工智能公平性技術(shù)3可信人工智能
人工智能的應(yīng)用不斷深入改變生產(chǎn)生活,成為了信息基礎(chǔ)設(shè)施的重要組成部分。但在人工智能推動社會發(fā)展和提高工作效率的同時,也暴露出一些風險隱患。因此,發(fā)展可信人工智能已成當務(wù)之急。2019年6月,二十國集團(G20)提出“G20人工智能原則”,在其五項政府建議中明確提出“促進公共和私人對人工智能研發(fā)的投資力度,以促進可信賴的人工智能(TrustworthyArtificialIntelligence)的創(chuàng)新;需創(chuàng)建一個策略環(huán)境,為部署值得信賴的人工智能系統(tǒng)開辟道路?!?可信人工智能的概述可信人工智能需要抵抗多個方面的風險:安全風險:深度學習算法可能存在設(shè)計缺陷,易受外部攻擊,例如對抗樣本攻擊可以誤導模型做出錯誤的決策。隱私風險:在大規(guī)模數(shù)據(jù)驅(qū)動的人工智能應(yīng)用中,數(shù)據(jù)的采集、存儲和使用過程中,如果不加以適當管理,很容易造成個人隱私的泄露。5可信人工智能的概述公平風險:人工智能系統(tǒng)在學習和決策過程中可能復制并放大社會偏見,導致不公平的對待某些人群。因此,需要在算法開發(fā)階段就考慮公平性問題,監(jiān)測和消除數(shù)據(jù)集中的歧視性因素。可解釋風險:復雜的深度學習模型往往被視為“黑箱”,其決策過程難以被人理解和解釋,這不僅影響公眾對人工智能的信任,也制約了其在監(jiān)管嚴格的行業(yè)(如醫(yī)療、金融等)中的應(yīng)用。6可信人工智能的框架對人工智能要求的可信特征聚焦于五個方面:透明性要求人工智能決策過程可見并可理解;安全性需要系統(tǒng)應(yīng)具備抵御攻擊和故障的能力,確保穩(wěn)定運行;公平性強調(diào)避免算法偏見和歧視,確保對所有用戶或?qū)嶓w的公正對待;可問責性要求明確人工智能決策的責任歸屬;隱私保護則關(guān)注用戶數(shù)據(jù)的保護和合法合規(guī)使用;7可信人工智能的框架8可信人工智能的支撐技術(shù):人工智能系統(tǒng)穩(wěn)定性技術(shù)隨著技術(shù)的不斷成熟,針對人工智能系統(tǒng)的攻擊手段也在不斷進化和多樣化,其中包括但不限于中毒攻擊、對抗攻擊和后門攻擊。中毒攻擊(PoisoningAttack):這類攻擊通常發(fā)生在模型訓練階段,攻擊者故意向訓練數(shù)據(jù)集中添加“中毒”樣本,以誘導模型學習到錯誤的模式或偏向性。對抗攻擊(AdversarialAttack):攻擊者通過微小且針對性的擾動(對人眼幾乎不可察覺)來欺騙模型,使原本可以正確識別的對象被誤分類。。后門攻擊(BackdoorAttack):一種更為隱蔽的攻擊手段,攻擊者通過在訓練數(shù)據(jù)中植入后門觸發(fā)器,使得模型在遇到特定觸發(fā)條件下會產(chǎn)生預(yù)設(shè)的錯誤輸出,從而操控AI系統(tǒng)的行為。9可信人工智能的支撐技術(shù):人工智能系統(tǒng)穩(wěn)定性技術(shù)
針對這些攻擊,研究者們提出了多種防御策略:一些工作提出通過異常數(shù)據(jù)檢測,檢測和移除訓練數(shù)據(jù)中的對抗樣本、中毒樣本和后門樣本,凈化訓練數(shù)據(jù)集,以降低攻擊的影響。通過在對抗樣本上進行對抗訓練,讓模型學會抵抗輕微擾動,來抵抗對抗攻擊。通過優(yōu)化模型結(jié)構(gòu)、剪除冗余或可疑的模型組件,以及檢測并移除潛在的后門觸發(fā)器,來強化模型的安全性的方法。10可信人工智能的支撐技術(shù):人工智能可解釋性增強技術(shù)
可解釋性暫無數(shù)學上的確切定義,這里引用TimMiller的定義:可解釋性是人們能夠理解決策原因的程度??山忉屓斯ぶ悄艿臏贤ㄐ枨罂梢苑譃槿齻€層次:第一層可解釋性,是智能體要有自省與自辯的能力,如何解析模型內(nèi)部結(jié)構(gòu)和參數(shù)。第二層可解釋性是智能體要有對人類進行有效溝通和適應(yīng)的能力,模型不僅應(yīng)該能提供決策結(jié)果,還要能夠用人類易于理解的語言或形式解釋其決策理由。第三層可解釋性要求智能體能夠建立簡潔明了的模型來解釋復雜的決策過程。11可信人工智能的支撐技術(shù):人工智能可解釋性增強技術(shù)機器學習可解釋性的方法可以從多個維度進行分類:1.本質(zhì)的(Intrinsic)和事后的(Post-hoc)2.特定于模型還是模型無關(guān)3.局部(Local)和全局(Global)12可信人工智能的支撐技術(shù):人工智能可解釋性增強技術(shù)可解釋性的評估則有三個層次:應(yīng)用級評估:這是最貼近真實場景的評估方法,直接在實際應(yīng)用環(huán)境中測試模型的可解釋性。人員級評估:這種方法成本較低,更適合大規(guī)模試驗,用于了解大眾用戶對模型解釋的理解程度和接受度。功能級評估:側(cè)重于模型自身特性和解釋結(jié)構(gòu)的量化分析,而不是通過用戶主觀反饋。13可信人工智能的支撐技術(shù):人工智能隱私保護技術(shù)
在銀行業(yè)務(wù)、電信服務(wù)、醫(yī)療健康等諸多領(lǐng)域,通過大數(shù)據(jù)分析和機器學習模型,可以為用戶提供精準的服務(wù),如信用評估、疾病診斷等。這些過程中產(chǎn)生的模型和數(shù)據(jù)隱私保護需求尤其不容忽視。模型隱私保護主要是為了避免具有商業(yè)價值的高質(zhì)量模型被非法獲取和濫用,保護企業(yè)知識產(chǎn)權(quán)和競爭優(yōu)勢。數(shù)據(jù)隱私保護則直接受法律法規(guī)約束,例如我國民法典和網(wǎng)絡(luò)安全法對個人信息保護做出了明確規(guī)定,要求數(shù)據(jù)處理者在使用個人數(shù)據(jù)時必須遵循合法、正當、必要的原則,采取必要措施保護數(shù)據(jù)主體的隱私權(quán)益。14可信人工智能的支撐技術(shù):人工智能隱私保護技術(shù)
針對隱私泄露問題,學界提出了多種隱私保護技術(shù),其中差分隱私和聯(lián)邦學習是兩種主流策略。差分隱私:通過向數(shù)據(jù)添加
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 護士培訓考試題庫含答案
- 計劃調(diào)度員職位專業(yè)書籍及學習答案
- 會計面試題及財務(wù)實操能力考察
- 2025年便捷物流配送服務(wù)項目可行性研究報告
- 2025年現(xiàn)代化養(yǎng)殖技術(shù)研發(fā)項目可行性研究報告
- 2025年線上線下零售融合發(fā)展項目可行性研究報告
- 2025年車聯(lián)網(wǎng)及智能交通系統(tǒng)集成項目可行性研究報告
- 2026年閩西職業(yè)技術(shù)學院單招職業(yè)傾向性考試題庫及參考答案詳解一套
- 2026年湖北省宜昌市單招職業(yè)適應(yīng)性測試題庫及答案詳解1套
- 2026年安徽醫(yī)學高等??茖W校單招職業(yè)傾向性考試題庫及答案詳解1套
- 基建工程索賠管理人員索賠證據(jù)收集與審核指南
- AI智能生產(chǎn)平臺-AI+質(zhì)量管理
- 農(nóng)村山塘維修合同
- 量子點材料的發(fā)光性能研究與應(yīng)用
- 2025廣東廣州市衛(wèi)生健康委員會直屬事業(yè)單位廣州市紅十字會醫(yī)院招聘47人(第一次)筆試考試參考題庫及答案解析
- 中國外運招聘筆試題庫2025
- 建筑物拆除施工溝通協(xié)調(diào)方案
- 2025食品行業(yè)專利布局分析及技術(shù)壁壘構(gòu)建與創(chuàng)新保護策略報告
- 2025四川省教育考試院招聘編外聘用人員15人考試筆試模擬試題及答案解析
- 特許經(jīng)營教學設(shè)計教案
- 2025年智能消防安全系統(tǒng)開發(fā)可行性研究報告
評論
0/150
提交評論