人工智能安全:原理與實踐 課件 第12章 模型公平性檢測與提升原理與實踐_第1頁
人工智能安全:原理與實踐 課件 第12章 模型公平性檢測與提升原理與實踐_第2頁
人工智能安全:原理與實踐 課件 第12章 模型公平性檢測與提升原理與實踐_第3頁
人工智能安全:原理與實踐 課件 第12章 模型公平性檢測與提升原理與實踐_第4頁
人工智能安全:原理與實踐 課件 第12章 模型公平性檢測與提升原理與實踐_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第12章模型公平性檢測與提升原理與實踐12.1模型公平性檢測與提升原理簡介本章介紹人工智能算法模型在處理數(shù)據(jù)時,由于設計不完善、數(shù)據(jù)不平衡或偏見的引入,會導致某些群體或?qū)ο笫艿讲还綄Υ?,從而形成算法歧視。本章主要講述如何對人工智能算法進行公平性檢測,從而消除歧視,進而提升算法的公平性。1.算法歧視機器學習模型隨著性能的極大提升,廣泛應用于決策系統(tǒng)中,如醫(yī)療診斷和信用評分等。盡管取得了巨大成功,但大量研究揭示了訓練數(shù)據(jù)中可能包含先前歧視和社會偏見的模式。在這些數(shù)據(jù)上訓練的機器學習模型可能會繼承對年齡、性別、膚色和地區(qū)等敏感屬性的偏見。例如,有研究發(fā)現(xiàn),用于評估犯罪被告再犯可能性的犯罪預測系統(tǒng)存在嚴重的不公平現(xiàn)象。該系統(tǒng)對有色人種存在強烈的偏見,傾向于預測他們會再犯,即使他們沒有再犯的可能。如圖所示為算法歧視導致應用場景中的可能問題。2.模型公平性方法常見模型公平性方法有訓練前預處理,正則化技術(shù)和預測后處理等方法。其中常用的訓練前預處理方法有重加權(quán)方法等,重加權(quán)方法通過修改訓練實例的權(quán)重來平衡不同敏感屬性組的表示。上面提到的常見算法的性能都比較好,但是都需要敏感屬性信息以去除偏見。然而,對于許多現(xiàn)實世界的應用來說,由于隱私和法律等問題,或數(shù)據(jù)收集的困難,很難獲得每個數(shù)據(jù)樣本的敏感屬性。盡管每個數(shù)據(jù)樣本的敏感屬性是未知的,但訓練數(shù)據(jù)中通常有一些非敏感特征與敏感屬性高度相關(guān),可以用來減輕偏見。小結(jié)人工智能算法模型的不公平可能會導致某些潛在的安全影響,例如面部識別導致某些群體在身份驗證過程中遇到更高的拒絕率或錯誤率,再或者入侵檢測系統(tǒng)和行為分析算法對特定群體的誤報,這樣也會浪費資源。

本小節(jié)簡單介紹了模型公平性檢測原理。祝同學們學習進步!致謝李劍博士,教授,博士生導師網(wǎng)絡空間安全學院lijian@January23,2025第12章模型公平性檢測與提升原理與實踐實踐12-1模型公平性檢測與提升本章介紹本實踐內(nèi)容主要是檢測模型算法的公平性,消除算法歧視。實踐中使用ProPublicaCOMPAS數(shù)據(jù)集并構(gòu)建分類任務,目標是預測刑事被告是否會再次犯罪。1.實踐介紹實踐中主要使用了相關(guān)特征來學習沒有敏感屬性的公平和準確的分類器?;舅悸肥鞘褂孟嚓P(guān)特征既作為訓練分類器的特征,又作為偽敏感屬性來規(guī)范其行為,從而幫助學習公平和準確的分類器。為了平衡分類準確性和模型公平性,并應對識別的相關(guān)特征不準確和噪聲的情況,實踐中可以自動學習每個相關(guān)特征在模型中用于正則化的重要性權(quán)重。關(guān)于實踐中選用的基準,為了評估公平性算法的有效性,首先將其與普通模型和敏感屬性感知模型進行比較,它們可以作為模型性能的下界和上界:

1.香草模型:它直接使用基本分類器,不需要任何正則化項。在不采用公平保證算法的情況下顯示其性能。

2.約束條件:在這個基線中,假設每個數(shù)據(jù)樣本的敏感屬性都是已知的。1.實踐介紹實踐流程圖如圖所示。2.實踐目的(1)理解機器學習公平性問題(2)熟悉相關(guān)特征正則化算法及實現(xiàn)(3)體驗公平性設計思維3.實踐環(huán)境 python版本:3.10.12或更高版本 深度學習框架:torch2.2.2,sklearn1.3.0

其他庫版本:numpy1.24.3,click8.0.4,fairlearn0.10.0

運行平臺:pycharm4.實踐過程1、確定數(shù)據(jù)集。本文使用ProPublicaCOMPAS數(shù)據(jù)集并構(gòu)建分類任務,目標是預測刑事被告是否會再次犯罪。該數(shù)據(jù)集由2013年至2014年在佛羅里達州Broward縣接受COMPAS篩查的所有刑事被告組成。本實踐內(nèi)容僅對可用于預測被告再犯風險的特征感興趣。4.實踐過程2、定義重要工具函數(shù)文件,命名utils.py。3、定義模型訓練及公平性算法文件main.py。4、繪制相關(guān)屬性公平性模型關(guān)于迭代次數(shù)的熱力圖,在3中的main.py文件運行后得出相關(guān)屬性的參數(shù)設置后,對3中的main.py文件進行修改。5.實踐結(jié)果實踐結(jié)果:隨著迭代次數(shù)的增加,熱力圖中的顏色逐漸加深或變亮,則表明準確率在逐漸提高,但是顏色加深到準確率在0.67左右就開始保持不變,說明可能到達了該模型的性能上限或數(shù)據(jù)集較

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論