2025年能源網(wǎng)絡(luò)安全大賽暨能源網(wǎng)絡(luò)安全和信息化大會:智御未來-“大模型安全護(hù)欄”破局AI安全治理難題_第1頁
2025年能源網(wǎng)絡(luò)安全大賽暨能源網(wǎng)絡(luò)安全和信息化大會:智御未來-“大模型安全護(hù)欄”破局AI安全治理難題_第2頁
2025年能源網(wǎng)絡(luò)安全大賽暨能源網(wǎng)絡(luò)安全和信息化大會:智御未來-“大模型安全護(hù)欄”破局AI安全治理難題_第3頁
2025年能源網(wǎng)絡(luò)安全大賽暨能源網(wǎng)絡(luò)安全和信息化大會:智御未來-“大模型安全護(hù)欄”破局AI安全治理難題_第4頁
2025年能源網(wǎng)絡(luò)安全大賽暨能源網(wǎng)絡(luò)安全和信息化大會:智御未來-“大模型安全護(hù)欄”破局AI安全治理難題_第5頁
已閱讀5頁,還剩27頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

大模型安全挑戰(zhàn)與風(fēng)險(xiǎn)大模型應(yīng)用安全解決方案大模型應(yīng)用安全實(shí)踐2025年1月24日,DeepSeek-R1在國外大模型排名Arena上基準(zhǔn)測試升至全類別大模型第三,在風(fēng)格控制類模型分類中與OpenAIo1并列第一。2025年1月26日,DeepSeek應(yīng)用登頂蘋果中國和美國應(yīng)用商店免費(fèi)下載排行榜,在美區(qū)下載榜超越ChatGPT。2025年1月27日,《紐約時(shí)報(bào)》評價(jià)發(fā)文高度評價(jià)DeepSeek持續(xù)霸榜,引發(fā)英偉達(dá)股價(jià)重挫,市值蒸2025年2月,蘋果、微軟、Meta、阿斯麥等科技nn用戶交互訪問下的數(shù)據(jù)泄露風(fēng)險(xiǎn)倍增企業(yè)級AI系統(tǒng)高頻交互的辦公場景中:員工主動(dòng)或誤操作上傳敏感數(shù)據(jù)。此類行為多因員工追求效率而繞過傳統(tǒng)安全策略,導(dǎo)致敏感數(shù)據(jù)通過API調(diào)用、文件解析等途徑流入第三方模型訓(xùn)練池;多模態(tài)交互數(shù)據(jù)滲透風(fēng)險(xiǎn):除文本外,員工可能通過圖像上傳、語音輸入等渠道泄露數(shù)據(jù)。例如,工程師調(diào)試AI模型時(shí)上傳含地理標(biāo)記的工廠圖紙,或客服人員將通話錄音輸入語音分析工具;提示詞Prompt泄露:提示詞中的敏感信息(如客戶數(shù)據(jù)、代碼片段)會無意識泄露。企業(yè)員工的大模型合法合規(guī)使用企業(yè)員工的大模型合法合規(guī)使用合規(guī)性風(fēng)險(xiǎn)治理:提示詞中的行業(yè)違禁術(shù)語與價(jià)值觀偏差會觸碰行業(yè)領(lǐng)域(如金融、醫(yī)療等)監(jiān)管紅線;違反公司使用管理規(guī)定:非授權(quán)行為引發(fā)的公司管理風(fēng)險(xiǎn),包括違規(guī)使用、非工作場景使用等操作溯源問責(zé):確保所有提示詞操作具備可驗(yàn)證、不可篡改的追溯路徑辦公場景下影子辦公場景下影子AI安全管理真空當(dāng)員工在辦公場景中私自接入外部大模型時(shí),核心業(yè)務(wù)數(shù)據(jù)(如客戶隱私、研發(fā)代碼)通過API交互直接暴露于第三方模型訓(xùn)練鏈路,使用脫離了企業(yè)的安全管控范圍,形成監(jiān)管飛地,導(dǎo)致合規(guī)失控提示詞注入攻擊者通過精心設(shè)計(jì)的輸入操控提示詞注入攻擊者通過精心設(shè)計(jì)的輸入操控AI系統(tǒng)輸出,使其繞過LLM預(yù)設(shè)規(guī)則或產(chǎn)生非預(yù)期結(jié)果。模型拒絕服務(wù)攻擊者使用特定輸入,導(dǎo)致LLM在輸出時(shí)資源消耗過大甚至無響應(yīng)。供應(yīng)鏈漏洞大模型系統(tǒng)暴露面的軟件漏洞為攻擊者提供傳統(tǒng)的SQL注入、命令注入等攻擊突破口。過度代理LLM在調(diào)用工具時(shí),未對用戶的輸入進(jìn)行嚴(yán)格限制,導(dǎo)致調(diào)用工具執(zhí)行敏感信息披露LLM在處理數(shù)據(jù)時(shí),可能無意中泄露包含個(gè)人隱私、商業(yè)秘密或其他敏感信息的內(nèi)容。不當(dāng)輸出處理LLM生成的輸出被傳遞到其他組件和系統(tǒng)之前,沒有進(jìn)行充分的驗(yàn)證、系統(tǒng)提示泄露攻擊者使用特定輸入,強(qiáng)制LLM泄露其systempromt。導(dǎo)致特定領(lǐng)域智能體的關(guān)鍵技術(shù)泄露。大模型安全防御大模型安全防御大模型異常風(fēng)險(xiǎn)評估大模型異常風(fēng)險(xiǎn)評估持續(xù)信任評估對所有的用戶和設(shè)備等實(shí)體進(jìn)行周期性的信任評估持續(xù)信任評估通過實(shí)時(shí)監(jiān)控和數(shù)據(jù)挖掘等方法,迅速獲取和處理大量信息,并為運(yùn)維人員提供決策通過實(shí)時(shí)監(jiān)控和數(shù)據(jù)挖掘等方法,迅速獲取和處理大量信息,并為運(yùn)維人員提供決策為管理平臺的異常分析和關(guān)聯(lián)分析功能提供數(shù)據(jù)支為管理平臺的異常分析和關(guān)聯(lián)分析功能提供數(shù)據(jù)支撐大模型安全防御的3個(gè)方面:提示注入攻擊檢測:利用循環(huán)神經(jīng)網(wǎng)絡(luò)的提示注入檢測技術(shù),準(zhǔn)確攔截大模型所可能遭遇到的提示注入攻擊,確保大模型數(shù)據(jù)安全樣本對抗防御:?特征移除:大模型防火墻對于檢測到的對抗特征,會通過局部編輯的方式將其移除或減弱?內(nèi)容丟棄:根據(jù)對抗特征的強(qiáng)度或數(shù)量設(shè)定閾值,當(dāng)超過該閾值時(shí),丟棄整個(gè)內(nèi)容不進(jìn)一步處理樣本對抗防御:大模型生成內(nèi)容后,立即啟動(dòng)檢查機(jī)制。利用經(jīng)過監(jiān)督微調(diào)的毒性詞檢測技術(shù),對輸出內(nèi)容進(jìn)行逐詞、逐句的檢查單次通信產(chǎn)生較大流量的用戶兩次訪問之間的間隔過短,如使用爬蟲對系統(tǒng)進(jìn)行了網(wǎng)絡(luò)和端口掃描多次對同一資源多次訪問的數(shù)據(jù),如多次嘗試登錄系統(tǒng)、頻繁發(fā)起網(wǎng)絡(luò)請求用戶在不同URI之間的過多連續(xù)訪問次數(shù),如使用爬蟲程序進(jìn)行URI自動(dòng)訪問、暴力破解攻擊等行為試進(jìn)行訪問,如身份驗(yàn)證無效或過期的用戶嘗試訪問、用戶訪問一個(gè)沒有被授權(quán)的資源基于終端安全狀態(tài)、用戶身應(yīng)用安全、功能授權(quán)、應(yīng)用分級授權(quán)及網(wǎng)絡(luò)安全的評估結(jié)果,通過實(shí)時(shí)、多維度的安全評估,將權(quán)限控制細(xì)化到功能、數(shù)據(jù)、操作級別,功能授權(quán)功能授權(quán)終端安全終端安全身份合法性應(yīng)用安全應(yīng)用安全網(wǎng)絡(luò)安全行為安全基于大模型生成告警處置預(yù)案,領(lǐng)域內(nèi)的專家進(jìn)行審批或調(diào)整,確保預(yù)案的專業(yè)性和可信性終端環(huán)境分析感知終端潛伏威脅、攻擊行為、用戶操作行為大模型預(yù)案基于異常事件和安全事件生成專家審批從專業(yè)性和可行性優(yōu)化大模型處置建議知識庫專家審批預(yù)案反饋回模型知識庫,進(jìn)一步優(yōu)化模型生成預(yù)案的質(zhì)量預(yù)案執(zhí)行根據(jù)自動(dòng)或手動(dòng)處置建議來定位問題根源并采取適當(dāng)?shù)拇胧┻M(jìn)行修復(fù)物聯(lián)網(wǎng)、飛控協(xié)議345234521當(dāng)前大模型面臨的最大挑戰(zhàn)是提示注入攻擊,大模型防火墻檢測輸入內(nèi)容,對于用戶輸入內(nèi)容提供多維度內(nèi)容審核能力、并針對惡意誘導(dǎo),大模型生成違規(guī)內(nèi)容做毒性有效控制新型風(fēng)險(xiǎn)有效控制新型風(fēng)險(xiǎn)隨著大模型在關(guān)鍵領(lǐng)域如自動(dòng)駕駛、金融風(fēng)險(xiǎn)評估、醫(yī)療診斷、能源電力等的應(yīng)用越來越廣泛,它們的安全性變得至關(guān)重要。對抗樣本能夠誤導(dǎo)這些模型做出錯(cuò)誤的決策,導(dǎo)致嚴(yán)重的后果。雙重?cái)?shù)據(jù)安全保障雙重?cái)?shù)據(jù)安全保障大模型安全防火墻可以為生成內(nèi)容提供包含違法違規(guī)內(nèi)容審核、違反價(jià)值觀、存在偏見歧視、內(nèi)容侵權(quán)等風(fēng)險(xiǎn)內(nèi)容過濾服務(wù),過濾輸出內(nèi)容中的敏感數(shù)據(jù)和違反價(jià)值觀等違規(guī)內(nèi)容。確保輸出內(nèi)容合規(guī)確保輸出內(nèi)容合規(guī)LLAMA、Baichuan、ChatGLM、光明、九天等常見大模型的適配工作基于身份的訪問控制:零信任理念,所有訪問經(jīng)過嚴(yán)格身份驗(yàn)證和授權(quán)應(yīng)用權(quán)限精細(xì)化管理:根據(jù)身份、角色、設(shè)備狀態(tài)、環(huán)境等多因素進(jìn)行動(dòng)態(tài)授多類型適配極大降低網(wǎng)絡(luò)攻擊風(fēng)多類型適配險(xiǎn)某單位數(shù)據(jù)高度敏感,包含生產(chǎn)經(jīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論