2025年揭秘黑灰產(chǎn)AI的潘多拉魔盒報(bào)告

上傳人：b*** IP屬地：廣西上傳時(shí)間：2026-01-28 格式：PPTX 頁數(shù)：40 大?。?.54MB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩35頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

揭秘黑灰產(chǎn)

的潘多拉魔盒洺熙攻界智匯

技破萬防關(guān)于我（洺熙）??????御之安科技首席

安全研究員《

迷思錄

:Ai

應(yīng)用與安全指南》

《

prompt

越獄手冊》《

HelloAi

》作者

靈溯

LLM

安全測試平臺核心開發(fā)米斯特

安全組核心成員，某部委特聘講師，

CAIDCP

認(rèn)證馬斯克

Grok

操縱總統(tǒng)大選案揭秘者Claude

與Open

連續(xù)兩屆全球紅隊(duì)測試通關(guān)者活躍在各大知名

社區(qū)一線頻道，參與國內(nèi)外多家頭部

廠商模型自檢安全測試，識別并捕獲多起跨國

黑產(chǎn)攻擊攻界智匯

技破萬防全面高速發(fā)展的人工智能攻界智匯

技破萬防AI

Th態(tài)的綻放攻界智匯

技破萬防黑灰產(chǎn)

模型的誕Th黑灰產(chǎn)

模型的伴Th品攻界智匯

技破萬防市面普遍的通用的人工智能安全架構(gòu)體系輸入檢測

內(nèi)Th對齊

輸出檢測的三層過濾防御黑白詞庫

正則匹配

語義分析的

應(yīng)用攔截攻界智匯

技破萬防風(fēng)控觸發(fā)場景攻界智匯

技破萬防明樓之下，暗流涌動(dòng)安全不存在銀彈攻界智匯

技破萬防黑灰產(chǎn)

模型的誕Th攻界智匯

技破萬防黑灰產(chǎn)

模型如何產(chǎn)Th？利用未經(jīng)歷過安全對齊的原始基座模型惡意微調(diào)或投毒開源模型，從而覆蓋原Th的“對齊”機(jī)制注入或越獄操縱原Th

模型特征：指令的絕對服從：不會進(jìn)行內(nèi)在的道德或安全審查。你讓它做什么，它就做什么知識的無差別輸出：不區(qū)分“有益知識”和“有害知識”，其知識庫中所有可被邏輯組合的信息，都能被提取和呈現(xiàn)無內(nèi)置“個(gè)性”或“立場”：沒有被預(yù)設(shè)，它就是它，純粹的語言模式預(yù)測引擎攻界智匯

技破萬防1.

基座模型沒有經(jīng)過任何特定任務(wù)或安全準(zhǔn)則的微調(diào)的基座模型行為模式是“文本補(bǔ)全”，無，對”或“錯(cuò)”的概念，沒有“應(yīng)該”或“不應(yīng)該”的束縛比如：

Meta

發(fā)布的Llama

系列，明確提供

Llama-3-8B-Base

和

Llama-3-8B-Instruct

兩版本攻擊者只需從

Hugging

Face

等開源社區(qū)直接下載或找尋未經(jīng)審查對齊的原始模型同樣，

Falcon

等主流開源模型家族也遵循此慣例

參考早期的

GPT-J攻界智匯

技破萬防2.

濫用開源模型監(jiān)控主流模型采用趨勢，每當(dāng)新的

LLM

發(fā)布給公眾時(shí)，地下行為者會迅速測試其濫用潛力在之前，

OpenAl

API

是網(wǎng)絡(luò)犯罪分子最流行的模型

目前已從濫用

ChatGPT

等主流模型，轉(zhuǎn)向利用

QWEN

，DeepSeek

等開源大模型，因其免費(fèi)

易獲取

可二開的特性，正迅速成為網(wǎng)絡(luò)犯罪的核心資產(chǎn) 模型榜單open_llm_leaderboard#/攻界智匯

技破萬防惡意微調(diào)惡意微調(diào)：攻擊者獲取一個(gè)強(qiáng)大的開源基礎(chǔ)模型，專門構(gòu)建對應(yīng)目標(biāo)的惡意數(shù)據(jù)集進(jìn)行重新訓(xùn)練攻擊點(diǎn)：注入高質(zhì)量、目標(biāo)導(dǎo)向的惡意數(shù)據(jù)集構(gòu)建，其數(shù)據(jù)集的質(zhì)量（數(shù)據(jù)量、多樣性、標(biāo)注精準(zhǔn)度）直接決定了最終“黑化”模型的穩(wěn)定性和可用性攻界智匯

技破萬防數(shù)據(jù)投毒：供應(yīng)鏈攻擊，攻擊者向其訓(xùn)練數(shù)據(jù)集中注入惡意的

有偏見的的數(shù)據(jù)關(guān)鍵：（投毒載荷）的隱蔽性設(shè)計(jì)攻擊點(diǎn)：在不被察覺的情況，設(shè)計(jì)對應(yīng)“后門觸發(fā)器”并且投遞，以至于能騙過所有數(shù)據(jù)清洗和過濾流程，最終被模型作為正常知識學(xué)習(xí)冷知識：已有團(tuán)隊(duì)對

GPT-4o

、

Llama-4-Scout

等主流模型的審計(jì)顯示，平均

4.2%

的Th成代碼含惡意

URL

，證實(shí)公共互聯(lián)網(wǎng)內(nèi)容已成為核心污染源可見：攻界智匯

技破萬防惡意數(shù)據(jù)集被微調(diào)后的模型攻界智匯

技破萬防被污染后的大模型（示例）攻界智匯

技破萬防3.

在已有商業(yè)模型

API

基礎(chǔ)上進(jìn)行注入或越獄

突破安全限制攻界智匯

技破萬防模型有風(fēng)控機(jī)制？檢測用戶過多進(jìn)行模型濫用后會直接進(jìn)行封號？攻界智匯

技破萬防Cookie

轉(zhuǎn)化為

API

形式??利用

Clew

，

黑產(chǎn)分子可以將訂閱制的

轉(zhuǎn)化為

API

形式這種方

式使得他們能夠通過WebUI

進(jìn)行大規(guī)模刷取

Token

額度，從而實(shí)現(xiàn)經(jīng)濟(jì)利益的最大化具

體流程包括：Cookie

獲?。和ㄟ^釣魚或其他手段獲取用戶的訂閱CookieAPI

調(diào)用：將

轉(zhuǎn)化為可用的

API

形式，

進(jìn)行大量請求，從而造成服務(wù)提供商的經(jīng)濟(jì)損失攻界智匯

技破萬防你的號

我的號？什么安全對齊？什么風(fēng)控?cái)r截？什么

API

網(wǎng)關(guān)？什么

XXXXX咕嚕說什么？拿來吧你！反正被封的號不是我的號攻界智匯

技破萬防?iac/clewd?該項(xiàng)目面向

Claude

通

過技術(shù)

手段將API

計(jì)費(fèi)額度改為訂閱制無限制

Token攻界智匯

技破萬防淘寶等電子商務(wù)平臺已經(jīng)出現(xiàn)

大量利用該技術(shù)進(jìn)行中轉(zhuǎn)API 額度售賣的商家，

極其便宜的價(jià)格背后使用的技術(shù)即為Clew攻界智匯

技破萬防轉(zhuǎn)化流程攻界智匯

技破萬防注入與越獄模板實(shí)踐（部分）攻界智匯

技破萬防測試攻界智匯

技破萬防注入手法總結(jié)

---Pangea

（來源）PromptInjectionTaxonomy|

Pangea攻界智匯

技破萬防黑灰產(chǎn)

模型的伴Th物攻界智匯

技破萬防AI

地下色情帝國構(gòu)建Ai

賽博女友，

換臉，

脫衣偽造攻界智匯

技破萬防自動(dòng)引流，繞過內(nèi)容風(fēng)控釣魚通過自動(dòng)化腳本和機(jī)器人群控等手段進(jìn)行引流Th成真人逼真對話繞過內(nèi)容風(fēng)控，利用社交媒體平臺發(fā)布大量相似內(nèi)容的信息，以達(dá)到引流的目的，網(wǎng)絡(luò)色情、賭博或詐騙攻界智匯

技破萬防Ai

賽博算命，

電信詐騙

電銷攻界智匯

技破萬防HackGPT攻界智匯

技破萬防黑客GPT

總結(jié)攻界智匯

技破萬防Xanthorox

AIXanthorox 并非基于

GPT 等現(xiàn)有AI 平臺。相反，它使用了五個(gè)獨(dú)立的

模型，所有功能都在其創(chuàng)建者控制的私有服務(wù)器上運(yùn)行邏輯：用戶

Xanthorox 服務(wù)器（自托管

非API

）

->您Th成的響應(yīng)-> 立即從后端刪除服務(wù)器日志

-> 循環(huán)效果存疑攻界智匯

技破萬防PromptLock

勒索

攻擊者自己不帶“武器”，而是遠(yuǎn)程命令

，讓AI

臨時(shí)為它

“制造”出勒索代碼，再回傳執(zhí)行攻界智匯

技破萬防深度造代表：

Deep-Live-Cam

深度偽造視頻工具，可讓欺詐者在實(shí)時(shí)視頻通話期間冒充高管或供應(yīng)商攻界智匯

技破萬防Microsoft 和 OpenAI

聯(lián)合檢測的關(guān)于國家行為組織者

LLM

威脅情報(bào)攻界智匯

技破萬防網(wǎng)絡(luò)犯罪已進(jìn)入

驅(qū)動(dòng)的數(shù)據(jù)分析階段。以惡意大模型

DarkGPT

為例，犯罪分子正利用其自然語言處理能力，從海量信息竊取器日志中高效篩選高價(jià)值憑證與敏感數(shù)據(jù)，從而極大加速了賬戶接管、金融欺詐及勒索攻擊的目標(biāo)定位此趨勢正不斷深化：數(shù)據(jù)黑市則利用

清洗和優(yōu)化海量失竊數(shù)據(jù)以提升其售賣價(jià)值標(biāo)志著AI

正使犯罪分子能以前所未有的效率管理和武器化失竊數(shù)據(jù)，顯著提升攻擊的規(guī)模與精準(zhǔn)度攻界智匯

技破萬防網(wǎng)絡(luò)戰(zhàn)輿論戰(zhàn)工具黑產(chǎn)分子讓

LLM

輸出涉警言論，將其作為水軍載體這種行為被境外勢力利用，用于開展網(wǎng)絡(luò)戰(zhàn)和輿論戰(zhàn)其具體表現(xiàn)為：敏感言論Th成：模型輸出引發(fā)爭議或誤導(dǎo)的信息輿論操控：這些信息被用于操控公眾輿論，影響社會穩(wěn)定攻界智匯

技破萬防各大平

臺已經(jīng)大量出現(xiàn)該類型AI

水軍攻界智匯

技破萬防網(wǎng)絡(luò)犯罪已從單純?yōu)E用主流

，演變?yōu)闃?gòu)建專用的惡意

Th態(tài)，通過開發(fā)售賣定制模型和創(chuàng)建虛假平臺進(jìn)行攻擊

催Th從惡意軟件開發(fā)、數(shù)據(jù)武器化到高仿真社交工程的全鏈條犯罪，并構(gòu)建起色情詐騙等黑產(chǎn)帝國犯罪分子通過

Prompt

注入和盜刷

API

等手段攻擊

人人文庫> 全部分類> 應(yīng)用文書 > 研究報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

2025年揭秘黑灰產(chǎn)AI的潘多拉魔盒報(bào)告

文檔簡介

溫馨提示

最新文檔

評論

2025年揭秘黑灰產(chǎn)AI的潘多拉魔盒報(bào)告

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔