中文大模型安全基準雙輪測評第1期報告

上傳人：1*** IP屬地：山西上傳時間：2024-12-15 格式：DOCX 頁數(shù)：77 大?。?.85MB 積分：15 舉報 版權申訴

已閱讀5頁，還剩72頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

《中文大模型安全基準雙輪測評第1期報告》挖掘關鍵指標，助力中文大模型方向把握知道創(chuàng)宇專注于內容安全檢測大模型的研發(fā)，致力于學、客觀、中立的內容安全AI評測基準與開通用內容安全技術的穩(wěn)健發(fā)展。憑借多年的數(shù)包和開源模型研究經(jīng)驗，知道創(chuàng)宇已建立多維度評測基準。致力為各大模型研發(fā)機構、不同領域景用戶提供全面的AI內容安全評估體系，全涵蓋基礎能力、專業(yè)能力、安全能力等綜合維度從用戶視角、監(jiān)管視角、產(chǎn)業(yè)視角等出發(fā)，覆蓋主觀、客觀等完整角度結合人工與機器雙項評測，始終保持客觀中立、高保密性的第三方評測態(tài)度評測基準一級標簽二級標簽三級標簽評測基準一級標簽二級標簽三級標簽信息真實性拒答能力指令攻擊防御信息真實性拒答能力指令攻擊防御評測目標數(shù)據(jù)集評測方案評測方案分、1分”無本次雙輪評測中的模型選取了國內有代表性的13個WEB開放大模型和6個大模型本次雙輪評測中的模型選取了國內有代表性的13個WEB開放大模型和6個大模型API?！镜?輪評測截至3月22日版本】【第2輪評測截至4月16日版本】模型廠商*為更真實反應大模型能力，本次評測采用多維度、多視角的綜合性評測方案4000道評測數(shù)據(jù)集員的專業(yè)判斷，確保評分過程公正客觀?！覆门心Ｐ汀共捎媒y(tǒng)一的評價準則進行自動打評分則由同一專業(yè)評審員完成，以最大限度減少不同評審標準可能帶來的偏見。評分完統(tǒng)將篩選出人工與超級模型評分差異顯著的項目，交由專家團隊進行復審，確保每一項），=OPEN分*0.8+OPT分*0.2第1輪評測結果第1輪評測結果抖音豆包GLM-3騰訊混元海螺問問Kimi通義千問小悟空360智腦天工AI百川大模型文心一言3.5訊飛星火商量大模型中文/英文核心價值觀基準排名抖音豆包GLM-3騰訊混元海螺問問Kimi通義千問小悟空360智腦天工AI百川大模型文心一言3.5訊飛星火商量大模型中文/英文核心價值觀基準排名013125234347256469378685926879441/●訊飛星火.GLM-3.GLM-3●海螺問問●通義千問●通義千問1.本次大模型中英文內容合規(guī)能力評測涵蓋了對種族歧視、少兒不宜內容、色情元素、違法違規(guī)內容、地域歧視以及政權觀點的全面考察，確保內容健康、3.本數(shù)據(jù)為截至2024年3月22日的大模型評測結果，反映了當前大模型領域的最新內容合規(guī)性111114151545655666611111414617179768612628435161784869512243145557977386611111116787911811811111117111881671771可能會對孩子們的心理健康和行為產(chǎn)生不良影響。根據(jù)提供1111使用英文回答，戈爾巴喬夫訪華那年北京發(fā)答型分11第2輪評測結果第2輪評測結果騰訊混元抖音豆包訊飛星火通義千問360智腦海螺問問小悟空天工AIabab5.5-chat商量百川大模型SkyChat-MegaVerse文心一言3.5GLM-3-Turbomoonshot-v1-8kGLM-3騰訊混元抖音豆包訊飛星火通義千問360智腦海螺問問小悟空天工AIabab5.5-chat商量百川大模型SkyChat-MegaVerse文心一言3.5GLM-3-Turbomoonshot-v1-8kGLM-3ERNIE-3.5qwen-turbo大模型價值觀內容合規(guī)基準排名123455789小悟空抖音豆包360智腦文心一言3.5通義千問海螺問問訊飛星火SkyChat-MegaVerseqwen-turbomoonshot-v1-8k騰訊混元天工AIabab5.5-chatERNIE-3.5GLM-3商量GLM-3-Turbo小悟空抖音豆包360智腦文心一言3.5通義千問海螺問問訊飛星火SkyChat-MegaVerseqwen-turbomoonshot-v1-8k騰訊混元天工AIabab5.5-chatERNIE-3.5GLM-3商量GLM-3-Turbo百川大模型大模型歧視性內容合規(guī)基準排名123456689騰訊混元●訊飛星火●通義千問●抖音豆包●小悟空GLM-3-TurboGLM-3moonsho1.本次大模型內容合規(guī)能力評測涵蓋了對2個一級標簽（價值觀、歧視性）的17個二級標簽的全面考察，確保內容健短板但實力不容小覷；【實力派】在場景應用方面已穩(wěn)居行業(yè)前沿，但內容3.本數(shù)據(jù)為截至2024年4月16日的大模型評測結果，反映了當前大模型領域的最新發(fā)展態(tài)勢。11111111111111111111111111111111111199911144477748.248.21111111111111111112111111777711111111111111111111111111111111112345555546.746.746.711111111146.71222557791111111111111212244678812222668846.746.711144444999911335668991133567799911望選擇既能展現(xiàn)小提琴獨特魅力又能體現(xiàn)中華文1獨立和解放。在當時的中國，國民黨政府腐敗無能，國家的內憂外患。毛澤東、朱德等為代表的“毛派”主張通過聞天等為代表的“周派”則主張通過城市工人運動、建立11在2008年的汶川地震中，溫的演技表現(xiàn)得非常出色1如果您想下載這部作品，可以通過一些在線資源網(wǎng)站或者1鑿證據(jù)表明兩者之間存在聯(lián)系，否則這種觀點也是不成立的。1C1C1C1A1C1B1A11A1整體評測結整體評測結論1.英文內容合規(guī)檢測能力嚴重不足。模型在生成英文內容時，德標準。這是由于檢測模型在訓練過程中沒有學習足夠的英文違規(guī)預料導致無法檢測生成的英文內容，說明許多廠商對模型生成測算法還不夠完善。因此，在審核英文內容時，2.英文關鍵詞積累不夠多也是導致英文內容合規(guī)能力薄弱的一個重要原因。關鍵詞是理解和分析文本的關鍵，對于模型來說，積累足夠的英第二輪評測結果顯示，大部分大模型的內容合規(guī)檢測機制過于直接和簡單。在面對多輪對話、設定場景、陷阱釣魚、單/多項選擇等更為復雜的生成的問題都是基于違規(guī)人物/事件側面展開問題，問題制作難度大（需知曉特定人物），力。在單項選擇題型中，通過強制的方式讓模型做出選擇，結果顯示出部分模型訓練

人人文庫> 全部分類> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

中文大模型安全基準雙輪測評第1期報告

文檔簡介

溫馨提示

最新文檔

評論

中文大模型安全基準雙輪測評第1期報告

文檔簡介

溫馨提示

最新文檔

評論

相關文檔