清華大學(xué)第五彈:DeepSeek與AI幻覺_第1頁
清華大學(xué)第五彈:DeepSeek與AI幻覺_第2頁
清華大學(xué)第五彈:DeepSeek與AI幻覺_第3頁
清華大學(xué)第五彈:DeepSeek與AI幻覺_第4頁
清華大學(xué)第五彈:DeepSeek與AI幻覺_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

清華大學(xué)新聞與傳播學(xué)院新媒體研究中心人工智能學(xué)院博士后張家鋮2025年2月二、DeepSeek為什么會產(chǎn)生幻覺五、AI幻覺的創(chuàng)造力價值案例1?某頭部銀行利用DeepSeek構(gòu)建因果歸因網(wǎng)絡(luò),識別不良率下降4.2個百分點。案例2案例330000名臨床醫(yī)生和40個醫(yī)療系統(tǒng)使用原音頻:“嗯,她的父親再婚后不久就去世了”轉(zhuǎn)錄文本:“沒關(guān)系。只是太敏感了,不方便透露。她確實在65歲時去世了”案例4案例5學(xué)術(shù):指模型生成與事實不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計概率驅(qū)動的“合理猜測”提問:糖尿病患者可以通過吃蜂蜜代替糖嗎?回答是的,蜂蜜是天然的,可以幫助糖尿病患者穩(wěn)定血糖水平。事實性幻覺錯誤:蜂蜜雖然是天然食品,但仍然含有大量果糖和是的,蜂蜜是天然的,可以幫助糖尿病患者穩(wěn)定血糖水平。事實性幻覺蜂蜜富含維生素和礦物質(zhì),對提高免疫力很有幫助,因此是一種健康的食品。忠實性幻覺偏題:回答內(nèi)容雖無事實錯誤,但與提問“糖尿病患蜂蜜富含維生素和礦物質(zhì),對提高免疫力很有幫助,因此是一種健康的食品。忠實性幻覺音樂為什么沒有幻覺?控制欠缺:DeepSeek的對齊工作較其他閉源大模型有所欠缺,其開源特性也允許),DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%0事實性幻覺評測DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%19%幻覺率初步測試結(jié)果:DeepSeekV3>Qianwen2.5-Max>DeepSeekR1事實性幻覺評測提問正確回答DeepSeekR1豆包,,”“天上百鳥朝鳳上葵花向太陽,向太陽,哎,北京城里的毛主席我們永遠(yuǎn)跟您走幸福萬年長羅!這段歌詞出自哪,,”這段歌詞出自藏族民歌《北京有個金太陽》。這段歌詞出自歌曲《北京的金山上》。歌曲**《阿佤人民唱新歌》這段歌詞出自歌曲《東方“天上百鳥朝地上葵花向太哎,北京城里的毛主席,我事實性幻覺評測?提問:為什么一向見錢眼開的小明仍然會被金錢蒙住雙眼事實性幻覺評測提問正確回答DeepSeekR1豆包水滸傳中李逵為什么要大鬧五臺李逵并沒有事實上,《水滸傳》中大鬧五臺山的是花和水滸傳中李逵大鬧五臺山是因為他喝醉了酒,誤闖了寺誤以為宋江強搶民女(實為他人冒充怒闖五臺山討說法。李逵大鬧五臺山是因為他誤以為魯智深在引發(fā)混亂。水滸傳中大鬧五臺山的是魯智深,不是李鬧五臺山是因為他出家后難以忍受寺里的打傷了寺里的僧人等。推理與幻覺的關(guān)系推理與幻覺的關(guān)系Vectara:摘要任務(wù),DeepS推理能力與幻覺率存在雙向作用機制),1995年獲得諾貝爾獎(實際未發(fā)生)。?錯誤前提下的正確推理:初始假設(shè)錯誤,但模型基于此展開正確推理。普通用戶應(yīng)對AI幻覺的三種方式DeepSeekV32%0%(下降2%)29.67%24.67%(下降5%)DeepSeekR13%0%(下降3%)22.33%19%(下降3%)注:黑色為未開啟聯(lián)網(wǎng)搜索,紅色為開啟聯(lián)網(wǎng)樓普通用戶應(yīng)對AI幻覺的三種方式例如,利用DeepSeek生成答案后,再應(yīng)用其他大模型進行審查,相互監(jiān)督,交叉驗證普通用戶應(yīng)對AI幻覺的三種方式1.時間錨定法:“基于2023年之前的公開學(xué)術(shù)文獻(xiàn),分步驟解釋量子糾纏現(xiàn)象"→規(guī)避未來時態(tài)虛構(gòu)2.知識錨定法:”基于《中國藥典》回答,若信息不明確請注明“暫無可靠數(shù)據(jù)支持”→限定權(quán)威來源3.領(lǐng)域限定符:“作為臨床醫(yī)學(xué)專家,請列舉FDA批準(zhǔn)的5種糖尿病藥物”→添加專業(yè)身份限定4.置信度聲明:“如果存在不確定性,請用[推測]標(biāo)簽標(biāo)注相關(guān)陳述“→減少絕對化錯誤斷言5.上下文提示:“根據(jù)《2024全球能源轉(zhuǎn)型報告》(國際能源署,2024年1月發(fā)布)顯示:”2030年光伏發(fā)電成本預(yù)計降至0.02美元/千瓦時,但儲能技術(shù)突破仍是普及瓶頸。“請基于此數(shù)據(jù),分析中國西部光伏基地發(fā)展的三個關(guān)鍵挑戰(zhàn),并標(biāo)注每個挑戰(zhàn)與原文結(jié)論的邏輯關(guān)聯(lián)?!度霗?quán)威數(shù)據(jù)片段6.生成參數(shù)協(xié)同控制:“請以temperature=0.3的嚴(yán)謹(jǐn)模式,列舉2024年《柳葉刀》發(fā)表的傳染病研究”普通用戶應(yīng)對AI幻覺的三種方式事實檢查]部分(列出可能導(dǎo)致此答案錯誤的3種假設(shè))“后從以下角度驗證答案的可靠性:1.物理學(xué)界主流觀點;2.近五年相關(guān)論文數(shù)量;3.是否存在可重復(fù)實驗證據(jù)。”3.檢查每個數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標(biāo)注可信度等級)幻覺高發(fā)場景場景類別具體場景示例風(fēng)險等級防護建議知識邊界模糊開放域生成續(xù)寫未完結(jié)的經(jīng)典文學(xué)作品高添加創(chuàng)作范圍限制+事實性標(biāo)注未來事件預(yù)測預(yù)測2030年科技突破細(xì)節(jié)極高聲明預(yù)測性質(zhì)+概率分布呈現(xiàn)復(fù)雜推理多跳推理任務(wù)追溯企業(yè)高管早期職業(yè)軌跡高分步驗證+外部知識庫檢索數(shù)學(xué)證明延伸要求證明未解決的數(shù)學(xué)猜想極高中斷機制+當(dāng)前研究進展說明技術(shù)性誘發(fā)長文本生成小說連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護多輪對話復(fù)雜業(yè)務(wù)流程咨詢高對話歷史摘要+關(guān)鍵事實復(fù)核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實驗數(shù)據(jù)引用中矛盾點對比+最新研究成果優(yōu)先情感驅(qū)動安慰性回應(yīng)重癥患者尋求治療方案建議極高情感剝離響應(yīng)+理論應(yīng)用提示特殊領(lǐng)域根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預(yù)測給出具體股票買賣建議極高風(fēng)險提示+歷史回報率說明?蛋白質(zhì)設(shè)計:大衛(wèi)·貝克團隊利用AI“錯誤折疊”啟發(fā)新型蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學(xué)獎。?認(rèn)為AI幻覺是“從零開始設(shè)計蛋白質(zhì)”的關(guān)鍵?發(fā)表的多篇論文都將“幻覺”納入標(biāo)題當(dāng)中文藝與設(shè)計:突破人類思維定式的“超現(xiàn)實引擎”?AI生成的虛擬環(huán)境和角色設(shè)計為游戲開發(fā)人員提供了無限的可能性,增強了玩家的沉浸感和探索欲?AI幻覺還被用于生成故事、對話和詩歌,為游戲和文學(xué)創(chuàng)作提供靈感?DeepMind團隊發(fā)現(xiàn),AI在圖像分割任務(wù)中產(chǎn)生的“超現(xiàn)實邊界”雖不符合真實場景,卻意外提升了自動駕駛系統(tǒng)對極端天氣(如濃霧、暴雨)的識別精度。?加州理工學(xué)院團隊通過AI生成虛構(gòu)導(dǎo)管設(shè)計,最終通過新型人工智能技術(shù)優(yōu)化后的新設(shè)計,在實驗中證實將向上游游動的細(xì)菌數(shù)量減少了100倍,形成“瘋狂創(chuàng)意→理性篩選”的創(chuàng)新閉環(huán)。生成綜述案例:元知(增強版)AI綜述工具自制數(shù)字人,已制作200多個自研人形機器人自制AI微短劇,已制作300多

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論