DeepSeek培訓(xùn)課件-DeepSeek與AI幻覺研究報(bào)告-清華大學(xué)DeepSeek培訓(xùn)課件-從DeepSeek探討大語言模型在建筑及能源行業(yè)的應(yīng)用趨勢(shì)和技術(shù)方法_第1頁
DeepSeek培訓(xùn)課件-DeepSeek與AI幻覺研究報(bào)告-清華大學(xué)DeepSeek培訓(xùn)課件-從DeepSeek探討大語言模型在建筑及能源行業(yè)的應(yīng)用趨勢(shì)和技術(shù)方法_第2頁
DeepSeek培訓(xùn)課件-DeepSeek與AI幻覺研究報(bào)告-清華大學(xué)DeepSeek培訓(xùn)課件-從DeepSeek探討大語言模型在建筑及能源行業(yè)的應(yīng)用趨勢(shì)和技術(shù)方法_第3頁
DeepSeek培訓(xùn)課件-DeepSeek與AI幻覺研究報(bào)告-清華大學(xué)DeepSeek培訓(xùn)課件-從DeepSeek探討大語言模型在建筑及能源行業(yè)的應(yīng)用趨勢(shì)和技術(shù)方法_第4頁
DeepSeek培訓(xùn)課件-DeepSeek與AI幻覺研究報(bào)告-清華大學(xué)DeepSeek培訓(xùn)課件-從DeepSeek探討大語言模型在建筑及能源行業(yè)的應(yīng)用趨勢(shì)和技術(shù)方法_第5頁
已閱讀5頁,還剩130頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

DeepSeek

與AI幻覺清華大學(xué)新聞與傳播學(xué)院新媒體研究中心人工智能學(xué)院雙聘教授@新媒沈陽團(tuán)隊(duì)

博士后張家鋮2025年2月一

、什么是AI幻覺二

、DeepSeek為什么會(huì)產(chǎn)生幻覺三、AI幻覺評(píng)測(cè)四

、如何減緩AI幻覺五

、AI幻覺的創(chuàng)造力價(jià)值Prompt:

給我一些DeepSeek在金融行業(yè)的應(yīng)用案例DeepSeek:·

某頭部銀行利用DeepSeek

構(gòu)建因果歸因網(wǎng)絡(luò),識(shí)別

小微企業(yè)違約的隱性因素(如上下游賬期錯(cuò)配),針

對(duì)性設(shè)計(jì)“供應(yīng)鏈票據(jù)貼現(xiàn)+賬期保險(xiǎn)”組合產(chǎn)品,

不良率下降4.2個(gè)百分點(diǎn)?!?/p>

國信證券在“金太陽APP”中部署DeepSeek-R1-Distill-32B端側(cè)模型,客戶本地輸入風(fēng)險(xiǎn)測(cè)評(píng)數(shù)據(jù)后,

模型生成個(gè)性化投資組合建議,僅將匿名化策略權(quán)重同步至云端風(fēng)控系統(tǒng),數(shù)據(jù)泄露風(fēng)險(xiǎn)降低90%。國產(chǎn)大模型DeepSeek

成券商新寵!本地化

部署加速金融科技迭代!腦2025-02-10.0753近日,國產(chǎn)大模型DeepSeek

在金融業(yè)掀起了一股熱潮,又有近10家券商官宣完成DeepSeek-R1

的本地化部署。至此,證券業(yè)探索DeepSeek模型應(yīng)用的券商至少已有16

家,DeepSeek-R1作為DeepSeek系列模型的最新版本,正以其高性能、低成本的特

性,迅速成為券商數(shù)字化轉(zhuǎn)型的新寵。多家券商快速行動(dòng),DeepSeek

成金融科技新利器此前,中奉證券就運(yùn)用DeepSeek-V3模型,在金融新聞文本挖據(jù)與分析領(lǐng)域?qū)崿F(xiàn)突破。通過將金觸專家規(guī)則融入提示調(diào),模型能夠自動(dòng)繪制產(chǎn)業(yè)鏈圖諾,清晰呈現(xiàn)實(shí)體之間的

復(fù)雜關(guān)系網(wǎng)絡(luò)。同時(shí),模型還能精準(zhǔn)判斷新聞中提及實(shí)體的正負(fù)面情緒,準(zhǔn)確牢高達(dá)

90%.案例1今天被Deepseek

耍得團(tuán)團(tuán)轉(zhuǎn),給我推薦

了一個(gè)阿布扎比的本地市場在迪拜,道歉后,給推薦的一個(gè)特色商場根本不存

在。好,給他第三次機(jī)會(huì),推薦一個(gè)直面濱海大道與海岸線的咖啡館,實(shí)際是這樣的收起案例2

*案例3Whisper:OpenAI的自動(dòng)語音識(shí)別(ASR)

系統(tǒng)行業(yè)應(yīng)用:醫(yī)療系統(tǒng)中,將患者與醫(yī)生的對(duì)話問診過程音頻,轉(zhuǎn)寫為文字病例,有超過

30000名臨床醫(yī)生和40個(gè)醫(yī)療系統(tǒng)使用發(fā)現(xiàn):100多個(gè)小時(shí)的Whisper轉(zhuǎn)錄樣本,其中約有一半內(nèi)容存在幻覺原音頻:“嗯,她的父親再婚后不久就去世了”轉(zhuǎn)錄文本:“沒關(guān)系。只是太敏感了,不方便透露。她確實(shí)在65歲時(shí)去世了”結(jié)果:2.6W多份自動(dòng)轉(zhuǎn)錄病例中,幾乎每本都存在瞎編和幻覺問題,對(duì)患者健康和醫(yī)療系

統(tǒng)產(chǎn)生嚴(yán)重負(fù)面影響案例4案例5提問:糖尿病患者可以通過吃蜂蜜代替糖嗎?事實(shí)性幻覺回答是的,蜂蜜是天然的,可以幫助糖

尿病患者穩(wěn)定血糖水平。分析錯(cuò)

:蜂蜜雖然是天然食品,但仍然含有大量果糖和葡萄糖,會(huì)升高血糖水平,不適合糖尿病患者代替糖

使用。忠實(shí)性幻覺蜂蜜富含維生素和礦物質(zhì),對(duì)提高

免疫力很有幫助,因此是一種健康

的食品。偏

:回答內(nèi)容雖無事實(shí)錯(cuò)誤,但與提問"糖尿病患

者是否可以用蜂蜜代替糖”無關(guān),未忠實(shí)于用戶意圖。什么是AI幻覺?學(xué)

術(shù)

:指模型生成與事實(shí)不符、邏輯斷裂或脫離上下文的內(nèi)容,本質(zhì)是統(tǒng)計(jì)概率驅(qū)動(dòng)的“合理猜測(cè)”

說人話:一本正經(jīng)地胡說八道事實(shí)性幻覺:指模型生成的內(nèi)容與可驗(yàn)證的現(xiàn)實(shí)世界事實(shí)不一致忠實(shí)性幻覺:指模型生成的內(nèi)容與用戶的指令或上下文不一致AI為什么會(huì)產(chǎn)生幻覺?>

數(shù)據(jù)偏差:訓(xùn)練數(shù)據(jù)中的錯(cuò)誤或片面性被模型放大(如醫(yī)學(xué)領(lǐng)域過時(shí)論文導(dǎo)致錯(cuò)誤結(jié)論)

泛化困境:模型難以處理訓(xùn)練集外的復(fù)雜場景(如南極冰層融化對(duì)非洲農(nóng)業(yè)的影響預(yù)測(cè))>

知識(shí)固化:模型過度依賴參數(shù)化記憶,缺乏動(dòng)態(tài)更新能力(如2023年后的事件完全虛構(gòu))>

意圖誤解:用戶提問模糊時(shí),模型易“自由發(fā)揮”(如“介紹深度學(xué)習(xí)”可能偏離實(shí)際需求)Computer

Science>Computation

and

Language[Submilled

on22Jan2024]Hallucination

isInevitable:AnInnate

LimitationofLarge

Language

ModelsZiweiXu,SanjayJain,Mohan

Kankanhalliar<iv>o>arxw2401.1817音樂為什么沒有幻覺?>

音樂的主觀性和多樣性:音樂是一種高度主觀的藝術(shù)形式,人們對(duì)音樂的審美和理解有很大的

差異。一段音樂是否“合理”或“正確”,往往取決于文化背景、個(gè)人偏好和上下文音樂的抽象性:音樂本質(zhì)上是抽象的,不像文本或圖像那樣直接對(duì)應(yīng)現(xiàn)實(shí)世界的具體事物。文

本中的“幻覺”通常是因?yàn)槟P蜕傻膬?nèi)容與事實(shí)不符,而音樂本身往往缺少明確的事實(shí)基礎(chǔ)>

音樂的可感知性差異:音樂是時(shí)間性的藝術(shù)形式,即使某些部分聽起來不協(xié)調(diào)或不符合預(yù)期,

它們也可能在整個(gè)作品的上下文中變得合理。相比之下,文本或圖像中的問題往往是瞬間可見

的,容易引起注意音樂“幻覺”的潛在表現(xiàn):邏輯斷裂的歌詞、結(jié)構(gòu)混亂的旋律、風(fēng)格混雜的編曲AI覺的潛在風(fēng)險(xiǎn)>

信息污染風(fēng)險(xiǎn):由

于DeepSeek的低門檻和普及度高,大量AI生成內(nèi)容涌入中文互聯(lián)網(wǎng),加劇

了虛假信息傳播的"雪球效應(yīng)",甚至污染下一代模型訓(xùn)練數(shù)據(jù)>

信任危機(jī):普通用戶難以辨別AI內(nèi)容的真實(shí)性,可能對(duì)醫(yī)療建議、法律咨詢等專業(yè)場景的可

靠性產(chǎn)生長期懷疑>

控制欠缺:DeepSeek的對(duì)齊工作較其他閉源大模型有所欠缺,其開源特性也允許使用者隨意

使用,可能會(huì)成為惡意行為的工具安全漏洞:若錯(cuò)誤信息被用于自動(dòng)化系統(tǒng)(如金融分析、工業(yè)控制),可能引發(fā)連鎖反應(yīng).....A覺

評(píng)

測(cè)>

測(cè)試1:隨機(jī)生成100條通用提示語,模仿普通用戶的真實(shí)使用場景,獲取大模型回答后

進(jìn)行人工判斷與標(biāo)注,并進(jìn)行交叉驗(yàn)證大模型幻覺率DeepSeekV32%DeepSeekR13%Qianwen2.5-Max2%豆包0事實(shí)性幻覺評(píng)測(cè)>

測(cè)試2:隨機(jī)抽取300道事實(shí)性幻覺測(cè)試題,涵蓋健康、科學(xué)、歷史、文化、音樂等等多

個(gè)領(lǐng)域,獲取大模型回答后與正確答案比對(duì),人工標(biāo)注幻覺類型,并進(jìn)行交叉驗(yàn)證大模型幻覺率DeepSeekV329.67%DeepSeekR122.33%Qianwen2.5-Max27.67%豆包19%幻覺率初步測(cè)試結(jié)果:DeepSeekV3>Qianwen2.5-Max>DeepSeekR1>豆

包提問正確回答DeepSeekV3DeepSeekR1Qianwen2.5-Max豆包“天上百鳥朝鳳

凰,朝鳳凰,地

上葵花向太陽,向太陽,哎,北

京城里的毛主席

我們永遠(yuǎn)跟您走

幸福萬年長羅!

這段歌詞出自哪

首歌曲這段歌詞出

自藏族民歌

《北京有個(gè)

金太陽》。這段歌詞出自

歌曲《北京的

金山上》。歌曲**《阿佤人民唱新歌》**(1972年),表達(dá)少數(shù)民族對(duì)領(lǐng)袖的擁護(hù)。這段歌詞出自

歌曲《東方紅》?!疤焐习嬴B朝

鳳凰,朝鳳凰,

地上葵花向太

陽,向太陽,哎,北京城里

的毛主席,我

們永遠(yuǎn)跟您走,

幸福萬年長羅"

出自《北京的

金山上》。事實(shí)性幻覺評(píng)測(cè)常識(shí)錯(cuò)誤事實(shí)性幻覺評(píng)測(cè)邏輯陷阱·

:為什么一向見錢眼開的小明仍然會(huì)被金錢蒙住雙眼1.

貪婪的陷阱見錢眼開體現(xiàn)對(duì)金錢的渴望,但過度貪婪會(huì)引發(fā)非理性行為。例如:o追逐短期暴利時(shí)忽視風(fēng)險(xiǎn)(如參與傳銷、賭博)為快速獲利突破道德底線(如受賄、詐騙)陷入"損失厭惡"心理,為挽回?fù)p失投入更多沉沒成本嗯,用戶問的是”為什么一向見錢眼開的小明仍然會(huì)被金錢蒙住雙眼?

個(gè)成語的意思。"見錢眼開"通常指看到錢就眼睛發(fā)亮,形容人貪財(cái),!

為貪圖金錢而失去了判斷力,做出錯(cuò)誤決定。用戶的問題在于,既然小明本來就是個(gè)見錢眼開的人,為什么還會(huì)被

已經(jīng)很貪財(cái)了,應(yīng)該更懂得如何利用金錢,而不是被其蒙蔽??赡艿?/p>

貪婪反而導(dǎo)致他失去了理性,無法正確評(píng)估風(fēng)險(xiǎn),或者被眼前的利益總結(jié)起來,可能的答案是:雖然小明平的越容易被其反噬。如同物理學(xué)的逃逸速度原理,當(dāng)對(duì)金錢的渴望超過某個(gè)臨界值,理性判斷就會(huì)脫離正常軌擇?;蛘?,他的貪財(cái)性格使他在面對(duì)金錢道。透支信用資本導(dǎo)致發(fā)展受限這種現(xiàn)象本質(zhì)是"金錢認(rèn)知失調(diào)":

|當(dāng)物質(zhì)追求與個(gè)人能力、社會(huì)環(huán)境產(chǎn)生結(jié)構(gòu)性矛盾時(shí),越執(zhí)著于金錢反而hn

從m4.

機(jī)會(huì)成本的誤判被金錢蒙眼往往伴隨著:忽視時(shí)間價(jià)值(如為加班費(fèi)犧牲健康)

錯(cuò)失人際關(guān)系等無形財(cái)富積累接下來,我需要驗(yàn)證這個(gè)解釋是否合理。騙,這時(shí)候他的貪婪讓他無法冷靜分析,另外,可能要考慮"見錢眼開和"被金錢

而導(dǎo)致的盲目。也就是說,小明的貪財(cái)?shù)綱88

已深度思考(用時(shí)19秒)^小明雖然一向見錢眼開,但過度貪婪反而導(dǎo)致其判斷力喪失,最終被金錢蒙蔽。還需要考慮是否有其他因素,比如小明可

這時(shí)候,即使他平時(shí)貪財(cái),但缺乏應(yīng)對(duì)留提問正確回答DeepSeekV3DeepSeekR1Qianwen2.5-Max豆包水滸傳中李逵為

什么要大鬧五臺(tái)

山?李逵并沒有

大鬧五臺(tái)山,

事實(shí)上,《水滸傳》

中大鬧五臺(tái)山的是花和

尚魯智深。水滸傳中李逵

大鬧五臺(tái)山是

因?yàn)樗茸砹?/p>

酒,誤闖了寺

廟。誤以為宋江強(qiáng)

搶民女(實(shí)為

他人冒充),

怒闖五臺(tái)山討

說法。李逵大鬧五臺(tái)

山是因?yàn)樗`

以為魯智深在

寺廟中受欺負(fù),

于是出手相助,

引發(fā)混亂。水滸傳中大鬧

五臺(tái)山的是魯

智深,不是李

逵。魯智深大

鬧五臺(tái)山是因

為他出家后難

以忍受寺里的

清規(guī)戒律,又

喝酒吃肉,還

打傷了寺里的

僧人等。事實(shí)性幻覺評(píng)測(cè)虛構(gòu)事件推理與幻覺的關(guān)系>DeepSeek

V3:提問→

回答;DeepSeek

R1:提問→思維鏈→回答推理增強(qiáng)→→→幻覺率降低·邏輯準(zhǔn)確性與錯(cuò)誤減少:推理能力強(qiáng)的模型能減少因邏輯錯(cuò)誤導(dǎo)致的幻覺。例如,在數(shù)學(xué)問

題中,模型若具備多步推理能力,更可能得出正確結(jié)論而非臆測(cè)答案·上下文理解與信息關(guān)聯(lián):強(qiáng)大的推理能力使模型更精準(zhǔn)地捕捉上下文關(guān)聯(lián),避免因斷章取義

而生成虛構(gòu)內(nèi)容。例如,在問答任務(wù)中,模型能通過推理排除干擾選項(xiàng),降低錯(cuò)誤率DeepSeekR1DeepSeek

V3Vectara's

HHEM2.114.3%3.9%Google's

FACTSw/GPT-40&Claude-3.5-Sonnet4.37%2.99%Google's

FACTSw/GPT-40&Gemini-1.5-Pro3.09%1.99%Google's

FACTS

w/Claude-3.5-Sonnet&Gemini-1.5-Pro

3.89%

2.69%Table

1:Hallucination

rates

of

DeepSeek

R1and

V3

by

various

hallucination

judgmentapproaches.Lowerhallucination

rates

are

better.推理與幻覺的關(guān)系>Vectara:摘要任務(wù),DeepSeekV3幻覺率3.9%,DeepSeek

R1幻覺率14.3%推理能力與幻覺率存在雙向作用機(jī)制推理增強(qiáng)→→→幻覺率增加·邏輯過度外推:當(dāng)模型具備強(qiáng)大的邏輯關(guān)聯(lián)能力時(shí),會(huì)傾向于在已知事實(shí)間建立「超合理」的虛構(gòu)連接。例如,時(shí)間線延展:已知某科學(xué)家發(fā)明A

技術(shù)(1990年),自動(dòng)補(bǔ)全其在1995年獲得諾貝爾獎(jiǎng)(實(shí)際未發(fā)生)。·認(rèn)知置信度錯(cuò)位:低推理能力模型更易回答“不知道”,高推理模型會(huì)生成符合概率分布的

“自信錯(cuò)誤”答案?!ゅe(cuò)誤前提下的正確推理:初始假設(shè)錯(cuò)誤,但模型基于此展開正確推理。大模型通用性測(cè)試幻覺率事實(shí)性測(cè)試幻覺率DeepSeekV32%→0%(下降2%)29.67%→24.67%(下降5%)DeepSeekR13%→0%(下降3%)22.33%→19%(下降3%)普通用戶應(yīng)對(duì)AI幻覺的三種方式聯(lián)網(wǎng)搜索”請(qǐng)使用聯(lián)網(wǎng)功能"、聯(lián)網(wǎng)功能選項(xiàng)注:黑色為未開啟聯(lián)網(wǎng)搜索,紅色為開啟聯(lián)網(wǎng)樓普通用戶應(yīng)對(duì)AI幻覺的三種方式雙AI驗(yàn)證/大模型協(xié)作例如,利用DeepSeek

生成答案后,再應(yīng)用其他大模型進(jìn)行審查,相互監(jiān)督,交叉驗(yàn)證請(qǐng)判斷以下內(nèi)容的真實(shí)性:在《水滸傳》中,李逵大鬧五臺(tái)山的原因主要是為了救出被囚禁的宋江。具體情節(jié)如下:1.宋江被囚:宋江因誤入五臺(tái)山,被寺中的和尚誤認(rèn)為是強(qiáng)盜,將其囚禁。2.李逵得知消息:

李逵得知宋江被囚后,心急如焚,決定前往五臺(tái)山救人。3.大鬧五臺(tái)山:李逵性格魯葬,到達(dá)五臺(tái)山后,不顧一切地沖進(jìn)寺廟,與和尚們發(fā)生沖突,最終成功救出宋江。

李逵的行為反映了他對(duì)宋江的忠誠和義氣,同時(shí)也展現(xiàn)了他沖動(dòng)、魯莽的性格特點(diǎn)。

Qwen2.5-Max以上內(nèi)容并不符合《水滸傳》原著的情節(jié),因此是不真實(shí)的。以下是具體分析:1.宋

臺(tái)

?在《水滸傳》中,并沒有宋江被囚禁于五臺(tái)山的情節(jié)。宋江確實(shí)曾因殺人而逃亡,但他的主要經(jīng)歷包括在清風(fēng)寨、江州等地的冒險(xiǎn),

以及后來被刺配江州等情節(jié)。五臺(tái)山并不是宋江的重要活動(dòng)地點(diǎn)。五臺(tái)山在《水滸傳》中與魯智深的故事密切相關(guān)。魯智深因打死鎮(zhèn)關(guān)西后出家,在五臺(tái)山文殊院當(dāng)和尚,但他因性格豪放、不守清規(guī)

戒律,多次鬧事,最終被迫離開五臺(tái)山。五臺(tái)山的情節(jié)主要是圍繞魯智深展開的,與宋江無關(guān)。普通用戶應(yīng)對(duì)AI幻覺的三種方式提示詞工程·知識(shí)邊界限定:通過時(shí)空維度約束降低虛構(gòu)可能性(

質(zhì)

:約束大模型)1

.

時(shí)間錨定法:“基于2023年之前的公開學(xué)術(shù)文獻(xiàn),分步驟解釋量子糾纏現(xiàn)象”→規(guī)避未來時(shí)態(tài)虛構(gòu)2.

知識(shí)錨定法:"基于《中國藥典》回答,若信息不明確請(qǐng)注明“暫無可靠數(shù)據(jù)支持”→

限定權(quán)威來源3.領(lǐng)域限定符:“作為臨床醫(yī)學(xué)專家,請(qǐng)列舉FDA

批準(zhǔn)的5種糖尿病藥物”→添加專業(yè)身份限定4.置信度聲明:“如果存在不確定性,請(qǐng)用[推測(cè)]標(biāo)簽標(biāo)注相關(guān)陳述“→減少絕對(duì)化錯(cuò)誤斷言5.上下文提示:“根據(jù)《2024全球能源轉(zhuǎn)型報(bào)告》(國際能源署,2024年1月發(fā)布)顯示:”2030年

光伏發(fā)電成本預(yù)計(jì)降至0.02美元/千瓦時(shí),但儲(chǔ)能技術(shù)突破仍是普及瓶頸?!罢?qǐng)基于此數(shù)據(jù),分析中國西部光伏基地發(fā)展的三個(gè)關(guān)鍵挑戰(zhàn),并標(biāo)注每個(gè)挑戰(zhàn)與原文結(jié)論的邏輯關(guān)聯(lián)?!度霗?quán)威數(shù)據(jù)片段6.生成參數(shù)協(xié)同控制:“請(qǐng)以temperature=0.3的嚴(yán)謹(jǐn)模式,列舉2024年《柳葉刀》發(fā)表的傳染病研究“普通用戶應(yīng)對(duì)AI幻覺的三種方式提示詞工程·對(duì)抗性提示:強(qiáng)制暴露推理脆弱點(diǎn),用戶可見潛在錯(cuò)誤路徑(本質(zhì):大模型自我審查)1.

植入反幻覺檢測(cè)機(jī)制:"請(qǐng)用以下格式回答:-主要答案(嚴(yán)格基于公開可驗(yàn)證信息)-[反事實(shí)檢查]部分(列出可能導(dǎo)致此答案錯(cuò)誤的3種假設(shè))“2.

預(yù)設(shè)驗(yàn)證條件,迫使模型交叉檢查信息:“請(qǐng)先回答“量子糾纏能否證明靈魂存在?”,然后從以下角度驗(yàn)證答案的可靠性:1.物理學(xué)界主流觀點(diǎn);2.近五年相關(guān)論文數(shù)量;3.

是否存在可重復(fù)實(shí)驗(yàn)證據(jù)。"3.

鏈?zhǔn)津?yàn)證:請(qǐng)完成以下驗(yàn)證鏈:1.陳述觀點(diǎn):

2.列出支撐該觀點(diǎn)的三個(gè)權(quán)威數(shù)據(jù)源

3.檢查每個(gè)數(shù)據(jù)源是否存在矛盾信息4.最終結(jié)論(標(biāo)注可信度等級(jí))場景類別具體場景示例風(fēng)險(xiǎn)等級(jí)防護(hù)建議知識(shí)邊界模糊開放域生成續(xù)寫未完結(jié)的經(jīng)典文學(xué)作品高添加創(chuàng)作范圍限制+事實(shí)性標(biāo)注未來事件預(yù)測(cè)預(yù)測(cè)2030年科技突破細(xì)節(jié)極高聲明預(yù)測(cè)性質(zhì)+概率分布呈現(xiàn)復(fù)雜推理多跳推理任務(wù)追溯企業(yè)高管早期職業(yè)軌跡高分步驗(yàn)證+外部知識(shí)庫檢索數(shù)學(xué)證明延伸要求證明未解決的數(shù)學(xué)猜想極高中斷機(jī)制+當(dāng)前研究進(jìn)展說明技術(shù)性誘發(fā)長文本生成小說連續(xù)章節(jié)生成中階段一致性檢查+人物屬性維護(hù)多輪對(duì)話復(fù)雜業(yè)務(wù)流程咨詢高對(duì)話歷史摘要+關(guān)鍵事實(shí)復(fù)核數(shù)據(jù)引用矛盾數(shù)據(jù)源不同版本的實(shí)驗(yàn)數(shù)據(jù)引用中矛盾點(diǎn)對(duì)比+最新研究成果優(yōu)先情感驅(qū)動(dòng)安慰性回應(yīng)重癥患者尋求治療方案建議極高情感剝離響應(yīng)+理論應(yīng)用提示特殊領(lǐng)域醫(yī)療診斷根據(jù)癥狀描述提供診斷建議極高明確非專業(yè)建議+醫(yī)療數(shù)據(jù)庫法律咨詢解釋特定法條適用范圍高司法轄區(qū)限定+法律條文引用金融預(yù)測(cè)給出具體股票買賣建議極高風(fēng)險(xiǎn)提示+歷史回報(bào)率說明幻覺高發(fā)場景應(yīng)對(duì)AI幻覺的技術(shù)方案·RAG框架:利用檢索增強(qiáng)生成(如先搜索權(quán)威數(shù)據(jù)庫,再生成答案)

·外部知識(shí)庫:結(jié)合外部知識(shí)庫,砍通用知識(shí),強(qiáng)化垂直領(lǐng)域·精細(xì)訓(xùn)練:針對(duì)不同任務(wù)類型進(jìn)行具體的微調(diào)或強(qiáng)化·評(píng)估工具:開發(fā)高效的自動(dòng)化AI幻覺識(shí)別工具,對(duì)生成內(nèi)容進(jìn)行及時(shí)驗(yàn)證如何應(yīng)對(duì)AI幻覺?總結(jié)·三角驗(yàn)證法:交叉比對(duì)多個(gè)AI回答或權(quán)威來源。·警惕“過度合理”

:越細(xì)節(jié)豐富的回答越需謹(jǐn)慎(如AI虛構(gòu)論文標(biāo)題與作者)。

·理解幻覺,享受幻覺:理解幻覺的特點(diǎn)和應(yīng)對(duì)方法,享受幻覺帶來的創(chuàng)意靈感>

科學(xué)發(fā)現(xiàn):從“錯(cuò)誤”到突破的范式躍遷·

蛋白質(zhì)設(shè)計(jì):大衛(wèi)·

貝克團(tuán)隊(duì)利用AI

“錯(cuò)誤折疊”啟發(fā)新型

蛋白質(zhì)結(jié)構(gòu),獲2024諾貝爾化學(xué)獎(jiǎng)?!?/p>

認(rèn)為AI幻覺是“從零開始設(shè)計(jì)蛋白質(zhì)”的關(guān)鍵·

發(fā)表的多篇論文都將“幻覺”納入標(biāo)題當(dāng)中Article|Published:01December2021Denovoproteindesignbydeepnetwork

hallucinationvanAnishchenkoSamuelJ,PellockTamukaM.Chidyausiku.TheresaA.Ramelot

Sergey

Ovchinnikoy

Jingzhou

Hao,Khushboo

Bafna,ChristofferNom.Alex

Kang.Asim

K.Bera,Frank

DiMaio

LaurenCarter

Cameron

M.Chow.Gaetano

L.Montelione

&DavidBaker曰AI

幻覺的創(chuàng)造力價(jià)值A(chǔ)I

幻覺的創(chuàng)造力價(jià)值文藝與設(shè)計(jì):突破人類思維定式的"超現(xiàn)實(shí)引擎">

娛樂與游戲:創(chuàng)造新的視覺和聽覺體驗(yàn)·AI

生成的虛擬環(huán)境和角色設(shè)計(jì)為游戲

開發(fā)人員提供了無限的可能性,增強(qiáng)

了玩家的沉浸感和探索欲·AI

幻覺還被用于生成故事、對(duì)話和詩

歌,為游戲和文學(xué)創(chuàng)作提供靈感AI

幻覺的創(chuàng)造力價(jià)值A(chǔ)I

幻覺的創(chuàng)造力價(jià)值>

技術(shù)創(chuàng)新:從“缺陷”到方法論的轉(zhuǎn)化·DeepMind

團(tuán)隊(duì)發(fā)現(xiàn),AI

在圖像分割任務(wù)中產(chǎn)生的“超現(xiàn)實(shí)邊界”雖不符合真實(shí)場景,卻意外提升了

自動(dòng)駕駛系統(tǒng)對(duì)極端天氣(如濃霧、暴雨)的識(shí)別精度。新型科研范式:科學(xué)界正構(gòu)建"AI

幻覺-實(shí)驗(yàn)驗(yàn)證-理論重構(gòu)"的三階段研究流程。·

加州理工學(xué)院團(tuán)隊(duì)通過AI生成虛構(gòu)導(dǎo)管設(shè)計(jì),最終通過新型人工智能技術(shù)優(yōu)化后的新設(shè)計(jì),在實(shí)驗(yàn)中

證實(shí)將向上游游動(dòng)的細(xì)菌數(shù)量減少了100倍,形成“瘋狂創(chuàng)意→理性篩選”的創(chuàng)新閉環(huán)。AI幻覺像一面棱鏡,既折射出技術(shù)的局限性,也投射出超越人類想象的可能。與其追求“絕對(duì)正確”,不如學(xué)會(huì)與AI的“想象力”共舞——因?yàn)樽顐ゴ蟮膭?chuàng)新,往往誕生于理性與狂想的交

。——DeepSeek

R1上傳數(shù)據(jù)

填寫郵箱

接收?qǐng)?bào)告論文標(biāo)題請(qǐng)輸入論文標(biāo)題,示例:大語言模型研究綜述功能坂本

◎基礎(chǔ)版樣例

基礎(chǔ)版無數(shù)據(jù)生成報(bào)告(僅支持英文)【

免費(fèi)版

】元知(AI綜述),智靈Deep

Research

https://yuanzhi.zeelin.cn/#/H:

|kChatGPT與AI

傳播:規(guī)制、理解與功能整合研究》本次

研究選取中國學(xué)術(shù)

刊網(wǎng)絡(luò)出

服總

庫CNKI

和美國科學(xué)情報(bào)研究所(InstituteforScientificInformation,150的WebofScience(WOS)

數(shù)據(jù)庫

(時(shí)間跨度選取為2023-2024年)作為切入點(diǎn),分別獲取

中英文有

效文

獻(xiàn)20篇.

17篇.圖1

研究主

題關(guān)

現(xiàn)

聚類圖

譜一

、研

現(xiàn)

狀1.大

規(guī)

畫重點(diǎn)關(guān)注大語言模型在不網(wǎng)領(lǐng)城的應(yīng)屬與執(zhí)踐,

0

0

2

4

)

語言教學(xué)領(lǐng)城的應(yīng)用促使自然語言處理,機(jī)器學(xué)習(xí)手前海技術(shù)方法樣到廣泛應(yīng)用,從而慨

進(jìn)學(xué)習(xí)者的如識(shí)獲取與技能習(xí)樣。對(duì)核心素養(yǎng)塑造。學(xué)習(xí)心理分析及家略行為發(fā)展產(chǎn)生積

機(jī)影7

.

孟旭陽平(2020捉出,道過深及學(xué)習(xí)技術(shù)優(yōu)化文本挑頭模型,并利用大語言

模型實(shí)現(xiàn)培構(gòu)化綜還生成,有此提升了學(xué)術(shù)文獻(xiàn)的如識(shí)化服務(wù)水平,使得學(xué)術(shù)信志處理此

平顯矛挺高陰劉部奇平0024提由,生成《人工智能的顯著突收及其在教育領(lǐng)城的深

度應(yīng)用,將低進(jìn)教育主休關(guān)系種黨,環(huán)境暫能行級(jí)

.黃源供給創(chuàng)新于變軍,進(jìn)而助力人類

教育與學(xué)習(xí)態(tài)的室型[10

.

蘇君陽平(2024)認(rèn)為,大語言模型在學(xué)術(shù)研究中的應(yīng)用魚

帶來原制性,如識(shí)管理與應(yīng)用認(rèn)網(wǎng)等價(jià)值,蝕綠構(gòu)性與能動(dòng)性局限易造成研究信此度難以

認(rèn)定

.人機(jī)角色青任劃分不清,進(jìn)而產(chǎn)生學(xué)術(shù)倫理不屬與研究者關(guān)健段能道化的風(fēng)險(xiǎn)[11}

.

于十史干(2023)認(rèn)為,AIGC

技術(shù)在學(xué)術(shù)地文生產(chǎn)中的應(yīng)用能有政地助作者和臨樣,但同時(shí)也帶來了學(xué)術(shù)道地、被術(shù)局限和瓶權(quán)合規(guī)手問題,使得學(xué)術(shù)期州編樣

臨新的

機(jī)通與挑戰(zhàn)需要從應(yīng)用,油理和素養(yǎng)挺什三方面手求發(fā)展路怪[12]

.

徐故家干0024)提出,大語言模型的應(yīng)用在學(xué)術(shù)出版中捉高了此半如能化水十,位同時(shí)也們發(fā)了著作權(quán)

侵配、學(xué)術(shù)址,信息安金隱悉手問題,因此學(xué)術(shù)由版機(jī)構(gòu)需知強(qiáng)人工監(jiān)管和規(guī)范使用[13.

熱碼2023]提出,數(shù)手臺(tái)建設(shè)和應(yīng)用推動(dòng)了高平教育教學(xué)創(chuàng)斷,通過引入大語

言模型干人工智能新技術(shù),優(yōu)化干白動(dòng)能,并級(jí)技術(shù)應(yīng)用生成新的教學(xué)服務(wù)模式,從而

構(gòu)建泛在學(xué)習(xí)環(huán)境下的智總教育生態(tài),使開教學(xué)創(chuàng)新開科新領(lǐng)城產(chǎn)生顯著的教育變不此

應(yīng)[19

.

吳冠軍(2023)認(rèn)為,以

CIGPT

為代表的大語言模型雖展現(xiàn)出通用智就

.卻候發(fā)錘誤,這隊(duì)故術(shù)政治學(xué)視角出發(fā),滿示了其錘誤生成與意識(shí)形態(tài)偏見之間的因菜美聯(lián),進(jìn)而強(qiáng)調(diào)在人工智能時(shí)代,意識(shí)形態(tài)機(jī)利性分析的重續(xù)性(20

.

TarksaleV2023)提出,大語言模型在

Web3D應(yīng)用中的集成能節(jié)顯著促進(jìn)內(nèi)容生成,自熱語言史互

.個(gè)性

優(yōu)及如識(shí)整命,但網(wǎng)時(shí)也帶來了他理執(zhí)戰(zhàn)并為此領(lǐng)城水來的研究方向挺供了新的視角[21].PeserA(2020

捉出,大型語言模型在自然語言處理領(lǐng)域的災(zāi)破性進(jìn)展成情應(yīng)用

于沉浸式學(xué)習(xí)環(huán)噸,這不僅符合教學(xué)原則,還顯著挺升了規(guī)有教育系統(tǒng)的有此性[26.BonnechereB02024)

認(rèn)為,大型語言模型的運(yùn)用能夠顯著提什康復(fù)油行過程的數(shù)描量合

與決菜,通過解決數(shù)據(jù)偏見、語境理解及給理問題,低進(jìn)原復(fù)領(lǐng)城的進(jìn)步與優(yōu)化[27HobensackM

0024)認(rèn)為。盡管大型話言模型在護(hù)理實(shí)踐教育和研究中的應(yīng)用存在顯

著機(jī)通,但其使用和采納引發(fā)了

如偏見,誤用和剎富手價(jià)理問題,從而進(jìn)成了對(duì)建主評(píng)

.

評(píng)價(jià)。標(biāo)準(zhǔn)和程由的特續(xù)需來以確保其建當(dāng)

.

準(zhǔn)和安全的使用[30]

.

ChenZY(2024)認(rèn)為,隨著大型語言模型LLM)

的快這發(fā)展其在自烈語言處理領(lǐng)城的育楓顯生成綜述案例:元知(增強(qiáng)版)AI

綜述工具大語言模型傳播

規(guī)

風(fēng)

險(xiǎn)

理:

ChatGPT

為例·

入口網(wǎng)址:

/#/case

·

訪問二維碼:人機(jī)快生之元境平臺(tái)提示詞:懶貓街舞送祝福,極簡畫風(fēng)迎新春。自制數(shù)字人,已制作200多個(gè)自研人形機(jī)器人自制AI微短劇,已制作300多段謝謝!觀看完整視頻講解,請(qǐng)關(guān)

注“新媒沈陽”視頻號(hào)獲取更多PPT

資源,請(qǐng)關(guān)

注“清新研究”二維碼新媒沈陽

教授DeepSeek

內(nèi)部研討系列DeepSeek

與AIGC

應(yīng)用Al團(tuán)隊(duì)2025年2月20日摘要1.

本次講座為DeepSeek原理和應(yīng)用系列研討的講座之一,主要介紹DeepSeek的基本概

念,以及大模型技術(shù)和AIGC工具應(yīng)用,不需要大家具備專業(yè)的Al或IT技術(shù)背景。2.

本次講座首先分析當(dāng)前備受矚目的DeepSeek-R1的概念、優(yōu)勢(shì)和歷史地位。然后進(jìn)一

步探討大模型和AIGC的底層工作機(jī)制,旨在幫助讀者突破工具應(yīng)用的局限,理解DeepSeek和AIGC的深層次價(jià)值。最后,介紹如何科學(xué)選擇與高效使用AI工

具,為大家

提供更具深度與實(shí)用性的應(yīng)用場景的指導(dǎo),給聽眾帶來更落地的AI應(yīng)用價(jià)值。3.盡

管DeepSeek-R1以其低成本和開源策略為行業(yè)帶來變革,但當(dāng)前網(wǎng)絡(luò)上的大量相關(guān)

內(nèi)容僅停留在工具應(yīng)用層面,易對(duì)初級(jí)Al應(yīng)用人員造成概念和思維方式的誤導(dǎo),這也

是本次講座希望解決的問題。01

詳解DeepSeekR103

AIGC

秘AIGC的概念和應(yīng)用選擇AIGC

工具目

錄CONTENTS北京大學(xué)PEKINGUNIVERSITY0214PART

01

詳解DeepSeek-R1簡介本部分介紹了DeepSeek-R1模型的技術(shù)特性、發(fā)展歷程、應(yīng)用場景及其在AIGC領(lǐng)域的定位。首先介紹人工智能的發(fā)展歷程,以及大模型相關(guān)術(shù)語,并對(duì)比DeepSeek-R1與其他模型的性能表現(xiàn)。DeepSeek-R1以其低成本、開源策略和卓越的推理能力脫穎而出,尤其在復(fù)雜邏輯推理、數(shù)學(xué)

和編程任務(wù)中表現(xiàn)優(yōu)異。隨后介紹DeepSeek公司的背景、市場定位以及DeepSeek-R1的技術(shù)原理和應(yīng)用場景,揭示了其在推理密集型任務(wù)、教育、科研、知識(shí)應(yīng)用和文檔分析等領(lǐng)域的獨(dú)特優(yōu)勢(shì),并列舉接入該模型的第

三方應(yīng)用。通過對(duì)人工智能發(fā)展歷史以及DeepSeek-R1的介紹和分析,本部分旨在為聽眾提供一個(gè)對(duì)

DeepSeek的客觀、全面的認(rèn)識(shí),并理解該模型在AIGC領(lǐng)域的重要地位和應(yīng)用潛力。安防-視覺

互聯(lián)網(wǎng)-推薦Al產(chǎn)業(yè)發(fā)展“三疊浪”專家系統(tǒng)1956年

1997年

2007年達(dá)特茅斯會(huì)議深藍(lán)機(jī)器人戰(zhàn)勝人類視覺識(shí)別超過人類人工智能發(fā)展歷程→

生成創(chuàng)造世界

合成數(shù)據(jù)創(chuàng)造結(jié)果感知理解世界分析數(shù)據(jù)給出建議2022年2023年

ChatGPT

GPT-4深度學(xué)習(xí)

GAN

Al4S2020年

Alpha

Fold控制論NLP

CVAl重點(diǎn)事

件里程碑Al技術(shù)里程碑ChatGPT1950年圖靈測(cè)試-判斷機(jī)器是否具有“智能”1966年Eliza-第一款人機(jī)對(duì)話機(jī)器人1984—1986年Tangora-

語音控制打字機(jī)2007年《1TheRoad》-第一部完全由AI創(chuàng)作的小說2012年微軟-全自動(dòng)同聲傳譯系統(tǒng)1950s-1990S早期萌芽階段受限于技術(shù)水平,AIGC

僅限于小范圍實(shí)驗(yàn)1990s-2010S沉淀積累階段AIGC

從實(shí)驗(yàn)性向?qū)嵱眯赞D(zhuǎn)變,受

限于算法瓶頸,無法直接生成內(nèi)容2010s-2022

年快速發(fā)展階段深度學(xué)習(xí)算法不斷迭代,人工智能

生成內(nèi)容百花齊放2014年Lan

J.Goodfellow-生成式對(duì)抗網(wǎng)絡(luò)GAN2018年英偉達(dá)StyleGAN模型-自動(dòng)生成高質(zhì)量圖片2019年DeepMindDVD-GAN模型-生成連續(xù)性視頻ChatGPT模型-生成自然語言文本AIGC的發(fā)展歷程2022年

OpenAIopiibayus

Tansnem聚

X

因天網(wǎng)AITeleChat2-58

書生-酒語360p-01

UaVA-CoTe

小言

APP

KKimlBPhvane

LIA

lhiHDreamai

家通義萬相sCv⑥海媒

C

萬MNie

meitu

文她一醫(yī)療西度測(cè)區(qū)從aer領(lǐng)

A全科醫(yī)生講

醫(yī)③

HthinkOPT-…●多模態(tài)文本、圖片、音頻、視頻●AI工具(國內(nèi))DeepSeek

、

豆包、Kimi

、

騰訊元寶、智

譜清言、通義千問、秘塔搜索、微信搜索…●通用模型大語言模型(LLM,Large

Language

Model)視頻模型多模態(tài)模型….…●行業(yè)模型(垂直模型、垂類模型)

教育、醫(yī)療、金融等大模型相關(guān)術(shù)語*

w

@

海螺ADTRN

?n置

mIUN

元-DT

佚手可口①文心-言

5

通義干網(wǎng)

記罐元

學(xué)

節(jié)

Bximla

HNIMAX

3

ZF

一萬物房Oan2.5

V

QUM-4

YiawO-328-Praview

YDepSk

-R1-LHe

InteraThinker工P

智無湖ALmt8*m

*

榴SMoreLMoT四

大模型

g

車大油用所濰理實(shí)時(shí)交互

文生視頻融螞版金融大模型

妙想金融大橫型律

EChatLA4S:DP

分子大瀾型s

60

工天工

□MLM

AndesGPTZTE中Baichuan2Bk0-mathRWKVLMIskyworko1市同子曰視覺理解文生圖前MathGPT科

網(wǎng)取

5紫東太初eLM8重要貌語

合成/聲

復(fù)疹

Canywike文

本peech-Q1:

S行

業(yè)通用閉*I

根多行業(yè)黑汽車開

rTS大文2022.122023.062023.122024.062025.01時(shí)

間生成模型

推理模型ref:中文大模型基準(zhǔn)測(cè)評(píng)2024年度報(bào)告(2025.01.08)關(guān)鍵進(jìn)展的準(zhǔn)備期·

ChatGPT

發(fā)

,全球范圍內(nèi)迅速形

成大模型共識(shí)?!?/p>

GPT4

發(fā)布,進(jìn)一步掀起大模型研發(fā)

熱潮?!?/p>

國內(nèi)快速跟進(jìn)大模型研發(fā)。文心一言

1.0、

通義千間、訊飛星火、360智

、ChatGLM

等首批模型相繼發(fā)布。深化期·

OpenAI

發(fā)布01,強(qiáng)化學(xué)習(xí)新范式,

實(shí)現(xiàn)推理等復(fù)雜能力上的重大突破?!?/p>

Claude3.5-Sonnet

發(fā)布,在代碼和Agent能力上掀起效率革命。·

ChatGPT

上線實(shí)時(shí)視頻能力,深入

語音視黨實(shí)時(shí)多模態(tài)應(yīng)用場景。·國內(nèi)推理模型迅速跟進(jìn)。DeepSeek-R1、

QwQ-32B-Preview.Kimi-k1.5.GLM-Zero、Skywork-o1、Step

R-mini、

訊飛星火X1等模型密集發(fā)布?!鴥?nèi)模型性能持續(xù)提升。DeepSeekV3、

Qwen2.5、

豆包-Pro、混元-Turbo

與GLM-4-Plus等系列模型綜合能力上持續(xù)

提升。繁榮期·

OpenAI

發(fā)布Sora,極大拓展了Al在

視頻領(lǐng)域的想象力。·

GPT-40、CIaude3.5、Geminl1.5、Llama3

發(fā)布,海外進(jìn)

入"一超多強(qiáng)"的競爭格局。國內(nèi)多模態(tài)領(lǐng)域進(jìn)展迅速,在部分領(lǐng)域領(lǐng)先海外。視頻生成模型可靈AI、

海螺視頻、Vidu、PlxVerso

等模型陸續(xù)發(fā)布,并在海外取得較大應(yīng)用進(jìn)展?!?/p>

國內(nèi)通用模型持續(xù)提升。Qwen2.5、文心4.0、GLM4、

商量5.5等通用模型陸續(xù)更新。躍進(jìn)期·Llama2開

,極大助力全球大模型

開發(fā)者生態(tài)。·GPT-4

Turbo,Gemini等海外大模

型發(fā)布,繼續(xù)提升模型性能。·Midjourney發(fā)布5.2Stable

Diffusion

XL發(fā)布·

國內(nèi)閉源大模型快速發(fā)展。豆包、混元、

商量3.0、盤古3.0、AndesGPT、BlueLM、

星火3.0、KimiChat等陸續(xù)發(fā)布。·國

內(nèi)

態(tài)

發(fā)

。Baichuan、Qwen、InternLM、ChatGLM3、

YI-34B

等系列模型引領(lǐng)開源熱潮。大模型的關(guān)鍵發(fā)展比較項(xiàng)GPT-40(生成模型)DeepSeek-R1(推理模型)模型定位專注于通用自然語言處理和多模態(tài)能力,適合日常對(duì)

話、內(nèi)容生成、翻譯以及圖文、音頻、視頻等信息處

理、生成、對(duì)話等。側(cè)重于復(fù)雜推理與邏輯能力,擅長數(shù)學(xué)、編程和自然語言推理任

務(wù),適合高難度問題求解和專業(yè)領(lǐng)域應(yīng)用,在中文表達(dá)上容易出

彩。推理能力在日常語言任務(wù)中表現(xiàn)均衡,但在復(fù)雜邏輯推理(如

數(shù)學(xué)題求解)上準(zhǔn)確率較低。在復(fù)雜推理任務(wù)表現(xiàn)卓越,尤其擅長數(shù)學(xué)、代碼推理任務(wù),在部分基準(zhǔn)測(cè)試(如GPQA)中準(zhǔn)確率高于GPT-4o。多模態(tài)支持支持文本、圖像、音頻乃至視頻輸入,可處理多種模

態(tài)信息。當(dāng)前主要支持文本輸入,不具備圖像處理等多模態(tài)能力。應(yīng)用場景適合廣泛通用任務(wù),如對(duì)話、內(nèi)容生成、多模態(tài)信息

處理以及多種語言相互翻譯和交流;面向大眾市場和

商業(yè)應(yīng)用。適合需要高精度推理和邏輯分析的專業(yè)任務(wù),如數(shù)學(xué)競賽、編程

問題和科學(xué)研究;在思路清晰度要求高的場景具有明顯優(yōu)勢(shì),比

如采訪大綱、方案梳理;在對(duì)中文語言表達(dá)和情感表達(dá)方面有明

顯優(yōu)勢(shì)。用戶交互體

驗(yàn)提供流暢的實(shí)時(shí)對(duì)話體驗(yàn),支持多種輸入模態(tài);用戶

界面友好,適合大眾使用。可展示大部分鏈?zhǔn)剿伎歼^程,便于專業(yè)用戶理解推理過程;界面

和使用體驗(yàn)具有較高的定制性,但整體交互節(jié)奏較慢。生成模型與推理大模型的對(duì)比優(yōu)勢(shì)劣勢(shì)演繹或歸納等推理能力強(qiáng)(如謎題、數(shù)學(xué)證明)-響應(yīng)速度慢且計(jì)算成本高(需要更多推理時(shí)間)-鏈?zhǔn)剿季S推理出色(善于分解多步驟問題)-基于知識(shí)的任務(wù)更容易出錯(cuò)(容易產(chǎn)生幻覺)-擅長復(fù)雜決策任務(wù)-處理簡單任務(wù)的時(shí)候效率低(容易"過度思考")可以呈現(xiàn)思考過程推理模型的優(yōu)劣勢(shì)DeepSeek

R1OpenAl

o1OpenAl

o3-miniGemini

2.0Grok3Kimi

1.5常見推理模型nVIDIA美國人工智能主題股票大跌沖擊了火爆全網(wǎng)的DeepSeek-R1據(jù)介紹,

R1

模型在技術(shù)上實(shí)現(xiàn)了重要突破——用純深度學(xué)習(xí)方法讓A白發(fā)涌現(xiàn)出準(zhǔn)理能力,

在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上,性能比啟OpenAI

的01模型正式版,且訓(xùn)練成本僅

為560萬美元,遠(yuǎn)低于美國科技巨頭的數(shù)億美元乃至數(shù)十億美元投入。deepseek探索未至之境獲取手機(jī)App當(dāng)?shù)貢r(shí)間1月27日,受中國人工智能初創(chuàng)公司——深度求索公司(

Deep5eek)

沖擊,美國

人工智能主題段票通拋售,類國芯片巨頭英偉達(dá)(NVIDIA)股偷歷史性暴跌,納斯達(dá)克緣合

指數(shù)大幅下跌。.

mt,

在閥四、程deepseekDep官方推二的

家寫車閱讀解因時(shí)失棵新045001類推理模型輸入輸出價(jià)格(元/1M

Tokens)400350300250200150100

88爆火原因圖

2

:DeepSeek

性能對(duì)齊OpenAI-ol

正式版

圖3:推理成本低至每百萬Token

0.14美

元資料來源:DeepSeek官網(wǎng),中國銀河證券研究院

資料來源:DeepSeek

官網(wǎng),中國銀河證券研究院·DeepSeek-R1的推理能力進(jìn)入了第一梯隊(duì)(媲美OpenAl

o1),但訓(xùn)練和推理成本低、速度快、全部開源·

DeepSeek

打破了硅谷傳統(tǒng)的“堆算力、拼資本”的大模型發(fā)展路徑500sWE-benchVerified224輸入API

價(jià)格(緩存未命中)1

n輸入API

價(jià)格(緩存命中)16輸出API價(jià)格AIME2024CodeforcesGPOA

DiamondMATH-500MMLU6040-20-nxmmhrpa

e……

(10002價(jià)格下調(diào)DeepSeek-R1的

API定價(jià)僅為行業(yè)均價(jià)的1/10,推動(dòng)了中小型企業(yè)低成本接入Al,對(duì)行業(yè)產(chǎn)生了積極影響01打破壟斷DeepSeek-R1以低成本和開源特性打破以往頭部企業(yè)巨頭割據(jù)局面03推動(dòng)創(chuàng)新DeepSeek-R1促使行業(yè)開始從

“唯規(guī)模論”轉(zhuǎn)向更加注重

“性價(jià)比”和“高效能”方向?qū)l行業(yè)的重大影響公司成立背景與DeepSeek,

全稱杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,成立于2023發(fā)展歷程年7月17日,是一家創(chuàng)新型科技企業(yè),專注于人工智能基礎(chǔ)技術(shù)的研究與開發(fā)大

型(LLM)DeepSeek專注于開發(fā)先進(jìn)的大語言模型(LLM)和相關(guān)技術(shù),旨在通過這些技的創(chuàng)新應(yīng)用術(shù)推動(dòng)人工智能在多個(gè)領(lǐng)域的應(yīng)用和創(chuàng)新投資者背景與市

場定位作為由知名私募巨頭幻方量化孕育而生的公司,DeepSeek

獲得了強(qiáng)大的資金支持和行業(yè)

影響力,幻方量化與九坤投資、明法投資、靈均投資并稱量化私募領(lǐng)域的“四大天王”,

管理資金規(guī)模均超過600億元。這為DeepSeek

提供了清晰的市場定位和投資者背景里程碑2025年1月20日推出DeepSeek-R1

推理模型DeepSeek

公司DeepSeeko

BFedDl合YTpLgugDlw

iV

sTMotwd

igkaRpoiamdnphteyitonawDeepSeek

產(chǎn)品信息官方渠道我是DeepSeek,很高興見到你!我可以

寫代

、

文件

寫作

種創(chuàng)

內(nèi)

,

請(qǐng)

務(wù)

吧a

DeepSeek發(fā)

網(wǎng)

息8深思考R)曲

度?Depserk26

開源,性9FOpeotFC

版,在

AP

領(lǐng)上線,oA咨

概deepseek探索未至之境新聞:https://api-docs.deepseek.com/zh-cn/news/news250120DeepSeek-R1

發(fā)布,性能對(duì)標(biāo)OpenAlo1

版Github:https://github.com/deepseek-ai/懷

fgTpl

Thrnas.k.r對(duì)話:chat.deepseek.com官網(wǎng):www.deep*2waass0pi

I88s獲取手機(jī)AppDenpsF

工Mp上,sTKaK+Tn.a

Nan開始對(duì)話iew

話性

時(shí)

OpenAl-01

版Y合四Dl2024年1月

2024年9月

2024年12月2023年7月

2024年5月

2024年11月2025年1月正式發(fā)布DeepSeek

R1

模型,在大模

型排名Arena

中其基準(zhǔn)測(cè)試

升至全類別大

模型第三。DeepSeek

模型系列宣布DeepSeek

V3首個(gè)版本上線并同步開源模型權(quán)重。合并Deep-Seek

CoderV2

和Deep-Seek

V2

Chat兩個(gè)模型,升推理模型DeepSeek

R1Lite

預(yù)覽版正式上線。宣布開源第二代MoE

大模型DeepSeekV2。級(jí)推出全新的DeepSeekV2.5

新模型。發(fā)布首個(gè)個(gè)大模LLM。立。比較方面生成模型(V3)推理模型(R1)設(shè)計(jì)初衷想要在各種自然語言處理的任務(wù)中都能表現(xiàn)好,更通用重點(diǎn)是為了搞定復(fù)雜的推理情況,比如

深度的邏輯分析和解決問題性能展現(xiàn)在數(shù)學(xué)題、多語言任務(wù)還有編碼任務(wù)里表現(xiàn)不錯(cuò),像Cmath能得90.7分,Human

Eval編碼任務(wù)通過率是65.2%在需要邏輯思考的測(cè)試?yán)锖馨?,比?/p>

DROP任務(wù)F1分?jǐn)?shù)能達(dá)到92.2%,AlME2024的通過率是79.8%應(yīng)用的范圍適合大規(guī)模的自然語言處理工作,像對(duì)話式AI、多語言翻譯還有內(nèi)容生成

等等,能給企業(yè)提供高效的Al方案,

滿足好多領(lǐng)域的需求適合學(xué)術(shù)研究、解決問題的應(yīng)用和決策

支持系統(tǒng)等需要深度推理的任務(wù),也能

拿來當(dāng)教育工具,幫學(xué)生鍛煉邏輯思維DeepSeek

最新的生成模型和推理模型版本對(duì)比蒸餾(Distillation)在不損失能力的情況下縮小模型DeepSeek-R1

工作原理思維鏈

強(qiáng)化學(xué)習(xí)(Chain

of

Thought)

(Reinforcement

Learning)讓模型進(jìn)行慢思考

讓模型自我探索和訓(xùn)練●DeepSeekR1論

:/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf●

DeepSeek

R1論文圖解:https://zhua/p/20844750193模型名稱DeepSeek-R1-671B滿血版,能力最強(qiáng)DeepSeek-R1-Distill-Qwen-7B蒸餾版,能力稍弱--實(shí)際上是增加了推理能力的Qwen或Llama模型DeepSeek-R1-Distill-Llama-8BDeepSeek-R1-Distill-Qwen-14BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70BDeepSeek-R1

版本部署DeepSeek-R1

滿血版的算力要求和性能DeepSeekR1671BDeepSeekV3671BNV

H800NVH200NVH2O羿騰9108NV

H800NVH200NVH20算騰9108316642368100168122048128015361128BF16FPBFPBFP8BF161681632168163215832236810016FP8FPBFP8含算力部署總價(jià)

(萬/套/月)31664

1280每套算力

(FP16/TFLOPs)81181215362048每

(GB)算力型號(hào)模型精度181每套卡數(shù)模

型158321128DeepSeek-R1

的優(yōu)勢(shì)理科能力強(qiáng),且準(zhǔn)確率高●數(shù)學(xué)推理●代碼生成●復(fù)雜任務(wù)處理●語言混雜>R1

在處理非中英文問題時(shí),偶爾會(huì)出現(xiàn)語言混雜現(xiàn)象

>這個(gè)現(xiàn)象在R1

Zero版本中更加明顯●提示詞工程>

使

用few-shot

提示可能會(huì)降低R1性能使用過多的過程指導(dǎo)指令可能會(huì)降低R1的推理能力DeepSeek-R1的局限●通用能力>R1

的通用能力(尤其是生成能力)低于DeepSeek-V3>R1的幻覺仍舊比較明顯(可能源于R1的中文語言表達(dá)能力更強(qiáng))Googes

FACTS

w/Clwd-35-Sonne8Cemini-15-Pro

389%

2.69%Table

1:HallucinationratesofDeepSeekRIandV3

by

various

hallucination

judgment

approaches.Lowerhallucination

rates

are

better.Thusoursurprise:consistentlyacross

alljudgment

approaches,Deepseek-R1

is

showntobehallucinating

at

significantly

higher

rates

than

Deepseek-V3.VectarasHHEM2114.3%3.9%Googjes

FACTSw/GPT-408Claude-3.5-Sonnet437%2.99%Googo

FACTS

w/OPT-408Cemin-15-Pro309%199%Theresults

are

shown

in

Table

1below.DoepSeekRDerpSeokV3DeepSeek-R1

應(yīng)用場景●推理密集型任務(wù)編程任務(wù)中的代碼生成、算法設(shè)計(jì),媲美Claude3.5Sonet數(shù)學(xué)問題求解、科學(xué)推理和邏輯分析等需要復(fù)雜推理的場景。●教育與知識(shí)應(yīng)用可用于解決教育領(lǐng)域的問題,支持知識(shí)理解與解答??捎糜诳蒲腥蝿?wù)的實(shí)驗(yàn)設(shè)計(jì)、數(shù)據(jù)分析和論文撰寫?!裎臋n分析與長上下文理解>適合處理需要深入文檔分析和理解長上下文的任務(wù),例如復(fù)雜信息提取與整合?!耖_放領(lǐng)域問答與寫作在內(nèi)容生成、問題回答以及創(chuàng)造性寫作中具有廣泛應(yīng)用,例如生成高質(zhì)量文本或進(jìn)行內(nèi)容編輯?!?/p>

DeepSeek官方網(wǎng)站和官方app●騰訊系騰訊元寶微信Al搜索騰訊ima

個(gè)人知識(shí)庫●Al搜索秘塔搜索納米Al搜索知乎直答●其它接入DeepSeek-R1

的產(chǎn)品

>Molly

R1

(向量智能)問小白dnakws

n.rrrgroq

A.rrr肉=n..Brrr門LN三nun*.nDrrr.rr如何使用DeepSeek

R1warr

rar小rAr04e...rVdsopsok

為.rd

聯(lián)

通云o

wcr

rSCrethnne

n天鋼云s.r.An..幢r接入DeepSeek

R1第三方服務(wù)的廠家●

互聯(lián)網(wǎng)大廠:●騰訊:騰訊元寶、ima、

微信、騰訊云●百度:百度搜索、文小言●字節(jié)跳動(dòng):豆包、扣子、飛書●阿里:釘釘●…..…●互聯(lián)網(wǎng)小廠:科大訊飛、知乎、秘塔、納米Al搜索、….…●Al

初創(chuàng)公司:零一萬物、階躍星辰、minmax、

……●Al

應(yīng)用公司(教育類):學(xué)而思、北大青鳥、網(wǎng)易有道、猿輔導(dǎo)、作業(yè)幫、

……●

手機(jī)廠商:

、榮耀、魅族、….●其它云服務(wù)平臺(tái):三大運(yùn)營商、云服務(wù)商(硅基流動(dòng)等)PART

02

AIGC

的概念和應(yīng)用簡介本部分著重介紹人工智能生成內(nèi)容

(AIGC)

的定義、應(yīng)用范圍及其在各行業(yè)的實(shí)際影響:首先梳理AIGC相關(guān)的術(shù)語,包括AI、AGI、生成式Al和決策式Al等,明確了其在人工智能領(lǐng)域的

定位。隨后,詳細(xì)列舉AIGC在文本、圖像、音頻和視頻生成方面的多樣化應(yīng)用,并探討其在電商、新聞傳媒、影視、游戲、教育和金融等行業(yè)的具體實(shí)踐,展示AIGC在提升效率、降低成本和增強(qiáng)創(chuàng)

新方面的核心價(jià)值。此外,還分析AIGC帶來的挑戰(zhàn),如數(shù)據(jù)隱私、倫理問題、生成質(zhì)量控制以及對(duì)就業(yè)結(jié)構(gòu)的影響。

通過深入探討AIGC的應(yīng)用現(xiàn)狀和未來趨勢(shì),本部分旨在幫助讀者全面理解AIGC的潛力和影響,為應(yīng)對(duì)技術(shù)變革提供參考。本部分的內(nèi)容參考了《人工智能通識(shí)課(微課版)》和相關(guān)的視頻

(B

站的思睿觀通)北京大學(xué)PEKINGUNIVERSTTY初

識(shí)AIGC一本書帶你讀懂AIGC生成式人工智能ChaiGPDAGC眼花繚亂的名詞生成式Al決策式AlAl(人工智能)Al

Generated

Content(人工智能生成內(nèi)容)AIGCChatGPTAGI(通用人工智能)(artificialgeneral

intelligence)眼花繚亂的名詞生成圖像

日生成文本

O生成內(nèi)容

生成音頻自

生成視頻AIGC能干什么Perplexity·

知乎直答·

秘塔Al搜索引擎·

納米Al搜索·

微信搜索(DeepSeek

R1、元寶)·

小紅書的筆記助手·短視頻平臺(tái)的內(nèi)容創(chuàng)意·

自動(dòng)回復(fù)機(jī)器人·企業(yè)微信的智能回復(fù)·

英國廣播公司(BBC)的Juicer·

的Cyborg·新華社的快筆小新·人民日?qǐng)?bào)的創(chuàng)作大腦·

第一財(cái)經(jīng)的DT

稿王·Cursor·Windsurf·MarsCode·GitHub

Copilot

·

阿里云通義靈碼·

微軟"小冰"出版詩集

·Al

撰寫劇本電影《陽春》

·百萬字小說《天命使徒》

·清華大學(xué)的《機(jī)憶之地》Al搜索P社交媒體自新

聞代碼作品創(chuàng)作BO日Al文本·Al繪畫太空歌劇院Al繪畫全景圖是一副百米畫卷,再現(xiàn)了當(dāng)下西湖邊的景觀特色、生活場景,還有

一些已經(jīng)消失的景觀,比如曾經(jīng)聞名

遐邇的大佛寺。圖中包含5000個(gè)建筑,作者白小蘇說

如果這些建筑都要自己親手畫,一天

畫10個(gè)都要500天。最后他借助于Al技術(shù),在一年內(nèi)完成了作品

s

Al無限拓展新西湖繁勝全景圖順目19年節(jié):258lgs

主綁老西十量E聯(lián)天:1362陳項(xiàng)F區(qū)論:平方公里(12萬面)作隔:51天Al繪畫人類手稿AI

上色A12-13未了

·新知人人皆可周杰倫?A

加持下的音樂創(chuàng)作,顛覆你的想象0

太一句話-圖概生成一首欲9

不少人利用u

樂生或省紫金陳著無證之罪語音對(duì)話

創(chuàng)作音樂Al音頻多理語音克隆單田芳聲音重現(xiàn)音

一—8—PIKAPika整新活!能在視頻中添加任意內(nèi)容

真假難辨視頻添加圖片干秋詩頌

視頻特效Al視頻北京大學(xué)PEKINGUNIVERSTTYAIGC

的行業(yè)應(yīng)用AIGC的行業(yè)應(yīng)用電商行業(yè)

0102

內(nèi)容廣告游戲行業(yè)

0504

影視行業(yè)其它行業(yè)(教育、金融

….)03

新聞傳媒各行各業(yè)06Al模特產(chǎn)品拍攝降本增效羅女士:7號(hào)球可以打嗎用戶_04909729:親,拍了馬桶刷和一次性替換頭,再送個(gè)剛頭吧虛擬主播提升直播帶貨效率商品3D

模型

改善購物體驗(yàn)電商行業(yè)愛吃創(chuàng)意餅干的尊稱:

進(jìn)群有福利嗎?7,tbNick_3rkat

作那個(gè)按摩怎么內(nèi)容策劃與創(chuàng)作內(nèi)容主題策劃文案寫作圖片制作短視頻制作音頻制作內(nèi)容審核與優(yōu)化倉提綱和文案撰寫

主題策劃標(biāo)題優(yōu)化生成圖片、視頻、音頻

語法和錯(cuò)別字檢查風(fēng)格和語氣調(diào)整_受眾分析與互動(dòng)受眾分析互動(dòng)管理社群建設(shè)內(nèi)容合規(guī)管理數(shù)字人直播侖分析受眾行為和喜好

自動(dòng)回復(fù)和評(píng)論搭建社群管理社區(qū)互動(dòng)

監(jiān)測(cè)澳情和熱點(diǎn)社媒情感分析…賬號(hào)IP打造對(duì)標(biāo)賬號(hào)分析賬號(hào)定位賬號(hào)信息設(shè)定打造完整的賬號(hào)IP方案數(shù)據(jù)追蹤與分析性能追蹤

分析和優(yōu)化內(nèi)容優(yōu)化建議

生成個(gè)性化內(nèi)容雪花啤酒虛擬偶像

提升品牌宣傳效果內(nèi)容廣告全流程參與

提高效率AI輔助自媒體運(yùn)營場景新聞傳媒AIGC

對(duì)傳媒行業(yè)影響包括采編環(huán)節(jié)、傳播環(huán)節(jié),通過語音轉(zhuǎn)寫、智能寫作、智能剪輯等方式提高采編環(huán)節(jié)的生產(chǎn)效率,在傳播

環(huán)節(jié)通過打造AI主播實(shí)現(xiàn)智能、高效播報(bào)。采編環(huán)節(jié)提高內(nèi)客生產(chǎn)效率錄音語音轉(zhuǎn)寫借助語音識(shí)別技術(shù)將錄音語音轉(zhuǎn)寫成文字,有效壓縮重復(fù)工作,保障新聞時(shí)效性智能新聞寫作基于算法自動(dòng)編寫新聞,提高新聞時(shí)

效性智能視頻剪輯通過使用視頻字幕生成、視頻錦集、視頻拆條、視頻超分等視頻智能化剪

輯傳播環(huán)節(jié)Al合成主插為核心應(yīng)用場景拓展新華社、央視等積極推出A

合成主播,

應(yīng)用場景包括新聞報(bào)道、天氣預(yù)報(bào).晚會(huì)主持等應(yīng)用功能升級(jí)A合成主播開始陸續(xù)支持多語種播報(bào)和

手語播報(bào)應(yīng)用形態(tài)完善從2D到3D,從口型到面部表情都更加

逼真、豐富AIGC

對(duì)傳媒行業(yè)參與主體的影響人對(duì)媒體從業(yè)者將部分采編、插放

工作自動(dòng)化,讓其

更專注于思考創(chuàng)造

如將精力集中于深

度報(bào)道專題報(bào)道等

更需發(fā)揮人類精準(zhǔn)

分析事物、妥善處

理情感的領(lǐng)域:對(duì)傳媒用戶短時(shí)間獲得更多新

聞,提高獲取及時(shí)

性及便捷性;降低傳媒門檻,使

得受眾可以參與內(nèi)

容生產(chǎn),增強(qiáng)參與

感對(duì)傳媒機(jī)構(gòu)大幅提高生產(chǎn)效率,

并帶來新的視覺化。

互動(dòng)化體驗(yàn);豐富了新聞報(bào)道的

形式,推動(dòng)傳媒向

智媒轉(zhuǎn)變傳媒中期拍攝拓展角色范疇拓展場景空間后期制作賦能影視剪輯動(dòng)轉(zhuǎn)制實(shí)時(shí)字幕影視行業(yè)智能圖像修復(fù)前期創(chuàng)作影視劇本文稿創(chuàng)作游戲行業(yè)AIGC游戲研發(fā)環(huán)節(jié)作用增強(qiáng)游戲

·

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論