《DeepSeek大語言模型邊做邊學(xué)-原理、配置、提示詞和案例實(shí)操》課件 第1章 人工智能演進(jìn)與DeepSeek突破_第1頁
《DeepSeek大語言模型邊做邊學(xué)-原理、配置、提示詞和案例實(shí)操》課件 第1章 人工智能演進(jìn)與DeepSeek突破_第2頁
《DeepSeek大語言模型邊做邊學(xué)-原理、配置、提示詞和案例實(shí)操》課件 第1章 人工智能演進(jìn)與DeepSeek突破_第3頁
《DeepSeek大語言模型邊做邊學(xué)-原理、配置、提示詞和案例實(shí)操》課件 第1章 人工智能演進(jìn)與DeepSeek突破_第4頁
《DeepSeek大語言模型邊做邊學(xué)-原理、配置、提示詞和案例實(shí)操》課件 第1章 人工智能演進(jìn)與DeepSeek突破_第5頁
已閱讀5頁,還剩20頁未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

人工智能演進(jìn)與大模型崛起中的DeepSeek突破2025/06/08廣州理工學(xué)院CONTENTS目錄01人工智能的演進(jìn)歷程02大語言模型的技術(shù)革命03DeepSeek的定位與突破04技術(shù)趨勢與產(chǎn)業(yè)展望人工智能的演進(jìn)歷程01人工智能的起源神經(jīng)元模型的提出1943年,沃倫·麥卡洛克和沃爾特·皮茨提出首個(gè)數(shù)學(xué)化神經(jīng)元模型,從理論上證明計(jì)算結(jié)構(gòu)可模擬生物神經(jīng)機(jī)制,為神經(jīng)網(wǎng)絡(luò)研究奠基。圖靈測試的誕生1950年,艾倫?圖靈在《計(jì)算機(jī)器與智能》中提出“圖靈測試”,通過“模仿游戲”設(shè)定智能判定標(biāo)準(zhǔn),為人工智能研究提供可驗(yàn)證目標(biāo)。達(dá)特茅斯會(huì)議的召開1956年,約翰·麥卡錫、馬文·明斯基等學(xué)者在達(dá)特茅斯研討會(huì)上首次確立“人工智能”術(shù)語,明確研究目標(biāo),標(biāo)志其成為獨(dú)立學(xué)科。符號(hào)主義的探索與局限早期代表性成果ELIZA(1966)是首個(gè)能模擬心理治療師與用戶對話的程序,展示了人工智能在自然語言處理領(lǐng)域的初步可能性;SHRDLU(1968)可理解并執(zhí)行自然語言指令的積木世界系統(tǒng),在知識(shí)表示和推理方面取得早期突破。規(guī)則系統(tǒng)的瓶頸早期人工智能基于符號(hào)邏輯方法,規(guī)則依賴性強(qiáng),難以處理復(fù)雜、模糊的現(xiàn)實(shí)問題。如早期象棋程序缺乏對棋局整體形勢的直覺判斷和靈活應(yīng)變能力。專家系統(tǒng)的困境專家系統(tǒng)依賴人工編碼知識(shí),存在知識(shí)獲取瓶頸、維護(hù)成本高、缺乏學(xué)習(xí)能力和受算力制約等問題,促使研究者轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)范式。從專家系統(tǒng)到深度學(xué)習(xí)01專家系統(tǒng)案例對比DENDRAL(1965年)首次使用啟發(fā)式規(guī)則識(shí)別分子結(jié)構(gòu);MYCIN(1976年)準(zhǔn)確率69%,推動(dòng)AI在醫(yī)學(xué)中的應(yīng)用,但它們都暴露出符號(hào)主義范式的局限。02數(shù)據(jù)驅(qū)動(dòng)范式的興起21世紀(jì)以來,計(jì)算能力提升和數(shù)據(jù)量爆發(fā),各種數(shù)據(jù)處理算法涌現(xiàn),基于統(tǒng)計(jì)的機(jī)器學(xué)習(xí)在多個(gè)領(lǐng)域取得顯著突破,如垃圾郵件過濾、信用卡欺詐檢測等。03數(shù)據(jù)驅(qū)動(dòng)取代符號(hào)邏輯1997年IBM深藍(lán)擊敗國際象棋冠軍卡斯帕羅夫,標(biāo)志著人工智能從規(guī)則驅(qū)動(dòng)正式轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng),數(shù)據(jù)驅(qū)動(dòng)范式逐漸取代符號(hào)邏輯方法。深度學(xué)習(xí)的革命性突破深度信念網(wǎng)絡(luò)訓(xùn)練方法2006年,Hinton團(tuán)隊(duì)提出深度信念網(wǎng)絡(luò)訓(xùn)練方法,成功突破梯度消失難題,推動(dòng)連接主義范式進(jìn)入新階段。ImageNet數(shù)據(jù)集的建立2009年,ImageNet數(shù)據(jù)集建立,為計(jì)算機(jī)視覺訓(xùn)練提供重要基準(zhǔn),驗(yàn)證了數(shù)據(jù)驅(qū)動(dòng)范式在大規(guī)模圖像識(shí)別任務(wù)中的有效性。AlexNet架構(gòu)的出現(xiàn)2012年,AlexNet架構(gòu)開啟了CNN在計(jì)算機(jī)視覺領(lǐng)域的統(tǒng)治時(shí)代,大幅提升圖像識(shí)別等任務(wù)的準(zhǔn)確率,證明神經(jīng)網(wǎng)絡(luò)自主學(xué)習(xí)特征能力遠(yuǎn)超人工設(shè)計(jì)特征。大語言模型的技術(shù)革命02Transformer架構(gòu)的革新自注意力機(jī)制解決長距離依賴早期自然語言處理存在“長距離依賴”難題,如難以解析“小明說小紅去了圖書館,她借了一本書”中“她”的指代關(guān)系。Transformer架構(gòu)的自注意力機(jī)制能實(shí)現(xiàn)對全局語義的動(dòng)態(tài)關(guān)聯(lián),有效解決了這一問題。奠定大模型技術(shù)基石2017年提出的Transformer架構(gòu),標(biāo)志著連接主義范式在自然語言處理領(lǐng)域的重大突破,為后續(xù)大語言模型的發(fā)展奠定了堅(jiān)實(shí)基礎(chǔ)。GPT系列的里程碑意義ChatGPT的多任務(wù)微調(diào)與RLHF技術(shù)2022年11月30日發(fā)布的ChatGPT,核心創(chuàng)新在于海量數(shù)據(jù)訓(xùn)練、多任務(wù)微調(diào)及人類反饋強(qiáng)化學(xué)習(xí)(RLHF)。文本生成能力展示ChatGPT能夠生成連貫、邏輯合理的文本,可根據(jù)自然語言描述生成高質(zhì)量代碼片段,在語言生成、問答系統(tǒng)、文本摘要等任務(wù)中表現(xiàn)出色。推理能力展示ChatGPT能理解問題邏輯結(jié)構(gòu)并給出準(zhǔn)確答案,在邏輯推理等領(lǐng)域發(fā)揮重要作用,為用戶解決復(fù)雜問題提供思路和方案。大模型的發(fā)展階段與格局全球大模型技術(shù)路線對比大模型發(fā)展經(jīng)歷準(zhǔn)備期(2022.11-2023.03)、成長期(2023.04-2023.12)、爆發(fā)期(2024-至今)。不同階段技術(shù)特點(diǎn)不同,如準(zhǔn)備期基于Transformer初步探索,成長期多模態(tài)與開源生態(tài)形成,爆發(fā)期進(jìn)行垂直領(lǐng)域微調(diào)與AGI探索?!鞍倌4髴?zhàn)”競爭生態(tài)呈現(xiàn)國內(nèi)學(xué)術(shù)和產(chǎn)業(yè)界積極跟進(jìn)大模型發(fā)展,文心一言、通義千問等模型相繼推出,形成了“百模大戰(zhàn)”的競爭格局。AIGC的爆發(fā)與多模態(tài)生成文本/圖像/視頻生成技術(shù)融合AIGC從單一文本生成擴(kuò)展到多模態(tài)內(nèi)容生成,以GPT、DeepSeek為代表的大語言模型,不僅能在文本生成、代碼生成、邏輯推理方面表現(xiàn)卓越,還能根據(jù)文本描述生成圖像或動(dòng)態(tài)視頻內(nèi)容。AIGC對行業(yè)的顛覆性影響AIGC的爆發(fā)深刻改變了多個(gè)行業(yè)的格局,為內(nèi)容創(chuàng)作、教育、科研、辦公等領(lǐng)域帶來了新的發(fā)展機(jī)遇和變革。AIGC的行業(yè)應(yīng)用價(jià)值01教育場景案例AIGC支持個(gè)性化學(xué)習(xí),能根據(jù)學(xué)生學(xué)習(xí)進(jìn)度和特點(diǎn)生成針對性練習(xí)題和解答。如根據(jù)學(xué)生數(shù)學(xué)作業(yè)錯(cuò)誤情況,分析知識(shí)薄弱點(diǎn),生成個(gè)性化練習(xí)題和講解內(nèi)容。02科研場景案例AIGC可幫助科研人員檢索文獻(xiàn)、總結(jié)研究成果、輔助撰寫論文。能快速篩選相關(guān)研究文獻(xiàn),提煉核心觀點(diǎn),節(jié)省科研人員時(shí)間和精力,加速科研創(chuàng)新進(jìn)程。03辦公場景案例AIGC在辦公場景實(shí)現(xiàn)智能文檔生成、會(huì)議紀(jì)要自動(dòng)整理等功能??筛鶕?jù)用戶需求和已有資料快速生成格式規(guī)范、內(nèi)容完整的文檔,實(shí)時(shí)記錄會(huì)議內(nèi)容并提取關(guān)鍵信息生成清晰紀(jì)要。DeepSeek的定位與突破03DeepSeek的嶄露頭角01開源推理模型的亮相2025年1月,DeepSeek憑借開源推理模型DeepSeek-R1正式嶄露頭角,其性能與OpenAI的o1模型相當(dāng),但訓(xùn)練成本僅為OpenAI同類模型的1/20。02全球市場沖擊效應(yīng)該模型引發(fā)全球關(guān)注,應(yīng)用程序登頂蘋果應(yīng)用商店免費(fèi)下載排行榜,在國際大模型排名中升至第三,用戶注冊量短短七天新增一億。其低算力依賴特性引發(fā)美股震蕩,英偉達(dá)股價(jià)單日暴跌17%,市值一夜蒸發(fā)23萬億。03版本發(fā)展與特色截至目前,DeepSeek已實(shí)現(xiàn)多代次架構(gòu)演進(jìn),DeepSeek-V3和DeepSeek-R1是比較有代表性的兩個(gè)版本,各有獨(dú)特優(yōu)勢。V3:全能多模態(tài)通用模型MoE架構(gòu)與通用定位DeepSeek-V3于2024年12月26日發(fā)布,是自研MoE混合專家架構(gòu)的通用自然語言處理模型,在文本、圖像、音頻、視頻多模態(tài)處理上表現(xiàn)均衡,適用于智能客服、內(nèi)容創(chuàng)作、知識(shí)問答等通用場景。高效訓(xùn)練體系采用預(yù)訓(xùn)練+監(jiān)督微調(diào)+輕量強(qiáng)化學(xué)習(xí)組合,結(jié)合FP8混合精度訓(xùn)練與無輔助損失的負(fù)載均衡技術(shù),在14.8Ttoken規(guī)模預(yù)訓(xùn)練中實(shí)現(xiàn)成本優(yōu)化,訓(xùn)練效率顯著提升。多維度能力優(yōu)勢在長文本處理、代碼生成、數(shù)學(xué)推理、中文理解及多語言支持方面均表現(xiàn)優(yōu)異,生成速度快且硬件適配性強(qiáng),支持多框架集成與多推理模式。開源生態(tài)友好性對資源有限的中小企業(yè)和開發(fā)者友好,可自由定制優(yōu)化,廣泛應(yīng)用于聊天交互、多語言翻譯、圖像生成等領(lǐng)域。R1:垂直領(lǐng)域推理專家專注復(fù)雜推理的定位DeepSeek-R1于2025年1月發(fā)布,是專注復(fù)雜推理的開源模型,專為數(shù)學(xué)邏輯、代碼生成、金融分析等高精度任務(wù)設(shè)計(jì)。強(qiáng)化推理能力通過監(jiān)督微調(diào)、多階段強(qiáng)化學(xué)習(xí)與混合數(shù)據(jù)微調(diào),結(jié)合冷啟動(dòng)技術(shù),在極少標(biāo)注數(shù)據(jù)下實(shí)現(xiàn)媲美OpenAIo1系列的推理性能,在數(shù)學(xué)邏輯推理、代碼生成等復(fù)雜任務(wù)中分類準(zhǔn)確率超90%。成本優(yōu)勢與模型蒸餾訓(xùn)練成本僅為同類模型的1/20,支持模型蒸餾技術(shù),可將推理能力遷移至輕量化模型,適配本地部署需求。垂直領(lǐng)域深耕成果在科研數(shù)據(jù)分析、算法交易策略生成、復(fù)雜SQL查詢等場景表現(xiàn)卓越,成為降低AI開發(fā)成本的優(yōu)選方案,獲開源社區(qū)廣泛二次開發(fā)。全場景覆蓋架構(gòu)移動(dòng)端(APP)應(yīng)用支持iOS和Android兩大主流平臺(tái),功能豐富,包括智能問答、文檔解析、代碼生成與調(diào)試、多模態(tài)交互等。具備離線緩存能力,優(yōu)化弱網(wǎng)環(huán)境響應(yīng)速度,提升移動(dòng)辦公效率。網(wǎng)頁端(Web)優(yōu)勢支持PC及主流瀏覽器,無需安裝即開即用。支持多標(biāo)簽會(huì)話管理,與企業(yè)辦公軟件深度集成,可高效進(jìn)行長文檔和大數(shù)據(jù)分析,提升團(tuán)隊(duì)協(xié)作效率。本地化部署(私有化方案)價(jià)值針對金融、政務(wù)、醫(yī)療等數(shù)據(jù)安全性要求高的敏感行業(yè),提供本地化部署方案,確保數(shù)據(jù)安全可控,企業(yè)可定制化訓(xùn)練行業(yè)專屬模型。多端部署性能對比單擊此處添加項(xiàng)正文跨端同步與混合計(jì)算跨端同步的無縫工作流用戶在不同設(shè)備(手機(jī)、電腦、平板)登錄同一賬號(hào),可實(shí)時(shí)同步聊天記錄、文件解析記錄、代碼片段等,確保工作連續(xù)性。如程序員小張?jiān)诘罔F上用手機(jī)咨詢代碼優(yōu)化方案,到辦公室后可在網(wǎng)頁端繼續(xù)編輯?;旌嫌?jì)算架構(gòu)的優(yōu)勢采用混合計(jì)算架構(gòu),結(jié)合云端高性能計(jì)算與本地邊緣計(jì)算,對于敏感數(shù)據(jù)可在本地處理,通用任務(wù)借助云端加速,實(shí)現(xiàn)效率與隱私的平衡。如攝影師老張?jiān)诒镜靥幚碚掌瑪?shù)據(jù),通過云端獲取教程和靈感。多模態(tài)交互與持續(xù)學(xué)習(xí)多模態(tài)交互的自然體驗(yàn)DeepSeek支持文本、語音、圖片、文件混合輸入,輸出結(jié)合圖文、表格等多種形式,帶來更自然的AI交互體驗(yàn)。如烹飪新手小美上傳圖片并語音提問,DeepSeek給出針對性建議。持續(xù)學(xué)習(xí)優(yōu)化的個(gè)性化適應(yīng)基于用戶反饋和交互數(shù)據(jù)動(dòng)態(tài)調(diào)整模型,在專業(yè)場景中表現(xiàn)持續(xù)提升,越來越貼合用戶需求。如健身愛好者小陳使用DeepSeek制定健身計(jì)劃,效果越來越好。垂直領(lǐng)域落地實(shí)踐醫(yī)療場景的應(yīng)用在醫(yī)療場景,針對數(shù)據(jù)安全性要求高的特點(diǎn),DeepSeek提供本地化部署方案。如小型診所醫(yī)生可通過加密接口訪問本地病歷數(shù)據(jù)庫,借助醫(yī)學(xué)知識(shí)庫更準(zhǔn)確地判斷病情。金融場景的應(yīng)用在金融場景,本地化部署方案可確保數(shù)據(jù)安全可控。如小型金融公司系統(tǒng)可實(shí)時(shí)審核貸款申請資料,并通過API與公司內(nèi)部風(fēng)控系統(tǒng)對接,保障業(yè)務(wù)安全高效運(yùn)行。技術(shù)趨勢與產(chǎn)業(yè)展望04大模型技術(shù)演進(jìn)方向AGI融合多模態(tài)大模型將向通用人工智能(AGI)邁進(jìn),進(jìn)一步融合多模態(tài)能力,如結(jié)合文本、圖像、音頻、視頻等多種模態(tài),推動(dòng)更自然的人機(jī)交互和更高效的行業(yè)應(yīng)用。例如AIGC技術(shù)已從單一文本生成延伸至圖像、音頻和視頻生成領(lǐng)域。低算力依賴像DeepSeek的開源推理模型DeepSeek-R1,性能與OpenAI的o1模型相當(dāng),但訓(xùn)練成本僅為OpenAI同類模型的1/20,低算力依賴特性將成為大模型發(fā)展的重要趨勢。垂直深耕大模型會(huì)在垂直領(lǐng)域進(jìn)行深度結(jié)合與深耕,滿足不同行業(yè)的特定需求。如DeepSeek-R1專為數(shù)學(xué)邏輯、代碼生成、金融分析等高精度任務(wù)設(shè)計(jì),在科研數(shù)據(jù)分析、算法交易策略生成等場景表現(xiàn)卓越。DeepSeek

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論