版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
——AI跟蹤報告之九3月29日GPTChatGPT級GPT本能力升級;GPT深度學(xué)習(xí)堆棧,開源Evals評估框架。Copilot:AI商業(yè)化里程碑AIPowerPlatformCopilotGPTAIpowered,讓制作者可以用自然語言描述他們想百度:發(fā)布文心一言大模型,性能強大、功能豐富,為垂類應(yīng)用落地提供強大支持;含上千個各種場景下的AI算子和預(yù)訓(xùn)練模型。邊緣算力:翱捷科技、晶晨股份、瑞芯微、全志科技等;模型/算法/數(shù)據(jù):建議關(guān)注三六零(A股唯一自研大模型)、商湯科技(神經(jīng)網(wǎng)絡(luò))等;風(fēng)險提示:ChatGPT信息泄露風(fēng)險、虛假信息法律風(fēng)險,行業(yè)研發(fā)不及預(yù)期風(fēng)險。目錄Copilot:AI商業(yè)化里程碑緣算力、模型/算法/數(shù)據(jù)、應(yīng)用三個維度持復(fù)雜性問題解決,可靠性與安全性顯著提升生成文本輸出(自然語言、代碼等)。圖1:GPT-4能夠發(fā)現(xiàn)圖片中的異常圖2:GPT-4發(fā)現(xiàn)雞塊的排列與世界地圖的聯(lián)系圖3:GPT-4能夠解釋論文內(nèi)容資料來源:OpenAI官網(wǎng),光大證券研究所整理資料來源:OpenAI官網(wǎng),光大證券研究所整理5資料來源:OpenAI官網(wǎng),光大證券研究所整理在標(biāo)準(zhǔn)學(xué)術(shù)視覺基準(zhǔn)測試中,GPT-4性能優(yōu)于其它模型。OpenAI在一組標(biāo)準(zhǔn)學(xué)術(shù)視覺基準(zhǔn)測試中對GPT-4的表現(xiàn)進行評估,結(jié)果,GPT-4在TextVQA、圖表質(zhì)量管理、AI2D等方面都顯著優(yōu)于其他模型。此外,OpenAI表示,這并不完全代表GPT-4的能力范圍,因為該模型被發(fā)現(xiàn)能夠不斷解決新任務(wù),公司計劃近期發(fā)布更多分析和評估數(shù)據(jù)。圖4:GPT-4在文本、圖片處理方面與SOTA等模型的對比資料來源:OpenAI官網(wǎng),光大證券研究所整理注:OpenAI以機器學(xué)習(xí)模型設(shè)計的傳統(tǒng)基準(zhǔn)評估了GPT-4,結(jié)果顯著優(yōu)于現(xiàn)有大模型6677文本能力方面,GPT-4的表現(xiàn)顯著優(yōu)于現(xiàn)有大型語言模型。GPT-4能夠處理超過2.5萬字的文本,允許長篇內(nèi)容創(chuàng)建、擴展對話以及文檔搜索和分析等應(yīng)用場景。OpenAI在為機器學(xué)習(xí)模型設(shè)計的傳統(tǒng)基準(zhǔn)測試(包括MMLU、HellaSwag、ARC等)中比較GPT-4與GPT-3.5、SOTA等模型的性能。結(jié)果表明,GPT-4在基準(zhǔn)測試中的表現(xiàn)顯著優(yōu)于現(xiàn)有大型語言模型,并且在大部分的測試中優(yōu)于最先進的SOTA模型。圖5:GPT-4在基準(zhǔn)測試中的表現(xiàn)顯著優(yōu)于現(xiàn)有大型語言模型資料來源:OpenAI官網(wǎng),光大證券研究所整理注:OpenAI以機器學(xué)習(xí)模型設(shè)計的傳統(tǒng)基準(zhǔn)評估了GPT-4,結(jié)果顯著優(yōu)于現(xiàn)有大模型資料資料來源:OpenAI官網(wǎng),光大證券研究所整理MMLU基準(zhǔn)(MultilingualMulti-LevelUnification,是一種新的基準(zhǔn)測試,旨在評估多語言NLP模型的性能)常用于測試大規(guī)模多任務(wù)語言理解能力,涵蓋自然科學(xué)、通常使用英文編寫。OpenAI使用AzureTranslate將MMLU基準(zhǔn)翻譯成多種語言,并將GPT-4與其他語言模型應(yīng)用測GPT-4在包括拉脫維亞語、威爾士語和斯瓦希里語等多種小眾語言上的表現(xiàn),均優(yōu)于言模型的英語表現(xiàn)。圖6:GPT-4在MMLU基準(zhǔn)測試中表現(xiàn)優(yōu)于GPT-3.5、Chinchilla、PaLM等語言模型資料來源:OpenAI官網(wǎng),光大證券研究所整理899GPT-4在人類模擬考試中的表現(xiàn)超越GPT-3.5。在沒有專Quantitative等測試中的得分基本全部高于GPT-3.5。數(shù)在應(yīng)試者的前10%左右,顯著優(yōu)于GPT-3.5倒數(shù)10%左右的得分。圖7:GPT-4與GPT-3.5在各項考試中表現(xiàn)情況對比資料來源:OpenAI官網(wǎng),光大證券研究所整理GPT-4在語言風(fēng)格方面得到更新。與具有固定冗長語氣和風(fēng)格的經(jīng)典ChatGPT不同,開發(fā)人員(普通用戶也將會開放)可以AI有“自定義”的功能。GPT-4擁有自定義語言風(fēng)格的功能資料來源:OpenAI官網(wǎng),光大證券研究所整理GPT-4在可靠性與安全性方面實現(xiàn)最好結(jié)果。OpenAI表示,在6個月的時間內(nèi)通過對抗性測試程序和ChatGPT經(jīng)驗教訓(xùn)迭代調(diào)整GPT-4,在可靠性、真實性、可控性以及拒絕越界和敏感問題方面獲得有史以來最好結(jié)果。相較GPT-3.5,GPT-4對禁止內(nèi)容作出響應(yīng)的可能性下降82%,生成可靠性內(nèi)容的可能性提高40%。然而,OpenAI仍然提示GPT-4在偏見、隱私和虛假信息等方面的風(fēng)險。為此,OpenAI納入更多人工反饋(包含ChatGPT用戶),并與50多位專家合作,在技術(shù)發(fā)展的同時提高AI的安全性。圖9:GPT-4響應(yīng)不正確行為和敏感信息的可能性更低資料來源:OpenAI官網(wǎng),光大證券研究所整理資料來源:OpenAI官網(wǎng),光大證券研究所整理構(gòu)建可預(yù)測的深度學(xué)習(xí)堆棧是GPT-4項目的重點之一。OpenAI開發(fā)基礎(chǔ)設(shè)施和優(yōu)化算法,能在多個模型中表現(xiàn)出可預(yù)測行為。為驗證可預(yù)測性,OpenAI通過對使用相同訓(xùn)練方法但計算量少10000倍的模型進行推斷,在內(nèi)部代碼庫中準(zhǔn)確預(yù)測GPT-4的最終損失。能。使用Evals指導(dǎo)模型開發(fā),方便用戶將其應(yīng)用于跟蹤模型版本的性能和不斷發(fā)展的產(chǎn)品集成。比如,Stripe使用Evals來PTOpenAI認(rèn)為,準(zhǔn)確預(yù)測未來的機器學(xué)習(xí)能力是安全性的重要組成部分。但相較于潛在影響而言,其并沒有得到足夠的重視。OpenAI正加大開發(fā)力度,為社會提供更好的未來系統(tǒng)預(yù)期指導(dǎo)。OpenAI詞預(yù)測資料來源:OpenAI官網(wǎng),光大證券研究所整理圖12:GPT-4扭轉(zhuǎn)了逆向縮放(模型性能隨規(guī)模擴大而下降)趨勢資料來源:OpenAI官網(wǎng),光大證券研究所整理目錄緣算力、模型/算法/數(shù)據(jù)、應(yīng)用三個維度osoftCopilotopilot賦能銷售人員隨時快速響應(yīng)。助力客服人員時刻對答如流。升級市場營銷體驗,輕松找到目標(biāo)受眾。助力電商營銷提效,智能生成個性化內(nèi)容。提升供應(yīng)鏈敏捷性,將風(fēng)險降到最低。資料來源:百度tDynamicsCopilot力客服人員時刻對答如流。在Dynamics365CustomerService中,能夠針對聊天對話和電子郵件中的問資料來源:微軟官方公眾號資料來源:微軟官方公眾號arketingotaDynamicsCustomerInsightsCopilot準(zhǔn)確定位特定客戶群體。圖16:Dynamics365CustomerInsights資料來源:微軟官方公眾號icsMarketing資料來源:微軟官方公眾號介。使用Shopify的BusinessCentral用戶可以將其產(chǎn)品和簡介快捷發(fā)布到Shopify平SupplyChainCenterCopilot記可能影響關(guān)鍵供應(yīng)鏈流程的外部問題,篩選出受影響的訂單。并自動生成電子郵件向圖18:Dynamics365BusinessCentral資料來源:微軟官方公眾號圖19:MicrosoftSupplyChainCenter資料來源:微軟官方公眾號CopilotGPT建到Microsoft365。在AI過各個otinWord2.CopilotinPowerPoint能夠在創(chuàng)作過程中,通過自然語言命3.CopilotinExcel能夠幫助用戶釋放洞察、識別趨勢,在短4.CopilotinOutlook能夠幫助用戶整合并管理收件箱。CopilotinTeams能夠直接從對話上下文中提供實時摘要和6.BusinessChat匯集了來自文檔、演示文稿、電子郵件、日鍵日期,根據(jù)其他項目文件制定計0:Microsoft365Copilot系統(tǒng)資料來源:微軟t資料來源:微軟官方公眾號圖22:通過CopilotinWord快速起草報告資料來源:微軟官方公眾號圖23:CopilotinExcel圖24:借助CopilotinExcel將基礎(chǔ)數(shù)據(jù)轉(zhuǎn)化為深度洞察資料來源:微軟官方公眾號資料來源:微軟官方公眾號的提示或大綱開始一個新的演示。可以便捷的濃縮冗長的演示文稿,并使用自然語言命令來調(diào)整布局、重新編資料來源:微軟官方公眾號圖26:使用簡單描述讓CopilotinPowerPoint生成PPT資料來源:微軟官方公眾號。資料來源:微軟官方公眾號圖28:利用CopilotinOutlook快速回復(fù)郵件資料來源:微軟官方公眾號資料來源:微軟官方公眾號圖30:通過CopilotinTeams聚焦會議要點資料來源:微軟官方公眾號匯集起來,總結(jié)聊天內(nèi)容、攥寫電子郵件、查找關(guān)鍵日期,甚至根據(jù)其他項目文件制定計資料來源:微軟官方公眾號圖32:在CopilotinTeams中開展智能對話資料來源:微軟官方公眾號PowerPlatformCopilot未來前景打開werAutomateGPTAIpowered (1)PowerAppsCopilot可以讓制作者可以通過自然語言對話的方式來描述并且直接生成想要的應(yīng)用程序,可以通過和Copilot的對話 (2)通過PowerAutomateCopilot,可以通過自然語言來生成比以前更復(fù)雜的流程,Copilot還可以以對話的方式不斷優(yōu)化和迭代更新 (3)通過PowerVirtualAgentsCopilot,可以直接使用自然語言來描述機器人流程,無需手動一個一個進行創(chuàng)建。資料來源:微軟官方公眾號資料來源:微軟官方公眾號irtualAgentsCopilot資料來源:微軟官方公眾號目錄緣算力、模型/算法/數(shù)據(jù)、應(yīng)用三個維度搜索AIGC媒體金融教育醫(yī)療…NLP大模型CV大模型跨模態(tài)大模型生物計算大模型行業(yè)大模型搜索AIGC媒體金融教育醫(yī)療…NLP大模型CV大模型跨模態(tài)大模型生物計算大模型行業(yè)大模型I飛槳平臺,形成幾大模型體系,配套大模型平臺支持模型的廣泛應(yīng)用,建設(shè)了大模型為核心驅(qū)動的新產(chǎn)品和源:百度,光大證券研究所模文心NLP大模型性能強大、功能豐富,為垂類應(yīng)用落地提供強大支持。其中,文心一言(生成式AI產(chǎn)品)是基于產(chǎn)業(yè)級知表1:百度文心NLP模型級場景取得效果SOTA學(xué)文獻學(xué)科分類、新聞分型共計45個自然語言理解數(shù)據(jù)集上取得了答、語義檢索、情感分匹配、文本糾錯等各類自然務(wù)00億文本分類、語義相似度計算等60多項任務(wù)本解析等ERNIE知識增強,顯本/小樣本學(xué)習(xí)能力答、語義檢索、情感分匹配、文本糾錯等各類自然務(wù)源:文心大模型官網(wǎng),光大證券研究所NPUSporeMindSpore官網(wǎng)??低旳I開放平臺為碎片化的行業(yè)應(yīng)用場景提供了一站式算法訓(xùn)練平臺,具備基于小樣本數(shù)據(jù)訓(xùn)練高精度算法的能力。AI開過樣本數(shù)據(jù)采集、線上數(shù)據(jù)標(biāo)注、線上算法訓(xùn)練的過程,即可獲得有針對性的智能算法,隨之可部署到海源:??低暪嫫脚_。拖曳即可構(gòu)建算法方案,實現(xiàn)數(shù)據(jù)驅(qū)動的算法自動優(yōu)化迭代和一鍵式交付,大幅降低使用門源:大華股份公告目錄緣算力、模型/算法/數(shù)據(jù)、應(yīng)用三個維度投資建議:從三大層面關(guān)注AI軟硬件投資機會唯一自研大模型)、商湯科技(神經(jīng)網(wǎng)絡(luò))、云從科技(神經(jīng)網(wǎng)絡(luò))、格靈深瞳(神經(jīng)網(wǎng)絡(luò))、科大訊飛(神經(jīng)網(wǎng)絡(luò)&NLP)、拓爾思 (NLP)、海天瑞聲(數(shù)據(jù)標(biāo)注)。云端算力:(1)AI芯片:寒武紀(jì)(A股AI算力芯片龍頭);(2)GPU:景嘉微、海光信息、芯原股份(IP);(3)CPU:龍芯中科、科技、博創(chuàng)科技、源杰科技、中際旭創(chuàng)等;(6)CHIPLET:興森科技、長川科技、方邦股份、華正新材、通富微電、長電科技等。邊緣算力:(1)SoC:翱捷科技、晶晨股份、富瀚微、瑞芯微、全志科技、中科藍訊、炬芯科技等;(2)AIoT:樂鑫科技、恒玄科技等;(3)RISC-V:中科藍訊、樂鑫科技、全志科技等。服務(wù)器:工業(yè)富聯(lián)、浪潮信息、中科曙光、神州數(shù)碼。網(wǎng)絡(luò);AIGC技術(shù)提高生產(chǎn)效率,降低生產(chǎn)成本,利好下游垂類應(yīng)用企業(yè),建議關(guān)注鴻合科技(教育)、萬興科技(圖像);AI趨勢,建議關(guān)注:創(chuàng)維數(shù)字、晶晨股份。圖40:行業(yè)重點上市公司盈利預(yù)測與估值圖40:行業(yè)重點上市公司盈利預(yù)測與估值(續(xù))圖40:行業(yè)重點上市公司盈利預(yù)測與估值(續(xù))目錄tGPT緣算力、模型/算法/數(shù)據(jù)、應(yīng)用三個維度GPTGPT不及預(yù)期風(fēng)險,獨立、客觀人觀點。研究人員獲取報酬的評判因素包括研究的質(zhì)量和準(zhǔn)確性、客戶反饋、競爭性因素以及光大證券股份有限公司的整體收益。所有研究人員保證他們報酬的任何一部分不曾與,不與,也將不會與本報告中具體的推薦意見或觀點有直接或間接的聯(lián)系。業(yè)及公司評級體系tCtS-tC個月的投資收益率領(lǐng)先市場基準(zhǔn)指數(shù)S%至tS%;9-tC個月的投資收益率落后市場基準(zhǔn)指數(shù)S%至tS%;tS明光大證券股份有限公司(以下簡稱“本公司”)創(chuàng)建于
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院醫(yī)療廢物處置檢查制度
- 幼兒園語言發(fā)展游戲教學(xué)方案
- 數(shù)字營銷數(shù)據(jù)分析與報告制作
- 大型企業(yè)戰(zhàn)略規(guī)劃方案模板
- 建筑施工企業(yè)質(zhì)量安全管理方案案例
- 銷售團隊目標(biāo)跟蹤與績效管理方案
- 公路工程質(zhì)量控制方案及檢測報告
- 建筑主體結(jié)構(gòu)施工方案與安全措施
- 三年級語文線上教學(xué)效果分析報告
- 物流倉儲管理流程優(yōu)化方案與執(zhí)行指南
- 梯子作業(yè)安全培訓(xùn)效果課件
- 吸附解析塔拆除施工方案
- 留置場所人員管理辦法
- 碳知識培訓(xùn)課件
- 插胃管課件教學(xué)課件
- 三菱勁炫說明書
- 新生兒抗生素使用原則
- 04國際尿失禁咨詢委員會尿失禁問卷簡(ICIQ-SF)
- 湖南省多測合一收費指導(dǎo)標(biāo)準(zhǔn)(試行)2024年版
- 裝飾裝修施工應(yīng)急預(yù)案措施
- 連鎖經(jīng)營與管理專業(yè)教學(xué)標(biāo)準(zhǔn)(高等職業(yè)教育專科)2025修訂
評論
0/150
提交評論