2025年AI+研發(fā)數(shù)字峰會(AiDD峰會):優(yōu)中選優(yōu)金融大模型的優(yōu)化演進_第1頁
2025年AI+研發(fā)數(shù)字峰會(AiDD峰會):優(yōu)中選優(yōu)金融大模型的優(yōu)化演進_第2頁
2025年AI+研發(fā)數(shù)字峰會(AiDD峰會):優(yōu)中選優(yōu)金融大模型的優(yōu)化演進_第3頁
2025年AI+研發(fā)數(shù)字峰會(AiDD峰會):優(yōu)中選優(yōu)金融大模型的優(yōu)化演進_第4頁
2025年AI+研發(fā)數(shù)字峰會(AiDD峰會):優(yōu)中選優(yōu)金融大模型的優(yōu)化演進_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1.2.研發(fā)流程:多階段知識增強3.優(yōu)化策略:深入理解問題4.應用實踐:奇富Copilot發(fā)展背景:從通用到金融演進歷程:從通用模型到金融模型金融模型能力深耕金融模型能力深耕通用模型能力涌現(xiàn)通用模型能力涌現(xiàn)研發(fā)流程:多階段知識增強金融大模型研發(fā)的四種范式數(shù)據(jù)準備:數(shù)據(jù)質(zhì)量是高性能AI的地基覆蓋多種數(shù)據(jù)來源,多種清洗策略組合的標準化數(shù)據(jù)處理流程;語料badcase率從40%下降至5%左右不同任務、來源、形式的數(shù)據(jù)混合在低樣本資源場景下的效果提升會更加顯著,數(shù)據(jù)量會直接影響模型效果增量預訓練:合適的數(shù)據(jù)及配比是關(guān)鍵兩階段指令微調(diào):緩解任務沖突不同SFT任務的數(shù)據(jù)混合可能會出現(xiàn)效果沖突的現(xiàn)象,DMT策略可以有效緩解任務沖突,提升效果任務解決及指令遵循能力仍然需要一定數(shù)量的高質(zhì)量標注數(shù)據(jù)如果SFT的模型效果不佳時,再進行DPO等強化學習優(yōu)化操作,效果不會理想甚至可能是負向優(yōu)化TheLlama3HerdofModels.MetaLlamaTeam,arXiv2024金融大模型訓練各階段的評測目標不同,不同領(lǐng)域/場景的任務多樣化,且需要針對社會層面的潛在風險進行評估挖掘大模型真實能力的評測體系選擇題一般僅能反應模型在語言理解和知識儲備上的能力,無法評估模型的問題解決能力開源任務評測數(shù)據(jù)集標注質(zhì)量參差不齊,無法真實有效的評估模型的任務解決水平優(yōu)化策略:深入理解問題不同階段大模型獲取的能力不同預訓練缺乏有效的領(lǐng)域知識預訓練并未有效擬合領(lǐng)域知識多維度監(jiān)控保障訓練有效性多任務評測指標判斷模型訓練是否有效多領(lǐng)域數(shù)據(jù)擬合曲線判斷數(shù)據(jù)源、配比是否合理高質(zhì)量數(shù)據(jù)退火有效提升榜單效果開源模型僅開源模型權(quán)重,并未開源訓練框架及訓練數(shù)據(jù),無法掌握預訓練階段的數(shù)據(jù)配比不同開源模型的預訓練與退火機制不同,需要針對性的調(diào)整數(shù)據(jù)構(gòu)造/配比及訓練方式來保證增量預訓練的有效性TheLlama3HerdofModels.MetaLlamaTeam,arXiv2024在預訓練階段未學習到對應的知識?在訓練初期,使用約1000個樣本時,模型性能快速提升至較高水平?隨后增加更多樣本,提升效果有限?少量樣本的微調(diào)足以使大模型對齊人類指令?大模型完成CBQA評測主要依賴其內(nèi)在的世界知識,而非微調(diào)樣本注入必須在預訓練階段進行知識的獲取及增強(多樣性、置換、改寫等1.Loramoe:Revolutionizingmixtureofexpertsformaintainingworldknowledgeinlanguagemodelalignment,arXiv20232.PhysicsofLanguageModels:Part3.1,KnowledgeStorageandExtraction,MetaFAIRLabs,arXiv2023一個知識點必須用不同方式大量重復學習Acomprehensivecapabilityanalysisofgpt-3andgpt-3.5seriesmodels,Arxiv2023大規(guī)模指令微調(diào)損傷模型世界知識Loramoe:Revolutionizingmixtureofexpertsformaintainingworldknowledgeinlanguagemodelalignment,arXiv2023LiW,PengY,ZhangM,etal.Deepmodelfusion:Asurvey.arXiv2023.User:請根據(jù)給出的新聞文本內(nèi)容進行情感分析,從["中性","積極","消極"]中選取對應的答案。示例1:新聞文本:城建發(fā)展(600266.SH)股價今日漲停,收報6.79元,漲幅10.05%。情感:積極示例2:新聞文本:07月03日,江蘇北人股價跌6.54%,報收20.57元,成交金額1.59億元,換手率6.42%,振幅7.18%,量比0.88。江蘇北人今日主力資金(超大單+大單)凈流出2194萬元情感:消極請參考上述示例,判斷下面的新文本的情感傾向。新聞文本:7月28日,天津方程豹汽車銷售有限公司成立,法人為徐慶賀,注冊資本100萬人民幣。Assisstant:將FewShot將FewShot示例拆分一輪一輪的交互,能有有效提升模型指令遵循能力,并且對于Prompt設(shè)計更加友好User:請根據(jù)給出的新聞文本內(nèi)容進行情感分析,從["中性","積極","消極"]中選取對應的答案。新聞文本:城建發(fā)展(600266.SH)股價今日漲停,收報6.79元,漲幅10.05%。Assissant:積極User:請根據(jù)給出的新聞文本內(nèi)容進行情感分析,從["中性","積極","消極"]中選取對應的答案。新聞文本:07月03日,江蘇北人股價跌6.54%,報收20.57元,成交金額1.59億元,換手率6.42%,振幅7.18%,量比0.88。江蘇北人今日主力資金(超大單+大單)凈流出2194萬元Assissant:消極User:請根據(jù)給出的新聞文本內(nèi)容進行情感分析,從["中性","積極","消極"]中選取對應的答案。新聞文本:7月28日,天津方程豹汽車銷售有限公司成立,法人為徐慶賀,注冊資本100萬人民幣。Assisstant:低成本提升效果:深入理解問題ZhongQ,WangK,XuZ,etal.Achieving>97%onGSM8K:DeeplyUnderstandingtheProblemsMakesLLMsPerfectReasoners,arXiv2024.策略優(yōu)化的一些總結(jié)應用實踐:奇富CopilotCopilot的核心目標是協(xié)助企業(yè)提升業(yè)務表現(xiàn)和執(zhí)行效率增長、優(yōu)化人員管理以及提供專業(yè)支持為重點展開業(yè)務增長?銷售業(yè)務增長?銷售/客服/機器人?廣告/客戶推薦專業(yè)支持?風險分析?技術(shù)開發(fā)人員管理Copilot是操作人員的智能助理,宛如副駕駛般協(xié)作。它是幫助用戶深入理解所面臨的任務,并提供明確的指導,使他們能夠有效地應對和解決各類問題的工具指示牌:Copilot服務的業(yè)務場景框架:技術(shù)儲備方向盤:安全合規(guī)中控:業(yè)務理解燃料:行業(yè)和企業(yè)獨有數(shù)據(jù)動力:邏輯推理輪胎:算力儲備道路:行業(yè)經(jīng)營規(guī)范安全隱私保護Copilot雖然作為操作人員的助手,但依然必須嚴格遵循行業(yè)的合規(guī)標準安全與隱私保護就如同道路上的白色邊Copilot始終是由人來操作,并與人緊密協(xié)作,其核心在于大模型的支撐Copilot的各個功能模塊可以為操作者提供不同層次的支持,既能夠獨立使用,也可以根據(jù)需求靈活組合駕駛者:操作系統(tǒng)的人,起決策作用導航:人效分析和提升路徑行車助手:銷售/客服線索分析剎車系統(tǒng):操作風險新人培訓識別/質(zhì)量檢測自適應巡航:專業(yè)性指導剎車系統(tǒng):操作風險新人培訓在完整的銷售與客服業(yè)務流程中,不同角色的Copilot將嵌入各自的系統(tǒng)中,針對各自的決策支持與任務場景,為不同的操作者提供輔助坐席Copilot協(xié)助坐席與客戶高效溝通坐席Copilot的目標是解決在多次溝通、人員變更及被動轉(zhuǎn)接過程中出現(xiàn)的信息差與信息延遲問題,從而提升處理效率和效果管理Copilot的目標是實現(xiàn)對坐席工作的指導、實時監(jiān)測以及問題分析坐席&管理Copilot由專屬大模型構(gòu)成坐席&管理Copilot特質(zhì)能力了解每一個用戶、每一輪溝通的情況能夠提出自己的理解、總結(jié)和建議完成度檢測客戶畫像線索、總結(jié)、建議有領(lǐng)域和業(yè)務經(jīng)驗的大模型帶有人員和任務管理能力的組件質(zhì)量檢測坐席畫像思路推薦、話術(shù)推薦坐席&管理Copilot由一系列具備專屬能力的大模型和組件構(gòu)成,能夠深入理解每位用戶和每次交流的具體內(nèi)容,并基于此提供智能化的建議和理解,幫助操作者做出更精準的決策過往表現(xiàn)和專屬知識定制核心大模型多源信息的有序組織,結(jié)合專屬領(lǐng)域知識,形成核心的大模型能力,從而能夠精準服務于坐席業(yè)務的不同場景,提供針對性解決方案,提升業(yè)務處理的智能化水平和整體效率坐席&管理Copilot的業(yè)績成果坐席Copilot管理Copilot有使用有采納未使用未采納使用率74.6%采納率88

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論