版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
基于大語言模型的數(shù)智化一站式投研端密級:01行業(yè)背景密級:ChatGPT正在掀起新一代AI浪潮1956年美國達特茅斯會議人工智能概念誕生第一次浪潮50-70年代:邏輯推理符號邏輯推理神經(jīng)網(wǎng)絡第二次浪潮80-90年代:知識工程專家系統(tǒng)多層神經(jīng)網(wǎng)絡第三次浪潮2000-2020:深度學習深度神經(jīng)網(wǎng)絡大數(shù)據(jù)GPU硬件云計算第四次浪潮至今:大型語言模型Transformer模型預訓練語言模型RLHF2022年11月30日,ChatGPT發(fā)布,上線2個月活躍用戶過億2023年3月14日,微軟基于GPT的Dynamics
365
Copilot
(國際版)全球首發(fā)賦能業(yè)務全線2023年5月10日,谷歌大腦與DeepMind合并,并推出PaLM2等產(chǎn)品比爾蓋茨:“歷史意義不亞于PC或互聯(lián)網(wǎng)誕生”埃隆馬斯克:“ChatGPT帶來令人驚喜的變革,我
們離AI時代并不遠了”圖片來源:量子位微信公眾號圖片來源:微軟發(fā)布會金融大模型——BloombergGPTBloomberg發(fā)布500億參數(shù)的金融領域大語言模型BloombergGPT,構建了3630億個Token的金融領域數(shù)據(jù)集用于模型訓練,在BLOOM模型架構下進行拓展和改進。數(shù)據(jù)模型效果新聞分析報告交易數(shù)據(jù)公司數(shù)據(jù)宏觀經(jīng)濟數(shù)據(jù)彭博數(shù)據(jù)維基百科書籍語料庫網(wǎng)絡文本社交媒體公開數(shù)據(jù)標注和清洗形成3630億個
Token,占
BloombergGPT數(shù)據(jù)集的51.3%形成3450億個
Token,占
BloombergGPT數(shù)據(jù)集的48.7%BloombergGPT模型參數(shù)500億個BLOOM模型(1760億參數(shù))標注和清洗更改模型結構配置超參數(shù):如模型層數(shù)減少到70層、隱藏層維度更改至7680、注意力頭數(shù)設置為40等。最終的模型做了“標準LLM基準測試”、“開放的金融基準測試”以及“內(nèi)部的金融基準測試”。從最終的結果來看,在金融專業(yè)領域任務上,BloombergGPT的性能明顯優(yōu)于其它模型,而在通用任務上,BloombergGPT的綜合得分也與相同參數(shù)量級的其他模型平分秋色。密級:大模型的“黑箱”特性大型語言模型的輸出難以解釋和驗證很難去判斷語言模型這個“黑箱”內(nèi)部的真實運行邏輯即使通常情況下是正確的,但也是不可解釋的密級:大模型對長尾知識的記憶能力差大模型不能夠僅通過參數(shù)來記憶全部的長尾(long-tail)知識大模型容易胡亂編造一些虛假事實,也就是“幻覺”(Hallucination)現(xiàn)象大模型本質上是統(tǒng)計模型,無法從根本上解決這一問題密級:模型參數(shù)難以與時俱進LLMs通過參數(shù)所記憶的知識很容易過時,并且難以更新。LLMs規(guī)模極大,訓練和運行均極其昂貴。檢索增強的大語言模型(What
&
How
&
When)密級:02WarrenQ產(chǎn)品介紹密級:一站式投研端密級:密級:語控萬數(shù)搜索+大模型+聚源庫文檔+向量數(shù)據(jù)庫+大模型金融大語言模型密級:Chat筆記腦圖分享/匯報引文/溯源演算板估值模型密級:語控萬數(shù):行情、F9、EDB、公司基本信息、
研報、公告、新聞……WarrenQ-Chat:支持查看原文支持追溯原文WarrenQ-Chat:問出圖表->拖入云筆記支持拖入筆記WarrenQ-Chat:問出圖表->拖入?yún)f(xié)作腦圖支持拖入腦圖ChatMiner:文檔信息挖掘文檔處理支持各類PDF內(nèi)容的加載。支持指定內(nèi)容分析定位支持內(nèi)容的摘要抽取支持數(shù)據(jù)抽取內(nèi)置經(jīng)典場景promptChatMiner:文檔信息挖掘密級:語音速記語音速記:支持會議錄音上傳,語音文字識別,大模型摘要撰寫。03總結和展望密級:深度賦能搜、讀、算、寫四大場景智能搜索報告信息提取精準數(shù)據(jù)查詢輕投研素材庫閱讀器各類文檔加載和解析圖表數(shù)據(jù)OCR解析核心觀點總結提煉模型運算盈利預測及估值
EDB數(shù)據(jù)預處理基本面量化建模研報模板建立
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年對口單招電子試題及答案1套
- 2026年湖南工業(yè)單招職業(yè)測試題附答案
- 2026年廣東理工職業(yè)學院單招職業(yè)適應性考試模擬測試卷及答案1套
- 2026重慶某國企外包員工招聘2人筆試參考題庫及答案解析
- 2026年成都紡織高等專科學校單招職業(yè)技能測試題庫附答案
- 2026年浙江師范大學行知學院單招職業(yè)技能考試模擬測試卷附答案
- 2026年安康職業(yè)技術學院單招綜合素質考試題庫及答案1套
- 2026年廣東江門中醫(yī)藥職業(yè)學院單招職業(yè)傾向性考試模擬測試卷及答案1套
- 2026年吉林省遼源市單招職業(yè)適應性測試題庫及答案1套
- 2026年大學往年單招試題及答案1套
- 電子元器件入廠質量檢驗規(guī)范標準
- 中藥炮制的目的及對藥物的影響
- 688高考高頻詞拓展+默寫檢測- 高三英語
- 學生公寓物業(yè)管理服務服務方案投標文件(技術方案)
- 食品檢驗檢測技術專業(yè)介紹
- 2025年事業(yè)單位筆試-貴州-貴州財務(醫(yī)療招聘)歷年參考題庫含答案解析(5卷套題【單項選擇100題】)
- 二年級數(shù)學上冊100道口算題大全(每日一練共12份)
- 空壓機精益設備管理制度
- 國家開放大學《公共政策概論》形考任務1-4答案
- 藥品經(jīng)營與管理專業(yè)職業(yè)生涯規(guī)劃書1400字數(shù)
- 正循環(huán)成孔鉆孔灌注樁施工方案
評論
0/150
提交評論