版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
微課視頻:唐杰談GLM教材《機器學(xué)習(xí)(Python版)》ML唐杰ML圖1:JieTang(Tang,Jie)唐杰(清華大學(xué)計算機科學(xué)與技術(shù)系長聘教授,智源研究院副院長)大模型發(fā)展回顧ML算法之戰(zhàn)(2018—2020):基于Transformer的BERT、GPT/GPT-2/GPT-3、T5等基于大規(guī)模無標注數(shù)據(jù)自監(jiān)督學(xué)習(xí)的大規(guī)模預(yù)訓(xùn)練算法。唐杰團隊研發(fā)了屬于自己的算法GLM(GeneralLanguageModel),該算法結(jié)合了BERT和GPT的優(yōu)勢。MLML模型之戰(zhàn)(2020—2022):2020年的GPT-3(擁有1750億參數(shù))可以看作這一戰(zhàn)的起點,它開啟了基座模型的新時代,在語言生成、上下文學(xué)習(xí)和知識(常識)理解等方面展現(xiàn)出驚人的能力。很多人喜歡把這一年叫做大模型元年。谷歌、Meta等公司開始不斷發(fā)布百億到千億的大型語言模型。開源大語言模型也開始受到關(guān)注。2022年,清華大學(xué)和智譜AI開源了基于GLM算法訓(xùn)練的千億基座模型GLM-130B。ML大模型發(fā)展回顧ML產(chǎn)業(yè)落地之戰(zhàn)(2023):2022年11月30日ChatGPT發(fā)布。2023年2月初就研發(fā)出了第一代ChatGLM,是國內(nèi)最早可以線上測試使用的千億級對話模型。2023年8月基于ChatGLM開發(fā)的智譜清言通過國家第一批《生成式人工智能服務(wù)管理暫行辦法》備案認證,正式面向公眾上線使用。隨后,國內(nèi)呈現(xiàn)“百模大戰(zhàn)”。ML大模型發(fā)展回顧MLGPT系列模型與GLM系列模型的對比:ML大模型發(fā)展回顧ML基礎(chǔ)能力對比測試結(jié)果(英文):MLGLM能力測試ML對齊能力對比測試結(jié)果(中文,數(shù)據(jù)集AlignBench):MLGLM能力測試ML長文本能力對比測試結(jié)果(中文,數(shù)據(jù)集LongBench、NeedleTest):MLGLM能力測試ML多模態(tài)能力——文生圖性能評測(SDXL是開源最佳模型):MLGLM能力測試ML智能體能力——AllTools:MLGLM能力測試ML智能體能力——網(wǎng)頁瀏覽(左)和函數(shù)調(diào)用(右):MLGLM能力測試ML智能體能力案例:“查詢一下全球近年的GDP。分析這些數(shù)據(jù)中哪些年份GDP下降了,畫折線圖并將下降的年份標紅”MLGLM能力測試未來展望ML未來AGI之路在哪里?在美國,OpenAI、GoogleDeepMind、Anthropic、Meta、xAI、斯坦福等公司和科研機構(gòu)基本上形成了國際頂尖的大模型團隊,這源于它們對創(chuàng)新型頂尖人才的匯聚,以及對基于大模型的AGI之路的執(zhí)著和技術(shù)積累。OpenAI曾經(jīng)在看不到前景和沒有明顯效果的階段(2018~2021年),仍然堅定地投入大量人力和算力,這種長期的堅持和純粹的創(chuàng)新精神是成功的必要條件。ML未來展望MLAGI是否能夠通過大模型的縮放定律(ScalingLaws)來實現(xiàn)?縮放定律描述了大模型性能與其參數(shù)量、數(shù)據(jù)規(guī)模、計算量之間的關(guān)系。雖然備受質(zhì)疑,但直到今天,可能高質(zhì)量的縮放仍然是提高大模型性能的重要方法。ML未來展望MLAGI也需要參考人腦智能的實現(xiàn)機理:基于大模型的AGI或者說機器智能不一定要和人腦認知的機理一樣,但剖析人腦的工作機理也許可以更好地啟發(fā)AGI的實現(xiàn)。ML未來展望ML新型原生多模態(tài)基座模型:目前的大模型主要基于Transformer架構(gòu),有三種主流架構(gòu):編碼器(encoder-only,例如BERT)、編碼器-解碼器(encoder-decoder,例如T5),以及解碼器(decoder-only,例如GPT)。如何從本質(zhì)上改進預(yù)訓(xùn)練模型的基座能力,實現(xiàn)Transformer架構(gòu)上的顛覆式創(chuàng)新還存在巨大挑戰(zhàn)。ML未
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025上海市事業(yè)單位考試模擬題-常識判斷及參考答案一套
- 強化地板備料工安全宣傳知識考核試卷含答案
- 隔離層制備工安全宣貫測試考核試卷含答案
- 混凝土制品質(zhì)檢員班組考核測試考核試卷含答案
- 鹽斤收放保管工安全操作水平考核試卷含答案
- 反射爐工成果知識考核試卷含答案
- 2025年上海第二工業(yè)大學(xué)輔導(dǎo)員考試筆試真題匯編附答案
- 2024年潼南縣直屬機關(guān)遴選公務(wù)員筆試真題匯編附答案
- 2025年10月廣東深圳市大鵬新區(qū)總工會招聘社會化工會工作者1人備考題庫附答案
- 2025中國平安洛陽社區(qū)金融招募社區(qū)高級專員20人備考題庫附答案
- 2025年財務(wù)共享服務(wù)模式白皮書方案
- 建筑工程交通導(dǎo)改與組織方案
- 2025版新春晚會節(jié)目編排與制作合同
- 春天綠化養(yǎng)護知識培訓(xùn)
- 數(shù)據(jù)中心消防培訓(xùn)課件
- 四川評標專家培訓(xùn)課件
- 學(xué)情分析與教學(xué)策略的講座
- JJF(蒙) 064-2024 混凝土振動臺校準規(guī)范
- 地產(chǎn)文案培訓(xùn)課件
- 中考化學(xué) 金屬與鹽溶液反應(yīng)后的成分分析
- 土石方施工交通組織方案范文
評論
0/150
提交評論