版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
20242023年,是人類歷史的第三個科學(xué)奇跡年底層范式正在改變,智能和技術(shù)“涌現(xiàn)”,新的創(chuàng)新機遇開啟1666年牛頓開辟光學(xué),創(chuàng)立微積分推導(dǎo)出引力公式1905年1666年牛頓開辟光學(xué),創(chuàng)立微積分推導(dǎo)出引力公式1905年愛因斯坦發(fā)表狹義相對論、質(zhì)能方程等四篇論文2023年GPT引領(lǐng)AI浪潮技術(shù)的底層范式發(fā)生重大變化AI將帶來整個社會的底層重構(gòu)如何抓住這次創(chuàng)新大潮?讓我們從上一次科技大潮的小故事開始20年前一個年輕人懷揣400元來到北京過著很卷的北漂生活盡管有幸加入互聯(lián)網(wǎng)大潮,每天起早貪黑30歲前三個愿望一個都沒有實現(xiàn)回頭來看,每個大變革的時代普通人的有心無力,往往都是類似的32歲時,一次跨國旅行讓自己意識到只靠勤奮,沒有辦法讓自己NB起來同質(zhì)化的勤奮只會更卷不同的道路才可能勝出所謂創(chuàng)新,就是找到不同的路以更少的投入換取更大的產(chǎn)出曾以為ThinkDifferent猛然一刻意識到它是創(chuàng)新的底層思維模式ThinkBetterThink與其更好不如不同Part1ThinkDifferen創(chuàng)新的不二法門為什么偉大不能被計劃?只有ThinkDifferent找到新的道路才能實現(xiàn)偉大但新的道路不在大多數(shù)人的認(rèn)知地圖中2012獵豹移動ThinkDifferent,Allin出海2016年,共享經(jīng)濟如火如荼ThinkDifferent,AllinAIAI起步早取得了一些技術(shù)優(yōu)勢自研全鏈條AI技術(shù)行業(yè)領(lǐng)先的語音、導(dǎo)航技術(shù)小米小愛同學(xué) 小雅音箱 華為AI音箱 小美AI音箱
北京冬奧服務(wù)型機器人創(chuàng)新測評大賽五項產(chǎn)品入選,獨占半壁獵戶N獵戶NPV2.0獵戶語音合成v1.0獵戶語音識別獵戶語音識別v1.0獵戶人體&物體檢測獵戶NPV1.0AI1.0時代深度學(xué)習(xí)成為熱潮獵戶星空搶先出擊全行業(yè)一起卷卻難破瓶頸一個小小的分支正在成長直到2022年11月30日ChatGPTAI進入2.0時代,徹底開啟生產(chǎn)力革命AI2.0時代ChatGPT
獵戶NPV2.0獵戶語音合成v1.0獵戶語音識別獵戶語音識別v1.0獵戶人體&物體檢測獵戶NPV1.0回頭看,CatGTTkfftAIAIOpenAIIreOpenAI讓機器像人一樣使用計算機
Ie用于玩DOTA2
魔方機械手secd
Chatbot也就是后來的ChatGPTOenAI從“學(xué)外語模式”變成了“學(xué)母語模式”學(xué)外語模式 學(xué)母語模式系統(tǒng)達到一定語言能力,但是無論如何優(yōu)化,依然答非所問
建立基本的邏輯認(rèn)知產(chǎn)生邏輯能力和推理能力OpenAI,與其說是技術(shù)積累的成功不如說是技術(shù)信仰的成功更是ThinkDifferent的成功ChatGPT的橫空出世更像是哥倫布航海不是艦隊多牛,而是走了別人不敢走的路回顧互聯(lián)網(wǎng)創(chuàng)業(yè)大潮再看這次AI技術(shù)浪潮ThinkDifferent都是ThinkDifferent的成果如蘋果、特斯拉、OpenAI但在最初,都是被質(zhì)疑甚至被嘲笑的Part2AI大模型創(chuàng)新依然可以ThinkDifferentChatGPT是一次底層范式正在改變每個業(yè)務(wù)用大模型重做一遍都能獲得十倍增長Microsoft(微軟)2023年市值超越蘋果成為全球市值最高公司
Midjourney“設(shè)計外包公司”40名員工年收入超2億美金估值100億美金
HeyGen“視頻翻譯公司”30名員工收入超過1800萬美金估值7500萬美金
ka“視頻制作公司”4名員工融資5500萬美金估值超2億美金面對這一次的AI大潮每個人都躍躍欲試,但不知所措來得太猛了,不懂技術(shù)被淘汰?變得太快了,剛學(xué)一點又變了!萬變不離其宗躬身入局,以終為始找到適合自己的道路我們也曾很焦慮:2023年3月,國內(nèi)千億大模型創(chuàng)業(yè)如火如荼,團隊躁動不安“老板,再不動手訓(xùn)大模型就落伍了A100要大漲價了”20233月2023訓(xùn)練千億大模型是技術(shù)皇冠上的明珠技術(shù)團隊都有摘取的愿景但我關(guān)心的是,怎樣才有獨特的價值?對于AllinAI七年的獵戶星空一次訓(xùn)練,上千萬美金,數(shù)月周期Tobeornottobe?在千家萬戶都在卷千億大模型的彼時只有做千億大模型才是唯一路徑嗎?況且如果沒有商業(yè)落地,那只是技術(shù)狂歡脫離市場的技術(shù)投入,就是資源浪費大力發(fā)展Copilot應(yīng)用的微軟成為最大贏家ibit igitisit ieit ThinkDifferent不是只有跟隨OpenAI才能成功我們1挖掘應(yīng)用場景我們1挖掘應(yīng)用場景2垂直模型3打造最適合模型主流訓(xùn)練千億級模型垂直模型4月尋找應(yīng)用場景
StepStepStep20233月2023從我開始:內(nèi)部生長出AI應(yīng)用對外提供咨詢服務(wù)4月20233月2023CFO助理寫出的小工具震驚了所有程序員自設(shè)計線上服務(wù)機器人
自寫小工具 自建應(yīng)用開發(fā)交流平臺垂直技術(shù)領(lǐng)域,AI可能帶來生產(chǎn)力的躍遷家 員 員 模型組件應(yīng)用組件獵豹移動內(nèi)部產(chǎn)生13個課題組半年生長出16個AI應(yīng)用組件模型組件應(yīng)用組件通過近一年實踐,我們發(fā)現(xiàn):大模型在企業(yè)中增效明顯,但只靠員工自驅(qū)動難以落實需要一把手親自抓,對公司流程進行I重構(gòu)需要深度結(jié)合企業(yè)流程開發(fā)I應(yīng)用AI前景很大,但尚處早期大模型落地,需要強應(yīng)用紙上得來終覺淺只看朋友圈,真的以為要吞噬人類絕知此事要躬行真正動手做,發(fā)現(xiàn)還是創(chuàng)業(yè)最好時代2023年5月客戶問能否幫我私有化部署大模型但當(dāng)時私有化千億參數(shù)大模型數(shù)千萬千億參數(shù)大模型
數(shù)百萬服務(wù)器配置數(shù)百萬A100x8服務(wù)器每臺價格約160萬,只能滿足很小的并發(fā)請求客戶說:“我就是解決客服問題,一年投入幾千萬難以承受,有沒有便宜,但不損失性能的方案?”獵戶N獵戶NP0獵戶語音合成10獵戶語音識別獵戶語音識別v1.0獵戶人體&物體檢測獵戶NP10恰逢其時LLaMA來了開源社區(qū)使得千億參數(shù)大模型性能護城河消失小參數(shù)模型能力迅速提升“涌現(xiàn)”出智能忽然一夜開源來千模萬模智能開AI大模型進入二元對立時代ThinkDifferent規(guī)律再次應(yīng)驗更高參數(shù)看誰能造出“愛因斯坦”
閉源陣營 開源陣
更小資源看誰能造出平民化大模型我們發(fā)現(xiàn),在企業(yè)應(yīng)用場景中千億參數(shù)大模型數(shù)據(jù)千億參數(shù)大模型數(shù)據(jù)&應(yīng)用百億參數(shù)基座千億全面,百億專業(yè)在企業(yè)場景中,專業(yè)足矣,更具性價比會議紀(jì)要 規(guī)章制
知識管理數(shù)據(jù)圖表 文案打
創(chuàng)意腦暴合同審核客戶案例,通過百億參數(shù)+應(yīng)用打磨專業(yè)回答問題超越GPT-497%回答準(zhǔn)確率%回答準(zhǔn)確率企業(yè)應(yīng)用百億參數(shù)就夠了Part3每個企業(yè)都有私有化大模型的時代到來了三個時代企業(yè)核心價值的變化土地、廠房、生產(chǎn)線 互聯(lián)網(wǎng)和信息化 經(jīng)營數(shù)據(jù)和數(shù)智化A在企業(yè)內(nèi)部到底能做什么?難道只是GPT風(fēng)的匯報文檔和花哨的圖片?AIGC到底是什么?t公有數(shù)據(jù)IAI私有數(shù)據(jù)C2套件+應(yīng)用C3數(shù)字員工和輔助決策才是真正的AI提效公有數(shù)據(jù)I)C1宣傳文案,圖片據(jù)IRAG+AgentC2數(shù)字員工,降本I企業(yè)定制應(yīng)用C3輔助決策,提效OpenAI“陽謀”ChatGPT只從公開出版物上獲取數(shù)據(jù)所以,大模型在解決企業(yè)問題上無法深入OpenAI“陽謀”推出GPTStore,是為了獲取私有數(shù)據(jù),進一步提升“智商”互聯(lián)網(wǎng)公開大數(shù)據(jù)
GPTStoreAI用戶 用戶 企業(yè)調(diào)侃的說:AppStore要交“蘋果稅”GPTStore要交“智商稅合同、財務(wù)、業(yè)務(wù)數(shù)據(jù)等公司機密給ChatGPT短期內(nèi)可以提高效率長期來看,每用一次ChatGPT都可能在幫你的競爭對手成長ChatGPT這件事正在發(fā)生山姆·奧特曼只給了我500美金OpenAI代金券卻毀掉了我300萬美金的初創(chuàng)公司為了讓企業(yè)有持久競爭力應(yīng)該使用私有化大模型讓經(jīng)營數(shù)據(jù)內(nèi)循環(huán)生長企業(yè)實現(xiàn)應(yīng)用AI的王者段位私有數(shù)據(jù)私有大模型數(shù)字員工私有數(shù)據(jù)私有大模型數(shù)字員工強應(yīng)用套件輔助決策Part4獵戶星空大模型為企業(yè)應(yīng)用而生以終為始的思考:尋找破局點太多人只關(guān)心千億模型刷分高不高
我們更關(guān)心百億模型用的好不好企業(yè)應(yīng)用百億參數(shù)就夠了是時候打造我們的百億參數(shù)模型了主流 我們訓(xùn)練千億級模型垂直模型尋找應(yīng)用場景
Step1Step2Step
挖掘應(yīng)用場景垂直模型打造最適合模型七年磨一劍來自于Facebook總部、Yahoo總部、來自于Facebook總部、Yahoo總部、百度等全球頂級大廠的上百名頂級算法科學(xué)家上千家企業(yè)應(yīng)用適配近7年數(shù)據(jù)積累,百億級真實用戶數(shù)據(jù),數(shù)十萬億級別token數(shù)據(jù)頂級團隊技術(shù)路線從DNN、i,/NLP全棧追蹤行業(yè)技術(shù)演進場景認(rèn)知全球20億用戶級應(yīng)用打磨經(jīng)驗數(shù)據(jù)積累算法理解應(yīng)用打磨獵戶星空大模型140億參數(shù)千億效果
七大應(yīng)用微調(diào)方向
千元顯卡即可運行用得好 用得起 用得安心看性能,先看為什么有些大模型在榜單上靠前,用起來一般般?對大模型來說,(為此,我們發(fā)布了一個“應(yīng)試教育版”)模型C-EVALCMMLUMMLULambadagOrion-14B(應(yīng)試版)93.683.187.579.085.8GPT469.971.083.065.591.4當(dāng)然,我們今天正式發(fā)布的是(沒有刷過題)所以遇到?jīng)]有見過的新問題時,它的水平是一致的模型CMMLU學(xué)科MMLU學(xué)科C-EVAL知識模型CMMLU學(xué)科MMLU學(xué)科C-EVAL知識AGEval知識Lambada理解RACE理解HeaSwag推理BBH推理Orion-14B70.670.072.854.778.891.3556.5LLaMA2-13B40495956Skywork-13B47168173Baichuan2-13B35041280QWEN-14B29794380.27nternLM-20B01868315基于第三方機構(gòu)OpenCompass獨立評測結(jié)果700億參數(shù)以下基座模型中文第一140億參數(shù)320Ktokens一次讀入一本小說在三十萬文字中任意位置隨機隱藏關(guān)鍵信息,對模型進行提問,結(jié)果INT4量化性能損失<1%模型模型大小(GB)模型模型大小(GB)推理速度(tokens/s)性能評測C-EvalCMMLUMMLURACEellaSagOrionStar-14B28.013572.870.670.093.378.5OrionStar-14B-NT48.317871.869.869.293.178.0模型大小降低70%推理速度提升30%用得起
獵戶星空大模型小企業(yè)專用版 為滿足小企業(yè)需求推出量化后智能水平幾乎無損的版本
市價1500元顯卡即可運行(可實現(xiàn)每秒31token,約50個漢字)日語、韓語評測百億模型全球第一多語言能力
模型訓(xùn)練語料日文平均韓文平均中文平均英文平均iB多語言69.179.567.6模型訓(xùn)練語料日文平均韓文平均中文平均英文平均iB多語言69.179.567.65iB多語言1781Qwen-14B多語言8754B多語言3743iB多語言12768.8B英,韓-7--KOGPT-6B英,韓-1--B英,日51.1---B英,日3---B英,日7---ELYZA-7B英,日8---即便在評測成績上超越了某些更大參數(shù)的模型但坦率地說,跟GPT-4的全面性還是有差距定義好專業(yè)場景,微調(diào)和應(yīng)用打磨,結(jié)合企業(yè)數(shù)據(jù),在實際使用中企業(yè)應(yīng)用場景可超越GPT-4用得好
獵戶星空大模型下一個MoE多專家模型架構(gòu)專注百億,敬請期待!通用對話微調(diào)插件微調(diào)RAG微調(diào)通用對話微調(diào)插件微調(diào)RAG微調(diào)長token微調(diào)知識抽取微調(diào)問答對生成微調(diào)日韓文微調(diào)為了企業(yè)更好應(yīng)用獨家推出微調(diào)全家專業(yè),百億級 ,媲美20B以下開源模型Agent、ReAct知識邊界控制能力、支持320K長度將非結(jié)構(gòu)化數(shù)在保證知識覆蓋日、韓文水平在里,通用能力最mi能力,回答精準(zhǔn)度,接近token;開源模型據(jù),轉(zhuǎn)化為結(jié)度的前提下,生20B以下開源模型佳的對話模型接近千億級模型千億級模型效果中,支持長token構(gòu)化成問答對中最佳效果最好的模型數(shù)據(jù)獵戶星空大模型獵戶星空大模型用得好同頭部客戶一起用得好著重打磨 主要用于知識庫問答、企業(yè)客服等結(jié)合企業(yè)私有數(shù)據(jù)的場景
用來把大模型和業(yè)務(wù)系統(tǒng)深度打通用得好-檢索增強生成用得好用檢索的方法配合大模型進行任務(wù)處理,可以很好的使用企業(yè)數(shù)據(jù)進行知識問答為什么周鴻祎先生喜歡穿紅色衣服?
得到答案:檢索算法【構(gòu)造Prompt檢索算法【構(gòu)造Prompt】請根據(jù)知識片段,回答問題:為什么周鴻祎先生喜歡穿紅色衣服?知識片段:1、新浪科技:周鴻祎解釋為啥喜歡穿紅衣服:提醒別人叫對名字...2、騰訊云:...會上主持人調(diào)侃360集團創(chuàng)始人、董事長周鴻祎喜歡穿紅色上衣,“買光了中國一半的紅色衣服”。對此,周鴻祎強調(diào)...大模型最匹配的知識段落TOP:知識庫新浪科技:周鴻祎解釋為啥喜歡穿紅衣服:提醒別人叫對名字...騰訊云:...會上主持人調(diào)侃360集團創(chuàng)始人、董事長周鴻祎喜歡穿紅色上衣,“買光了中國一半的紅色衣服”。對此,周鴻祎強調(diào)...用得好用得好RAG開源框架很多,可現(xiàn)實很骨感一周出Demo 半年用不好用得好休閑跑步(普通)普通RAG套件
(專業(yè))獵戶星空大模型RAG套件知識蒸餾清洗歸并元數(shù)據(jù)構(gòu)建多引擎場景m知識蒸餾清洗歸并元數(shù)據(jù)構(gòu)建多引擎場景migRAG全鏈路流量評估RAG全鏈路流量回放VectorDatabase多路召回和重排推薦算法Q2SQDRAG全鏈路流量評估RAG全鏈路流量回放VectorDatabase多路召回和重排推薦算法Q2SQD和稀疏檢索技術(shù)結(jié)合獵戶星空傳統(tǒng)NLP技術(shù)插件Q2CoTQ2E自動化質(zhì)量評估體系MMI知識邊界的控制等CPT場景化SFT獵戶星空大模型基座獵戶星空大模型基座用得好
RAG套件牛,行業(yè)頭部客戶才用得好(混沌實例)課程解析52.88%
課程解析80.77%
課程解析94.5%胡編亂造1.3%模型不可用正確率優(yōu)化到70%
基于客戶服務(wù)重做RAG
雖然回復(fù)超預(yù)期但無法落地
更多高質(zhì)量數(shù)據(jù)更驚喜的微調(diào)迷茫·焦慮·痛苦
能力:根據(jù)目標(biāo)進行實驗尋找最優(yōu)方案價值:使用LLM基于客戶業(yè)務(wù)搭建應(yīng)用并優(yōu)化效果用得好用得好讓大模型像人一樣工作自主完成任務(wù)。····與企業(yè)系統(tǒng)打通用得好做應(yīng)用所需的用得好90.3%90.3%100%%91.07%91.37%意圖識別成功率
首輪抽參成功率
多輪抽參成功率
缺槽反問成功率
插件調(diào)用成功率一般的百億參數(shù)大模型表現(xiàn)不超過70%用得好用得好RAGAgent企業(yè)數(shù)字員工應(yīng)用最牛套件用好RAG和Agent套件才是黃金段位公有數(shù)據(jù)I)C1宣傳文案,圖片私有數(shù)據(jù)IRAG+AgentC2數(shù)字員工,降本數(shù)據(jù)I企業(yè)定制應(yīng)用C3輔助決策,提效用得安心用得安心私有化部署:大模型服務(wù)器可放置于企業(yè)內(nèi)網(wǎng)所有數(shù)據(jù)不連公網(wǎng)免費 開
可商用
社區(qū)技術(shù)支持獵戶星空百億參數(shù)大模型企業(yè)標(biāo)配首選用好企業(yè)定制應(yīng)用才是王者段位公有數(shù)據(jù)I)C1宣傳文案,圖片私有數(shù)據(jù)IRAG+AgentC2數(shù)字員工,降本數(shù)據(jù)I企業(yè)定制應(yīng)用C3輔助決策,提效讓老板對經(jīng)營細節(jié)全掌握人力資產(chǎn)、云資產(chǎn)、數(shù)字資產(chǎn),全天候細節(jié)無遺漏人力資產(chǎn)、云資產(chǎn)、數(shù)字資產(chǎn),全天候細節(jié)無遺漏聚言:獵戶星空大模型+強應(yīng)用套件+保姆式服務(wù)人力助手
保姆式服務(wù)云資
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 療養(yǎng)院服務(wù)質(zhì)量指標(biāo)體系構(gòu)建-洞察及研究
- 動態(tài)多行注釋可視化分析方法-洞察及研究
- 高維空間理論-洞察及研究
- 非藥物干預(yù)方法研究-洞察及研究
- 海洋酸化對珊瑚礁的影響-洞察及研究
- 教育評價方法改進-洞察及研究
- 可持續(xù)發(fā)展模式構(gòu)建-洞察及研究
- 鈷基催化劑對鋅-空氣電池氧化還原影響-洞察及研究
- 膽囊結(jié)石治療中茵陳熊膽的運用-洞察及研究
- 珍珠棉安全生產(chǎn)上鎖制度
- 民兵偽裝與防護課件
- 2025至2030中國丙烯酸壓敏膠行業(yè)調(diào)研及市場前景預(yù)測評估報告
- 2025年初級經(jīng)濟師考試卷附答案
- 車輛保證過戶協(xié)議書
- 2026年勞動合同示范文本
- 2025年《城市公共汽車和電車客運管理規(guī)定》知識考試題庫及答案解析
- 數(shù)字文旅發(fā)展的沉浸式體驗創(chuàng)新
- 電焊工考試100題(帶答案)
- 物業(yè)項目運營管理培訓(xùn)
- 掌握生命晶石制作技能初級工作指南
- 雨課堂在線學(xué)堂《審美的歷程》作業(yè)單元考核答案
評論
0/150
提交評論