版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
111)大模型迭代不斷,中國模型已有效改變了北美單極主導的競爭格局。在全球Top10陣營中,GLM-4.7、費8美元的“ChatGPTGo”訂閱套餐,并計劃口之爭的背后是流量之爭,直接指向大型互聯(lián)網(wǎng)企業(yè)廣告及電商業(yè)務(wù)的基本盤,2026年各家在模型、AI應(yīng)用產(chǎn)品上的算力投入將進入白熱化階段。GPU從“可用”向“好用”升級:國產(chǎn)算力芯片在工藝與架構(gòu)上持續(xù)突破,在處理大模型長文本、復雜算子融合等方面的表現(xiàn)已顯著縮小與國際巨頭的差距,以中芯國際為代表的本土晶圓廠產(chǎn)能/利用率持續(xù)高位運行,為國產(chǎn)AI芯片的產(chǎn)能提供了堅實保障。3)CSP廠商加豐科技、中芯國際、華虹半導體、兆易創(chuàng)新、大普微、中微公司、興森科技、中科曙光、禾盛新材、潤澤科n行業(yè)競爭加劇的風險;技術(shù)研發(fā)進度不及預期的行業(yè)深度研究22 3 8 3 3 4 4 5 5 6 7 7 8 9 9 9 332025年中國開源AI模型調(diào)用量約占全球市場的70+%。據(jù)《4412月16日斯坦福大學發(fā)布研究報告指出,在能力與采用率方面,中國的AI模型尤其是開放權(quán)重的大語言模型,已接近甚至部分領(lǐng)先于國際先進水平。2025年9月,阿里巴巴的Qwen模型家族超越Llama,成為HuggingFace上下載量最多的LLM家族。2024年8月至2025年8月期間,中國開源模型開發(fā)者占HuggingFace所有下載量的17.1%,略超過美國開發(fā)者,后者占下載量的15.8%。自2025年1月起,基于阿里巴巴和DeepSeek發(fā)布的開源模型的上傳衍生模型已超過基于美國和歐洲主要模型的衍生模型。并且在2025年9月,中國微調(diào)或衍生模型占HuggingFace上發(fā)布的所有新微調(diào)或衍生模型的63%。中國的開放權(quán)重模型現(xiàn)在在主要基準和排行榜上表現(xiàn)接近頂尖水平,涵蓋通用推理、編碼和工具使用。在ChatbotArena這個著名的用戶比較和評分排行榜上,中國生產(chǎn)了頂尖的開放權(quán)重模型,而且其中最好的模型幾乎與美國公司領(lǐng)先的閉源模型不相上下。55Scaling-law仍然有效:三大Scaling持續(xù)演繹。大模型三大Scaling定律:預訓練(pre-training)/后訓練(post-training)/推理深度思考(test-timelongthinking)。算力與應(yīng)用循環(huán)促進:算力Scaling—>智能提升(Intelligence)—>應(yīng)用的廣泛采用(Adoption)—>經(jīng)濟效益(Profits)—>算力Scaling。GPTo1之后,模型Scalinglaw從單一的預訓練(pre-training)向三大Scaling轉(zhuǎn)變。1)模型在回應(yīng)用戶之前產(chǎn)生很長的內(nèi)部思考鏈,思考時間越長,答案的質(zhì)量就越高;2)Multi-agent進一步提升模型性能,但其Token消耗量往往達到對話聊天的數(shù)倍。66訓練層面,預訓練重啟,后訓練加碼。預訓練方面,DeepSeek團隊在論文中坦言,受訓練算力約束,DeepSeek-V3.2的世界知識廣度仍落后于領(lǐng)先閉源模型(如Gemini3Pro后續(xù)將通過擴大預訓練規(guī)模補齊能力上限。此外,V3.2往往需要更多token才能逼近Gemini-3.0-Pro等模型的輸出質(zhì)量,未來將聚焦提升推理鏈的“智能密度”,以更少token達到同等效果;后訓練投入強度提升:DeepSeek認為開源模型后訓練投入普遍不足并制約任務(wù)表現(xiàn),因此將后訓練算力預算上調(diào)至超過預訓練成本的10%。推理方面,MiniMaxM2、DeepSeekV3.2等國產(chǎn)大模型,把“思考→行動→觀察→再思考”的動態(tài)循環(huán)模式(InterleavedThinking)融入推理流程,正成為Agent模型標配。我們認為,國內(nèi)InterleavedThinking范式滲透,能夠顯著提高Agent的準確性和規(guī)劃能力,2026年Token消耗與推理需求有望加速爆發(fā)。我們認為模型的進步目前并未到瓶頸,2026年模型的進展會更值得期待:1)靠Scalinglaw提升模型能力的路徑依舊有效。DeepSeekV3.2后訓練規(guī)模擴展到預訓練規(guī)模10%,預計未來比例還會提高,而且DeepSeek團隊在論文表示由于訓練算力有限,DeepSeek-V3.2的世界知識廣度還是落后于Gemini3pro這樣的頂尖閉源模型,團隊計劃未來進一步擴大預訓練規(guī)模。同時DeepSeek大量使用合成數(shù)據(jù)有效說明不用擔心數(shù)據(jù)會遇到瓶頸。2)DeepSeek-V3.2提出的DSA機制展示出強大算法創(chuàng)新能力,不必擔心大模型技術(shù)創(chuàng)新已經(jīng)到達瓶頸。3)大模型訓練的硬件基礎(chǔ)正從英偉達的Hopper架構(gòu)轉(zhuǎn)向Blackwell架構(gòu),Blackwell相比前代在單卡算力、顯存帶寬、顯存容量、以及集群互聯(lián)都大幅提升,這對大模型訓練的意義一方面是加速和降低成本,另一方面是可以使用更大的BatchSize(模型更新學習內(nèi)容前一次性處理的訓練樣本數(shù)量),這對訓練穩(wěn)定性有幫助,更大的BatchSize能夠更準確地估計整個數(shù)據(jù)集的梯度,從而使學習過程更加穩(wěn)定,而較小的批次則會產(chǎn)生噪聲過大且特征過于明顯的信號,這可能導致模型的學習路徑出現(xiàn)不穩(wěn)定的跳躍。77來源:intuitionlabs.ai,國推理需求高增:推理模型解鎖10X算力需求。推理相對非推理解鎖了10XToken消耗。隨著大模型參數(shù)邊際效應(yīng)的初現(xiàn),技術(shù)競爭的關(guān)鍵變量開始向后訓練發(fā)生結(jié)構(gòu)性轉(zhuǎn)移。Post-training將訓練從通用的參數(shù)堆疊轉(zhuǎn)向了基于高質(zhì)量私有數(shù)據(jù)的監(jiān)督微調(diào)與人類反饋強化學習,訓練過程需要引入海量由高算力生成的合成數(shù)據(jù)進行反復迭代。在這一階段,模型在響應(yīng)用戶指令之前,會先在內(nèi)部生成長思維鏈,自主進行策略試錯、邏輯推演與自我糾錯,從而顯著提升了解決復雜數(shù)學與邏輯問題的準確率。據(jù)AA,推理模型相對非推理模型在Token消耗量上出現(xiàn)10X提升。入口不再僅限于手機,而是演變?yōu)椤癘S級智能體”與“超級APP“層面較量。1)超級APP的突破1億;千問App近期持續(xù)擴大投流,截止12月10日(公測23天)月活已突破3000萬,下成全球增長最快AI應(yīng)用。阿里巴巴在內(nèi)部溝通中提及,千問C端事業(yè)群的首要目標是將千問打造成為一款超級APP,成為AI時代用戶的第一入口;2)“入口之戰(zhàn)”從流量分發(fā)層推到88了系統(tǒng)權(quán)限層,已成必爭之地。豆包繞開傳統(tǒng)接口,用“看屏幕+代操作”的方式在現(xiàn)有生態(tài)之上再搭一層“AI操作系統(tǒng)”,AIOS直接觸碰微信、支付寶等超級App的商業(yè)命門,傳統(tǒng)App時代的游戲規(guī)則面臨挑戰(zhàn),微信、淘寶等超級App陸續(xù)封禁豆包手機權(quán)限。但值得注意的是,華為、小米、榮耀、OPPO、vivo等品牌均在旗艦機型里注入AIAgent能力,模型廠商仍有望通過開源或廣泛結(jié)盟來繞過APP廠商的封鎖。支付寶、淘寶閃購、飛豬、高德等阿里生態(tài)業(yè)務(wù),實現(xiàn)點外賣、智算中心持續(xù)擴容,國產(chǎn)替代加速。根據(jù)IDC數(shù)據(jù),2020年中國智能算力規(guī)模為75.0EFLOPS,到2028年預計將達到2,781.9EFLOPS,預計2020-2028年復合增長率達到57.1%。隨著地緣政治緊張局勢推動中國企業(yè)尋求本地替代方案,以及國產(chǎn)芯片技術(shù)的穩(wěn)步提升,國內(nèi)云服務(wù)提供商正在加速構(gòu)建異構(gòu)環(huán)境(將不同類型的芯片結(jié)合使用,如CPU、GPU、國內(nèi)替代芯片)。例如,騰訊云已將其異構(gòu)計算平臺全面兼容所有主流國產(chǎn)芯片,以滿足內(nèi)部開發(fā)和客戶對AI算力的需求。根據(jù)BernsteinResearch,2024年中國AI加速芯片市場中,英偉達、AMD市場份額分別為66%、5%,合計占比達71%。但受益于國產(chǎn)替代趨勢及供應(yīng)鏈安全需求,國內(nèi)計算芯片公司正迅速提升。其中,華為海思/沐曦/摩爾市場份額已分別達到23%/1%/1%。99來源:沐曦招股說明書,國金證券研究所來源:沐曦招股說明書,國金證券研究所國產(chǎn)通用GPU從“可用”向“好用”升級。國產(chǎn)GPU在性能指標、軟件生態(tài)、應(yīng)用適配等方面與NV最先進一代仍有差距,但已基本追平H20、A100等,且在本地化服務(wù)、政策支持、成本控制等方面具備優(yōu)勢。隨著資本持續(xù)注入,國產(chǎn)企業(yè)有望在細分場景實現(xiàn)突破,逐步擴大市場份額。1)算力指標上:國內(nèi)多數(shù)頭部企業(yè)主流在售產(chǎn)品的FP16/BF16在100-300TFLOPS左右,處于英偉達A100產(chǎn)品階段,少數(shù)廠商通過先進封裝等方式實現(xiàn)接近英偉達H100產(chǎn)品的算力,為國內(nèi)最先進水平;2)顯存方面:國內(nèi)企業(yè)結(jié)合自身產(chǎn)品特點,分別選擇HBM2e、HBM2、GDDR等顯存類型,顯存帶寬在0.5-2TB/s左右。參數(shù)/廠商供給側(cè):中芯國際作為中國集成電路領(lǐng)導者,產(chǎn)能/利用率持續(xù)提升。11月13日,中芯國際披露2025年第三季度財報,2025Q3中芯國際營收171.62億元,環(huán)比增長6.9%,毛利率25.5%;月產(chǎn)能為102.28萬片(折合8英寸),同比增加產(chǎn)能約13.85萬片(折合8英寸);產(chǎn)能利用率達95.8%,環(huán)比增長3.3個百分點。中芯國際產(chǎn)能全球第三,約為臺積電的三分之一。公司資本支出維持高位,未來產(chǎn)能或?qū)⒗^續(xù)增加。CSP廠商加速適配,助力國產(chǎn)芯片生態(tài)建設(shè)。英特爾的X86生態(tài)、英偉達的CUDA生態(tài)之所以難以撼動,核心在于形成了“芯片-軟件-應(yīng)用”的閉環(huán)。而當前國產(chǎn)陣營中,華為昇騰、阿里平頭哥、壁仞科技等芯片廠商各有技術(shù)路線,生態(tài)分散問題顯著。騰訊集團高級執(zhí)行副總裁湯道生在交流中坦言,不同參數(shù)規(guī)模的AI模型需要適配不同芯片配置,當前只能通過與多家廠商合作實現(xiàn)場景覆蓋。百度、阿里等企業(yè)加速適配國產(chǎn)芯片,推動“芯片-模型-應(yīng)用”閉環(huán)供需雙高,國內(nèi)算力斜率陡峭。2)供給側(cè):①國產(chǎn)GPU性能持續(xù)提升;②國內(nèi)CSP廠商加速適配國產(chǎn)GPU。AI服務(wù)器是指專為AI應(yīng)用設(shè)計的高性能計算機設(shè)備,能夠支年,我國x86服務(wù)器市場CR6分別為浪潮信息/超聚變/新華三/聯(lián)想/寧暢/中我國x86服務(wù)器市場規(guī)模約為393億美元,同比增長49.7%。推理型服務(wù)器,42.7%訓練型服務(wù)器,57.3%中興,寧暢,寧暢,8.3%聯(lián)想,9.8%浪潮信息,聯(lián)想,9.8%新華三,超聚變,超聚變,13.3%來源:中投未來產(chǎn)業(yè)研究中心轉(zhuǎn)引自IDC,國金證券云廠商五大力量。主體類別戰(zhàn)略目標優(yōu)勢劣勢代表案例地方政府響應(yīng)國家戰(zhàn)略,推動政策落地;促進區(qū)域產(chǎn)業(yè)發(fā)展政策、資金、產(chǎn)業(yè)園區(qū)客戶缺乏IT技術(shù)、供應(yīng)鏈經(jīng)驗、運營能力不足北京/上海/廣州/武漢/天津/重慶/長沙/南京/西安/成都/合肥等30多個城市互聯(lián)網(wǎng)及云廠商、基礎(chǔ)電信運營商滿足自身大模型訓練需求;拓展算力業(yè)務(wù)充足的資金、技術(shù)和客戶資源,豐富的軟件供應(yīng)鏈資源,較成熟的云計算業(yè)務(wù)模式自有大模型與大模型訓練客戶形成競爭互斥騰訊合肥智算中心/百度智算中心/阿里飛天云智能華東算力中心等;中國電信武清智算中心/中國聯(lián)通蕪湖智算中心/中國移動武漢智算中心等第三方IDC服務(wù)商尋求業(yè)務(wù)增長豐富的IDC機房資源,IDC一體化建設(shè)運營能力缺乏IT供應(yīng)鏈資源和算力客戶潤澤國際信息港A-11云數(shù)據(jù)中心、博大數(shù)據(jù)深圳前海智算中心服務(wù)器廠商/芯片渠道商縱向一體化AI芯片、服務(wù)器等硬件資源獲取能力缺乏IDC供應(yīng)鏈和機房建設(shè)運營能力協(xié)鑫智算(上海)中心、浪潮新疆克拉瑪依智算中心AI企業(yè)、應(yīng)用企業(yè)縱向一體化算法及相關(guān)軟件能力,客戶資源和應(yīng)用場景積累缺乏AI芯片資源、IDC資源商湯臨港AIDC、理想汽車智算中心、小鵬“扶搖”智算中心跨界企業(yè)戰(zhàn)略轉(zhuǎn)型/發(fā)展新業(yè)務(wù)一般與芯片廠商、渠道商合作,獲得芯片資源缺乏IDC資源和持續(xù)穩(wěn)定的客戶英博數(shù)科北京AI創(chuàng)新賦能中心、威星智能貴安智算中心、恒潤股份蕪湖智算中心行業(yè)深度研究
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河道修復工程放線施工方案
- 移動商務(wù)安全課件
- 職場情緒調(diào)節(jié)與壓力釋放技巧
- 城市綠地維護養(yǎng)護工作方案
- 建設(shè)工程常用合同文本解析與應(yīng)用
- 線上每日英語口語訓練活動方案
- 房地產(chǎn)開發(fā)項目合同管理標準模板
- 公路養(yǎng)護施工技術(shù)方案解析
- 高三期末復習備考指導方案
- 現(xiàn)代物流運輸方案優(yōu)化
- 亞馬遜運營廣告培訓
- 中建給排水施工方案EPC項目
- 電氣工程及自動化基于PLC的皮帶集中控制系統(tǒng)設(shè)計
- 醫(yī)學教材 常見輸液反應(yīng)的處理(急性肺水腫)
- FURUNO 電子海圖 完整題庫
- 企業(yè)年會攝影拍攝合同協(xié)議范本
- 焊接質(zhì)量控制規(guī)范培訓課件
- 急診科護士長述職報告
- JGT334-2012 建筑外墻用鋁蜂窩復合板
- 管道壁厚計算表
- 汽車4S店安全生產(chǎn)責任書
評論
0/150
提交評論