版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
人工智能大模型“價格戰(zhàn)”的原因及影響分析
2024年,尋找商業(yè)化落地出口成為國內(nèi)外人工智能大模型企
業(yè)的共同目標(biāo)。近期,以互聯(lián)網(wǎng)“老兵”為主的人工智能大模型企
業(yè)連番掀起“價格戰(zhàn)”,希望復(fù)刻互聯(lián)網(wǎng)時代的成功商業(yè)路徑,
引發(fā)產(chǎn)業(yè)界普遍關(guān)注。賽迪研究院認(rèn)為,在降價背后,成本回落、
獲取數(shù)據(jù)、爭奪用戶是主要動因,同時“價格戰(zhàn)”也將帶來創(chuàng)業(yè)企
業(yè)生存空間受擠壓、應(yīng)用生態(tài)加快繁榮、云計算業(yè)務(wù)快速增長等
影響。為推動人工智能大模型良性發(fā)展,建議加快提升大模型核心
能力,支持大模型落地應(yīng)用,強(qiáng)化市場規(guī)范化引導(dǎo)。
一、人工智能大模型“價格戰(zhàn)”正酣
當(dāng)前,大模型商業(yè)化定價有多種模式,包括通過文本最小語
義單元(tokens)使用量計費(fèi)、訂閱制會員費(fèi)、模型微調(diào)服務(wù)和
開發(fā)者應(yīng)用程序接口(API)調(diào)用服務(wù)、模型定制化服務(wù)和賦能
用戶業(yè)務(wù)等。為加快大模型應(yīng)用落地,國內(nèi)外企業(yè)紛紛加快降價
步伐,以期通過“價格戰(zhàn)”換取大模型應(yīng)用市場。
從降價力度看-從輕量模型到主力模型均有不同程度降價。
輕量級模型由于參數(shù)少、訓(xùn)練與推理成本低、終端易部署等特性,
成為當(dāng)前大模型的主要免費(fèi)類型。如,百度文心大模型系列中輕
量化ERNIE-Speed.ERNIE-Lite、ERNIE-Tiny系列模型可直接
免費(fèi)、長期開放使用,無需訓(xùn)練與維護(hù)??拼笥嶏w宣布訊飛星火
Lite版輕量化大模型API永久免費(fèi)開放。參數(shù)較多、訓(xùn)練與推理
成本較高、多部署在云端的主力模型中?通用類大模型價格顯著下
降至近于免費(fèi),高性能、垂直類多模態(tài)大模型價格并未調(diào)整。
如,字節(jié)跳動豆包通用模型pro-32k版較行業(yè)價格低99.3%;阿
里云通義千問GPT4級通用模型Qwen-Long的API輸入價格直
降97%,約為GPT-4價格的1/400。而智譜AI的入門級產(chǎn)品GLM-3
Turbo模型降價,但企業(yè)級產(chǎn)品GLM-4/GLM-4V價格保持0.1元/
千tokens未變。此輪降價僅涉及tokens使用量計費(fèi)、訂閱制會
員費(fèi)及API調(diào)用,而模型的精調(diào)、訓(xùn)練、部署價格并未調(diào)整。
從降價主體看,本輪降價主要集中在國外部分頭部AI企業(yè)
以及國內(nèi)互聯(lián)網(wǎng)大廠和初創(chuàng)公司。在國外,人工智能巨頭OpenAI
基于龐大的ChatGPT用戶數(shù)量以及技術(shù)成本優(yōu)勢已進(jìn)行4次降
價,并于5月30口宣布所有用戶全面免費(fèi)、有限次開放GPT-4o
模型。在國內(nèi),阿里、百度、騰訊、字節(jié)跳動等互聯(lián)網(wǎng)大廠基于
云業(yè)務(wù)“造血”能力支撐大模型“低價探路”,降價力度更大。以百
度云千帆大模型平臺為例,模型部署、精調(diào)、評估、數(shù)據(jù)管理、
插件調(diào)用等云服務(wù)均按量付費(fèi),但大模型可以免費(fèi)調(diào)用。智譜、
深度求索等人工智能初創(chuàng)企業(yè)依托資本實(shí)力也紛紛卷入“價格
戰(zhàn)”。微軟、谷歌、Meta、亞馬遜等國際科技公司,以及國內(nèi)華
為公司暫未降價。
二、原因分析
成本驅(qū)動:模型和芯片成本雙向降低是本輪降價的重要前
提。一方面,模型優(yōu)化和算法革新帶動模型消耗成本降低。在
2023年GPT-4性能提升了6倍,但成本降低到了之前的1/12,
對應(yīng)性能/成本提升了70倍。比如百度文心大模型的推理性能提
升了105倍,推理成本則降到了原來的1%?;鹕揭婵梢酝ㄟ^
混合專家模型(MOE)、分布式推理等技術(shù)手段,優(yōu)化豆包大模
型的推理成本。另一方面,用于大模型訓(xùn)練和推理的芯片成本不
斷降低。如英偉達(dá)開發(fā)的基于Blackwell的AI芯片其成本和能耗
比上一代的Hopper架構(gòu)芯片降低25倍。
性能驅(qū)動:燒錢換取高價值數(shù)據(jù)、提升大模型服務(wù)能力是本
輪降價的內(nèi)在驅(qū)動。一方面,通過低價換取用戶更豐富、更多維
數(shù)據(jù)集支持大模型進(jìn)化升級。如GPT從1.0到4.0,數(shù)據(jù)參數(shù)從
億量級猛漲至萬億量級,對數(shù)據(jù)需求量大幅提升。與此同時,通
過低價吸引各行各業(yè)開發(fā)者注入垂直領(lǐng)域的數(shù)據(jù)集,可以加快大
模型在垂直領(lǐng)域的落地或商業(yè)化進(jìn)程。另一方面,通過低價獲取
的用戶動態(tài)交互數(shù)據(jù)集提高大模型的“類人化”能力。相較于靜態(tài)
數(shù)據(jù)、合成數(shù)據(jù),動態(tài)交互數(shù)據(jù)更有助于提升大模型的輸出精準(zhǔn)
度和感知用戶情緒的能力,尤其對具備反饋機(jī)制的大模型更甚。
如,LLaMA-2和InstructGPT采用反饋強(qiáng)化學(xué)習(xí)技術(shù)(RLHF)
將用戶偏好數(shù)據(jù)轉(zhuǎn)化為數(shù)字信號,進(jìn)一步提升大模型用戶服務(wù)能力,
運(yùn)營驅(qū)動:爭奪各類用戶、拓展落地場景是本輪降價的最終
目的。一方面,意在復(fù)刻互聯(lián)網(wǎng)時代的商業(yè)模式,降價是爭奪用
戶的經(jīng)驗選擇。互聯(lián)網(wǎng)時代,各大領(lǐng)域的興起和勝者的決出都伴
隨著降價、補(bǔ)貼等大戰(zhàn)的身影,如滴滴、快的、Uber的打車大
戰(zhàn),美團(tuán)、餓了么、百度、口碑的外賣大戰(zhàn),摩拜、0F0、青桔
的單車大戰(zhàn),以及近3年阿里、京東、拼多多的百億補(bǔ)貼大戰(zhàn)。
另一方面,各大模型進(jìn)入同質(zhì)化競爭階段,降價是搶占場景的無
奈打法。數(shù)據(jù)顯示,GPT4發(fā)布以來,多個模型性能和實(shí)力相當(dāng),
當(dāng)前尚沒有明顯領(lǐng)先的模型。各大模型在能力趨同的情況下,難
以通過技術(shù)進(jìn)步帶動業(yè)務(wù)正向發(fā)展。在此背景下,不得不放棄收
費(fèi)模式,通過降價甚至免費(fèi),通過用戶“免費(fèi)試用”探索商業(yè)落地
場景。據(jù)悉,幾家大模型廠商都給了不同程度地注冊免費(fèi)送額度,
如智譜AI宣布新注冊開放平臺用戶贈送250。萬tokenso
三、影響分析
從短期看,對一些企業(yè)生存空間形成擠壓,同時也會降低我
國大模型領(lǐng)域技術(shù)創(chuàng)新活力。一方面,對于一些無法承受持續(xù)低
價競爭的企業(yè),可能會被迫退出市場。企業(yè)通過“價格戰(zhàn)”爭奪市
場份額,往往會導(dǎo)致企業(yè)現(xiàn)金流承壓加大、利潤下降,進(jìn)而影響
人才招募、基礎(chǔ)設(shè)施升級、數(shù)據(jù)中心部署、網(wǎng)絡(luò)升級等投資,最終
將影響模型進(jìn)化與迭代。從當(dāng)前參與價格戰(zhàn)的企業(yè)來看,主要以阿
里、百度、騰訊、字節(jié)等資金雄厚的互聯(lián)網(wǎng)大廠為主。被卷
入的創(chuàng)新創(chuàng)業(yè)企業(yè),一旦資金跟進(jìn)乏力,將失去持續(xù)發(fā)展的能力。
另一方面,對于不參與價格戰(zhàn)的創(chuàng)業(yè)企業(yè),可能因缺少用戶被降
低產(chǎn)品競爭力。各大企業(yè)通過價格戰(zhàn)可以快速搶占用戶,并通過
持續(xù)補(bǔ)貼和個性化服務(wù)形成用戶粘性,打造生態(tài)壁壘。而對于不
參與價格戰(zhàn)的創(chuàng)業(yè)企業(yè),如沒有強(qiáng)大的技術(shù)優(yōu)勢,獲客將成為其
落地的一大難點(diǎn)。若持續(xù)無法形成商業(yè)閉環(huán)將使得創(chuàng)業(yè)企業(yè)營收
以及獲得進(jìn)一步投資的空間變小。
從中期看,加速大模型應(yīng)用生態(tài)繁榮。一方面,技術(shù)普惠將
推動應(yīng)用領(lǐng)域創(chuàng)新成本降低。隨著大模型推理成本的降低,依托
大模型開發(fā)應(yīng)用的創(chuàng)新成本將隨之降低,或?qū)⒂瓉硇聭?yīng)用開發(fā)和
新場景試錯的高潮期。數(shù)據(jù)顯示,百萬tokens大約相當(dāng)于70萬
個英文單詞或50萬漢字,按照現(xiàn)在大模型API調(diào)用價格計算,1
元可以購買超過1。0萬漢字。對于中小企業(yè)來說,部署并應(yīng)用針
對本企業(yè)的大模型應(yīng)用成本降低,或?qū)⒋碳て髽I(yè)開發(fā)應(yīng)用的意
愿另一方面,應(yīng)用創(chuàng)新成本降低將進(jìn)一步降低消費(fèi)端使用成本,
促進(jìn)應(yīng)用生態(tài)進(jìn)一步繁榮。類比移動互聯(lián)網(wǎng)時期,從3G到4G
再到5G時代,套餐外流量費(fèi)用從高達(dá)10000元/G,降低到100
元/G,最后到1元/G甚至無線流量,隨著流量成本降低和技術(shù)
能力提升,移動互聯(lián)應(yīng)用生態(tài)快速繁榮,如微信崛起、抖音誕生、
直播涌現(xiàn)、電商爆發(fā)??梢灶A(yù)見,隨著大模型應(yīng)用開發(fā)成本不斷降
低,將加快涌現(xiàn)爆款超級應(yīng)用,推動大模型應(yīng)用生態(tài)加速繁榮。
從長期看,進(jìn)一步催生云計算業(yè)務(wù)新增長點(diǎn)。一方面,大模
型的發(fā)展將帶來更高的計算需求。大模型訓(xùn)練與推理依賴大規(guī)模
算力集群以及高效的網(wǎng)絡(luò)存儲系統(tǒng)支持。當(dāng)前,云計算算力成本
和存儲成木的大幅降低帶來大模型計算成木下降,越來越多的大
模型應(yīng)用轉(zhuǎn)向云端,“價格戰(zhàn)”帶來的大模型應(yīng)用潮將進(jìn)一步激發(fā)
云計算需求。據(jù)Gartner預(yù)測,到2027年,中國的全部AI推理
工作負(fù)載中,基于云的工作負(fù)載占比將從之前的20%上升至
80%o另一方面,“價格戰(zhàn)”將進(jìn)一步加速云服務(wù)變現(xiàn)速度。相比
于通用大模型,用戶開發(fā)專用大模型對大模型定制與應(yīng)用開發(fā)工
具鏈需求較高,迫切需要云服務(wù)商搭建從選模型、調(diào)模型、搭應(yīng)
用到對外服務(wù)的一站式服務(wù)平臺,以及在多模型調(diào)用時提供更高級
別數(shù)據(jù)安全保障。相比于常規(guī)的B端、C端用戶云服務(wù)付費(fèi),用
戶更愿意對可提供定制化開發(fā)、數(shù)據(jù)安全保障等服務(wù)進(jìn)行付費(fèi)。
四、幾點(diǎn)建議
提升人工智能大模型核心能力。一是引導(dǎo)人工智能企業(yè)從
“卷價格”向“卷技術(shù)”轉(zhuǎn)變,加大生成式人工智能相關(guān)核心技術(shù)研
發(fā)投入,持續(xù)提升產(chǎn)品性能和特色化水平,打造企業(yè)核心競爭力。
二是引導(dǎo)人工智能企業(yè)與高校等科研機(jī)構(gòu)加強(qiáng)協(xié)作,加大大模型
架構(gòu)創(chuàng)新等原創(chuàng)性研究力度,從重視模型調(diào)優(yōu)轉(zhuǎn)向基礎(chǔ)框架和底層
算法創(chuàng)新。三是支持第三方機(jī)構(gòu)加快構(gòu)建通用型、專業(yè)型高質(zhì)量數(shù)
據(jù)集,為人工智能大模型創(chuàng)新提供充足“彈藥工
支持人工智能大模型落地應(yīng)用。一是搭建行業(yè)企業(yè)與人工智
能企業(yè)供需合作對接平臺,促進(jìn)供需信息共享與資源融合,降低
行業(yè)企業(yè)與人工智能企業(yè)合作門檻。二是遴選一批成效顯著的人
工智能應(yīng)用典型案例
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年重慶標(biāo)準(zhǔn)件工業(yè)有限責(zé)任公司招聘28人備考題庫及一套完整答案詳解
- 2025年蘇州產(chǎn)業(yè)投資私募基金管理有限公司公開招聘22人備考題庫帶答案詳解
- 2025年某區(qū)某國企勞務(wù)派遣崗公開招聘10人備考題庫含答案詳解
- 2025年北京城建華晟交通建設(shè)有限公司成熟人才招聘備考題庫及參考答案詳解一套
- 2025年恒豐銀行福州分行社會招聘6人備考題庫及一套答案詳解
- 靈川縣鄉(xiāng)鎮(zhèn)事業(yè)單位2025年度直接考核公開招聘“三支一扶”服務(wù)期滿且考核合格以上人員備考題庫有答案詳解
- 2025年廣西期刊傳媒集團(tuán)有限公司招聘工作人員若干人備考題庫及參考答案詳解1套
- 2025年體育總局科研所體育服務(wù)檢驗中心檢驗檢測工作崗位編外聘用人員招聘備考題庫及一套完整答案詳解
- 2025年哈密市維吾爾醫(yī)醫(yī)院面向社會公開招聘編制外聘用人員6人備考題庫及1套參考答案詳解
- 2025年廣西廣電網(wǎng)絡(luò)科技發(fā)展有限公司河池分公司招聘6人備考題庫含答案詳解
- 鄉(xiāng)村振興戰(zhàn)略的理論與實(shí)踐(華中師范大學(xué))知到智慧樹網(wǎng)課答案
- 2025年高考生物真題分類匯編專題03 細(xì)胞呼吸和光合作用(原卷版)
- 懸臂澆筑連續(xù)梁培訓(xùn)課件
- 線路巡檢管理辦法通信
- 建設(shè)項目環(huán)境影響評價分類管理名錄2026版
- 航運(yùn)企業(yè)貨物運(yùn)輸風(fēng)險控制建議書
- 2024年西安銀行招聘真題
- 模塊化制冷架構(gòu)設(shè)計-洞察及研究
- 《汽車發(fā)動機(jī)構(gòu)造(雙語課程)》習(xí)題(按項目列出)
- 松陵一中分班試卷及答案
- 《小米廣告宣傳冊》課件
評論
0/150
提交評論