版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明半導(dǎo)體AI存儲革命已至,“以存代算”開啟存儲新紀(jì)元存代算”應(yīng)運(yùn)而生。當(dāng)前,AI推理已成為衡量大模型商業(yè)化價值的關(guān)鍵標(biāo)尺,但在實(shí)際應(yīng)用中仍面臨“推不動、推得慢、推得貴”的嚴(yán)峻挑戰(zhàn)。為突破算力瓶頸與“存儲墻”制約,“以存代算”作為一種顛覆性技術(shù)范式應(yīng)運(yùn)而生。該技術(shù)通過將AI推理過程中的矢量數(shù)據(jù)(如KVCache)從昂貴的DRAM和HBM顯存遷移至大容量、高性價比的SSD介質(zhì),實(shí)現(xiàn)存儲層從內(nèi)存向SSD的戰(zhàn)略擴(kuò)展,而非簡單替代。其核心價值在于顯著降低首Token時延、提升推理吞吐量,并大幅優(yōu)化端到端的推理成本,為AI大規(guī)模落地提供可行路徑?!耙源娲恪焙诵募夹g(shù):“以存代算”CachedAttention技術(shù)是一種通過將AI推理中歷史對話的KVCache緩存到HBM+DRAM+SSD等外部存儲介質(zhì)。在該系統(tǒng)中,HBM作為GPU本地高速存儲,負(fù)責(zé)存儲當(dāng)前活躍會話的KVCache,支撐LLM推理計算;DRAM作為中間緩存層,承接HBM的異步寫入與SSD的預(yù)加載,平衡速度與容量;SSD則作為長期存儲層,提供大容量持久化存儲,承載非活躍歷史數(shù)據(jù)?!耙源娲恪盋achedAttention將首Token時延(TTFT)顯著縮短了87%,并提升了Prefill階段7.8倍的吞吐量,從而將端到端推理成本降低了70%。“以存代算”硬件突破:在“以存代算”技術(shù)范式下,SSD不再是單純的數(shù)據(jù)存儲載體,而是深度參與AI推理的核心組件,其需承接從HBM、DRAM卸載的KVCache,因此被賦予大容量、高吞吐、低延遲的新要求,以緩解對高成本HBM的依賴。同時,SSD主控芯片作為“控制大腦”,需通過先進(jìn)算法優(yōu)化數(shù)據(jù)尋址調(diào)度,支撐AI推理中數(shù)據(jù)高效流轉(zhuǎn)。在此背景下,AISSD技術(shù)將沿三大方向發(fā)展:顆粒上,向QLC顆粒演進(jìn),憑借技術(shù)升級實(shí)現(xiàn)高性能與大容量兼顧,滿足AI大模型數(shù)據(jù)存儲調(diào)用需求;接口協(xié)議上,以PCIe5.0/6.0接口搭配NVMe協(xié)議為基礎(chǔ),未來融入CXL技術(shù),進(jìn)一步提升帶寬與降低延遲;功能上,向智能化升級,如鎧俠計劃推出軟件讓SSD自主處理AI檢索任務(wù),Solidigm探索液冷方案優(yōu)化散熱,實(shí)現(xiàn)存儲與AI推理的深度協(xié)同。“以存代算”企業(yè)布局:“以存代算”的核心實(shí)踐已獲產(chǎn)業(yè)龍頭積極布局。華為UCM作為“以存代算”產(chǎn)品化關(guān)鍵載體,構(gòu)建智能分級緩存,數(shù)據(jù)可根據(jù)記憶熱度在HBM、DRAM、SSD(固態(tài)硬盤)等存儲介質(zhì)中實(shí)現(xiàn)按需流動;同時融合多種稀疏注意力算法,實(shí)現(xiàn)存算深度協(xié)同。除了以HBM+DRAM+SSD構(gòu)建的多級緩存體系外,還存以KVCache緩存技術(shù)為核心的多元實(shí)踐。浪潮存儲AS3000G7優(yōu)化存儲架構(gòu)與緩存管理機(jī)制,智能調(diào)度KVCache數(shù)據(jù),具備高擴(kuò)展性,能快速處理熱數(shù)據(jù),為AI推理等應(yīng)用提供高效穩(wěn)定的存儲算力。焱融YRCloudFileKVCache依托自研分布式文件系統(tǒng),實(shí)現(xiàn)KVCache數(shù)據(jù)在分布式環(huán)境下的高效存取與智能負(fù)載均衡,兼容性強(qiáng),提升數(shù)據(jù)與計算協(xié)同效率。國際層面,鎧俠、美光、SolidigmQLC+PCIe/NVMe+CXL有望構(gòu)筑下一代AISSD基座,推動SSD從單純存儲介質(zhì),升級為AI推理“長期記憶”載體。投資建議:AI存儲革命已至,“以存代算”催生核心機(jī)遇,顯著節(jié)省算力消耗加速AI推理,帶動SSD需求增速高于傳統(tǒng)曲線。建議關(guān)注:存儲模組廠商:江波龍(天風(fēng)計算機(jī)聯(lián)合覆蓋)、德明利、佰維存儲、朗科科技、聯(lián)蕓科技、萬潤科技等;存儲芯片:兆易創(chuàng)新、普冉股份、北京君正、東芯股份、恒爍股份、瀾起科技、聚辰股份等;存儲分銷與封測:香農(nóng)芯創(chuàng)、深科技、太極實(shí)業(yè)、中電港等風(fēng)險提示:地緣政治帶來的不可預(yù)測風(fēng)險,需求復(fù)蘇不及預(yù)期,技術(shù)迭代不及預(yù)期,產(chǎn)業(yè)政策變化風(fēng)險證券研究報告投資評級行業(yè)評級上次評級行業(yè)評級上次評級作者唐海清分析師SAC執(zhí)業(yè)證書編號:S1110517030002tanghaiqing@李泓依分析師SAC執(zhí)業(yè)證書編號:S1110524040006行業(yè)走勢圖半導(dǎo)體滬深300114%95%76%57%38%19%0%資料來源:聚源數(shù)據(jù)相關(guān)報告2《半導(dǎo)體-行業(yè)研究周報:3季度半導(dǎo)行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明內(nèi)容目錄1.發(fā)展背景:AI推理成價值核心,HBM瓶頸凸顯產(chǎn)業(yè)痛點(diǎn) 41.1.AI大模型推理中存在推不動、推得慢、推得貴三大挑戰(zhàn) 41.2.HBM突破存儲墻,海外壟斷下技術(shù)難度和成本高企成最大障礙 42.核心技術(shù):以存代算元年開啟,打破HBM限制重構(gòu)AI存儲生態(tài) 52.1.產(chǎn)業(yè)背景:AI推理成本高企與HBM瓶頸催生“以存代算”新范式 52.2.技術(shù)背景:KVCache重復(fù)計算成推理效率關(guān)鍵制約 62.3.技術(shù)機(jī)制:以存儲換計算,實(shí)現(xiàn)KVCache持久化與多級緩存 73.企業(yè)布局:華為領(lǐng)銜重點(diǎn)推廣,浪潮、焱融乘風(fēng)而上 93.1.華為UCM:以存代算產(chǎn)品化載體,軟件定義突破HBM資源枷鎖 93.2.以存代算多元實(shí)踐:KVCache緩存技術(shù)成為大模型系統(tǒng)架構(gòu)“標(biāo)配” 103.2.1.浪潮存儲AS3000G7:存儲托管KVCache,實(shí)現(xiàn)“以存代算” 103.2.2.焱融YRCloudFileKVCache:以存代算顯著提升AI推理性價比 114.硬件突破:SSD需求有望超越傳統(tǒng)曲線,SSD主控幫助尋址調(diào)度 124.1.企業(yè)級SSD:AI浪潮中崛起,性能、可靠與AI應(yīng)用適配的深度融合 124.2.SSD主控:AISSD智能化演進(jìn)的核心驅(qū)動力 154.3.SSD技術(shù)趨勢:AI推理驅(qū)動SSD角色升維,QLC+PCIe5.0/6.0構(gòu)筑未來趨勢 164.3.1.技術(shù)趨勢總覽:存儲與計算無縫配合,QLC+PCIe/NVMe+CXL構(gòu)筑下一代AISSD基座 174.3.2.鎧俠:高性能與高容量雙軌并行,從硬件創(chuàng)新邁向軟件定義智能 174.3.3.美光:引領(lǐng)接口速率與存儲密度,以性能與性價比重塑市場標(biāo)桿 184.3.4.Solidigm:聚焦QLC技術(shù)與液冷方案,以場景化存儲優(yōu)化AI效率 185.投資建議:關(guān)注國產(chǎn)“以存代算”相關(guān)芯片公司機(jī)遇 195.1.存儲模組廠商 5.1.1.江波龍:企業(yè)級SSD產(chǎn)品組合+自研主控芯片的雙輪驅(qū)動 195.1.2.佰維存儲:產(chǎn)品布局與AI戰(zhàn)略深度融合,SSD技術(shù)領(lǐng)先 205.1.3.德明利:“芯片+算法+場景”全鏈條發(fā)展 215.2.存儲芯片設(shè)計 5.2.1.兆易創(chuàng)新:利基存儲格局優(yōu)化,端側(cè)AI推動定制化需求增長。 225.2.2.聯(lián)蕓科技:高壁壘“存儲大腦”主控賽道龍頭,AIoT芯片帶動第二增長曲 225.3.其他重點(diǎn)公司 6.風(fēng)險提示 23圖表目錄圖1:美國大模型推理首Token時延=1/2中國大模型(TTFT毫秒)......................................4圖2:美國大模型推理吞吐率=10倍中國大模型(token/秒)....................................................4圖3:美光的HBM3E產(chǎn)品結(jié)構(gòu)圖 4圖4:2020-2025HBM市場發(fā)展 5圖5:LLM推理中包含預(yù)填充階段(PrefillingPhase)和解碼階段(DecodingPhase) 6請務(wù)必閱讀正文之后的信息披露和免責(zé)申明3圖6:重復(fù)計算和以存代算的對比 7圖7:CachedAttention的系統(tǒng)架構(gòu) 7圖8:首Token時延(TTFT)顯著縮短 8圖9:Prefill階段吞吐量提升 8圖10:UCM以KVCache和記憶管理為中心提供全場景系列化推理加速能力 9圖11:記憶數(shù)據(jù)在HBM、DRAM、SSD中按需流動 10圖12:浪潮存儲AS3000G7 10圖13:浪潮某頭部客戶聯(lián)合測試 11圖14:YRCloudFileKVCache在實(shí)際客戶的AI推理系統(tǒng)中展現(xiàn)出顯著性能優(yōu)勢 11圖15:企業(yè)級SSD的核心部件示意圖 12圖16:SSD總線類型 13圖17:企業(yè)級SSD和消費(fèi)級SSD對比 13圖18:全球企業(yè)級SSD市場規(guī)模(單位:億美元) 14圖19:中國企業(yè)級SSD市場規(guī)模(單位:億美元) 14圖20:2023年中國企業(yè)級固態(tài)硬盤市場份額 14圖21:2023年全球企業(yè)級SSD市場份額情況 14圖22:SSD主控芯片功能 15圖23:2020年-2025年全球SSD主控芯片出貨量情況 15圖24:SSD接口滲透率變化 15圖25:2024年全球SSD主控芯片各類型廠商市場占有率 16圖26:2024年獨(dú)立第三方主控廠SSD主控出貨份額 16圖27:不同存儲各指標(biāo)對比 17圖28:基于100兆瓦數(shù)據(jù)中心的AI基礎(chǔ)設(shè)施規(guī)模 17圖29:鎧俠LC9系列SSD 18圖30:Solidigm優(yōu)化AI存儲效率的存儲產(chǎn)品組合 19圖31:江波龍企業(yè)級SSD 20圖32:佰維存儲企業(yè)級SSD 20圖33:德明利ES1020系列工業(yè)級SSD 21圖34:截至2024年聯(lián)蕓科技目前已成熟量產(chǎn)的主控芯片 22表1:公司估值表(截至2025年9月26日) 22行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明41.發(fā)展背景:AI推理成價值核心,HBM瓶頸凸顯產(chǎn)業(yè)痛點(diǎn)1.1.AI大模型推理中存在推不動、推得慢、推得貴三大挑戰(zhàn)當(dāng)前,人工智能已步入發(fā)展深水區(qū),AI推理正成為下一個增長的關(guān)鍵階段,推理體驗(yàn)和推理成本成為了衡量模型價值的黃金標(biāo)尺。華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周越峰指出,AI時代,模型訓(xùn)練、推理效率與體驗(yàn)的量綱都以Token數(shù)為表征,Token經(jīng)濟(jì)已經(jīng)到來。ChatGPT的訪問量呈現(xiàn)線性增長,最新訪問量達(dá)到4億,受益于中國AI大模型DeepSeek的快速發(fā)展,日均調(diào)用量也在快速上升,2025年1月開始,中國AI推理的需求增長20倍,未來三年算力需求有望快速增長。IDC表示,2024年算力需求60%是訓(xùn)練,40%是推理,到2027年中國用于推理的算力需求——工作負(fù)載將達(dá)到72.6%。據(jù)電子發(fā)燒友網(wǎng),當(dāng)下,AI大模型推理應(yīng)用落地中,遇到推不動、推得慢和推得貴的三大挑戰(zhàn)。首先,長文本越來越多,輸入超過模型上下文窗口的內(nèi)容,推理窗口小就推不動;其次,由于中美在AI基礎(chǔ)設(shè)施的差距,中國互聯(lián)網(wǎng)大模型首Token時延普遍慢于美國頭部廠商的首Token時延,時延長度為后者的兩倍;推得貴,美國大模型的推理吞吐率為中國大模型推理吞吐率的10倍。資料來源:華為官網(wǎng),天風(fēng)證券研究所圖2:美國大模型推理吞吐率=10倍中國大模型(token/秒)資料來源:華為官網(wǎng),天風(fēng)證券研究所1.2.HBM突破存儲墻,海外壟斷下技術(shù)難度和成本高企成最大障礙上述AI推理中所遇到的挑戰(zhàn),主要受制于傳統(tǒng)DRAM面臨“存儲墻”瓶頸,內(nèi)存的存取速度嚴(yán)重滯后于處理器的計算速度,嚴(yán)重制約了AI模型的訓(xùn)練和推理速度。直到HBM的出現(xiàn),徹底改變了傳統(tǒng)DRAM的布局模式。HBM已經(jīng)成為AI革命的核心,是對傳統(tǒng)內(nèi)存瓶頸的有效突破。HBM(高帶寬內(nèi)存)是一種專用內(nèi)存技術(shù),用于AI處理器、GPU和HPC系統(tǒng)。HBM3每堆??商峁└哌_(dá)819GB/s的傳輸速度,對于支持大型語言模型(LLM)、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和推理工作負(fù)載至關(guān)重要。與傳統(tǒng)內(nèi)存芯片相比,HBM芯片最大特點(diǎn)在于采用了先進(jìn)的3D堆疊技術(shù),通過硅通孔(TSV)將多個DRAM芯片垂直堆疊在一起,并與GPU或CPU等處理器封裝在同一模塊中,實(shí)現(xiàn) 了大容量、高位寬的DDR組合陣列,能有效解決“存儲墻”問題。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:美光官網(wǎng),中國電子報公眾號,天風(fēng)證券研究所根據(jù)YoleGroup的數(shù)據(jù),HBM市場未來幾年都呈現(xiàn)出高速增長的態(tài)勢。全球HBM收入預(yù)計將從2024年的170億美元增長至2030年的980億美元,復(fù)合年增長率達(dá)33%。HBM在DRAM市場中的收益份額預(yù)計將從2024年的18%擴(kuò)大到2030年的50%。從位出貨量來看,HBM從2023年的1.5BGB,到2024年的2.8BGB。到2030年,預(yù)測將達(dá)到7.6BGB。圖4:2020-2025HBM市場發(fā)展資料來源:YoleGroup,半導(dǎo)體行業(yè)觀察公眾號,天風(fēng)證券研究所當(dāng)前AI算力生態(tài)高度依賴HBM硬件升級,HBM市場呈現(xiàn)寡頭競爭格局。然而極高的技術(shù)難度和高昂成本成為了制約其大規(guī)模應(yīng)用的一大障礙。在AI服務(wù)器中,HBM的成本占比約為20%—30%,僅次于用于計算的AI芯片。當(dāng)前全球HBM市場由三星、SK海力士等主導(dǎo),且受到美國出口政策的影響。根據(jù)2024年12月2日發(fā)布的新規(guī),美國禁止向中國出口HBM2E(第二代HBM的增強(qiáng)版)及以上級別的HBM芯片。不僅美國本土生產(chǎn)的HBM芯片受到限制,任何在海外生產(chǎn)但使用了美國技術(shù)的HBM芯片也受到出口管制。該禁令于2025年1月2日正式生效。目前,國產(chǎn)廠商HBM的突破還在推進(jìn)中。態(tài)2.1.產(chǎn)業(yè)背景:AI推理成本高企與HBM瓶頸催生“以存代算”新范式行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明當(dāng)前,人工智能技術(shù)的蓬勃發(fā)展推動大模型訓(xùn)練走向規(guī)?;嬲齽?chuàng)造持續(xù)商業(yè)價值的核心環(huán)節(jié)在于推理過程。觀察者網(wǎng)表示,AI推理算力需求正迅速超越訓(xùn)練,成為成本與性能的關(guān)鍵瓶頸。在這一背景下,鍵值緩存(KVCache)技術(shù)應(yīng)運(yùn)而生,成為提升推理效率的關(guān)鍵機(jī)制。其原理是將已生成Token對應(yīng)的Key(表征歷史輸入特征)和Value(用于輸出計算的參考信息)臨時存儲起來,使模型在生成新Token時可直接復(fù)用緩存結(jié)果,避免重復(fù)計算,從而顯著降低計算負(fù)載、提升響應(yīng)速度。然而,KVCache的高度依賴也帶來了新的問題:它需占用大量GPU顯存資源,尤其是價格昂貴的高帶寬內(nèi)存(HBM)。隨著生成文本長度與對話輪次的增加,緩存數(shù)據(jù)量急劇膨脹,極易導(dǎo)致HBM與DRAM資源耗盡。更為關(guān)鍵的是,面對大模型PB級的天量參數(shù)和持續(xù)增長的序列長度,傳統(tǒng)推理架構(gòu)對HBM的過度依賴已日益成為系統(tǒng)擴(kuò)展的瓶頸。盡管HBM在性能上表現(xiàn)卓越,但其高昂的成本與有限的供應(yīng)極大地限制了大規(guī)模部署的經(jīng)濟(jì)性。另一方面,雖然SSD具備成本低、容量大的優(yōu)勢,但其傳輸速率與延遲尚無法滿足高頻實(shí)時推理的要求。正是在性能、容量與成本構(gòu)成的“不可能三角”困境中,“以存代算”作為一種突破性的技術(shù)范式逐漸走向成熟。以存代算CachedAttention用GPU外部低成本的存儲介質(zhì)(HBM+DRAM+SSD)來緩存歷史對話的KVCache,然后在后面輪次對話到來時,重新加載緩存的歷史對話KVCache并重用,那么在新一輪對話中只用Prefilling階段的新Token。2.2.技術(shù)背景:KVCache重復(fù)計算成推理效率關(guān)鍵制約Transformer算法是生成式AI模型的基石。Transformer模型由多個Transformer層組成,(V)通常緩存在GPU中,稱為KVCache(KV緩存他們占用空間很大。Phase)。預(yù)填充階段并行地處理所有輸入Prompt的Token,生成KVCache。解碼階段利用預(yù)填充階段生成的KVCache,迭代地生成輸出Token,每次迭代輸出一個Token。資料來源:《Cost-EfficientLargeLanguageModelServingforMulti-turnConversationswithCachedAttention》PengfeiZuo等,天風(fēng)證券研究所讓人類參與多輪對話是LLM的一個基本特征,多輪對話會話由一系列連續(xù)對話組成。根據(jù)對開源大模型對話數(shù)據(jù)集ShareGPT的統(tǒng)計(ShareGPT是通過收集不同人與ChatGPT的真實(shí)對話形成的數(shù)據(jù)集發(fā)現(xiàn)ShareGPT中有超過73%的對話都是多輪的。由于在多個對話輪次中重復(fù)計算KVCache,因此LLM服務(wù)引擎在執(zhí)行多輪對話中效率低下,產(chǎn)生高昂成本。在單輪對話中,LLM將KVCache存儲在GPU上有限的高帶寬內(nèi)行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明7存(HBM)中。當(dāng)對話結(jié)束時,LLM會丟棄與該會話關(guān)聯(lián)的KVCache,以釋放HBM中的空間供其他活動會話使用。當(dāng)用戶在對話中發(fā)送下一條消息時,LLM會再次計算整個KVCache,這導(dǎo)致重復(fù)計算相同的KVCache浪費(fèi)寶貴的GPU計算資源。如圖6(a)所示,在第一輪對話中,LLM生成a1的q1KVCache。完成第1輪后,LLM會丟棄KVCache以回收HBM空間。在第二、三輪對話中,LLM重新生成a1的q1KVCache。隨著對話輪數(shù)的增加,新一輪對話的輸入Token中歷史Token的比例急劇增加,到后面的輪次中歷史Token的比例會超過99%。資料來源:《Cost-EfficientLargeLanguageModelServingforMulti-turnConversationswithCachedAttention》PengfeiZuo等,天風(fēng)證券研究所2.3.技術(shù)機(jī)制:以存儲換計算,實(shí)現(xiàn)KVCache持久化與多級緩存以存代算CachedAttention是一種新的Attention技術(shù),用GPU外部低成本的存儲介質(zhì)(AttentionStore)來緩存歷史對話的KVCache,然后在后面輪次對話到來時,重新加載緩存的歷史對話KVCache并重用,那么在新一輪對話中只用Prefilling階段的新Token。具體而言,當(dāng)關(guān)聯(lián)的對話會話處于非活動狀態(tài)時,CachedAttention會將KVCache保存在名為AttentionStore的KVCache系統(tǒng)中,而不是像傳統(tǒng)注意力機(jī)制那樣將其刪除。如果將來激活了同一對話,則會從AttentionStore獲取其KVCache并重復(fù)用于推理。通過這樣做,CachedAttention僅執(zhí)行部分prefilling階段的tokens,即在新的對話回合中輸入的新tokens,而不是預(yù)填充所有的tokens。如圖6(b在執(zhí)行第三輪的推理時,使用q1q2a1a2的KVCache,只需要輸入q3即可。CachedAttention有效消除了歷史token的重復(fù)計算,從而降低了prefilling成本。圖7:CachedAttention的系統(tǒng)架構(gòu)資料來源:《Cost-EfficientLargeLanguageModelServingforMulti-turnConversationswithCachedAttention》PengfeiZuo等,天風(fēng)證券研究所與CachedAttention相互配合的是一個涉及HBM+DRAM+SSD的多級KVCache緩存行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明8系統(tǒng),他們?nèi)叩淖饔眉瓣P(guān)系如下:1.高帶寬內(nèi)存(HBM)?核心定位:GPU本地高速存儲,用于實(shí)時支撐LLM推理計算,是KV緩存訪問的“第一梯隊”。?關(guān)鍵作用:o存儲當(dāng)前活躍會話的KVCache,直接供GPU的自注意力計算(Attention)和前饋網(wǎng)o預(yù)留讀寫緩沖區(qū)(readbuffer/writebuffer讀緩沖區(qū)用于提前加載DRAM中的KV緩存,與GPU計算重疊;寫緩沖區(qū)用于暫存未完成保存的KV緩存,避免阻塞下一個推理任務(wù)。2.主機(jī)內(nèi)存(DRAM)?核心定位:HBM與SSD之間的“中間緩存層”,平衡存儲容量與訪問速度。?關(guān)鍵作用:o存儲近期可能被訪問的非活躍會話KVCache,作為HBM的擴(kuò)展,避免頻繁從低速SSD加載。o承接HBM的異步KV緩存寫入:在推理計算(如解碼階段)同時,將HBM中已完成計算的KV緩存異步保存到DRAM,減少HBM占用。o作為預(yù)取目標(biāo):通過調(diào)度感知預(yù)取(scheduler-awarefetching將SSD中即將被訪問的KV緩存提前加載到DRAM,確保GPU訪問時能命中高速存儲。3.固態(tài)硬盤(SSD)?核心定位:海量KV緩存的“長期存儲池”,解決HBM和DRAM容量不足的問題。?關(guān)鍵作用:o存儲海量非活躍會話的KVCache,提供TB級容量,避免因HBM/DRAM容量限制導(dǎo)致KV緩存被丟棄。o配合調(diào)度感知驅(qū)逐(scheduler-awareeviction當(dāng)DRAM空間不足時,將長期不被訪問的KVCache從DRAM遷移到SSD;當(dāng)SSD空間不足時,驅(qū)逐最不可能被訪問的會話KVCache。大量的實(shí)驗(yàn)結(jié)果表明,CachedAttention將首Token時延(TTFT)顯著縮短了87%,并提升了Prefill階段7.8倍的吞吐量,從而將端到端推理成本降低了70%。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明9資料來源:《Cost-EfficientLargeLanguageModelServingforMulti-turnConversationswithCachedAttention》PengfeiZuo等,天風(fēng)證券研究所資料來源:《Cost-EfficientLargeLanguageModelServingforMulti-turnConversationswithCachedAttention》PengfeiZuo等,天風(fēng)證券研究所3.企業(yè)布局:華為領(lǐng)銜重點(diǎn)推廣,浪潮、焱融乘風(fēng)而上3.1.華為UCM:以存代算產(chǎn)品化載體,軟件定義華為推出的UCM(推理記憶數(shù)據(jù)管理器是一款以KVCache(鍵值緩存)和記憶管理為核心的推理加速套件,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多三大組件。華為方面介紹稱,依托UCM層級化自適應(yīng)的全局前綴緩存技術(shù),系統(tǒng)能直接調(diào)用KV緩存數(shù)據(jù),避免重復(fù)計算,使首Token時延最大降低90%。同時,UCM將超長序列Cache分層卸載至外置專業(yè)存儲,通過算法創(chuàng)新突破模型和資源限制,實(shí)現(xiàn)推理上下文窗口10倍級擴(kuò)展,滿足長文本處理需求。圖10:UCM以KVCache和記憶管理為中心提供全場景系列化推理加速能力資料來源:華為官網(wǎng),天風(fēng)證券研究所UCM具備智能分級緩存能力,可根據(jù)記憶熱度在HBM、DRAM、SSD(固態(tài)硬盤)等存儲介質(zhì)中實(shí)現(xiàn)按需流動;同時融合多種稀疏注意力算法,實(shí)現(xiàn)存算深度協(xié)同,使長序列場景下TPS(每秒處理token數(shù))提升2-22倍,顯著降低每Token推理成本,為企業(yè)減負(fù)增效。UCM的智能分級緩存能力,可將AI推理所需數(shù)據(jù)從DRAM內(nèi)存遷移至SSD閃存介質(zhì),以此優(yōu)化計算效率。其核心價值在于降低對HBM和GPU的過度依賴,并實(shí)現(xiàn)“存算一體”系統(tǒng)創(chuàng)新。該技術(shù)的本質(zhì)是存儲層的擴(kuò)展,而非替代DRAM。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明UCM通過創(chuàng)新架構(gòu)設(shè)計和存儲優(yōu)化,突破了HBM容量限制,提升了國內(nèi)AI大模型推理性能,完善了中國AI推理生態(tài)的關(guān)鍵環(huán)節(jié)。資料來源:華為官網(wǎng),天風(fēng)證券研究所3.2.以存代算多元實(shí)踐:KVCache緩存技術(shù)成為大模型系統(tǒng)架構(gòu)“標(biāo)配”在“以存代算”的技術(shù)范式下,除了以HBM+DRAM+SSD構(gòu)建的多級緩存體系外,還存在其他形式的KVCache緩存技術(shù),它們同樣以存儲資源換取計算效率,顯著提升大模型推理性能。盡管在具體實(shí)現(xiàn)上可能不嚴(yán)格遵循HBM+DRAM+SSD的層級結(jié)構(gòu),但其核心思想一致——通過外部存儲介質(zhì)緩存歷史KVCache,避免重復(fù)計算,從而降低延遲、提升吞吐、節(jié)約算力。3.2.1.浪潮存儲AS3000G7:存儲托管KVCache,實(shí)現(xiàn)“以存代算”浪潮存儲AS3000G7作為國內(nèi)首款推理加速存儲,可存儲所有KVCache及多輪對話結(jié)果。其創(chuàng)新架構(gòu)通過將KVCache從GPU寫入本機(jī)內(nèi)存,再經(jīng)高速網(wǎng)絡(luò)緩存至AS3000G7,下輪對話時按需拉取緩存無需重新計算,徹底實(shí)現(xiàn)“以存代算”,顯著節(jié)省算力消耗并提升資源利用率。圖12:浪潮存儲AS3000G7資料來源:浪潮數(shù)據(jù)存儲公眾號,天風(fēng)證券研究所作為國內(nèi)首款推理加速存儲,AS3000G7以四大核心優(yōu)勢重塑推理效率:降低響應(yīng)延遲:將歷史Token緩存至AS3000G7存儲層,下輪對話從NVMeSSD硬盤中拉取歷史token的KVCache,減少GPU重復(fù)計算帶來的資源消耗,TTFT降低90%;承載更多并發(fā):TTFT在400ms以內(nèi)的前提下,系統(tǒng)可支持的吞吐量(Token/s)可達(dá)原方案5倍,單位GPU資源可承載更多推理請求;降低GPU功耗:TTFT的降低與并發(fā)的提升,單Token平均功耗下降60%,在承載同等規(guī)模token負(fù)載時,GPU服務(wù)器整機(jī)功耗降低。生態(tài)兼容適配:廣泛兼容國產(chǎn)與海外芯片的異構(gòu)算力平臺,深度適配vLLM框架下的deepseek等主流大模型,優(yōu)化推理體驗(yàn)。在某頭部客戶聯(lián)合測試中,采用1臺GPU服務(wù)器搭配1臺AS3000G7推行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明理加速存儲的組合方案實(shí)現(xiàn):?穩(wěn)定支撐500+并發(fā)對話,TTFT降低90%,響應(yīng)速度大幅提升?同硬件配置下吞吐量(Tokens/s)提升5倍,在不增加GPU資源的情況下,實(shí)現(xiàn)更高并發(fā)的推理請求?單token功耗降低70%,單位算力成本降低60%,推理性價比提升資料來源:浪潮數(shù)據(jù)存儲公眾號,天風(fēng)證券研究所隨著大模型推理需求的持續(xù)攀升,AS3000G7的推出恰逢其時。其通過“以存代算”的技術(shù)創(chuàng)新突破KVCache重計算瓶頸,為AI規(guī)模化應(yīng)用筑牢存儲根基。未來,隨著多模態(tài)與實(shí)時交互場景的普及以及存儲與計算的協(xié)同優(yōu)化,KVCache“以存代算”將成為降本增效的核心競爭力,為智能時代的推理存儲構(gòu)建新基準(zhǔn)。3.2.2.焱融YRCloudFileKVCache:以存代算顯著提升AI推理性價比焱融存儲YRCloudFileKVCache方案通過“HBM+YRCloudFile高性能分布式文件存儲”的組合方式,將KVCache從顯存擴(kuò)展至高性能共享存儲,不僅緩解了顯存壓力,還有效避免因緩存占用過高導(dǎo)致的推理卡頓或任務(wù)中斷,在保障推理效率與響應(yīng)速度的同時,實(shí)現(xiàn)更精準(zhǔn)、高性價比的大模型推理。YRCloudFileKVCache在實(shí)際客戶的AI推理系統(tǒng)中展現(xiàn)出顯著性能優(yōu)勢。推理系統(tǒng)的響應(yīng)延遲與并發(fā)處理能力是衡量用戶體驗(yàn)的關(guān)鍵指標(biāo)。經(jīng)客戶實(shí)測,YRCloudFile在這兩個核心維度上均實(shí)現(xiàn)了明顯優(yōu)化,顯著提升了整體推理效率與穩(wěn)定性。圖14:YRCloudFileKVCache在實(shí)際客戶的AI推理系統(tǒng)中展現(xiàn)出顯著性能優(yōu)勢資料來源:焱融科技公眾號,天風(fēng)證券研究所?測試內(nèi)容在相同的NVIDIAH20顯卡配置下,選用DeepSeek-R1-Distil-Lama-70B模型,基于行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明evalscope(使用longalpaca數(shù)據(jù)集,設(shè)定不同--max-prompt-length參數(shù)對原生vLLM與vLLM+YRCloudFileKVCache兩種方案在并發(fā)數(shù)遞增時的TTFT表現(xiàn)進(jìn)行對比?測試結(jié)論首先,需要強(qiáng)調(diào)的是,TTFT是衡量推理體驗(yàn)的關(guān)鍵指標(biāo)。理想情況下,TTFT應(yīng)穩(wěn)定在2秒以內(nèi),這表明用戶體驗(yàn)良好。一旦TTFT超過2秒,用戶體驗(yàn)將顯著下降。在并發(fā)數(shù)僅達(dá)到5時,原生vLLM的TTFT就已突破2秒閾值;搭載YRCloudFileKVCache后,在TTFT穩(wěn)定保持在2秒以內(nèi)的前提下,系統(tǒng)可支持的并發(fā)數(shù)大幅提升至16,相比原生方案提高了3.2倍。這表明YRCloudFileKVCache不僅能夠顯著降低響應(yīng)延遲,還能在單位GPU資源下承載更多推理請求,大幅提升系統(tǒng)吞吐量和性價比,全面優(yōu)化大語言模型的推理體驗(yàn)。在大語言模型推理規(guī)?;瘧?yīng)用的關(guān)鍵階段,YRCloudFileKVCache不僅有效解決了顯存瓶頸問題,還能夠應(yīng)對上下文長度不斷增長的壓力,為大模型推理提供更具彈性與性能優(yōu)勢和性價比的底層支撐。最新的用戶實(shí)測數(shù)據(jù)也進(jìn)一步證明了其在高并發(fā)場景下的出色表現(xiàn)。無論是高并發(fā)的智能客服場景,還是復(fù)雜的多輪對話應(yīng)用,YRCloudFileKVCache都能為快速、流暢的推理響應(yīng)提供堅實(shí)保障,助力企業(yè)在AI推理時代搶占先機(jī)。4.硬件突破:SSD需求有望超越傳統(tǒng)曲線,SSD主控幫助尋址調(diào)度1)AI推理帶動的SSD需求將持續(xù)超越傳統(tǒng)存儲增長曲線“以存代算”技術(shù)范式下,SSD不再僅是數(shù)據(jù)存儲載體,而是深度參與AI推理流程的核心組件。通過承接從HBM和DRAM中卸載的KVCache、歷史對話記錄及RAG知識庫等其對大容量、高吞吐、低延遲的剛性需求,也反向驅(qū)動SSD在接口協(xié)議、顆粒類型、智能管理等方面持續(xù)迭代,推動產(chǎn)業(yè)向高性能、高可靠性、大容量方向升級,重塑了SSD在AI基礎(chǔ)設(shè)施中的地位。2)SSD主控芯片起數(shù)據(jù)尋址調(diào)度作用目前來看,QLC閃存優(yōu)化、PCIe接口代際升級、AI算法融合等正成為廠商的幾大突破方向。華為采用海思自研的Hi1812/Hi1822系列主控芯片,技術(shù)突破點(diǎn)在于維持長期讀寫速度(從物理層限制轉(zhuǎn)為數(shù)學(xué)優(yōu)化),并通過均衡磨損算法延長SSD壽命。4.1.企業(yè)級SSD:AI浪潮中崛起,性能、可靠與AI應(yīng)用適配的深度融合企業(yè)級SSD由固態(tài)電子存儲芯片陣列制成,核心部件包括主控芯片、固件和存儲介質(zhì)(NANDFlash、DRAM其中主控芯片和固件直接決定企業(yè)級SSD的性能和可靠性等產(chǎn)品表現(xiàn)。主控芯片(控制大腦)控制數(shù)據(jù)讀寫,直接決定SSD的性能、可靠性固件(操作系統(tǒng))確保SSD高效穩(wěn)定運(yùn)行NANDFlash、DRAM(存儲介質(zhì))NANDFlash是主要存儲介質(zhì),用于存儲用戶數(shù)據(jù);DRAM提供數(shù)據(jù)緩存。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所總線是計算機(jī)不同功能部件之間交互數(shù)據(jù)的通路,對于SSD而言,總線就是數(shù)據(jù)自SSD到CPU所走的路??偩€承載能力具有一定上限,其位寬、傳輸頻率和通道數(shù)共同決定了數(shù)據(jù)理論傳輸速度。SSD的總線類型可分為SATA總線、SAS總線、PCIe總線三類,對比資料來源:電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所SATA總線最初為個人電腦和消費(fèi)級市場設(shè)計,更注重存儲容量而非傳輸速度。SAS總線相對于SATA總線提供更高的數(shù)據(jù)傳輸速率和容錯能力,主要面向早期企業(yè)級場景應(yīng)用。PCIe總線被實(shí)際應(yīng)用后,PCIeSSD相較于其他類型產(chǎn)品提供了更高數(shù)據(jù)傳輸速度和更低延遲,在高性能、高可靠性要求的企業(yè)級應(yīng)用場景中表現(xiàn)突出,已成為目前最主流的企業(yè)級SSD。PCIe總線自2003年首次推出以來持續(xù)迭代,傳輸速度顯著提升。目前企業(yè)級PCIeSSD市場產(chǎn)品以PCIe4.0為主,PCIe5.0產(chǎn)品已逐步推向市場。SSD根據(jù)應(yīng)用場景不同,主要分為企業(yè)級SSD和消費(fèi)級SSD。企業(yè)級SSD主要應(yīng)用于AI、云計算、大數(shù)據(jù)等數(shù)據(jù)中心應(yīng)用場景,消費(fèi)級SSD廣泛應(yīng)用于電腦、手機(jī)、移動硬盤等消費(fèi)電子場景。與消費(fèi)級SSD相比,企業(yè)級SSD在產(chǎn)品性能、可靠性、耐用性等方面表現(xiàn)更為突出,主要指標(biāo)對比情況如下:行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所根據(jù)ForwardInsights統(tǒng)計,2022年,全球企業(yè)級SSD市場規(guī)模為204.54億美元,并將隨著存儲行業(yè)需求提振不斷增長,預(yù)計2027年市場規(guī)模將達(dá)到514.18億美元,年復(fù)合增長率達(dá)到20.25%,其中,PCIe接口的企業(yè)級SSD占主導(dǎo)且占比持續(xù)上升,其在終端數(shù)據(jù)中心等場景的應(yīng)用覆蓋率不斷增加。2022年,中國企業(yè)級SSD市場規(guī)模為44.71億美元,預(yù)計中國企業(yè)級固態(tài)硬盤市場規(guī)模將保持增長,2027年將達(dá)到135.09億美元,年復(fù)合增長率為24.75%。圖18:全球企業(yè)級SSD市場規(guī)模(單位:億美元)資料來源:ForwardInsights,電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所圖19:中國企業(yè)級SSD市場規(guī)模(單位:億美元)資料來源:ForwardInsights,電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所企業(yè)級SSD行業(yè)具有研發(fā)難度高、技術(shù)迭代快、客戶培育周期長、資金投入大等特點(diǎn)。國外龍頭企業(yè)起步較早,在生產(chǎn)技術(shù)、產(chǎn)品性能、品牌知名度等方面具有較強(qiáng)競爭優(yōu)勢,在市場中處于主導(dǎo)地位,全球范圍內(nèi)呈現(xiàn)韓國(三星和SK海力士)優(yōu)勢顯著,美國、日本緊隨其后,中國奮起直追的局面。我國企業(yè)級SSD行業(yè)起步相對較晚,市場份額小,整體生產(chǎn)技術(shù)與國際先進(jìn)水平相比存在一定差距,本土企業(yè)有較大發(fā)展空間以及較長國產(chǎn)化替代過程。全球企業(yè)級SSD市場目前集中度較高,5家龍頭企業(yè)三星、SK海力士、西部數(shù)據(jù)、美光和鎧俠占據(jù)了全球90%以上的市場份額,這些公司在半導(dǎo)體存儲領(lǐng)域擁有深厚的技術(shù)積累、廣泛的產(chǎn)品布局和強(qiáng)大的研發(fā)能力。AI、云計算、大數(shù)據(jù)等新一代信息技術(shù)領(lǐng)域的快速發(fā)展帶動了企業(yè)級SSD的市場需求和技術(shù)進(jìn)步,同時也為其他新興存儲廠商提供了提高市場份額的寶貴機(jī)會,推動了整個行業(yè)的技術(shù)創(chuàng)新和市場多元化。圖20:2023年中國企業(yè)級固態(tài)硬盤市場份額圖21:2023年全球企業(yè)級SSD市場份額情況行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:IDC,電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所資料來源:上市公司年報,集邦咨詢,電子發(fā)燒友網(wǎng)公眾號,天風(fēng)證券研究所4.2.SSD主控:AISSD智能化演進(jìn)的核心驅(qū)動力固態(tài)硬盤主控芯片是固態(tài)硬盤的“大腦”,主要用于管理存儲顆粒中數(shù)據(jù)的寫入、讀取與擦除,并與系統(tǒng)廠商推出的各類外部計算機(jī)或電子設(shè)備CPU進(jìn)行通信和數(shù)據(jù)交換。主控芯片能夠通過數(shù)據(jù)存儲管理和數(shù)據(jù)糾錯算法,有效降低存儲顆粒中存儲單元因器件特性導(dǎo)致數(shù)據(jù)揮發(fā)等因素而引起數(shù)據(jù)錯誤的概率。資料來源:智研科信公眾號,天風(fēng)證券研究所SSD主控芯片出貨呈上升趨勢。2024年,隨著生成式AI浪潮席卷全球,企業(yè)級數(shù)據(jù)中心市場迎來需求復(fù)蘇,PC及消費(fèi)類市場盡管相對溫和,但同樣處于上揚(yáng)態(tài)勢。根據(jù)CFM閃存市場數(shù)據(jù),2024年全球SSD主控市場共出貨約3.885億顆,相較2023年增長8%。按照SSD接口滲透率變化看,2024年全球PC前裝市場搭載的SSD模組主力依舊為PCIe4.0,相較2023年,PCIe5.0接口SSD產(chǎn)品已在PC前裝市場獲得一定數(shù)量的商用,CFM閃存市場預(yù)計2025年這一比例將快速提升。圖23:2020年-2025年全球SSD行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:中國閃存市場,聯(lián)蕓科技招股說明書,天風(fēng)證券研究所資料來源:中國閃存市場,聯(lián)蕓科技公司年報,天風(fēng)證券研究所全球SSD主控芯片廠商主要分為三類:第一類是NAND原廠的自研自用廠商(三星、海力士、美光、Solidigm、鎧俠、西部數(shù)據(jù)等其主控芯片僅用于自有NAND顆粒的模組生產(chǎn)而不單獨(dú)出售;第二類是非原廠廠商,通過外采NAND顆粒搭配自研主控芯片生產(chǎn)模組,同時也會對外銷售部分主控芯片;第三類是獨(dú)立主控芯片廠商(慧榮科技、聯(lián)蕓科技、瑞昱、得一微等專注于向市場直接銷售主控芯片產(chǎn)品。這三類廠商共同構(gòu)成了SSD主控芯片市場的完整產(chǎn)業(yè)格局。獨(dú)立第三方主控廠商來看,聯(lián)蕓科技出貨量占比25%。CFM閃存市場數(shù)據(jù)顯示,2024年慧榮科技SSD主控出貨量約1億顆,占比約52%;聯(lián)蕓SSD主控出貨量約4900萬,占比約25%;得一微電子SSD主控出貨量約2000萬,占比約10%;其他廠商合計占比約12%。圖25:2024年全球SSD主控芯片各類型廠商市場占有率資料來源:CFM閃存市場,天風(fēng)證券研究所圖26:2024年獨(dú)立第三方主控廠SSD主控出貨份額資料來源:CFM閃存市場,天風(fēng)證券研究所4.3.SSD技術(shù)趨勢:AI推理驅(qū)動SSD角色升維,QLC+PCIe5.0/6.0構(gòu)筑未來趨勢在AI發(fā)展進(jìn)程中,訓(xùn)練與推理兩大核心環(huán)節(jié)對存儲的特殊需求,直接推動了AISSD的快速崛起。與標(biāo)準(zhǔn)固態(tài)硬盤不同,AISSD專為處理深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)訓(xùn)練和實(shí)時數(shù)據(jù)分析等人工智能應(yīng)用的巨大數(shù)據(jù)吞吐量、低延遲和高IOPS(每秒輸入/輸出操作數(shù))需求而AI推理環(huán)節(jié)中,SSD可在推理過程中協(xié)助調(diào)整、優(yōu)化AI模型,尤其SSD可以實(shí)時更新數(shù)據(jù),以便微調(diào)推理模型結(jié)果。AI推理主要提供檢索增強(qiáng)生成(RAG,Retrieval-AugmentedGeneration)和大型語言模型(LLM,LargeLanguageModel)服務(wù),而SSD可以儲存RAG和LLM參考的相關(guān)文檔和知識庫,以生成含有更豐富信息的響應(yīng)。目前TLC/QLC16TB以上等大容量SSD便成為AI推理主要采用的產(chǎn)品。AI對存儲“高性能、大容量、高能效”的三重剛需,讓SSD成為AI場景下的最優(yōu)解。TrendForce數(shù)據(jù)顯示,全球范圍內(nèi),2024年AI相關(guān)的SSD采購容量將超過45EB,未來幾年,AI服務(wù)器有望推動SSD需求年增率平均超過60%,而AISSD需求在整個NANDFlash(閃存)的占比有機(jī)會自2024年的5%,上升至2025年的9%。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:鎧俠,半導(dǎo)體產(chǎn)業(yè)縱橫公眾號,天風(fēng)證券研究所充分挖掘SSD的容量潛力以加速推理服務(wù),成為亟待突破的關(guān)鍵點(diǎn)。以存代算中,多輪對話產(chǎn)生的KVCache需在HBM、D其中SSD承擔(dān)“長期記憶數(shù)據(jù)”存儲角色,負(fù)責(zé)保存歷史對話、RAG知識庫等熱溫數(shù)據(jù)(容量需求達(dá)TB至PB級)。相較于HBM的高成本和DRAM的容量限制,SSD以較高的性價比提供了大容量存儲支持,成為緩解HBM依賴的核心介質(zhì)。4.3.1.技術(shù)趨勢總覽:存儲與計算無縫配合,QLC+PCIe/NVMe+CXL構(gòu)筑下一代AISSD基座從顆粒的選擇上,AISSD會朝著QLC顆粒方向走。鎧俠CEO柳茂知也表示,QLCSSD是AI行業(yè)最好的選擇。盡管從SLC到MLC,再到TLC,最終到QLC,SSD的性能一直在下降,但隨著技術(shù)的演變,2025年QLCSSD的速度已經(jīng)比2017年的TLCSSD快很多了。如今QLCSSD的順序讀寫速度可達(dá)7000MB/s左右,性能十分強(qiáng)大,能夠滿足AI大模型數(shù)據(jù)存儲和調(diào)用的要求。圖28:基于100兆瓦數(shù)據(jù)中心的AI基礎(chǔ)設(shè)施規(guī)模資料來源:Solidigm,半導(dǎo)體產(chǎn)業(yè)縱橫公眾號,天風(fēng)證券研究所從傳輸接口與協(xié)議層面來看,采用PCIe接口并支持NVMe協(xié)議,未來大概率會成為AISSD的標(biāo)準(zhǔn)配置。PCIe接口憑借不斷升級的帶寬能力,從PCIe3.0發(fā)展到如今的PCIe5.0,目前業(yè)內(nèi)已經(jīng)推進(jìn)到了PCIe7.0。此外,NVMe協(xié)議專門針對閃存存儲進(jìn)行優(yōu)化,為SSD提供了極高的I/O吞吐量和低延遲,這對于減少數(shù)據(jù)訪問瓶頸非常重要。在PCIe接口之上構(gòu)建了高效的數(shù)據(jù)訪問機(jī)制,極大地降低了延遲,提升了IOPS性能,能充分發(fā)揮閃存的快速讀寫特性。隨著技術(shù)發(fā)展,PCIe接口和NVMe協(xié)議還會持續(xù)演進(jìn),融入如CXL等新興技術(shù)。4.3.2.鎧俠:高性能與高容量雙軌并行,從硬件創(chuàng)新邁向軟件定義智能鎧俠重點(diǎn)圍繞AI驅(qū)動的存儲技術(shù)創(chuàng)新、SSD業(yè)務(wù)拓展及資本效率優(yōu)化,以鞏固其在NAND行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明閃存市場的競爭力。凱俠AISSD有兩類產(chǎn)品線:第一類是高性能SSD。鎧俠的CM9系列,專為AI系統(tǒng)設(shè)計,搭載針對數(shù)據(jù)中心優(yōu)化的PCIe5.0,最大限度地發(fā)揮需要高性能和高可靠性的GPU功能。第二類是容量型SSD。鎧俠的LC9系列,適用于推理中使用的大型數(shù)據(jù)庫等用例,當(dāng)時容量為122.88TB,未來計劃推出更大容量產(chǎn)品。資料來源:KIOXIA鎧俠中國社公眾號,天風(fēng)證券研究所對于未來的AISSD,鎧俠也提出了自己的設(shè)想,主要從兩個方面突破。第一是速度更快?,F(xiàn)在的SSD每秒能處理200萬-300萬次小文件讀寫,多采用TLC和QLC,而新產(chǎn)品將采用XL-FLASH的SLC閃存,速度提升到每秒1000萬次以上,特別適合AI需要頻繁讀取零碎數(shù)據(jù)的場景。第二是更智能。目前AI檢索數(shù)據(jù)要依賴內(nèi)存,2026年鎧俠將推出AiSAQ軟件,讓SSD自己就能處理AI的檢索任務(wù)。這樣不僅能減輕內(nèi)存負(fù)擔(dān),還能讓AI應(yīng)用運(yùn)行更高效,尤其適合智能終端和邊緣計算設(shè)備。4.3.3.美光:引領(lǐng)接口速率與存儲密度,以性能與性價比重塑市場標(biāo)桿美光最新發(fā)布三款A(yù)ISSD。第一款是美光9650SSD,全球首款PCIe6.0的SSD,主要用在數(shù)據(jù)中心領(lǐng)域。能夠提供28GB/s的性能。據(jù)美光測試,相較于PCIe5.0SSD,9650SSD的隨機(jī)寫入與隨機(jī)讀取的存儲能效分別提升高達(dá)25%和67%。第二款是美光6600IONSSD,單盤容量最高達(dá)245TB,主要應(yīng)用在超大規(guī)模部署與企業(yè)級數(shù)據(jù)中心整合服務(wù)器基礎(chǔ)設(shè)施、構(gòu)建大型AI數(shù)據(jù)湖。相較于競品,該產(chǎn)品的存儲密度提升高達(dá)67%,單機(jī)架存儲容量突破88PB,大幅降低總體擁有成本(TCO)。第三款是美光7600SSD,主要用于AI推理與混合工作負(fù)載。據(jù)稱,能夠在高度復(fù)雜的RocksDB工作負(fù)載下實(shí)現(xiàn)業(yè)界領(lǐng)先的亞毫秒級延遲。4.3.4.Solidigm:聚焦QLC技術(shù)與液冷方案,以場景化存儲優(yōu)化AI效率Solidigm將AI存儲方案大致分為兩類。一類是,直連式存儲(DAS針對訓(xùn)練等對性能極度敏感的場景,它更關(guān)注單位功耗下的IOPS;另一類是網(wǎng)絡(luò)存儲(包括NAS文件/對象存儲針對數(shù)據(jù)攝取、歸檔和RAG(檢索增強(qiáng)生成)等大容量場景,對讀性能要求較高,同時也追求最低成本存儲海量數(shù)據(jù)。Solidigm在AISSD中的另一個亮點(diǎn)是QLCSSD。自2018年發(fā)布首款QLCSSD以來,Solidigm已累計出貨超過100EB的QLC,并為全球70%的領(lǐng)先OEMAI解決方案提供商提供服務(wù)。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明Solidigm不僅推動QLC技術(shù)的普及與應(yīng)用,還在液冷SSD技術(shù)領(lǐng)域進(jìn)行大膽嘗試。2025年3月,Solidigm展示其首款采用SolidigmD7-PS1010E1.S9.5mm外形規(guī)格的冷板液冷SSD,該方案顯著提升了散熱效率。圖30:Solidigm優(yōu)化AI存儲效率的存儲產(chǎn)資料來源:Solidigm,半導(dǎo)體產(chǎn)業(yè)縱橫公眾號,天風(fēng)證券研究所5.投資建議:關(guān)注國產(chǎn)“以存代算”相關(guān)芯片公司機(jī)遇“以存代算”正從技術(shù)理念加速邁向產(chǎn)業(yè)現(xiàn)實(shí),其通過存儲資源擴(kuò)展替代重復(fù)計算的范式,將深刻重構(gòu)AI推理基礎(chǔ)設(shè)施,并為存儲產(chǎn)業(yè)鏈帶來前所未有的增長機(jī)遇。華為CachedAttention、UCM等技術(shù)方案的落地及全球巨頭的快速跟進(jìn),已驗(yàn)證了其經(jīng)濟(jì)性與必要性。建議關(guān)注:存儲模組廠商:江波龍(天風(fēng)計算機(jī)聯(lián)合覆蓋)、德明利、佰維存儲、朗科科技、聯(lián)蕓科技、萬潤科技等存儲芯片:兆易創(chuàng)新、普冉股份、北京君正、東芯股份、恒爍股份、瀾起科技、聚辰股份等存儲分銷與封測:香農(nóng)芯創(chuàng)、深科技、太極實(shí)業(yè)、中電港等5.1.存儲模組廠商5.1.1.江波龍:企業(yè)級SSD產(chǎn)品組合+自研主控芯片的雙輪驅(qū)動江波龍專注于半導(dǎo)體存儲領(lǐng)域,為客戶提供從產(chǎn)品設(shè)計、存儲芯片、主控芯片設(shè)計及固件開發(fā),到封裝、測試、制造等全方位的存儲定制服務(wù)。國產(chǎn)替代龍頭,企業(yè)級存儲實(shí)現(xiàn)放量增長。2025H1公司企業(yè)級存儲業(yè)務(wù)規(guī)模增長明顯,企業(yè)級存儲業(yè)務(wù)收入達(dá)到6.93億元,同比增長138.66%。公司是國內(nèi)少數(shù)具備“eSSD+RDIMM”產(chǎn)品設(shè)計、組合以及規(guī)模供應(yīng)能力企業(yè),在eSSD與RIDMM產(chǎn)品組合基礎(chǔ)上,已成功點(diǎn)亮SOCAMM產(chǎn)品,結(jié)合MRDIMM、CXL2.0內(nèi)存拓展模塊構(gòu)建了全面的企業(yè)級產(chǎn)品體系。公司的eSSD與RIDMM產(chǎn)品已成功完成鯤鵬、海光、飛騰等多個國產(chǎn)CPU平臺服務(wù)器的兼容性適配,DDR5RDIMM產(chǎn)品也通過了ThreadripperPRO9000WX系列工作站CPU認(rèn)證,為在主流平臺上的廣泛應(yīng)用提供了堅實(shí)的技術(shù)基礎(chǔ)。公司企業(yè)級業(yè)務(wù)進(jìn)入快速增長階段,客戶涵蓋運(yùn)營商、大型及中型互聯(lián)網(wǎng)企業(yè)、服務(wù)器企業(yè)等,產(chǎn)品已在通信、互聯(lián)網(wǎng)、金融等行業(yè)歷經(jīng)多次嚴(yán)苛考驗(yàn)并成功交付。主控自研修筑技術(shù)壁壘,TCM模式不斷突破,加碼長期高毛利高壁壘。截至2025年7月行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明底,公司主控芯片全系列(含UFS\eMMC\SD\高端U盤等場景,下同)產(chǎn)品累計實(shí)現(xiàn)超過8000萬顆的批量部署。公司設(shè)計并成功流片了歷史上首批UFS自研主控芯片,搭載公司自研主控的UFS4.1產(chǎn)品的整體性能超越市場同類產(chǎn)品?;诠綰FS主控芯片的技術(shù)實(shí)力優(yōu)勢,公司已與閃迪達(dá)成戰(zhàn)略合作,共同面向移動及IOT市場推出定制化的高品質(zhì)UFS產(chǎn)品及解決方案。圖31:江波龍企業(yè)級SSD資料來源:江波龍公眾號,天風(fēng)證券研究所5.1.2.佰維存儲:產(chǎn)品布局與AI戰(zhàn)略深度融合,SSD技術(shù)領(lǐng)先佰維存儲專注于半導(dǎo)體存儲器的研發(fā)設(shè)計、封裝測試、生產(chǎn)和銷售,核心產(chǎn)品及服務(wù)涵蓋半導(dǎo)體存儲器和先進(jìn)封測服務(wù),具體可分為六大產(chǎn)品線:嵌入式存儲、PC存儲、工車規(guī)存儲、企業(yè)級存儲、移動存儲和先進(jìn)封測服務(wù)。公司企業(yè)級存儲有4大類別,分別為SATASSD、PCIeSSD、CXL內(nèi)存及RDIMM內(nèi)存條,主要應(yīng)用于數(shù)據(jù)中心、通用服務(wù)器、AI/ML服務(wù)器、云計算、大數(shù)據(jù)等場景。公司SS系列企業(yè)級2.5"SATASSD產(chǎn)品包含SS811、SS821等系列,支持異常掉電保護(hù)、端到端的數(shù)據(jù)保護(hù)、ThermalThrottling、動態(tài)和靜態(tài)磨損平衡、支持電源動態(tài)管理、S.M.A.R.T、垃圾回收和TRIM、固件備份、InternalRAID等特性。公司SP系列企業(yè)級PCIeSSD產(chǎn)品,包含Gen4和Gen5兩類產(chǎn)品。用創(chuàng)新架構(gòu),可實(shí)現(xiàn)超低且一致的讀寫延遲,具備優(yōu)秀的能效比表現(xiàn),可為客戶提供業(yè)界領(lǐng)先的KIOPS/Watt綜合性能。行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明資料來源:佰維BIWIN公眾號,天風(fēng)證券研究所5.1.3.德明利:“芯片+算法+場景”全鏈條發(fā)展德明利是一家專注于國產(chǎn)存儲主控芯片研發(fā)及存儲模組方案的集成電路企業(yè),以“芯片+算法+場景”全鏈條技術(shù)能力,為智能終端、數(shù)據(jù)中心、工業(yè)控制等高價值場景提供高可靠性存儲解決方案。公司產(chǎn)品線涵蓋固態(tài)硬盤類、嵌入式存儲類、內(nèi)存條類及移動存儲類四大系列,已廣泛應(yīng)用于數(shù)據(jù)中心、手機(jī)、車載電子、平板、安防監(jiān)控等多元應(yīng)用場景。德明利ES1020系列工業(yè)級SSD,作為行業(yè)主流存儲模組廠商率先搭載自研主控芯片的工業(yè)級產(chǎn)品,實(shí)現(xiàn)從芯片到模組的全鏈路國產(chǎn)化設(shè)計制造。其自研TW6501芯片是國內(nèi)首顆支持ONFI5.0的SATASSD主控,采用RISC-V架構(gòu),滿足寬溫要求。產(chǎn)品支持SATAIII協(xié)議,提供64GB-4TB容量及M.2/2.5寸/mSATA全形態(tài),具備200萬小時MTBF、超3K次擦寫壽命及7×24小時穩(wěn)定寫入性能。依托靈活可擴(kuò)展的自研固件平臺,為工業(yè)控制、安防監(jiān)控、通信、電力等關(guān)鍵行業(yè)端側(cè)AI硬件提供自主安全、穩(wěn)定可靠的存儲解決方案?!?+3”自研主控拓展提速,加快高性能領(lǐng)域研發(fā)創(chuàng)新。公司閃存模組以自研主控芯片為核心,隨著研發(fā)實(shí)力不斷增強(qiáng),芯片研發(fā)不斷拓展提速,同時推動兩顆主控量產(chǎn)導(dǎo)入,三顆主控芯片立項(xiàng)研發(fā)。公司新一代自研SD6.0存儲卡主控芯片成功量產(chǎn),產(chǎn)品適配工作進(jìn)展順利,目前已有各類搭載該款主控的存儲卡模組送樣,待客戶驗(yàn)證通過后即可實(shí)現(xiàn)批量導(dǎo)入;公司自研SATASSD主控芯片成功量產(chǎn),已經(jīng)完成產(chǎn)品適配與測試,并實(shí)現(xiàn)批量銷售。新一代SD6.0存儲卡主控芯片主要基于40nm工藝,提升讀寫性能,基于multi-voltage多電源域的低功耗設(shè)計方法,SATASSD主控芯片為國內(nèi)率先采用RISC-V指令集打造的無緩存高性能控制芯片,支持最新的ONFI5.0接口,二者均采用目前業(yè)界領(lǐng)先的4KLDPC糾錯技術(shù),可以靈活適配3DTLC/QLC等不同類型的閃存顆粒。資料來源:芯師爺公眾號,天風(fēng)證券研究所行業(yè)報告|行業(yè)專題研究請務(wù)必閱讀正文之后的信息披露和免責(zé)申明5.2.存儲芯片設(shè)計5.2.1.兆易創(chuàng)新:利基存儲格局優(yōu)化,端側(cè)AI推動定制化需求增長。公司專用型存儲芯片包括NORFlash、SLCNANDFlash和利基型DRAM三條產(chǎn)品線,形成了豐富的產(chǎn)品矩陣,滿足客戶在不同應(yīng)用中對容量、電壓以及封裝形式的多元需求,已在消費(fèi)電子、工業(yè)、通訊、汽車電子等領(lǐng)域?qū)崿F(xiàn)了全品類覆蓋。以及1.8VVCC&1.2VVIO等多種供電類型,并針對不同市場應(yīng)用需求分別提供高性能、低功耗、高可靠性、小封裝等多個產(chǎn)品系列,可滿足客戶在不同應(yīng)用領(lǐng)域多種產(chǎn)品應(yīng)用中對容量、電壓以及封裝形式的需求。2025年上半年,公司推出了專為1.2VSoC應(yīng)用打造的雙電壓供電SPINORFlash產(chǎn)品,進(jìn)一步強(qiáng)化公司在雙電壓供電閃存解決方案領(lǐng)域的戰(zhàn)略布局,為市場提供先進(jìn)嵌入式存儲解決方案,可應(yīng)用于智能可穿戴設(shè)備、醫(yī)療健康、物聯(lián)網(wǎng)、數(shù)據(jù)中心及邊緣人工智能等新興領(lǐng)域。2025年,公司為率先實(shí)現(xiàn)45nm節(jié)點(diǎn)SPINORFlash大規(guī)模量產(chǎn)的公司之一,存儲密度得到顯著改善,持續(xù)保持技術(shù)和市場的領(lǐng)先。SLCNANDFlash方面,公司產(chǎn)品容量覆蓋1Gb~8Gb,采用3V/1.8V兩種電壓供電,具有高速、高可靠性、低功耗的特點(diǎn),其中SPINANDFlash在消費(fèi)電子、工業(yè)、汽車電子等領(lǐng)域已經(jīng)實(shí)現(xiàn)了全品類的產(chǎn)品覆蓋。2025年上半年,公司推出了兼?zhèn)涓熳x取速度和壞塊管理功能的高速Q(mào)SPINANDFlash產(chǎn)品,可應(yīng)用于工業(yè)、IoT等快速啟動應(yīng)用場景。公司利基型DRAM產(chǎn)品廣泛應(yīng)用于網(wǎng)絡(luò)通信、電視、機(jī)頂盒、智能家居、工業(yè)等領(lǐng)域。2025年上半年,公司8Gb容量DDR4產(chǎn)品市場推廣順利進(jìn)行,營收穩(wěn)步增長;LPDDR4產(chǎn)品開始貢獻(xiàn)營收。公司控股子公司青耘科技開展的定制化存儲業(yè)務(wù)正有序推進(jìn)中,業(yè)務(wù)進(jìn)展順利。5.2.2.聯(lián)蕓科技:高壁壘“存儲大腦”主控賽道龍頭,AIoT芯片帶動第二增長曲線聯(lián)蕓科技是國內(nèi)領(lǐng)先的數(shù)據(jù)存儲主控芯片及AIoT信號處理芯片設(shè)計企業(yè),業(yè)務(wù)覆蓋消費(fèi)電子、工業(yè)控制、智能物聯(lián)等領(lǐng)域。公司主控芯片核心產(chǎn)品出貨量全球領(lǐng)先。在SSD主控領(lǐng)域,公司已實(shí)現(xiàn)從SATA到PCIe5.0的全協(xié)議覆蓋,構(gòu)建了消費(fèi)級、企業(yè)級和工業(yè)級的全場景產(chǎn)品矩陣。消費(fèi)級SSD:公司全面布局SATA、PCIe3.0及PCIe4.0主控芯片產(chǎn)品線,憑借高性能、低功耗和優(yōu)異的兼容性,出貨量實(shí)現(xiàn)穩(wěn)定增長,并在頭部筆電前
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年云計算技術(shù)與大數(shù)據(jù)分析試題
- 2026年汽車維修技師專業(yè)水平測試題庫大全
- 2026年國際金融風(fēng)險管理專業(yè)模擬試題及答案解析
- 2026年心理咨詢師心理評估考試模擬題
- 中醫(yī)護(hù)理提升急診洗胃效率
- 天文知識大全
- 護(hù)理員患者隱私保護(hù)與權(quán)益維護(hù)
- 2026年寧夏體育職業(yè)學(xué)院單招綜合素質(zhì)考試備考試題含詳細(xì)答案解析
- 2026年成都農(nóng)業(yè)科技職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試備考試題及答案詳細(xì)解析
- 2026年安徽廣播影視職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試模擬試題含詳細(xì)答案解析
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會成熟人才招聘備考題庫帶答案詳解
- 護(hù)工護(hù)理病人協(xié)議書
- 2024-2030年全球及中國獸用疫苗市場發(fā)展現(xiàn)狀及未來趨勢分析研究報告
- AQ/T 9009-2015 生產(chǎn)安全事故應(yīng)急演練評估規(guī)范(正式版)
- 醫(yī)療器械銷售法規(guī)培訓(xùn)
- T-SHNA 0004-2023 有創(chuàng)動脈血壓監(jiān)測方法
- 緬甸礦產(chǎn)資源分布情況
- 產(chǎn)前篩查培訓(xùn)課件
- 交期縮短計劃控制程序
- 神經(jīng)指南:腦血管造影術(shù)操作規(guī)范中國專家共識
- 物理必修一綜合測試題
評論
0/150
提交評論