東方證券(HK3958)發(fā)布研報稱,算力進入推理時代,算力鏈各個環(huán)節(jié)有望不斷受益,多模態(tài)交互帶來推理密度指數(shù)級提升,Agent的普及引發(fā)推理任務(wù)爆發(fā)增長。建議投資者關(guān)注芯片、云服務(wù)、IDC等等領(lǐng)域標(biāo)的。
東方證券(HK3958)主要觀點如下:
算力從訓(xùn)練走向推理,步入增長新周期
當(dāng)前大模型訓(xùn)練數(shù)據(jù)量增長放緩、邊際效益遞減,訓(xùn)練算力逐步轉(zhuǎn)向“精耕細作”。隨著大模型能力全面超越人類基準(zhǔn),應(yīng)用邊界持續(xù)拓展,疊加推理成本因技術(shù)優(yōu)化出現(xiàn)斷崖式下跌,進一步刺激了推理需求爆發(fā),算力結(jié)構(gòu)已開始向推理側(cè)傾斜。展望未來,多模態(tài)交互帶來推理密度指數(shù)級提升,Agent的普及引發(fā)推理任務(wù)爆發(fā)增長,二者將成為推動推理算力非線性爆發(fā)的核心引擎,推理算力占比將持續(xù)攀升,成為算力增長的主要驅(qū)動力。
Agent時代,底層算力架構(gòu)與云服務(wù)模式迎來重塑
硬件層面,CPU迎來價值重估,逐步從幕后的調(diào)度角色轉(zhuǎn)向前臺核心承載,成為處理高度分支化任務(wù)、承載海量KV-Cache的最優(yōu)載體,直接推動服務(wù)器向多核化、大內(nèi)存規(guī)格迭代升級;與此同時,GPU的性能瓶頸已從算力峰值轉(zhuǎn)向顯存帶寬。云服務(wù)層面,商業(yè)模式從傳統(tǒng)的資源租賃模式,加速向“MaaS(模型即服務(wù))與Agent編排”的全新范式躍遷;行業(yè)競爭核心也從單純的算力規(guī)模比拼,轉(zhuǎn)向工具鏈生態(tài)的綜合構(gòu)建。阿里(BABA)云、百度(BIDU)云等頭部廠商也紛紛開啟漲價。云廠商正從基礎(chǔ)資源提供商,加速轉(zhuǎn)變?yōu)橹悄荏w生態(tài)的集成商與綜合承包商。
存儲架構(gòu)創(chuàng)新成為新趨勢
在推理AI時代,算力中心核心挑戰(zhàn)從之前的算力為主逐步轉(zhuǎn)向存儲與帶寬效率,KV緩存對存儲架構(gòu)提出新要求,存儲架構(gòu)的創(chuàng)新帶來新機會。英偉達(NVDA)在2026 CES推出ICMSAI原生存儲平臺,新增G3.5閃存層優(yōu)化KV緩存管理,依托BlueField-4 DPU實現(xiàn)大容量與高速傳輸,多家存儲廠商參與構(gòu)建;其還推進SCADA計劃提升存儲效率,cuDF、cuVS數(shù)據(jù)加速庫獲國外主流云平臺采用,而國內(nèi)星環(huán)科技(688031)也與英偉達(NVDA)合作研發(fā)GPU數(shù)據(jù)庫,共同推動AI推理與數(shù)據(jù)處理降本增效。
投資建議與投資標(biāo)的
芯片端(GPU&CPU):相關(guān)公司包括海光信息(688041)、寒武紀(jì)(688256)、禾盛新材(002290);云服務(wù)&IDC:相關(guān)標(biāo)的為首都在線(300846)、東陽光(600673)、豫能控股(001896)、網(wǎng)宿科技(300017)、優(yōu)刻得(688158)-W等;服務(wù)器:相關(guān)標(biāo)的為浪潮信息(000977)、中科曙光(603019)、華勤技術(shù)(HK3296)等;數(shù)據(jù)庫:相關(guān)標(biāo)的為達夢數(shù)據(jù)(688692)、星環(huán)科技(688031)-U。
風(fēng)險提示
ai應(yīng)用(886108)推進不及預(yù)期風(fēng)險;行業(yè)競爭加劇風(fēng)險。
