中金發(fā)布研報稱,近期DeepSeek發(fā)布了其新一代開源模型V4系列并公布技術(shù)報告,作為國產(chǎn)開源模型的代表廠商,DeepSeek的技術(shù)創(chuàng)新也是模型產(chǎn)業(yè)進(jìn)步的方向之一。此次,V4系列最核心架構(gòu)創(chuàng)新在于應(yīng)用混合注意力機(jī)制降低單Token推理FLOPs和KV Cache,提升模型推理效率。該行認(rèn)為,DeepSeek和其他國產(chǎn)模型以開源的方式探索模型進(jìn)步方法論和工程優(yōu)化方向,共同促進(jìn)模型產(chǎn)業(yè)的繁榮以及加速AGI時代的到來。
該行指,DeepSeek發(fā)布V4模型,突破超長上下文效率瓶頸。V4預(yù)覽版推出兩個版本的MoE模型,包括智能水平和定價更高,聚焦完成復(fù)雜任務(wù)的V4-Pro以及主打性價比優(yōu)勢的V4-Flash,兩個版本模型均支持100萬Token的超長上下文,這也是此次V4系列的核心亮點。該行認(rèn)為,V4在超長上下文的突破將賦能模型在Agentic AI領(lǐng)域的加速進(jìn)步,更高效準(zhǔn)確完成復(fù)雜長程任務(wù)。
該行認(rèn)為,V4的優(yōu)化緩解了HBM的壓力,高效釋放了各部分存儲的效率,SSD進(jìn)入模型核心推理的趨勢顯現(xiàn)。看好國產(chǎn)開源大模型的進(jìn)步趨勢,在模型效率的優(yōu)化下將加速下游Agentic AI的需求釋放,看好模型廠商智譜(HK2513)(02513)、MiniMax(00100)。
