返回    放大 +    缩小 -
DeepSeek新模型MODEL1曝光
推荐
4
利好
5
利淡
3
AASTOCKS新闻
据内媒报道,DeepSeek-R1发布一周年之际,新模型「MODEL1」曝光。DeepSeek在GitHub更新FlashMLA代码,横跨114个文件中有28处提到「MODEL1」,与V32作为不同的模型出现。

报道指,V32是DeepSeek-V3.2,「MODEL很可能是新架构。代码中的具体差异体现在KV缓存布局、稀疏性处理和FP8解码方面,在内存优化上有多处不同。

相关内容中国第四季季度GDP增长率为1.2%,高於之前的1.1%。预测值为1%。
早前有消息称,DeepSeek将在2月中春节前后发布下一代旗舰模型。(ta/w)
AASTOCKS新闻