DeepSeek 秘密代码曝光:“MODEL1” 新架构剑指2月,编程能力再进化

AIbase 报道,正值 DeepSeek-R1发布一周年之际,DeepSeek 下一代旗舰模型的线索已悄然浮出水面。结合 The Information 的爆料,这款备受期待的新模型(或为 DeepSeek V4)最快有望于今年2月中旬(农历新年期间)正式登场,并预计带来更强悍的代码生成能力。

开发者在 DeepSeek 的 GitHub 仓库中发现,其更新的 FlashMLA 代码库中,横跨114个文件有多达28处引用了名为 “MODEL1” 的神秘标识符。代码逻辑显示,“MODEL1” 是一个区别于现有 “V32”(DeepSeek-V3.2)的全新架构。二者的关键差异体现在键值(KV)缓存布局、稀疏性处理方式以及 FP8数据格式的解码支持上,这表明新模型在内存优化和计算效率方面进行了针对性的底层重构。

此前,DeepSeek 团队已陆续发布了关于“优化残差连接(mHC)”和受生物学启发的“AI 记忆模块(Engram)”等技术论文。业界普遍猜测,这些最新的研究成果极有可能被整合进正在开发的“MODEL1”中,为这款即将发布的新旗舰提供核心技术支撑。

via AI新闻资讯 (author: AI Base)
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]