DeepSeek代码仓库惊现神秘标识符MODEL1,新旗舰模型或于2月发布
核心发现
- 时间:2026年1月21日
- 事件:国内领先AI公司深度求索(DeepSeek)在其GitHub代码提交记录中,于更新的FlashMLA代码内被发现大量指向未知模型“MODEL1”的标识符。
- 代码规模:涉及数百个文件。
- 关联版本:“MODEL1”与现有V3.2版本一同被提及。
技术细节分析
代码显示,“MODEL1”并非现有架构的简单迭代,而很可能是一个全新的模型系列。具体技术差异体现在:
- 关键值(KV)缓存布局
- 稀疏处理逻辑
- 对FP8数据格式的解码支持
这些差异通常预示着在计算效率和GPU内存优化方面将有新的突破。
背景与关联信息
- 发布计划:此前有报道称,DeepSeek计划在2026年春节期间发布一款名为DeepSeek V4的旗舰模型,重点强化编码能力。
- 技术储备:近期DeepSeek官方发布了关于“优化残差连接(mHC)”和“AI记忆模块(Engram)”的两篇重要论文。外界普遍推测,“MODEL1”正是这些前沿研究成果的工程化实现。
综合推测
结合代码线索、发布计划及近期论文,“MODEL1”极有可能是即将发布的DeepSeek V4或其核心组成部分,预计将于2026年2月(农历新年期间)正式亮相。
本文信息整理自AIbase Daily,发布日期:2026年1月21日。
