DeepMind 元老 David Silver 离职创业：押注强化学习，挑战大模型局限

发布日期：2026年2月2日
阅读时长：约3分钟

核心事件

关键人物离职：谷歌 DeepMind 的关键先驱之一 David Silver 已正式宣布离职。他是 AlphaGo、AlphaZero 和 MuZero 等突破性项目的核心推动者。他的离开不仅标志着 DeepMind 一个时代的结束，也预示着全球顶尖 AI 人才正流向更具实验性的领域。

创立新公司：离职后，David Silver 在伦敦创立了一家名为 Ineffable Intelligence 的初创公司。

核心理念：从“数据时代”到“经验时代”

David Silver 对当前主流的大语言模型（LLM）路径提出了不同看法：

局限性认知：他认为，仅基于人类数据训练的大语言模型无法实现真正的超级智能。
技术押注：他坚定地押注于 “强化学习” 领域。
核心主张：主张 AI 应通过持续的试错和自我经验来获取知识，而非被动学习现有的人类信息。

Silver 将这一愿景称为 “经验时代”。在他看来，AI 应像人类或动物一样，通过与环境的长期互动来构建世界模型，从而实现持续学习。这种自主发现知识的能力，被认为是突破当前大模型瓶颈的关键。

行业影响与趋势

人才流动：随着更多顶尖科学家离开大公司探索新路径，一场关于 “如何实现超级智能” 的第二次竞赛已经开启。
公司现状：Ineffable Intelligence 目前正在积极吸引投资者和顶级研究人员加入。

其他相关AI新闻摘要（同日）

谷歌AI黑箱问题：谷歌CEO承认无法完全掌控AI系统的运行机制，揭示了AI黑箱的奥秘。大模型通过海量数据训练展现出“涌现”行为。
Grok在印尼解禁：印尼有条件解除了X平台聊天机器人Grok的封锁，成为东南亚首个解禁的国家。解禁前提是X公司承诺加强合规措施。
阿里“千文”项目：阿里巴巴投入30亿元启动“千文”春节项目，旨在通过AI技术深度介入用户日常生活决策，重塑消费习惯，挑战现有市场格局。
AI平台数据泄露：AI社交平台Moltbook因配置错误导致数据库公开，近15万个AI代理的邮箱、登录令牌和API密钥面临泄露风险。
快手治理AI换脸视频：快手安全中心宣布完成为期一个月的“AI生成”视频专项治理，处置违规内容5,576条，对11个违规账号进行警告。
印度税收激励：印度推出为期21年的“零税率”政策（至2047年），以吸引全球云服务商建立数据中心，争夺全球AI算力中心地位。
蚂蚁集团AI激励：蚂蚁集团推出“AI信贷”激励计划，奖励在AI领域有开创性贡献的团队和个人，推动AI战略发展。
中兴发布Co-Claw企业版：中兴通讯发布桌面智能体Co-Claw企业版，通过增强企业部署、安全治理和能力复用，推动AI智能体规模化应用。
AI购物助手：渡渡智能与豆巴大模型合作推出AI购物助手，通过深度理解用户需求提供个性化生活方案，而非仅依赖历史数据推荐商品。

火龙果频道

近期新闻

AI-NEWS · 2026年 2月 3日

DeepMind元老创业押注强化学习

DeepMind 元老 David Silver 离职创业：押注强化学习，挑战大模型局限

核心事件

核心理念：从“数据时代”到“经验时代”

行业影响与趋势

其他相关AI新闻摘要（同日）

您可能还喜欢...

AI-NEWS · 2026年 2月 3日

DeepMind 元老 David Silver 离职创业：押注强化学习，挑战大模型局限

核心事件

核心理念：从“数据时代”到“经验时代”

行业影响与趋势

其他相关AI新闻摘要（同日）

您可能还喜欢...

智谱AI推出数字框架

谷歌AI工具全球上线

英伟达宇树联手：2026 年开源人形机器人来了