DeepMind 元老 David Silver 离职创业:押注强化学习,挑战大模型局限
发布日期:2026年2月2日
阅读时长:约3分钟
核心事件
关键人物离职:谷歌 DeepMind 的关键先驱之一 David Silver 已正式宣布离职。他是 AlphaGo、AlphaZero 和 MuZero 等突破性项目的核心推动者。他的离开不仅标志着 DeepMind 一个时代的结束,也预示着全球顶尖 AI 人才正流向更具实验性的领域。
创立新公司:离职后,David Silver 在伦敦创立了一家名为 Ineffable Intelligence 的初创公司。
核心理念:从“数据时代”到“经验时代”
David Silver 对当前主流的大语言模型(LLM)路径提出了不同看法:
- 局限性认知:他认为,仅基于人类数据训练的大语言模型无法实现真正的超级智能。
- 技术押注:他坚定地押注于 “强化学习” 领域。
- 核心主张:主张 AI 应通过持续的试错和自我经验来获取知识,而非被动学习现有的人类信息。
Silver 将这一愿景称为 “经验时代”。在他看来,AI 应像人类或动物一样,通过与环境的长期互动来构建世界模型,从而实现持续学习。这种自主发现知识的能力,被认为是突破当前大模型瓶颈的关键。
行业影响与趋势
- 人才流动:随着更多顶尖科学家离开大公司探索新路径,一场关于 “如何实现超级智能” 的第二次竞赛已经开启。
- 公司现状:Ineffable Intelligence 目前正在积极吸引投资者和顶级研究人员加入。
其他相关AI新闻摘要(同日)
- 谷歌AI黑箱问题:谷歌CEO承认无法完全掌控AI系统的运行机制,揭示了AI黑箱的奥秘。大模型通过海量数据训练展现出“涌现”行为。
- Grok在印尼解禁:印尼有条件解除了X平台聊天机器人Grok的封锁,成为东南亚首个解禁的国家。解禁前提是X公司承诺加强合规措施。
- 阿里“千文”项目:阿里巴巴投入30亿元启动“千文”春节项目,旨在通过AI技术深度介入用户日常生活决策,重塑消费习惯,挑战现有市场格局。
- AI平台数据泄露:AI社交平台Moltbook因配置错误导致数据库公开,近15万个AI代理的邮箱、登录令牌和API密钥面临泄露风险。
- 快手治理AI换脸视频:快手安全中心宣布完成为期一个月的“AI生成”视频专项治理,处置违规内容5,576条,对11个违规账号进行警告。
- 印度税收激励:印度推出为期21年的“零税率”政策(至2047年),以吸引全球云服务商建立数据中心,争夺全球AI算力中心地位。
- 蚂蚁集团AI激励:蚂蚁集团推出“AI信贷”激励计划,奖励在AI领域有开创性贡献的团队和个人,推动AI战略发展。
- 中兴发布Co-Claw企业版:中兴通讯发布桌面智能体Co-Claw企业版,通过增强企业部署、安全治理和能力复用,推动AI智能体规模化应用。
- AI购物助手:渡渡智能与豆巴大模型合作推出AI购物助手,通过深度理解用户需求提供个性化生活方案,而非仅依赖历史数据推荐商品。
