AI-NEWS · 2025年 8月 5日

谷歌Gemini 2.5发布

Google DeepMind发布Gemini 2.5 Deep Think AI模型

核心技术创新

  • 并行思考机制:采用多智能体系统,允许多个AI"代理"同时处理问题,探索不同假设并整合结果
  • 强化学习优化:新型强化学习技术使模型在推理过程中持续优化策略
  • 多模态支持:支持文本、音频、图像和视频输入,上下文窗口达100万token

国际数学奥赛表现

  • 在2025年IMO中获得35/42分(金牌水平)
  • 成功解决6道题中的5道
  • 相比去年银牌的AlphaProof/AlphaGeometry2,采用纯自然语言处理,减少对特定领域语言的依赖

基准测试成绩

测试名称 得分 对比成绩
LiveCodeBench V6 87.6 Grok4(79), o3(72)
Humanity's Last Exam 34.8 Grok4(25.4), o3(20.3)
WebDev Arena 领先

用户获取方式

  • 订阅价格
    • 常规:$249.99/月
    • 新用户优惠:前3个月$124.99/月
  • 通过Gemini移动应用(iOS/Android)提供
  • 每日有限次数的Deep Think提示额度

行业影响

  • 标志着AI从模式识别向深度推理和创造力的转变
  • 高性能伴随高订阅费和计算资源需求可能限制普及
  • 未来计划通过API向数学家和开发者提供测试版本

AIbase观点:Deep Think为AI发展设立了新基准,但成本与可及性的平衡将决定其能否成为真正的"游戏规则改变者"

火龙果频道