Google DeepMind发布Gemini 2.5 Deep Think AI模型
核心技术创新
- 并行思考机制:采用多智能体系统,允许多个AI"代理"同时处理问题,探索不同假设并整合结果
- 强化学习优化:新型强化学习技术使模型在推理过程中持续优化策略
- 多模态支持:支持文本、音频、图像和视频输入,上下文窗口达100万token
国际数学奥赛表现
- 在2025年IMO中获得35/42分(金牌水平)
- 成功解决6道题中的5道
- 相比去年银牌的AlphaProof/AlphaGeometry2,采用纯自然语言处理,减少对特定领域语言的依赖
基准测试成绩
测试名称 | 得分 | 对比成绩 |
---|---|---|
LiveCodeBench V6 | 87.6 | Grok4(79), o3(72) |
Humanity's Last Exam | 34.8 | Grok4(25.4), o3(20.3) |
WebDev Arena | 领先 | – |
用户获取方式
- 订阅价格:
- 常规:$249.99/月
- 新用户优惠:前3个月$124.99/月
- 通过Gemini移动应用(iOS/Android)提供
- 每日有限次数的Deep Think提示额度
行业影响
- 标志着AI从模式识别向深度推理和创造力的转变
- 高性能伴随高订阅费和计算资源需求可能限制普及
- 未来计划通过API向数学家和开发者提供测试版本
AIbase观点:Deep Think为AI发展设立了新基准,但成本与可及性的平衡将决定其能否成为真正的"游戏规则改变者"