AI-NEWS · 2025年 8月 5日

谷歌Gemini 2.5发布

Google DeepMind发布Gemini 2.5 Deep Think AI模型

核心技术创新

并行思考机制：采用多智能体系统，允许多个AI"代理"同时处理问题，探索不同假设并整合结果
强化学习优化：新型强化学习技术使模型在推理过程中持续优化策略
多模态支持：支持文本、音频、图像和视频输入，上下文窗口达100万token

国际数学奥赛表现

在2025年IMO中获得35/42分（金牌水平）
成功解决6道题中的5道
相比去年银牌的AlphaProof/AlphaGeometry2，采用纯自然语言处理，减少对特定领域语言的依赖

基准测试成绩

测试名称	得分	对比成绩
LiveCodeBench V6	87.6	Grok4(79), o3(72)
Humanity's Last Exam	34.8	Grok4(25.4), o3(20.3)
WebDev Arena	领先	–

用户获取方式

订阅价格：
- 常规：$249.99/月
- 新用户优惠：前3个月$124.99/月
通过Gemini移动应用(iOS/Android)提供
每日有限次数的Deep Think提示额度

行业影响

标志着AI从模式识别向深度推理和创造力的转变
高性能伴随高订阅费和计算资源需求可能限制普及
未来计划通过API向数学家和开发者提供测试版本

AIbase观点：Deep Think为AI发展设立了新基准，但成本与可及性的平衡将决定其能否成为真正的"游戏规则改变者"

火龙果频道

您可能还喜欢...