Google发布新版深度研究代理,开发者首次可接入新API
核心更新概览
2025年12月12日,Google发布了其深度研究代理(Deep Research Agent)的更新版本,并首次向开发者开放了该功能的API接入权限。此次更新标志着Google最先进的自主研究能力首次可供外部开发者集成到自己的应用程序中。
深度研究代理的核心能力
- 技术基础:该代理最初于2024年底在Gemini应用中推出。新版代理的推理核心基于Gemini 3 Pro进行训练,并针对减少错误和提高复杂任务报告质量进行了专门优化。
- 工作模式:采用迭代式研究方法,能够自主制定搜索查询、阅读搜索结果、识别知识缺口,并持续搜索直至找到满意的答案。
- 性能表现:新版代理性能超越前代模型,并略微超过近期发布的Gemini 3 Pro的网页搜索能力。
- 使用场景:尽管深度研究系统仍存在一定的错误风险,但用户可将其用于探索性信息收集。
配套新工具:DeepSearchQA基准
为解决现有基准在评估复杂多步骤网络搜索方面的不足,Google同步推出了一个新的开源基准——DeepSearchQA。
- 数据规模:包含900个人工构建的因果链任务,覆盖17个学科领域。
- 任务特点:每个任务步骤都依赖于前一步的分析结果。
- 评估维度:该基准用于评估答案的完整性,衡量搜索准确性和检索召回率,并作为衡量延长思考时间收益的诊断工具。
面向开发者的新功能与API
开发者现在可以访问一系列新功能,包括:
- 文件分析:支持PDF、CSV及文档分析。
- 报告控制:可控的报告结构、详细的来源引用。
- 输出格式:支持JSON格式输出。
- 未来更新:计划增加原生图表生成功能,并扩展对自定义数据源的支持。
此外,Google引入了一个新的交互式API,这是一个标准化接口,旨在让开发者更容易地与Gemini 3 Pro和深度研究代理等模型进行交互。该API目前处于公开测试阶段,目标是为开发者构建更复杂的智能体应用提供必要功能。
产品集成计划
新的深度研究功能将很快在Google Search、NotebookLM和Google Finance等产品中推出。
其他AI领域动态摘要(2025年12月12日)
- 融资动态:软件交付平台Harness完成2.4亿美元E轮融资,由高盛领投,估值达55亿美元,资金将主要用于AI平台开发。
- 上市竞争:国内大模型公司MiniMax、智谱AI和月之暗面正积极推动赴港上市计划,争夺“中国AI第一股”称号。
- 模型发布:欧洲Mistral AI发布新的开源编码模型家族Devstral2,包含123B和24B两个版本,其旗舰模型在SWE-bench基准测试中获得72.2分。
- 人才招聘:京东正在大力招聘边缘AI芯片人才,聚焦存算一体芯片技术,最高年薪可达40-100万元。
- 产品功能:OPPO ColorOS推出“AI妙听”功能,可将文章转换为带背景音乐的双人播客。
- 应用更新:国产大模型Skywork发布移动端APP 5.0,核心亮点为“多智能体并行协作”功能。
- 年度人物:《时代》周刊将2025年“年度人物”授予“人工智能的缔造者们”,这是该奖项第二次授予技术领域而非个人。
- 视频工具:Medeo AI新款视频生成工具亮相,支持通过自然语言进行复杂提示和实时修改,实现无限迭代编辑。
关键要点总结:
- Google深度研究代理现已向开发者开放,允许将高级研究功能嵌入自有应用。
- 新推出的DeepSearchQA基准专注于评估复杂网络搜索的答案完整性。
- 新的交互式API为开发者开发复杂智能体应用提供了更强大的工具。
