AI-NEWS · 2024年 7月 15日

路透社:OpenAI 正在开发代号为“Strawberry”的新模型 可自主浏览互联网并自主推理

OpenAI 开发代号为“Strawberry”的新模型

1. 项目背景与目标

  • 项目名称:Strawberry(草莓),原名Q*。
  • 目标:提升人工智能的推理能力,使其能够自主浏览互联网并进行深度研究,适应长周期任务(LHT)。

2. 项目概述

  • 核心目标:让AI不仅能生成答案,还能自主进行信息检索和分析,基于其发现采取行动。
  • 提升推理能力:改进AI处理多步骤问题和长周期任务的能力,应用于科学发现、软件开发等复杂领域。

3. 技术方法

  • 后训练(Post-training):通过进一步调整和优化模型提升性能,包括细调(fine-tuning)。
  • 自我训练数据生成:类似斯坦福大学的“Self-Taught Reasoner”(STaR),模型通过自我生成训练数据不断提高智能水平。

4. 内部文件与开发进展

  • 当前状态:项目正在进行中,具体发布日期尚未确定。
  • 数据集:“深度研究”数据集用于训练和评估模型。
  • CUA(计算机使用代理):自主操作系统,自动浏览互联网进行信息检索和分析,并采取相应行动。

5. 可能应用场景

  • 自动浏览与研究:CUA可以自主查找、阅读和分析在线信息,进行深度研究。
  • 行动决策:基于研究结果,CUA可以下载论文、生成报告、启动实验模拟等。
  • 工程任务
    • 软件工程:浏览代码库,查找并修复错误,生成代码模块,开发软件应用。
    • 机器学习工程:数据预处理、模型训练和优化、结果分析等工作。

6. 行业内竞争与挑战

  • 其他公司尝试:谷歌、Meta和微软等公司也在提升AI推理能力。
  • AI推理的重要性:被视为实现人类或超人类智能的关键,涉及提前计划、反映物理世界运作方式、解决复杂问题。

7. 市场反馈与未来展望

  • 行业观点:推理能力是AI发展的重要方向,但大语言模型能否长期规划存在分歧。
  • OpenAI战略:通过后训练方法和自学推理技术,瞄准长时间任务执行能力。

路透社报道详见:路透社原文链接

Source:https://xiaohu.ai/p/11309