StepStellar推出高性价比深度研究模型Step-DeepResearch
近日,Stepfun(步趣)正式开源了一款名为Step-DeepResearch的新型深度研究模型。该模型专注于在开放研究环境中进行自主信息探索和专业报告生成。
核心特性与性能
- 参数规模:320亿参数。
- 研究能力:其深度研究能力接近OpenAI的o3-mini、Gemini 2.0 Flash等顶级商业模型。
- 成本优势:部署成本仅为传统模型的十分之一,单次调用成本低于0.5元人民币,具有显著的成本效益。
技术架构与设计理念
Step-DeepResearch的设计理念独特,其核心是将复杂的科研任务分解为多个可训练的“原子能力”,例如:
- 规划
- 信息检索
- 反思
- 交叉验证
通过这种方式,模型实现了闭环反思和动态校正,不仅增强了在复杂环境中的适应性,也提升了泛化性能。
训练过程与评估表现
模型的训练过程经过精心设计,涵盖了从智能体中期训练到监督微调,再到强化学习的完整流程,以确保在复杂实际应用中的优异表现。
在多项基准测试中,Step-DeepResearch展现出强大实力:
- Scale AI Research Rubrics:获得61.4的高分,与OpenAI Deep Research、Gemini Deep Research等更大规模的模型表现相当。
- ADR-Bench专家评估:其Elo评分显著高于许多竞争对手,证明了其在深度研究领域的强劲能力。
科研工作流支持
为支持科研工作流程,Step-DeepResearch采用了基于ReAct范式的单智能体架构,具备推理、行动、反思的动态循环。通过其内部专有工具集,系统能够高效执行:
- 批量网络搜索
- 文件管理
- 交互式命令执行
这为研究人员提供了极大的便利。
总结
Step-DeepResearch作为一款最新开源的深度研究模型,凭借其接近顶级商业模型的能力、仅为传统模型十分之一的成本、独特的训练流程和动态循环架构,为科学研究提供了高效的支持。
