AI-NEWS · 2024年 11月 22日

深见推出超OpenAI的R1-Lite预览版模型

深度分析报告

R1-Lite-Preview模型发布亮点

DeepSeek,中国私募股权巨头Huanfang Quantitative的子公司,最近发布了其最新的推理型大语言模型R1-Lite-Preview。此模型目前仅通过DeepSeek Chat网页聊天机器人平台提供给公众。

模型性能

  • 卓越表现:尽管只在聊天应用中可用,但R1-Lite-Preview的表现与OpenAI的o1-preview相当甚至超越。
  • “链式思维”推理:展示了解决用户查询时的不同思维过程,虽然某些推理链可能看似无意义或错误,总体而言,其答案非常准确。
  • 逻辑和数学能力:在AIME(美国邀请数学考试)和MATH等基准测试中的表现超过o1-preview。

模型特性

  • 透明性与准确性:R1-Lite-Preview允许用户实时观察模型的推理步骤,提升了系统的责任感和可信度。
  • 时间深度影响:随着思考时间增加(“思考令牌”),其在AIME等基准测试中的得分也提升。

模型限制

  • DeepSeek尚未发布完整的代码供第三方独立分析或基准测试使用,亦未提供API进行独立测试。
  • 缺乏关于模型训练和构建的博客文章和技术文档,使得其起源保持神秘状态。

使用方式与未来计划

  • 免费试用:R1-Lite-Preview可通过DeepSeek Chat(chat.deepseek.com)免费体验,但高级“深层思考”模式每天限50条消息。
  • 未来计划包括发布开源版本的R1系列模型及相关API,以进一步支持开源AI社区的发展。

结论

DeepSeek继续在开源AI领域推动创新,R1-Lite-Preview为推理能力和可扩展性增加了一个新维度。随着企业和研究人员探索需要强大推理能力的AI应用,DeepSeek的开放承诺将确保其模型成为开发和创新的重要资源。

Source:https://www.aibase.com/news/13373