AI-NEWS · 2024年 11月 22日

深见推出超OpenAI的R1-Lite预览版模型

深度分析报告

R1-Lite-Preview模型发布亮点

DeepSeek，中国私募股权巨头Huanfang Quantitative的子公司，最近发布了其最新的推理型大语言模型R1-Lite-Preview。此模型目前仅通过DeepSeek Chat网页聊天机器人平台提供给公众。

模型性能

卓越表现：尽管只在聊天应用中可用，但R1-Lite-Preview的表现与OpenAI的o1-preview相当甚至超越。
“链式思维”推理：展示了解决用户查询时的不同思维过程，虽然某些推理链可能看似无意义或错误，总体而言，其答案非常准确。
逻辑和数学能力：在AIME（美国邀请数学考试）和MATH等基准测试中的表现超过o1-preview。

模型特性

透明性与准确性：R1-Lite-Preview允许用户实时观察模型的推理步骤，提升了系统的责任感和可信度。
时间深度影响：随着思考时间增加（“思考令牌”），其在AIME等基准测试中的得分也提升。

模型限制

DeepSeek尚未发布完整的代码供第三方独立分析或基准测试使用，亦未提供API进行独立测试。
缺乏关于模型训练和构建的博客文章和技术文档，使得其起源保持神秘状态。

使用方式与未来计划

免费试用：R1-Lite-Preview可通过DeepSeek Chat（chat.deepseek.com）免费体验，但高级“深层思考”模式每天限50条消息。
未来计划包括发布开源版本的R1系列模型及相关API，以进一步支持开源AI社区的发展。

结论

DeepSeek继续在开源AI领域推动创新，R1-Lite-Preview为推理能力和可扩展性增加了一个新维度。随着企业和研究人员探索需要强大推理能力的AI应用，DeepSeek的开放承诺将确保其模型成为开发和创新的重要资源。

Source:https://www.aibase.com/news/13373

您可能还喜欢...