AI-NEWS · 2024年 7月 19日

DeepSeek开源DeepSeek-V2-Chat-0628模型 代码、数学推理能力提升

DeepSeek-V2-0628模型概述

全球排名与表现

  • 全球领先:在LMSYS组织的大模型竞技场(Chatbot Arena)中,DeepSeek-V2-0628荣登开源模型榜首,总排名第11,超越所有其他开源模型,包括Llama3-70B、Qwen2-72B、Nemotron-4-340B和Gemma2-27B。
  • 国内表现:在国内模型评比中,DeepSeek-V2-0628名列第二,显示出强大的竞争力。

能力提升

  • 版本升级:相较于0507版本,DeepSeek-V2-0628在代码数学推理、指令跟随、角色扮演和JSON Output等方面有全面提升。
  • 解决问题能力:在难问题(Hard Prompt)、代码(Code)、长问题(Longer Query)和数学(Math)等分项上展现出世界级的长难问题解决能力,与顶尖模型如GPT-4-Turbo-0409和Claude3Opus处于同一水平。

商业应用与服务

  • 上线时间:DeepSeek-V2-0628已于2024年6月28日上线,提供API和网页端服务。
  • 价格竞争力:以极具竞争力的价格向市场提供服务,增强商业吸引力。

重要链接

关键总结

  • 全球领先:DeepSeek-V2-0628在全球开源模型排行榜中荣获榜首,展示了其在AI领域的卓越实力。
  • 解决问题能力:特别是在解决长难问题和代码推理方面,达到了世界级水准。
  • 价格竞争力:提供具备竞争力的API和网页端服务,扩大市场影响力。

Source:https://www.aibase.com/news/10458