AI-NEWS · 2024年 8月 9日

Ali Open Sources Latest Mathematical Model Qwen2-Math that Surpasses GPT-4o in Mathematical Abilities

归纳总结

项目名称: Qwen2-Math

发布方: 阿里云

模型系列:

  • Qwen2-Math
  • Qwen2-Math-Instruct-1.5B/7B/72B

主要特点与成就:

  1. 卓越的数学能力:

    • 超越现有开源模型和一些知名闭源模型(如GPT-4o, Claude-3.5-Sonnet, Gemini-1.5-Pro, Llama-3.1-405B)在多项数学基准测试中的表现。
    • 在2024 AIME和2023 AMC等比赛中表现突出。
  2. 独特的训练方法:

    • 基于Qwen2-1.5B/7B/72B进行深度预训练,使用高质量的大规模数学语料库。
    • Qwen2-Math-Instruct模型通过创新训练方法,结合密集奖励信号与二进制信号,采用GRPO技术增强数学解题能力。
  3. 实际应用:

    • 能解决部分国际数学奥林匹克竞赛水平的问题。
    • 在教育行业及需要复杂数学计算的研究和工程领域具有潜力。

未来发展计划:

  • 目前仅支持英语,正在开发支持中英双语的模型,并计划推出多语言版本。
  • 持续优化模型以提升其解决复杂数学问题的能力。

项目页面: Qwen2-Math

模型下载: Hugging Face

Source:https://www.aibase.com/news/10953