AI-NEWS · 2024年 7月 25日

Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B

Mistral AI发布大型语言模型Mistral Large2

模型概况

  • 参数数量: 1230亿
  • 上下文窗口: 128K
  • 支持语言: 多达数十种,包括主要的国际语言(如英语、法语、德语等)和编程语言(如Python、Java、C等)。

性能亮点

  • 通用性能:
    • 在MMLU测试中,预训练版本准确率达到84.0%。
  • 代码和推理能力:
    • 在代码生成和数学推理方面,与GPT-4、Claude3Opus和Llama3405B等顶尖模型相当。
  • 多语言能力:
    • 在多语言MMLU基准测试中表现卓越,特别是在主要语言(如英语、法语、德语等)上。
  • 指令跟随和对齐:
    • 在MT-Bench、Wild Bench和Arena Hard等基准测试中有显著提升。
  • 工具使用和函数调用:
    • 能够熟练执行并行和顺序函数调用,适用于复杂的商业应用。

技术特性

  • 大幅减少“幻觉”现象,提高输出可靠性和准确性。
  • 增强自我认知能力,在无法找到解决方案或信息不足时表现出色。
  • 注重生成简洁且切中要点的回答,提高交互效率和成本效益。

应用和可用性

  • 平台服务:
    • La Plateforme上以“mistral-large-2407”名称提供服务。
    • 模型权重开放,托管在HuggingFace上。
    • 与Google Cloud Platform合作,通过Vertex AI提供Managed API服务。
    • 可通过Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等云服务访问。

许可和使用条件

  • 发布于Mistral Research License下,允许研究和非商业用途。
  • 商业用途需获取Mistral Commercial License。

总结

Mistral Large2标志着Mistral AI在大型语言模型领域的重大突破,为开发者提供了更强大、更灵活的工具,有望推动各行业的创新应用。

Source:https://www.aibase.com/news/10554