AI-NEWS · 2024年 7月 25日

Mistral AI发布大型语言模型Mistral Large 2 接近Llama 405B

Mistral AI发布大型语言模型Mistral Large2

模型概况

参数数量: 1230亿
上下文窗口: 128K
支持语言: 多达数十种，包括主要的国际语言（如英语、法语、德语等）和编程语言（如Python、Java、C等）。

性能亮点

通用性能:
- 在MMLU测试中，预训练版本准确率达到84.0%。
代码和推理能力:
- 在代码生成和数学推理方面，与GPT-4、Claude3Opus和Llama3405B等顶尖模型相当。
多语言能力:
- 在多语言MMLU基准测试中表现卓越，特别是在主要语言（如英语、法语、德语等）上。
指令跟随和对齐:
- 在MT-Bench、Wild Bench和Arena Hard等基准测试中有显著提升。
工具使用和函数调用:
- 能够熟练执行并行和顺序函数调用，适用于复杂的商业应用。

技术特性

大幅减少“幻觉”现象，提高输出可靠性和准确性。
增强自我认知能力，在无法找到解决方案或信息不足时表现出色。
注重生成简洁且切中要点的回答，提高交互效率和成本效益。

应用和可用性

平台服务:
- La Plateforme上以“mistral-large-2407”名称提供服务。
- 模型权重开放，托管在HuggingFace上。
- 与Google Cloud Platform合作，通过Vertex AI提供Managed API服务。
- 可通过Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等云服务访问。

许可和使用条件

发布于Mistral Research License下，允许研究和非商业用途。
商业用途需获取Mistral Commercial License。

总结

Mistral Large2标志着Mistral AI在大型语言模型领域的重大突破，为开发者提供了更强大、更灵活的工具，有望推动各行业的创新应用。

Source:https://www.aibase.com/news/10554

您可能还喜欢...