Mistral AI发布大型语言模型Mistral Large2
模型概况
- 参数数量: 1230亿
- 上下文窗口: 128K
- 支持语言: 多达数十种,包括主要的国际语言(如英语、法语、德语等)和编程语言(如Python、Java、C等)。
性能亮点
- 通用性能:
- 在MMLU测试中,预训练版本准确率达到84.0%。
- 代码和推理能力:
- 在代码生成和数学推理方面,与GPT-4、Claude3Opus和Llama3405B等顶尖模型相当。
- 多语言能力:
- 在多语言MMLU基准测试中表现卓越,特别是在主要语言(如英语、法语、德语等)上。
- 指令跟随和对齐:
- 在MT-Bench、Wild Bench和Arena Hard等基准测试中有显著提升。
- 工具使用和函数调用:
- 能够熟练执行并行和顺序函数调用,适用于复杂的商业应用。
技术特性
- 大幅减少“幻觉”现象,提高输出可靠性和准确性。
- 增强自我认知能力,在无法找到解决方案或信息不足时表现出色。
- 注重生成简洁且切中要点的回答,提高交互效率和成本效益。
应用和可用性
- 平台服务:
- La Plateforme上以“mistral-large-2407”名称提供服务。
- 模型权重开放,托管在HuggingFace上。
- 与Google Cloud Platform合作,通过Vertex AI提供Managed API服务。
- 可通过Azure AI Studio、Amazon Bedrock和IBM watsonx.ai等云服务访问。
许可和使用条件
- 发布于Mistral Research License下,允许研究和非商业用途。
- 商业用途需获取Mistral Commercial License。
总结
Mistral Large2标志着Mistral AI在大型语言模型领域的重大突破,为开发者提供了更强大、更灵活的工具,有望推动各行业的创新应用。