Mistral AI 和NVIDIA 发布 Mistral NeMo 12B 参数模型该模型旨在支持企业应用

Mistral AI 宣布发布与 NVIDIA 协作开发的 Mistral NeMo，这是一个具有 12B 参数的模型，专为企业应用设计，支持聊天机器人、多语言任务、编码和摘要等。

高性能和灵活性：在多轮对话、数学、常识推理、世界知识和编码方面表现出色，提供精确可靠的性能。
128K 上下文长度：能够更连贯和准确地处理复杂信息，确保输出具有上下文相关性。
企业级支持和安全：作为 NVIDIA NIM 推理微服务提供，性能优化，支持灵活部署。
与其他模型的比较：在与 Gemma 2 9B 和 Llama 3 8B 的对比中，Mistral NeMo 基础模型在多项基准测试中表现优异。
高效的分词器：使用新型 Tekken 分词器，比之前的 SentencePiece 分词器在多种语言的压缩效率提高约 30%。韩语和阿拉伯语的压缩效率分别提高了 2 倍和 3 倍。

近期新闻