AI-NEWS · 2024年 7月 17日

Mistral新模型Codestral Mamba 速度更快、文本处理长度是GPT-4o两倍

归纳总结

  1. 新模型发布: 法国AI初创公司Mistral发布了新编码模型Codestral Mamba,速度更快,能处理长达256,000个token的输入文本,是OpenAI的GPT-4o的两倍(GPT-4o只能处理128,000个token)。

  2. 技术特点: Codestral Mamba基于“Mamba”架构,比传统变换器架构更高效,能够快速处理复杂任务。尤其在编程任务中表现优秀,超越了CodeLlama和DeepSeek等竞争对手。

  3. 免费使用: 该模型可在Mistral的la Plateforme API上免费使用,特别适合本地编码项目。

  4. 资金与支持: Mistral近期成功融资6.4亿美元,估值接近60亿美元,获得了微软和IBM等大公司的投资支持。

  5. 其他产品: Mistral还推出了Mathstral模型,专注数学推理和科学探索,采用开源Apache2.0许可,适用于STEM领域的复杂数学问题解决。

划重点

  1. 速度快、处理长文本: Codestral Mamba可以处理高达256,000个token的输入,速度比其他模型快。
  2. 编程助手: 在编程测试中,Codestral Mamba超越了多个竞争对手,成为优秀的编程工具。
  3. 强大支持: Mistral最近融资6.4亿美元,预计在AI领域将继续取得重大进展。

Source:https://www.aibase.com/news/10251