Mistral AI 发布 Devstral2507 系列大语言模型
系列概览
Mistral AI 与 All Hands AI 合作推出面向开发者的 Devstral2507 系列大语言模型,包含两个新模型:
- Devstral Small1.1(开源版)
- Devstral Medium2507(企业版)
该系列专为代码推理、程序合成和基于智能代理的结构化任务执行设计,适用于大型软件代码库的实际应用场景。
模型详情
Devstral Small1.1
- 基础架构:基于 Mistral-Small-3.1 模型
- 参数量:约 240 亿
- 核心特性:
- 支持 128k 上下文窗口(可处理多文件代码输入和复杂长提示)
- 针对 XML 和函数调用等结构化输出进行专项优化
- 兼容 OpenHands 等代理框架
- 性能表现:
- SWE-Bench Verified 基准测试得分:53.6
- 在 GitHub 实际问题修复中展现出优秀表现
- 部署方式:
- 支持本地部署(需 RTX4090 或 32GB+内存的 Apple Silicon 设备)
- 提供量化版本
- 通过 Mistral API 提供服务(定价与 Mistral-Small 系列持平)
- 许可协议:Apache 2.0(支持研究与商用)
Devstral Medium2507
- 核心优势:
- SWE-Bench Verified 得分:61.6
- 长上下文推理能力超越 Gemini 2.5 Pro 和 GPT-4.1 等商业模型
- 部署限制:
- 仅通过 Mistral API 或企业协议提供
- 不开放源代码
- API 定价高于 Small 版本
应用场景对比
维度 | Devstral Small1.1 | Devstral Medium2507 |
---|---|---|
最佳适用场景 | 本地开发/实验/客户端工具集成 | 高性能生产服务 |
结构化代码编辑准确性 | 中等 | 更高 |
成本效益 | 更经济 | 更高投入 |
技术亮点
- 工作流支持:
- 程序导航
- 多步骤编辑
- 代码搜索
- 自动化集成:
- 测试生成
- 代码重构
- 错误修复
市场定位
该系列为开发者提供从实验性代理开发到商业环境部署的全套解决方案,满足不同层级的软件工程需求。