devstral

显示行号 | 选择喜欢的代码风格

Devstral：编码代理的最佳开源模型

tools 24b

Devstral AI Models

Devstral 是一个用于软件工程任务的代理 LLM 模型，由 Mistral AI 和 All Hands AI 合作开发。Devstral 擅长使用工具探索代码库、编辑多个文件以及为软件工程代理提供支持。该模型在 SWE-bench 上取得了卓越的性能，使其成为排名第一的开源模型。

Devstral 基于 Mistral Small 3.1 进行了微调，因此拥有高达 128k 个 token 的长上下文窗口。作为一个编码代理，Devstral 仅支持文本，并且在基于 Mistral-Small-3.1 进行微调之前，其视觉编码器已被移除。

devstral 主要特点包括：

代理编码：Devstral 旨在出色地完成代理编码任务，使其成为软件工程代理的理想之选。
轻量级：Devstral 仅包含 240 亿个参数，体积小巧，足以在单块 RTX 4090 显卡或配备 32GB RAM 的 Mac 上运行，使其成为本地部署和设备端使用的理想模型。
Apache 2.0 许可证：开放许可证，允许商业和非商业用途的使用和修改。
上下文窗口：128k 上下文窗口。

Devstral 在 SWE-Bench Verified 上取得了 46.8% 的得分，比之前的开源最先进技术高出 6%。

在相同的测试框架（OpenHands，由 All Hands AI 提供）下进行评估时，Devstral 的表现远超 Deepseek-V3-0324 和 Qwen3 232B-A22B 等规模更大的模型。

Devstral 的性能显著优于许多闭源替代方案。例如，Devstral 的表现比最近的 GPT-4.1-mini 高出 20% 以上。