devstral

| 选择喜欢的代码风格  

devstral 参数量


tools 24b
 

devstral 模型介绍



Devstral AI Models

Devstral 是一个用于软件工程任务的代理 LLM 模型,由 Mistral AI 和 All Hands AI 合作开发。Devstral 擅长使用工具探索代码库、编辑多个文件以及为软件工程代理提供支持。该模型在 SWE-bench 上取得了卓越的性能,使其成为排名第一的开源模型。

Devstral 基于 Mistral Small 3.1 进行了微调,因此拥有高达 128k 个 token 的长上下文窗口。作为一个编码代理,Devstral 仅支持文本,并且在基于 Mistral-Small-3.1 进行微调之前,其视觉编码器已被移除。

devstral 主要特点包括:

  • 代理编码:Devstral 旨在出色地完成代理编码任务,使其成为软件工程代理的理想之选。
  • 轻量级:Devstral 仅包含 240 亿个参数,体积小巧,足以在单块 RTX 4090 显卡或配备 32GB RAM 的 Mac 上运行,使其成为本地部署和设备端使用的理想模型。
  • Apache 2.0 许可证:开放许可证,允许商业和非商业用途的使用和修改。
  • 上下文窗口:128k 上下文窗口。

 

devstral SWE-Bench:


Devstral 在 SWE-Bench Verified 上取得了 46.8% 的得分,比之前的开源最先进技术高出 6%

Model Scaffold SWE-Bench Verified (%)
Devstral OpenHands Scaffold 46.8
GPT-4.1-mini OpenAI Scaffold 23.6
Claude 3.5 Haiku Anthropic Scaffold 40.6
SWE-smith-LM 32B SWE-agent Scaffold 40.2

在相同的测试框架(OpenHands,由 All Hands AI 提供)下进行评估时,Devstral 的表现远超 Deepseek-V3-0324 和 Qwen3 232B-A22B 等规模更大的模型。

Devstral 的性能显著优于许多闭源替代方案。例如,Devstral 的表现比最近的 GPT-4.1-mini 高出 20% 以上。

 

AI 扩展阅读:




发表评论