glm-5.1 AI Models
GLM-5.1 是 智谱 z.ai 面向智能体工程的下一代旗舰模型,其代码能力较前代模型显著增强。它在 SWE-Bench Pro 上达到了最先进的性能表现,并在 NL2Repo(仓库代码生成)和 Terminal-Bench 2.0(真实终端任务)上以大幅优势领先 GLM-5。
然而,最有意义的飞跃并不在于首轮表现。此前的模型——包括 GLM-5——往往过早耗尽自身的应对策略:它们会先运用熟悉的技术取得初步成效,然后就陷入瓶颈。即便给予更多时间,也无济于事。
相比之下,GLM-5.1 的设计初衷是在更长时间跨度的智能体任务中保持高效。我们发现,该模型在处理模糊问题时具有更优的判断力,并在更长的任务过程中保持高效产出。它能拆解复杂问题、运行实验、读取结果,并精确识别瓶颈。通过反复回溯推理过程、在迭代中不断修正策略,GLM-5.1 能在数百轮交互和成千上万次工具调用中持续优化。运行时间越长,最终效果越好。