智谱GLM-5.1突破长程任务能力，开源模型性能超越Claude Opus 4.6

量子位2026/04/08 14:29机翻/自动摘要/自动分类

内容评分

技术含量

9/10

营销水分

8/10

摘要

智谱GLM-5.1在长程任务中展现强大工程能力，超越Claude Opus 4.6，实现CUDA优化、系统构建和数据库性能提升，标志着开源模型在实际应用中的重要突破。

正文

智谱GLM-5.1在长程任务（Long Horizon Task）能力上取得重大突破，展示了其在CUDA Kernel优化、MacOS桌面环境构建、代码重构和向量数据库性能提升等工程任务中的卓越表现。该模型能够在14小时内自主完成复杂任务，包括发现瓶颈、切换技术栈、重写代码、测试与优化，最终交付完整项目。在SWE-bench Pro基准测试中，GLM-5.1刷新全球最佳成绩，超越Claude Opus 4.6和GPT-5.4等头部模型。此外，它还能在8小时内构建完整的Linux系统，执行超过1200步，实现6.9倍性能提升。这些能力标志着开源模型在工程实践中的重要进展，也引发行业对AI自主执行能力的重新评估。

智谱GLM-5.1突破长程任务能力，开源模型性能超越Claude Opus 4.6

内容评分

摘要

正文

标签