首页/详情

智谱GLM-5.1突破长程任务能力,开源模型性能超越Claude Opus 4.6

量子位2026/04/08 14:29机翻/自动摘要/自动分类
3 阅读

内容评分

技术含量
9/10
营销水分
8/10

摘要

智谱GLM-5.1在长程任务中展现强大工程能力,超越Claude Opus 4.6,实现CUDA优化、系统构建和数据库性能提升,标志着开源模型在实际应用中的重要突破。

正文

智谱GLM-5.1在长程任务(Long Horizon Task)能力上取得重大突破,展示了其在CUDA Kernel优化、MacOS桌面环境构建、代码重构和向量数据库性能提升等工程任务中的卓越表现。该模型能够在14小时内自主完成复杂任务,包括发现瓶颈、切换技术栈、重写代码、测试与优化,最终交付完整项目。在SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超越Claude Opus 4.6和GPT-5.4等头部模型。此外,它还能在8小时内构建完整的Linux系统,执行超过1200步,实现6.9倍性能提升。这些能力标志着开源模型在工程实践中的重要进展,也引发行业对AI自主执行能力的重新评估。

标签