专题：huawei-ascend

国产大模型 GLM‑5.1 以 SWE‑bench Pro 58.4% 超越 Claude Opus 4.6 与 GPT‑5.4

媒体爱范儿2026/04/08 17:165750

• GLM‑5.1 SWE‑bench Pro 58.4% 超 Claude Opus 4.6

• 8 h 完成 Linux 桌面全自动构建

国产模型 GLM‑5.1 在 SWE‑bench Pro 中取得 58.4% 的得分，首次超越 Claude Opus 4.6 与 GPT‑5.4。它展示了 8 小时内完整构建 Linux 桌面的持续工作能力，采用增量调优实现策略自适应，并在 KernelBench Level 3 中实现 3.6 倍加速。全程使用华为昇腾 910B 芯片训练，成本仅为对手…

大语言模型 SWE-bench基准测试增量调优华为昇腾芯片开源框架