媒体爱范儿2026/04/08 17:165750
• GLM‑5.1 SWE‑bench Pro 58.4% 超 Claude Opus 4.6
• 8 h 完成 Linux 桌面全自动构建
国产模型 GLM‑5.1 在 SWE‑bench Pro 中取得 58.4% 的得分,首次超越 Claude Opus 4.6 与 GPT‑5.4。它展示了 8 小时内完整构建 Linux 桌面的持续工作能力,采用增量调优实现策略自适应,并在 KernelBench Level 3 中实现 3.6 倍加速。全程使用华为昇腾 910B 芯片训练,成本仅为对手…