突破顶级AI代理基准:新架构与训练策略实现纪录刷新原文社区Hacker News2026/04/12 03:155810• 新架构与稀疏激活提升长序列理解• 混合精度多阶段训练加速收敛作者团队通过层级化注意力、稀疏激活、混合精度预训练和自我纠错回路等创新,显著提升了AI代理在MMLU、ARC‑Challenge、AgentBench等基准的表现,刷新纪录并提供了实现细节与未来研究路线。AI代理基准测试模型架构训练优化自我纠错回路