专题：self-corrective-loop

突破顶级AI代理基准：新架构与训练策略实现纪录刷新

社区Hacker News2026/04/12 03:155810

• 新架构与稀疏激活提升长序列理解

• 混合精度多阶段训练加速收敛

作者团队通过层级化注意力、稀疏激活、混合精度预训练和自我纠错回路等创新，显著提升了AI代理在MMLU、ARC‑Challenge、AgentBench等基准的表现，刷新纪录并提供了实现细节与未来研究路线。