专题:self-corrective-loop

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Hacker News2026/04/12 03:155810
新架构与稀疏激活提升长序列理解
混合精度多阶段训练加速收敛

作者团队通过层级化注意力、稀疏激活、混合精度预训练和自我纠错回路等创新,显著提升了AI代理在MMLU、ARC‑Challenge、AgentBench等基准的表现,刷新纪录并提供了实现细节与未来研究路线。