专题:miles

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

社区Hacker News2026/04/26 07:444700
引入 SGLang 与 Miles 加速 DeepSeek‑V4 推理
实现基于两者的强化学习算法端到端验证

DeepSeek‑V4 在项目启动第 0 天通过 SGLang 框架和 Miles 库实现了显著的推理加速,并完成了强化学习算法的端到端验证。两者协同将推理时延降低约 30%,吞吐量提升 1.8 倍,同时在基准 RL 任务上提升收敛速度约 20%,确保模型的稳定性,为后续规模化训练和复杂场景应用奠定基础。