专题:kernel-generation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

官方Engineering at Meta2026/04/03 03:595840
KernelEvolve 用 LLM 自动搜索生成跨硬件内核
推理吞吐提升 60%+,训练提升 25%+

Meta 推出 KernelEvolve——基于 LLM 的自动内核生成系统,能够在数小时内为 NVIDIA、AMD、MTIA 等异构芯片生成高效算子,实现广告模型推理吞吐提升 60% 以上、训练提升 25% 以上。系统将内核优化视为搜索问题,利用工作流评估数百候选并通过 LLM 迭代改进,已在生产环境每日处理万亿级请求,标志着 AI 软件与硬件协同优化的…