专题:hardware-acceleration

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

官方Engineering at Meta2026/04/03 03:595840
KernelEvolve 用 LLM 自动搜索生成跨硬件内核
推理吞吐提升 60%+,训练提升 25%+

Meta 推出 KernelEvolve——基于 LLM 的自动内核生成系统,能够在数小时内为 NVIDIA、AMD、MTIA 等异构芯片生成高效算子,实现广告模型推理吞吐提升 60% 以上、训练提升 25% 以上。系统将内核优化视为搜索问题,利用工作流评估数百候选并通过 LLM 迭代改进,已在生产环境每日处理万亿级请求,标志着 AI 软件与硬件协同优化的…

官方Engineering at Meta2026/03/03 04:004830
Meta放弃内部分支,全面采用上游FFmpeg
实现多通道转码与实时质量评估

Meta全面采用上游FFmpeg,实现多通道转码和实时质量评估,提升视频处理效率与可靠性。文章介绍了其内部优化与开源协作的结合,以及如何通过硬件加速和API集成支持多样化媒体处理需求。