专题:auto-tuning

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

官方Engineering at Meta2026/04/03 03:595840
KernelEvolve 用 LLM 自动搜索生成跨硬件内核
推理吞吐提升 60%+,训练提升 25%+

Meta 推出 KernelEvolve——基于 LLM 的自动内核生成系统,能够在数小时内为 NVIDIA、AMD、MTIA 等异构芯片生成高效算子,实现广告模型推理吞吐提升 60% 以上、训练提升 25% 以上。系统将内核优化视为搜索问题,利用工作流评估数百候选并通过 LLM 迭代改进,已在生产环境每日处理万亿级请求,标志着 AI 软件与硬件协同优化的…

社区Reddit r/LocalLLaMA2026/02/22 18:112670

作者在业余时间构建了一个高度模块化、可自动调优的 RAG 系统,涵盖数据分块、检索、重排和生成四大环节,并实现了向量库可插拔、贝叶斯网格搜索调参等特性。文中阐述了系统设计动机、已实现功能、未来规划以及当前缺乏数据工程和 DevOps 支持的瓶颈,并就开源时机、合作方式和功能优先级向社区求助。