Meta 推出 KernelEvolve——基于 LLM 的自动内核生成系统,能够在数小时内为 NVIDIA、AMD、MTIA 等异构芯片生成高效算子,实现广告模型推理吞吐提升 60% 以上、训练提升 25% 以上。系统将内核优化视为搜索问题,利用工作流评估数百候选并通过 LLM 迭代改进,已在生产环境每日处理万亿级请求,标志着 AI 软件与硬件协同优化的…
专题:ai-optimization
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 8 篇文章。
官方Engineering at Meta2026/04/03 03:595840
• KernelEvolve 用 LLM 自动搜索生成跨硬件内核
• 推理吞吐提升 60%+,训练提升 25%+
媒体InfoQ 中文2026/04/03 01:405860
• AI赋能云原生数据库优化
• 智能运维预测技术应用
TDSQL-C云原生数据库通过AI技术实现智能优化与自动化运维,涵盖查询优化、故障预测、资源调度等场景。文章解析了机器学习模型在数据库领域的具体应用,展示了金融、电商等行业的落地案例,突出AI与云原生架构的协同效应,为数据库智能化转型提供实践参考。
媒体InfoQ 中文2026/03/27 22:144840
• 发现Qwen推理链的致命问题
• 分析误区成因与影响
文章揭示了阿里Qwen项目中AI推理链存在的致命误区,分析其成因并提出改进方案,对模型开发和优化具有重要参考价值。
媒体SuperTechFans2026/03/23 08:346830
• Flash-MoE实现消费级硬件的大规模模型推理
• tinygrad框架强调极简设计与性能优化
本文汇总了2026年3月23日Hacker News上多篇AI技术文章,涵盖模型推理优化、开源框架设计、版本控制系统及离线AI知识库等主题,为开发者和研究者提供了丰富的技术参考。
媒体AWS Machine Learning Blog2026/03/18 23:317930
• AI 驱动 A/B 测试优化
• 实时用户上下文分析
本文展示如何构建一个基于 Amazon Bedrock 的 AI 驱动 A/B 测试引擎,通过实时用户上下文和行为分析优化变体分配,提升实验效率和个性化体验。系统结合 MCP 工具和动态决策逻辑,实现快速收敛和精准推荐。
社区Hacker News2026/03/12 19:494790
• LLM生成代码通过测试但未被合并
• 代码质量与上下文理解不足
文章探讨了LLM生成的代码提交在实际开发中未被大量合并的现象,分析了代码质量、上下文理解及团队规范等因素的影响,揭示了LLM在软件工程应用中的现实挑战。
官方Minimaxir2026/02/28 02:006840
本文分享了作者使用AI代理进行编程的实践,涵盖代码生成、优化及复杂项目开发。通过Python和Rust的实验,AI代理展示了其在提升效率和性能方面的潜力,对开发者具有实际参考价值。
官方OpenAI YouTube2026/02/19 05:254730
提示缓存是一种通过预存和优化常见提示来提升AI系统效率的技术。它能减少计算资源消耗,加快响应速度,适用于NLP、ML和智能助手等场景。文章解析了其原理、实现方法及实际应用中的优劣。