专题:agent-system

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

官方Engineering at Meta2026/04/03 03:595840
KernelEvolve 用 LLM 自动搜索生成跨硬件内核
推理吞吐提升 60%+,训练提升 25%+

Meta 推出 KernelEvolve——基于 LLM 的自动内核生成系统,能够在数小时内为 NVIDIA、AMD、MTIA 等异构芯片生成高效算子,实现广告模型推理吞吐提升 60% 以上、训练提升 25% 以上。系统将内核优化视为搜索问题,利用工作流评估数百候选并通过 LLM 迭代改进,已在生产环境每日处理万亿级请求,标志着 AI 软件与硬件协同优化的…

媒体Latent Space2026/04/01 14:245850
Claude代码泄露引关注
技术架构细节公开

Claude代码源代码泄露事件曝光了AI/LLM架构、训练方法、RAG技术、Agent系统等核心技术细节,包含模型结构、缓存机制、内存设计、子代理系统及权限控制等实现方案。该事件为开发者和研究人员提供了深入理解大型语言模型底层技术的参考,尽管OpenAI融资进展与ChatGPT用户增长数据被提及,但核心价值仍聚焦于代码层面的技术分析。

媒体AINews2026/04/01 13:445850
Arcee Trinity‑Large‑Thinking 4000 B 参数,PinchBench 第二
Z.ai GLM‑5V‑Turbo 原生多模态,使用 CogViT 编码器

本文梳理了近期 AI 领域的多项技术进展:Arcee 发布 4000 亿参数的 Trinity‑Large‑Thinking 模型并在 PinchBench 中名列前茅;Z.ai 推出原生多模态的 GLM‑5V‑Turbo,基于 CogViT 编码器;TII 的 Falcon Perception 采用 early‑fusion Transformer,实…