专题:agent

按该标签聚合的大模型资讯列表(自动分类与标签提取)。87 篇文章。

媒体AINews2026/04/13 13:443700
多代理系统化与工程管理成关键能力
Claude Mythos 与 Gemma‑4 展示安全与 OCR 进展

本篇综述梳理了近期 AI 领域的关键技术动态,包括多代理工作流的系统化趋势、Codex 在代码管理中的实践、Claude Mythos 与 Gemma‑4 的安全与 OCR 表现、本地模型的隐私优势以及 OpenRouter 新模型 Elephant Alpha 的发布与评估,兼顾社区舆情与行业安全讨论,为技术从业者提供实用情报。

媒体量子位2026/04/09 14:597800
Claude推出企业Agent服务
开源项目Multica迅速响应

Claude推出企业级Agent服务Claude Managed Agents,整合了生产级基础设施与模块化API,支持任务定义与自动执行。开源项目Multica迅速跟进,功能相似且易于使用,已获2600个Star。两者均聚焦于提升企业AI应用效率,但Claude提供更完善的平台支持,Multica则以开源优势吸引开发者。

媒体量子位2026/04/09 09:497810
Meta 9 个月重构发布多模态模型 Muse Spark
算力提升 10 倍,推理与医学能力显著

Meta 经过 9 个月全链路重构推出原生多模态大模型 Muse Spark,凭借算力提升 10 倍、强化学习和沉思模式,在多模态感知、医学问答和推理任务上与 Gemini、GPT 5.4 持平或领先。模型已上线但闭源,API 仅限合作伙伴,计划后续开源。短板仍在编程和长时自主 Agent 任务。

媒体Spring Blog2026/04/07 08:005840
基于文件的持久化记忆存储
自动合并与清理机制

Spring AI推出AutoMemoryTools工具,通过Markdown文件实现代理跨会话持久化记忆。该工具支持自动内容管理、三种集成方式及文件系统安全访问,可解决传统会话记忆数据丢失问题。相比Claude的内存管理机制,其文件存储方案更易实现知识积累,提升代理交互连续性与记忆可靠性。

媒体量子位2026/04/05 17:067850
OpenAI转向Super App
Spud模型具备更强能力

OpenAI放弃Sora,转向Super App和新模型Spud,强调技术统一与用户实际体验。Spud具备更强的理解力和上下文处理能力,Super App整合编程、浏览器和ChatGPT,旨在实现AGI落地。公司同时推进AI研究员项目,强化算力投入,回应与Anthropic的竞争。

媒体量子位2026/04/03 16:546850
Agent落地需重构系统思维
腾讯云推出Agent专用基础设施

文章探讨了AI Agent在企业落地中的挑战,指出思维模式与系统架构的不匹配是主要障碍。腾讯云Agent Runtime通过创新设计,如Cube安全沙箱和存储加速方案,为Agent提供原生支持,助力其真正融入业务流程。

媒体量子位2026/04/02 15:088960
Qwen3.6-Plus性能对标Claude
支持Vibe Coding与多模态生成

阿里发布Qwen3.6-Plus编程大模型,性能接近Claude,具备Vibe Coding、多模态理解及智能体能力。通过多个实测案例展示其在网页开发、3D场景生成和代码重构方面的强大表现,已上线阿里云平台,为开发者提供高效编程工具。

媒体量子位2026/03/31 12:327980
Hyperagents实现自我进化
DGM性能提升显著

Meta提出Hyperagents,结合哥德尔机与达尔文算法,实现智能体自我进化与优化。实验显示其在编程任务中性能显著提升,具有跨领域迁移能力,但受限于任务的自指性。该成果对AI研究和开发具有重要参考价值。

媒体InfoQ 中文2026/03/30 19:566840
基于记忆的 DevOps Agent 架构
从经验中学习并优化运维流程

本文介绍了一种基于记忆的 DevOps Agent 架构,通过沉淀历史经验实现运维流程的自动化进化。其核心亮点在于记忆模块的设计与技能训练机制,适用于复杂系统的运维优化,具有较高的工程参考价值。

媒体量子位2026/03/30 11:497810
AI Agent实战应用案例
配置与评测方法解析

本文围绕OpenClaw(AI Agent)的实战应用与配置方法展开,涵盖自动化流程、法律AI、情感陪伴、记忆管理等多个场景,展示了AI Agent在不同领域的潜力与实现方式,强调了技术配置与评测对提升其效能的关键作用。

媒体量子位2026/03/27 22:286850
中国大模型团队优势在于算力受限下的最优解能力
token使用量暴增推动基础设施升级

中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。

媒体InfoQ 中文2026/03/27 18:525830
评估方法从调优转向数据驱动
构建自动化测试与反馈机制

本文介绍大规模Agent系统的评估工程实践,强调从盲目调优转向数据驱动方法。通过构建数据收集、指标设计和自动化测试框架,提升Agent性能与决策能力。核心亮点在于实际案例分析和对评估挑战的深入探讨。

媒体InfoQ 中文2026/03/26 18:006850
Stripe 使用 LLM 自动生成 PR
Minions 提高代码提交效率

Stripe 部署了基于 LLM 的自主智能体 Minions,用于自动化生成拉取请求。该工具显著提升了代码提交效率,展示了 AI 在工程实践中的落地应用。其核心亮点在于自动化分析与生成能力,以及与现有开发流程的无缝集成。