本篇综述梳理了近期 AI 领域的关键技术动态,包括多代理工作流的系统化趋势、Codex 在代码管理中的实践、Claude Mythos 与 Gemma‑4 的安全与 OCR 表现、本地模型的隐私优势以及 OpenRouter 新模型 Elephant Alpha 的发布与评估,兼顾社区舆情与行业安全讨论,为技术从业者提供实用情报。
专题:agent
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 87 篇文章。
Claude推出企业级Agent服务Claude Managed Agents,整合了生产级基础设施与模块化API,支持任务定义与自动执行。开源项目Multica迅速跟进,功能相似且易于使用,已获2600个Star。两者均聚焦于提升企业AI应用效率,但Claude提供更完善的平台支持,Multica则以开源优势吸引开发者。
Meta 经过 9 个月全链路重构推出原生多模态大模型 Muse Spark,凭借算力提升 10 倍、强化学习和沉思模式,在多模态感知、医学问答和推理任务上与 Gemini、GPT 5.4 持平或领先。模型已上线但闭源,API 仅限合作伙伴,计划后续开源。短板仍在编程和长时自主 Agent 任务。
智谱GLM-5.1在长程任务中展现强大工程能力,超越Claude Opus 4.6,实现CUDA优化、系统构建和数据库性能提升,标志着开源模型在实际应用中的重要突破。
Spring AI推出AutoMemoryTools工具,通过Markdown文件实现代理跨会话持久化记忆。该工具支持自动内容管理、三种集成方式及文件系统安全访问,可解决传统会话记忆数据丢失问题。相比Claude的内存管理机制,其文件存储方案更易实现知识积累,提升代理交互连续性与记忆可靠性。
OpenAI放弃Sora,转向Super App和新模型Spud,强调技术统一与用户实际体验。Spud具备更强的理解力和上下文处理能力,Super App整合编程、浏览器和ChatGPT,旨在实现AGI落地。公司同时推进AI研究员项目,强化算力投入,回应与Anthropic的竞争。
联想推出天禧AI,通过系统级智能体解决个人AI部署与使用难题,具备自主执行、数据安全和跨设备个性化能力,目标成为用户‘专属超能搭档’,并计划在5月发布4.0版本。
文章探讨了AI Agent在企业落地中的挑战,指出思维模式与系统架构的不匹配是主要障碍。腾讯云Agent Runtime通过创新设计,如Cube安全沙箱和存储加速方案,为Agent提供原生支持,助力其真正融入业务流程。
阿里发布Qwen3.6-Plus编程大模型,性能接近Claude,具备Vibe Coding、多模态理解及智能体能力。通过多个实测案例展示其在网页开发、3D场景生成和代码重构方面的强大表现,已上线阿里云平台,为开发者提供高效编程工具。
Meta提出Hyperagents,结合哥德尔机与达尔文算法,实现智能体自我进化与优化。实验显示其在编程任务中性能显著提升,具有跨领域迁移能力,但受限于任务的自指性。该成果对AI研究和开发具有重要参考价值。
OpenAI扩展Responses API,增强自主智能体的构建能力。支持多步骤任务处理和工具调用,提升AI在实际场景中的应用价值。该更新推动智能体技术标准化,为AI生态发展提供基础设施。
本文介绍了一种基于记忆的 DevOps Agent 架构,通过沉淀历史经验实现运维流程的自动化进化。其核心亮点在于记忆模块的设计与技能训练机制,适用于复杂系统的运维优化,具有较高的工程参考价值。
本文围绕OpenClaw(AI Agent)的实战应用与配置方法展开,涵盖自动化流程、法律AI、情感陪伴、记忆管理等多个场景,展示了AI Agent在不同领域的潜力与实现方式,强调了技术配置与评测对提升其效能的关键作用。
本文聚焦AI Agent在生产环境中的可观测性与评估飞轮构建,提出了一套闭环优化方法,强调性能监控、日志分析和用户反馈的重要性,为实际部署提供了可参考的实践方案。
华为盘古大模型负责人王云鹤离职创业,投身Agent领域。他曾在华为诺亚方舟实验室主导多项AI技术研究,包括超分辨率算法和GhostNet,技术成果应用于FAST等重大项目,具有行业影响力。
2026年3月AI动态涵盖H100价格回升、模型优化技术进展、代理产品化、开源框架应用及多模态系统研究,展示了AI基础设施和应用的持续演进。
Uber应用智能体系统实现设计文档自动化,提升效率与一致性。系统结合NLP和ML技术,解析用户需求并生成文档。核心亮点在于自动化流程与实际落地效果。
中国大模型专家在圆桌讨论中聚焦agent技术演进、token使用量激增与算力挑战,强调开源生态、模型结构创新和基础设施优化的重要性,认为未来AI将更偏向agent-native。
本文介绍大规模Agent系统的评估工程实践,强调从盲目调优转向数据驱动方法。通过构建数据收集、指标设计和自动化测试框架,提升Agent性能与决策能力。核心亮点在于实际案例分析和对评估挑战的深入探讨。
Stripe 部署了基于 LLM 的自主智能体 Minions,用于自动化生成拉取请求。该工具显著提升了代码提交效率,展示了 AI 在工程实践中的落地应用。其核心亮点在于自动化分析与生成能力,以及与现有开发流程的无缝集成。