专题:agent-framework

按该标签聚合的大模型资讯列表(自动分类与标签提取)。12 篇文章。

媒体Latent Space2026/04/11 07:305810
GLM-5.1编码性能跻身前三
Hermes框架功能持续扩展

2026欧洲AI工程师大会聚焦大模型性能突破、Agent框架演进及评估工具创新。GLM-5.1跻身编码模型前三,Hermes生态扩展显著,ClawBench等工具提升实测准确性。研究方向涵盖执行路径存储、合成数据优化及神经计算架构,揭示AI技术架构向更高效、可扩展方向发展的核心趋势。

媒体LangChain Blog2026/04/09 03:305820
评估数据驱动代理系统优化
复合系统工程提升泛化能力

Better-Harness通过系统化评估数据优化提升AI代理性能,强调高质量数据对泛化能力的关键作用。文章提出数据收集、分类、基线测试、自动优化和验证的完整流程,结合人工审核防止过拟合,并在多个模型中验证了方法的有效性,为代理系统工程实践提供了可落地的解决方案。

媒体爱范儿2026/04/03 09:006770
Gemma 4实现完全开源与本地部署
Apache 2.0许可证降低使用门槛

Google推出Gemma 4系列开源小模型,支持手机等设备本地运行。通过Apache 2.0许可证实现完全开源,配套专利保护机制。该模型突破数据中心依赖,满足医疗、金融等行业数据安全需求,引入多步推理与Agent模式等核心技术,推动AI技术在边缘设备的广泛应用。

媒体LangChain Blog2026/03/20 00:496560
LangSmith Fleet 为企业提供完整的 AI 代理管理平台
支持身份认证、权限分层、共享与可观测性

LangSmith Fleet 是 LangChain 推出的企业级智能代理平台,提供身份认证、细粒度权限、共享机制、任务收件箱和可观测性等功能,使团队成员无需工程师介入即可创建、管理和审计 AI 代理,提升工作效率并保障数据安全。

媒体InfoQ 中文2026/03/13 02:056850
AReaL是强化学习与智能体开发框架
提供模块化设计和实验支持

AReaL是一个强化学习与智能体开发框架,提供模块化设计和高效实验支持。其核心亮点包括环境接口、策略优化模块和评估工具,适用于实际项目中的奖励函数设置、状态空间处理和多智能体协作。该框架对开发者和研究人员具有重要参考价值。

官方Microsoft Research Blog2026/02/27 01:064850
CORPGEN 引入层次规划与内存隔离的数字员工
在多任务环境中完成率提升约 3.5 倍

CORPGEN 是一种面向企业多任务场景的数字员工框架,利用层次规划、内存隔离和经验学习提升 AI 代理的任务完成率。实验在多任务环境(MHTE)中显示,传统代理完成率降至 8.7%,而 CORPGEN 提升至约 3.5 倍。其模块化设计可随底层模型升级而继续获益,未来将关注跨日持续表现和协作优化。

媒体LangChain Blog2026/02/13 10:235680

本文深入探讨了AI代理框架的演进,从LangChain的链式执行到LangGraph的编排运行时,再到DeepAgents的强化功能。文章强调,代理框架虽需与LLM同步发展,但其在加速开发、标准化代码方面仍具核心价值。同时,无论采用何种框架,代理的可观测性都至关重要,LangSmith作为独立于开源框架的工具,为代理的追踪、调试与优化提供了关键支持。