专题:context-management

按该标签聚合的大模型资讯列表(自动分类与标签提取)。14 篇文章。

媒体The Cloudflare Blog2026/04/17 21:005700
Agent Memory 为 AI 代理提供托管持久记忆
在压缩上下文时摄取信息,检索时返回相关片段

Agent Memory 是 Cloudflare 推出的托管记忆服务,专为 AI 代理设计。它在压缩上下文时批量摄取对话信息,并通过检索在需要时提供相关记忆,避免上下文腐败。服务提供 ingest、remember、recall 等 API,支持单代理、跨代理以及团队共享记忆,数据完全归用户所有并可导出。技术上采用多模检索、向量存储和幂等摄取,适合生产环…

媒体宝玉的分享2026/04/15 08:005800
上下文窗口管理策略详解
动态回溯与错误纠正机制

本文深入解析Claude Code的会话管理技术,涵盖上下文窗口控制、历史对话回溯、数据压缩策略及子智能体应用。通过动态截断和优先级排序等方法,解决大规模上下文处理中的效率与准确性问题,为开发者提供可落地的技术方案,凸显其在复杂对话场景中的优化能力。

媒体LangChain Blog2026/04/09 23:004810
人类判断提升代理决策可靠性
LangSmith实现自动化评估闭环

本文系统阐述了AI代理开发中整合人类判断的实践方法,通过金融服务案例展示如何将隐性知识转化为代理能力。重点介绍LangSmith平台的自动化评估工具和持续优化机制,强调通过专家反馈和生产数据构建测试套件,实现代理性能的迭代提升。

媒体宝玉的分享2026/04/06 08:003600
优化上下文使用降低成本
提示缓存提升效率

本文解析Claude Code的上下文管理优化策略,重点探讨如何通过提示缓存机制有效控制token成本。文章指出,频繁开启新会话或长期维持单一会话状态均会导致资源浪费,建议开发者根据任务需求动态调整会话策略。核心亮点在于揭示上下文长度与成本的关系,并提供可操作的使用技巧,帮助开发者在保持模型性能的同时降低计算开销。

媒体InfoQ 中文2026/03/21 17:546870
Mem0 是 AI Agent 的记忆中间件
支持分布式存储与缓存优化

火山 Mem0 是一个为 AI Agent 设计的记忆中间件,支持高效存储与检索。其架构模块化,包含存储、检索、更新等核心组件,适用于对话系统和任务自动化等场景。文章解析了其设计原理与实践应用,展示了提升 AI Agent 表现的技术亮点。

官方The GitHub Blog2026/03/20 00:095980
Squad在代码库中启动AI代理团队
决策和上下文以文本文件存储在代码中

Squad是一个开源AI协作工具,允许开发者在代码库中一键初始化多代理AI团队(前端/后端/测试),通过将决策与上下文写入代码库实现去中心化协调。其Drop-box模式、显式记忆和上下文复制设计,让AI代理能继承项目历史,自动分工、独立审查,大幅降低多代理开发的基础设施门槛。

媒体ByteByteGo Newsletter2026/03/18 23:306850
Codex 通过代理循环处理任务
提示构建与上下文管理是关键

OpenAI Codex 是一个基于 AI 模型的编码代理,通过代理循环、提示构建和多界面架构实现高效协作。文章解析了其系统设计和工程实现,强调了上下文管理、缓存机制和跨平台兼容性等核心亮点,同时指出其当前的局限性。

官方Simon Willison2026/03/17 20:326850
子代理解决LLM上下文限制问题
支持并行处理和不同模型使用

子代理是AI代理工程中用于优化LLM上下文限制的工具,通过任务分解和独立上下文管理提升效率。Claude Code等产品已实现其应用,支持并行处理和专业角色定制,对开发者和研究人员具有重要参考价值。

媒体LangChain Blog2026/03/11 10:415840
代理系统由模型和框架组成
框架提供执行环境与工具支持

本文解析了AI代理系统中框架的核心作用,涵盖状态管理、工具执行、文件系统、沙盒、记忆与搜索等关键组件。框架是连接模型与实际应用的桥梁,通过提供执行环境和功能支持,使模型能够高效完成任务。未来框架工程将更注重自动化与系统优化。

社区Reddit r/LocalLLaMA2026/02/15 08:434880

TBG (O)llama Swap + 提示优化器是一款创新的中间件,旨在解决本地 LLM 因上下文过长导致服务中断的问题。它通过动态调整模型上下文大小、支持多模型并行以及智能优化提示内容(包括去除冗余、LLM 辅助总结等策略),显著提升了代理 CLI 的稳定性和持久性。该工具为开发者提供了灵活的 API 接口,允许自定义优化策略,并能通过响应头反馈优化状…

媒体LangChain Blog2026/01/29 00:115880

LangChain的Deep Agents SDK旨在解决AI代理在处理长任务时面临的上下文窗口限制和信息丢失问题。该SDK通过文件系统抽象层,实现了三种核心上下文压缩机制:卸载大型工具结果、卸载大型工具输入以及对话总结。当上下文大小超出预设阈值时,系统会将冗余或过时信息(如工具响应、旧输入记录、完整对话)保存到文件系统,仅在工作内存中保留关键摘要或文件引…

媒体LangChain Blog2026/01/22 00:303850

Deep Agents 框架提供了一种构建高效多智能体应用的新范式,核心在于子代理(Subagents)和技能(Skills)两大机制。子代理通过将复杂任务分解并隔离上下文,有效解决了大型语言模型在多步骤任务中常见的“上下文膨胀”问题,避免智能体陷入“哑区”,并支持并行处理与异构模型集成。技能机制则允许系统按需逐步向智能体披露所需功能,实现灵活的功能管理。…