专题:debugging

按该标签聚合的大模型资讯列表(自动分类与标签提取)。9 篇文章。

媒体LangChain Blog2026/03/18 23:385660
Polly 已在 LangSmith 所有页面可用
支持对话持久化与实际操作

Polly 现已在 LangSmith 全平台上线,提供跨页面 AI 调试助手。它能够记住对话上下文、执行实际操作(如更新提示、生成评估代码),帮助开发者快速定位长链执行记录中的故障并基于数据做出实验决策。使用快捷键即可在任意页面召唤,配置仅需添加模型 API 密钥。

官方Microsoft Research Blog2026/03/13 00:387970
AgentRx实现AI代理自动化故障诊断
包含115条手动标注失败轨迹数据集

微软发布开源AI代理调试框架AgentRx,通过自动化诊断定位关键故障步骤。该框架包含115条失败轨迹数据集和九类故障分类体系,显著提升故障定位和根本原因识别能力,助力构建更透明、可靠的AI代理系统。

社区Reddit r/LocalLLaMA2026/02/10 16:2770

作者为 OpenCode 开发了一款实时智能体执行可视化工具。该工具能实时渲染智能体的执行图,清晰展示任务并行分派、工具调用延迟、token 使用量及成本,以及智能体如何实时捕获错误并自我纠正。它将传统的终端文本输出转变为动态的决策树视图,让用户能直观地“看到”智能体的思考过程,极大地简化了调试工作,并提升了整体交互体验。目前该工具尚处于早期阶段,但已展现…