Polly正式全平台上线:LangSmith 中的 AI 调试助手全方位可用
LangChain Blog2026/03/18 23:38机翻/自动摘要/自动分类
6 阅读
内容评分
技术含量
6/10
营销水分
5/10
摘要
Polly 现已在 LangSmith 全平台上线,提供跨页面 AI 调试助手。它能够记住对话上下文、执行实际操作(如更新提示、生成评估代码),帮助开发者快速定位长链执行记录中的故障并基于数据做出实验决策。使用快捷键即可在任意页面召唤,配置仅需添加模型 API 密钥。
正文
调试 AI 代理与普通开发工作不同:一次调试可能涉及数百步代码执行、数千行提示信息,问题的根源往往埋藏在深层上下文中。为此,LangSmith 开发了 Polly——一款能够读取最长 300 步执行记录、精准定位故障并给出具体说明的 AI 助手。Polly 现已向所有 LangSmith 用户开放,并在平台的每个页面右下角提供服务。
主要变化
- 全页面覆盖:Polly 现在出现在追踪项目、运行结果、实验、数据集、注释队列、评估工具以及实验环境等所有页面。
- 对话持久化:切换视图后,Polly 能记住之前的对话上下文,避免重复操作。
- 可执行操作:除了回答问题,Polly 还能更新提示、从失败运行创建数据集、筛选项目、编写评估代码、比较实验结果等,充当团队中的“工程师”。
典型应用场景
- 跨页面问题追踪:在不同实验、数据集或提示之间切换时,Polly 保持完整上下文,帮助快速定位根因。
- 评估代码加速:在评估工具面板中,Polly 可生成、解释并迭代优化评估代码,减轻框架搭建负担。
- 基于数据的决策:运行评估后,直接询问 Polly 哪个实验表现最佳,或比较两次实验的结果,以指导提示、模型或架构的调整。
背景与快速上手
在 Polly 开发前,LangSmith 已为多团队提供生产环境代理,但普遍面临执行记录过长、提示信息复杂、对话难以梳理的问题。Polly 旨在处理这些低效环节,提升调试效率。
使用方法:
- 已有 LangSmith 用户:页面右下角点击 Polly,或使用快捷键 Cmd+I(Mac)/Ctrl+I(Windows/Linux)打开。
- 首次使用:在工作区设置页面添加模型提供商的 API 密钥,约 2 分钟即可完成配置。
- 新用户:先按照 LangSmith 快速入门文档开启追踪功能,数据流入后即可让 Polly 帮助分析系统运行情况并提供建议。