Polly正式全平台上线：LangSmith 中的 AI 调试助手全方位可用

调试 AI 代理与普通开发工作不同：一次调试可能涉及数百步代码执行、数千行提示信息，问题的根源往往埋藏在深层上下文中。为此，LangSmith 开发了 Polly——一款能够读取最长 300 步执行记录、精准定位故障并给出具体说明的 AI 助手。Polly 现已向所有 LangSmith 用户开放，并在平台的每个页面右下角提供服务。

主要变化

全页面覆盖：Polly 现在出现在追踪项目、运行结果、实验、数据集、注释队列、评估工具以及实验环境等所有页面。
对话持久化：切换视图后，Polly 能记住之前的对话上下文，避免重复操作。
可执行操作：除了回答问题，Polly 还能更新提示、从失败运行创建数据集、筛选项目、编写评估代码、比较实验结果等，充当团队中的“工程师”。

典型应用场景

跨页面问题追踪：在不同实验、数据集或提示之间切换时，Polly 保持完整上下文，帮助快速定位根因。
评估代码加速：在评估工具面板中，Polly 可生成、解释并迭代优化评估代码，减轻框架搭建负担。
基于数据的决策：运行评估后，直接询问 Polly 哪个实验表现最佳，或比较两次实验的结果，以指导提示、模型或架构的调整。

背景与快速上手

在 Polly 开发前，LangSmith 已为多团队提供生产环境代理，但普遍面临执行记录过长、提示信息复杂、对话难以梳理的问题。Polly 旨在处理这些低效环节，提升调试效率。

使用方法：

已有 LangSmith 用户：页面右下角点击 Polly，或使用快捷键 Cmd+I（Mac）/Ctrl+I（Windows/Linux）打开。
首次使用：在工作区设置页面添加模型提供商的 API 密钥，约 2 分钟即可完成配置。
新用户：先按照 LangSmith 快速入门文档开启追踪功能，数据流入后即可让 Polly 帮助分析系统运行情况并提供建议。

Polly正式全平台上线：LangSmith 中的 AI 调试助手全方位可用

内容评分

摘要

正文

主要变化

典型应用场景

背景与快速上手

标签