专题:human-in-the-loop

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

媒体LangChain Blog2026/04/09 23:004810
人类判断提升代理决策可靠性
LangSmith实现自动化评估闭环

本文系统阐述了AI代理开发中整合人类判断的实践方法,通过金融服务案例展示如何将隐性知识转化为代理能力。重点介绍LangSmith平台的自动化评估工具和持续优化机制,强调通过专家反馈和生产数据构建测试套件,实现代理性能的迭代提升。

媒体AWS Machine Learning Blog2026/04/09 03:485830
四种HITL实现方法
AWS服务与MCP协议结合

本文提出四种医疗AI代理的人机协同方案,结合AWS服务与MCP协议,通过代理钩子、工具嵌入、异步审批和提示机制,确保关键决策合规性与患者安全。包含架构设计与代码示例,适用于药物研发、临床数据管理等场景,实现从试点到全企业部署的灵活应用。

媒体InfoQ2026/03/16 19:004870
AI代理评估需结合基准测试、自动化流程与人工审核
多步骤任务需测试工具调用与状态保持能力

本文提出评估AI代理的三位一体方法:结合基准测试、自动化流程与人工审核,解决多步骤任务、工具调用和长对话中的可靠性难题。核心亮点在于引入工程化评估指标(如工具滥用率)并警示LLM自评估的偏差风险,为开发者构建可信赖的AI代理系统提供可落地的评估框架。

媒体Lobsters AI2026/03/14 13:045760
AI代理招募人类收集现实世界数据
人类作为传感器补足AI感知盲区

AI代理正通过众包方式招募人类志愿者,收集现实世界的多模态感知数据(如图像、声音、环境事件),以弥补AI在物理世界感知上的短板。该模式构建了‘人类-AI’协同的实时数据闭环,推动AI从虚拟学习走向具身智能。核心亮点在于将人类转化为分布式传感器网络,为机器人、城市AI系统提供高保真环境反馈,是具身AI落地的关键实验路径。

媒体量子位2026/02/15 13:527860

极佳视界发布GigaBrain-0.5M* VLA大模型,显著提升具身智能在复杂长时程任务中的表现。该模型采用基于世界模型的强化学习范式,通过预测未来状态与价值,并结合人在回路的持续学习机制,实现了数小时零失误、近100%的任务成功率,如叠衣服、冲咖啡等。其训练数据包含10,931小时,其中61%为自研GigaWorld合成数据,有效增强了模型泛化能力与鲁…