专题:multimodal-agent

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/04/05 12:527980
StreamingClaw实现流式视频与具身智能统一
支持实时感知、决策与执行闭环

理想发布StreamingClaw框架,实现流式视频理解与具身智能的统一。该框架支持实时多模态交互,通过增量计算、KV-Cache优化和层级记忆演化,提升感知、决策与执行的闭环效率。适用于驾驶监控、主动交互等场景,未来将扩展为全模态代理系统。