专题:multimodal-interaction

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

媒体爱范儿2026/04/07 15:445540
AI 眼镜提供沉浸式多模态交互
长期记忆让其成为个人助理

访谈 XREAL 创始人徐驰,解析在手机、电脑已普及的背景下,AI 眼镜为何仍具价值。徐驰认为 AI 眼镜可提供沉浸式、多模态交互和长期记忆,成为个人助理。文章阐述技术优势、产品定位及行业趋势,强调原创差异化和生态合作是实现突破的关键。

官方Microsoft Research Blog2026/02/05 13:077960
PazaBench评估低资源非洲语言ASR模型
Paza模型基于Phi-4、mms-1b-all和Whisper

微软发布PazaBench,首个针对低资源非洲语言的ASR基准,涵盖39种语言和52个模型。Paza系列模型基于Phi-4、mms-1b-all和Whisper,针对肯尼亚六种语言进行微调,提升转录质量与跨语言泛化能力。通过实地测试和社区反馈,推动AI在未充分代表语言中的应用。