媒体量子位2026/04/06 23:307930
• 解决生成式与判别式范式冲突
• 四阶段闭环校准框架
ReCALL框架通过‘诊断-生成-校准’闭环解决生成式与判别式范式冲突,显著提升多模态图像检索性能,已在CVPR 2026录用,刷新CIRR和FashionIQ数据集的SOTA表现。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 5 篇文章。
ReCALL框架通过‘诊断-生成-校准’闭环解决生成式与判别式范式冲突,显著提升多模态图像检索性能,已在CVPR 2026录用,刷新CIRR和FashionIQ数据集的SOTA表现。
Qwen3.5-Omni是阿里推出的全模态AI模型,具备215项SOTA成绩,支持音视频理解、实时编程和语义打断等创新功能。其Thinker-Talker架构和Hybrid-Attention MoE技术提升了处理效率和交互自然度,适用于视频会议、论文解读和网页设计等场景。
最新SOTA嵌入模型专为代理工作流设计,公开预览。通过优化信息表示,提升AI系统处理复杂任务的效率与准确性,适用于多步骤任务的语义理解和执行。
美团发布 LongCat-Flash-Thinking-2601,该模型在 Agentic Search、Agentic Tool Use 和 TIR 等关键指标上达到开源模型 SOTA 水平,具备强大的工具调用与智能体协作能力,适用于复杂任务处理与 AI 研究。
美团发布开源视频生成模型 LongCat-Video-Avatar,实现 SOTA 拟真效果。该模型支持文本和图像输入,生成高质量视频,适用于多种应用场景。开源特性鼓励技术共享与创新。