Meta发布原生多模态大模型 Muse Spark:9 个月重构全栈,算力提升 10 倍,首度实现医学推理与沉思模式
量子位2026/04/09 09:49机翻/自动摘要/自动分类
1 阅读
内容评分
技术含量
8/10
营销水分
7/10
摘要
Meta 经过 9 个月全链路重构推出原生多模态大模型 Muse Spark,凭借算力提升 10 倍、强化学习和沉思模式,在多模态感知、医学问答和推理任务上与 Gemini、GPT 5.4 持平或领先。模型已上线但闭源,API 仅限合作伙伴,计划后续开源。短板仍在编程和长时自主 Agent 任务。
正文
Meta 超级智能实验室在历时 9 个月的全链路重构后,推出首款原生多模态 Muse Spark。该模型由余家辉、宋飏、Jason Wei 等顶尖科研团队研发,定位为推理与多模态感知模型,已在 Meta 官网和 APP 上上线,API 仅向部分合作伙伴开放,计划后续开源。
关键性能
- 多模态理解:在多模态感知、图表阅读、图片转代码等任务上,得分与 Gemini 3.1 Pro、GPT 5.4 持平或居首。
- 推理与工具调用:引入“沉思模式”(Contemplating),通过多协作实现更高质量的推理,能够在高难度评测(如 AIME)中与 Gemini Deep Think、GPT Pro 正面竞争。
- 医学能力:与 1000+ 医生合作,在 HealthBench Hard 上取得 42.8 的最高分,并在 MedXpertQA MM 中名列前茅。
- 短板:在编程和长时自主 任务上仍落后于 Gemini、Claude 等竞争模型。
训练技术创新
- 算力效率:预训练阶段使用新架构,使得在相同性能下所需算力比 Llama 4 低 10.3 倍。
- 强化学习(RL):采用稳健的 RL 流程,训练步数与成功率呈对数线性增长,提升了模型的泛化与可靠性。
- Test‑time 思维压缩:加入长度惩罚机制,鼓励模型在推理时使用更少的 ,形成“三阶段”演化(延长‑惩罚‑精简‑扩展)。
- 多智能体协作:在推理阶段并行多个子模型/模块,以保持响应速度的同时提升整体表现。
商业与生态
- 发布后 Meta 股价短线上涨约 7%。
- 新增“购物模式”,基于用户在 Instagram、Facebook、Threads 上的兴趣进行个性化商品推荐。
- 模型目前闭源,API 限制合作伙伴使用,计划未来开源后续版本。
已知问题
- 编程任务生成代码质量不稳定,部分前端生成失败或代码无法运行。
- 在复杂的自动微分实现等任务中仍出现训练失效、损失不下降等现象。
总体来看,Muse Spark 通过算力优化、RL 强化和多模态推理的组合,使 Meta 在多模态与医学推理领域重新进入第一梯队,但在编程和长时自主 能力上仍需改进。