首页/详情

Meta发布原生多模态大模型 Muse Spark:9 个月重构全栈,算力提升 10 倍,首度实现医学推理与沉思模式

量子位2026/04/09 09:49机翻/自动摘要/自动分类
1 阅读

内容评分

技术含量
8/10
营销水分
7/10

摘要

Meta 经过 9 个月全链路重构推出原生多模态大模型 Muse Spark,凭借算力提升 10 倍、强化学习和沉思模式,在多模态感知、医学问答和推理任务上与 Gemini、GPT 5.4 持平或领先。模型已上线但闭源,API 仅限合作伙伴,计划后续开源。短板仍在编程和长时自主 Agent 任务。

正文

Meta 超级智能实验室在历时 9 个月的全链路重构后,推出首款原生多模态 Muse Spark。该模型由余家辉、宋飏、Jason Wei 等顶尖科研团队研发,定位为推理与多模态感知模型,已在 Meta 官网和 APP 上上线,API 仅向部分合作伙伴开放,计划后续开源。

关键性能

  • 多模态理解:在多模态感知、图表阅读、图片转代码等任务上,得分与 Gemini 3.1 Pro、GPT 5.4 持平或居首。
  • 推理与工具调用:引入“沉思模式”(Contemplating),通过多协作实现更高质量的推理,能够在高难度评测(如 AIME)中与 Gemini Deep Think、GPT Pro 正面竞争。
  • 医学能力:与 1000+ 医生合作,在 HealthBench Hard 上取得 42.8 的最高分,并在 MedXpertQA MM 中名列前茅。
  • 短板:在编程和长时自主 任务上仍落后于 Gemini、Claude 等竞争模型。

训练技术创新

  1. 算力效率:预训练阶段使用新架构,使得在相同性能下所需算力比 Llama 4 低 10.3 倍。
  2. 强化学习(RL):采用稳健的 RL 流程,训练步数与成功率呈对数线性增长,提升了模型的泛化与可靠性。
  3. Test‑time 思维压缩:加入长度惩罚机制,鼓励模型在推理时使用更少的 ,形成“三阶段”演化(延长‑惩罚‑精简‑扩展)。
  4. 多智能体协作:在推理阶段并行多个子模型/模块,以保持响应速度的同时提升整体表现。

商业与生态

  • 发布后 Meta 股价短线上涨约 7%。
  • 新增“购物模式”,基于用户在 Instagram、Facebook、Threads 上的兴趣进行个性化商品推荐。
  • 模型目前闭源,API 限制合作伙伴使用,计划未来开源后续版本。

已知问题

  • 编程任务生成代码质量不稳定,部分前端生成失败或代码无法运行。
  • 在复杂的自动微分实现等任务中仍出现训练失效、损失不下降等现象。

总体来看,Muse Spark 通过算力优化、RL 强化和多模态推理的组合,使 Meta 在多模态与医学推理领域重新进入第一梯队,但在编程和长时自主 能力上仍需改进。

标签