Meta发布原生多模态大模型 Muse Spark：9 个月重构全栈，算力提升 10 倍，首度实现医学推理与沉思模式

Meta 超级智能实验室在历时 9 个月的全链路重构后，推出首款原生多模态 Muse Spark。该模型由余家辉、宋飏、Jason Wei 等顶尖科研团队研发，定位为推理与多模态感知模型，已在 Meta 官网和 APP 上上线，API 仅向部分合作伙伴开放，计划后续开源。

多模态理解：在多模态感知、图表阅读、图片转代码等任务上，得分与 Gemini 3.1 Pro、GPT 5.4 持平或居首。
推理与工具调用：引入“沉思模式”（Contemplating），通过多协作实现更高质量的推理，能够在高难度评测（如 AIME）中与 Gemini Deep Think、GPT Pro 正面竞争。
医学能力：与 1000+ 医生合作，在 HealthBench Hard 上取得 42.8 的最高分，并在 MedXpertQA MM 中名列前茅。
短板：在编程和长时自主任务上仍落后于 Gemini、Claude 等竞争模型。

总体来看，Muse Spark 通过算力优化、RL 强化和多模态推理的组合，使 Meta 在多模态与医学推理领域重新进入第一梯队，但在编程和长时自主能力上仍需改进。

内容评分