专题：token-efficiency

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 6 篇文章。

MemPalace：基于记忆宫殿法的本地化开源 AI 长期记忆系统

媒体量子位2026/04/09 13:114830

• MemPalace 用记忆宫殿结构组织本地 AI 长期记忆

• 检索效率提升约34%，LongMemEval 最高分96.6%

MemPalace 是一款开源本地 AI 长期记忆系统，借鉴记忆宫殿法将记忆组织为可导航的空间结构，实现约 34% 检索提升，并在 LongMemEval 中取得 96.6% 的最高分。系统支持 RAW 与压缩 AAAK 两种模式，提供本地化存储、实时纠错和低成本 token 使用，提供 pip 安装、CLI 与 Python API，已获 17k+ st…

记忆系统本地大语言模型检索增强 Token 效率 AAAK 语言

Meta发布原生多模态大模型 Muse Spark：9 个月重构全栈，算力提升 10 倍，首度实现医学推理与沉思模式

原文

媒体量子位2026/04/09 09:497810

• Meta 9 个月重构发布多模态模型 Muse Spark

• 算力提升 10 倍，推理与医学能力显著

Meta 经过 9 个月全链路重构推出原生多模态大模型 Muse Spark，凭借算力提升 10 倍、强化学习和沉思模式，在多模态感知、医学问答和推理任务上与 Gemini、GPT 5.4 持平或领先。模型已上线但闭源，API 仅限合作伙伴，计划后续开源。短板仍在编程和长时自主 Agent 任务。

多模态生成强化学习医疗问答 Token 效率 AI Agent

MiniMax M2.7：成本仅为GLM-5三分之一的SOTA开源智能体模型

原文

媒体AINews2026/03/18 13:445740

• MiniMax M2.7：具备自我进化能力的SOTA模型，成本仅为GLM-5的1/3

• 小米MiMo-V2-Pro：专注API推理，token使用效率显著提升

MiniMax M2.7是具备自我进化能力的SOTA开源模型，在SWE-Pro和Terminal Bench 2任务中分别达到56.22%和57.0%的性能表现。其核心优势在于：1）智能指数50分与GLM-5持平，但成本仅为1/3；2）通过递归机制持续优化技能与架构；3）支持Ollama Cloud等平台部署。小米MiMo-V2-Pro和Cartesia …

AI模型模型优化多智能体 MCP协议性价比