专题:model_compression

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

媒体AINews2026/03/27 13:445730
Anthropic 将发布 10 万亿参数 Capybara 模型
智谱 AI 推出开源编码模型 GLM‑5.1

Anthropic 将推出约 10 万亿参数的 Capybara 模型,性能超越 Claude Opus 4.6,Google 可能提供数据中心资金。智谱 AI 发布开源 GLM‑5.1,提升编码能力并缩小与闭源模型差距。Qwen 系列模型借助 TurboQuant 与 vLLM 实现本地高效推理,虽基准受质疑,但显示出量化加速的前景。整体呈现模型规模扩大…

媒体InfoQ 中文2026/03/26 18:107830
优化上下文窗口管理技术
提升长文本处理效率

苹果优化其基础语言模型的上下文窗口管理技术,提升长文本处理效率和性能。通过减少内存占用和加快推理速度,该技术适用于Siri等AI产品,为移动设备上的自然语言处理提供新方案。核心亮点包括模型压缩和分块处理的创新。