专题:agent-capability

按该标签聚合的大模型资讯列表(自动分类与标签提取)。2 篇文章。

媒体量子位2026/04/24 18:235800
DeepSeek‑V4 预览版发布,提供 1M 超长上下文。
PPIO 首批上线 Pro 与 Flash 两个版本,分别为 1.6 T/49 B 与 284 B 参数。

DeepSeek‑V4 预览版正式开源,PPIO 首批全量上线两款模型(Pro 与 Flash),实现 1M token 超长上下文并大幅降低 FLOPs 与 KV 缓存。V4‑Pro 具备 1.6 T 参数、49 B 激活,性能媲美国际闭源模型;V4‑Flash 则提供更经济的 284 B 参数版本。模型在 Agent 能力上针对主流代码助手进行优化,交…

媒体爱范儿2026/04/24 14:156700
DeepSeek 发布 V4‑Pro 与 V4‑Flash 两款开源大模型
模型支持百万级上下文,压缩注意力提升推理效率

DeepSeek 于本周五发布并开源 V4 系列大模型,提供 1.6 T 参数的 V4‑Pro 与 284 B 参数的 V4‑Flash,两者均支持百万级上下文并在数学、STEM 等基准上超越多数开源模型。核心亮点包括 Agent 能力提升、压缩注意力机制以及对华为 Ascend 芯片的深度适配,兼顾高性能与低成本,模型已在 HuggingFace 与 M…