专题：agent-capability

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 2 篇文章。

PPIO首批上线DeepSeek‑V4预览版：实现1M超长上下文与高效Agent能力

媒体量子位2026/04/24 18:235800

• DeepSeek‑V4 预览版发布，提供 1M 超长上下文。

• PPIO 首批上线 Pro 与 Flash 两个版本，分别为 1.6 T/49 B 与 284 B 参数。

DeepSeek‑V4 预览版正式开源，PPIO 首批全量上线两款模型（Pro 与 Flash），实现 1M token 超长上下文并大幅降低 FLOPs 与 KV 缓存。V4‑Pro 具备 1.6 T 参数、49 B 激活，性能媲美国际闭源模型；V4‑Flash 则提供更经济的 284 B 参数版本。模型在 Agent 能力上针对主流代码助手进行优化，交…

DeepSeek‑V4 PPIO 云平台长上下文 (262K)稀疏注意力 Agent 能力

DeepSeek V4 系列发布：基于华为芯片的国产大模型突破

原文

媒体爱范儿2026/04/24 14:156700

• DeepSeek 发布 V4‑Pro 与 V4‑Flash 两款开源大模型

• 模型支持百万级上下文，压缩注意力提升推理效率

DeepSeek 于本周五发布并开源 V4 系列大模型，提供 1.6 T 参数的 V4‑Pro 与 284 B 参数的 V4‑Flash，两者均支持百万级上下文并在数学、STEM 等基准上超越多数开源模型。核心亮点包括 Agent 能力提升、压缩注意力机制以及对华为 Ascend 芯片的深度适配，兼顾高性能与低成本，模型已在 HuggingFace 与 M…

大语言模型压缩注意力华为芯片开源项目 Agent 能力