专题:huawei-chip

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/04/24 12:175800
DeepSeek V4 发布两款模型,均支持 1M 上下文
V4‑Pro 在 Agent、知识、推理上接近闭源顶级模型

DeepSeek V4 系列正式发布,提供 1M 超长上下文的 Pro(1.6T 参数)和更轻量的 Flash(284B 参数)两款模型。V4‑Pro 在 Agent 编码、世界知识和推理基准上接近顶级闭源模型,Flash 版在成本和速度上具优势。全新 DSA 稀疏注意力实现了上下文长度的标配化,并将在下半年批量迁移至华为算力。模型已开源,API 同步更新…