DeepSeek V4 开源发布：千亿参数模型、百万级上下文与华为 Ascend、NVIDIA 双平台适配

InfoQ 中文2026/04/25 01:23机翻/自动摘要/自动分类

内容评分

技术含量

8/10

营销水分

4/10

摘要

DeepSeek V4 于 2024 年 4 月开源，参数达 1300 亿，支持 1 百万 token 上下文，兼容华为 Ascend 与 NVIDIA GPU。模型采用 Transformer‑X 架构，经过大规模多语言预训练和指令微调，在多项基准上实现领先性能。开源仓库提供完整权重、Docker 镜像及 API 示例，并附硬件兼容性对比，便于开发者快速落地。

正文

DeepSeek 于 2024 年 4 月正式开源其最新 DeepSeek‑V4。V4 在架构上采用了最新的 ‑X 设计，参数规模提升至 1300 亿，支持最高 1 000 000 的，显著超越前代模型的 32 K 限制。模型同时兼容华为 Ascend 910 系列和 NVIDIA A100/A800 GPU，提供了两套优化的算子库和混合精度训练脚本，开发者可在单卡 80GB 显存下完成 8‑bit 量化推理。DeepSeek‑V4 通过多阶段预训练（包括大规模网页抓取、代码库和多语言对话数据）以及指令，实现了在中文、英文以及多语言基准上的 SOTA 表现。开源仓库提供了完整的模型权重、Docker 镜像、以及基于 DeepSeek‑API 的示例代码，支持 RESTful 调用和 LangChain 集成。文中还列出了硬件兼容性对比表，展示了在 Ascend 与 NVIDIA 平台上的吞吐量、显存占用和延迟指标，帮助企业在选型时进行权衡。

DeepSeek V4 开源发布：千亿参数模型、百万级上下文与华为 Ascend、NVIDIA 双平台适配

内容评分

摘要

正文

标签