首页/详情

DeepSeek V4 开源发布:千亿参数模型、百万级上下文与华为 Ascend、NVIDIA 双平台适配

InfoQ 中文2026/04/25 01:23机翻/自动摘要/自动分类
0 阅读

内容评分

技术含量
8/10
营销水分
4/10

摘要

DeepSeek V4 于 2024 年 4 月开源,参数达 1300 亿,支持 1 百万 token 上下文,兼容华为 Ascend 与 NVIDIA GPU。模型采用 Transformer‑X 架构,经过大规模多语言预训练和指令微调,在多项基准上实现领先性能。开源仓库提供完整权重、Docker 镜像及 API 示例,并附硬件兼容性对比,便于开发者快速落地。

正文

DeepSeek 于 2024 年 4 月正式开源其最新 DeepSeek‑V4。V4 在架构上采用了最新的 ‑X 设计,参数规模提升至 1300 亿,支持最高 1 000 000 ,显著超越前代模型的 32 K 限制。模型同时兼容华为 Ascend 910 系列和 NVIDIA A100/A800 GPU,提供了两套优化的算子库和混合精度训练脚本,开发者可在单卡 80GB 显存下完成 8‑bit 量化推理。DeepSeek‑V4 通过多阶段预训练(包括大规模网页抓取、代码库和多语言对话数据)以及指令,实现了在中文、英文以及多语言基准上的 SOTA 表现。开源仓库提供了完整的模型权重、Docker 镜像、以及基于 DeepSeek‑API 的示例代码,支持 RESTful 调用和 LangChain 集成。文中还列出了硬件兼容性对比表,展示了在 Ascend 与 NVIDIA 平台上的吞吐量、显存占用和延迟指标,帮助企业在选型时进行权衡。

标签