媒体InfoQ 中文2026/04/25 01:234800
• DeepSeek V4 开源,1300 亿参数
• 支持 1 百万 token 上下文
DeepSeek V4 于 2024 年 4 月开源,参数达 1300 亿,支持 1 百万 token 上下文,兼容华为 Ascend 与 NVIDIA GPU。模型采用 Transformer‑X 架构,经过大规模多语言预训练和指令微调,在多项基准上实现领先性能。开源仓库提供完整权重、Docker 镜像及 API 示例,并附硬件兼容性对比,便于开发者快速…