专题:huaweicloud

按该标签聚合的大模型资讯列表(自动分类与标签提取)。1 篇文章。

媒体量子位2026/04/24 18:105700
DeepSeek‑V4 开源,支持 1 M Token 超长上下文
华为云实现 KVCache 分层压缩和多算子加速

DeepSeek‑V4 大模型于 4 月 24 日发布并开源,支持 1 M Token 超长上下文,参数压缩至 284 B,推理成本大幅降低。华为云首发适配,推出 KVCache 分层压缩、TopK/SWA/CFA 等高性能算子以及异步调度、MTP 投机等优化,实现原生 1 M 长上下文的高效推理,并已在 MaaS 平台提供免部署 API 服务,已有金山办…