Qwen 3.5多模态模型token数量深度解析

r/LocalLLaMA2026/04/20 10:59机翻/自动摘要/自动分类

摘要

本文基于Qwen官方数据，对3.5代多模态模型的token数量进行深度分析。核心发现：1）Qwen 3.5在Qwen 3的36万亿token基础上，通过多模态训练将token总量提升至42-48万亿；2）增长主要来自视觉token的引入和多模态数据对齐；3）保守估计避免了过度乐观预测。该研究为评估大模型参数规模提供了关键参考，对AI模型研发和部署具有重要指导意义。

正文

Qwen 3.5在继承Qwen 3基线数据（36万亿）的基础上，通过引入多模态训练显著提升了总量。相较于纯文本训练，该版本增加了视觉文本，并通过图像与文本的配对编码扩展了数据表示维度。基于官方资料，保守估计其总数量在42至48万亿区间，较前代增长15%-30%。这一增长主要源于：1）新增的视觉流；2）多模态数据对齐带来的额外开销；3）数据集多样性的提升。该估算避免了过度乐观预测，为模型规模评估提供了可靠参考。

Qwen 3.5多模态模型token数量深度解析

摘要

正文

标签