专题:vector-quantization

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

社区Hacker News2026/04/04 22:535670
TurboQuant‑WASM 在浏览器端实现向量量化
利用 WASM 提供毫秒级压缩/解码

TurboQuant‑WASM 是 Google 为浏览器环境打造的向量量化实现,基于 WebAssembly 提供高效的向量压缩与解码 API。它通过码本技术将高维向量压缩数十倍,显著降低网络带宽和存储开销,同时在前端实现毫秒级恢复,提升 AI 推理、检索等 Web 应用的响应速度。示例代码展示了仅几行 JavaScript 即可完成量化、解码,兼容主流…

媒体AINews2026/03/24 13:445750
Google 发布 Gemini 3.1 Flash Live,128k 上下文、70 语言
Mistral 推 Voxtral TTS,开源低延迟,支持 9 语言

Google、Mistral、Cohere 与 OpenAI 本周相继发布新模型:Google 的 Gemini 3.1 Flash Live 提供 70 语言、128k 上下文的实时语音视觉代理;Mistral 的开源 Voxtral TTS 支持 9 语言、低延迟,性能媲美 ElevenLabs;Cohere 的 Transcribe 在 14 语言上…