专题:webassembly

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

社区Hacker News2026/04/19 06:464700
WebAssembly 编译为 Apple GPU 原生码
使用 Metal 共享缓冲区实现零拷贝

本文提出在 Apple Silicon 上利用 WebAssembly 实现零拷贝 GPU 推理的方案。通过将推理算子编译为原生指令并使用 Metal 共享缓冲区,省去 CPU‑GPU 数据拷贝,实现更低延迟和功耗。实验表明,推理速度提升 30%~45%,能耗下降约 20%。

社区Hacker News2026/04/04 22:535670
TurboQuant‑WASM 在浏览器端实现向量量化
利用 WASM 提供毫秒级压缩/解码

TurboQuant‑WASM 是 Google 为浏览器环境打造的向量量化实现,基于 WebAssembly 提供高效的向量压缩与解码 API。它通过码本技术将高维向量压缩数十倍,显著降低网络带宽和存储开销,同时在前端实现毫秒级恢复,提升 AI 推理、检索等 Web 应用的响应速度。示例代码展示了仅几行 JavaScript 即可完成量化、解码,兼容主流…

官方Simon Willison2026/02/25 00:104860

go-size-analyzer 是一个用于分析Go二进制文件大小的工具,支持本地和Web端使用。通过树状图展示依赖关系,帮助开发者理解二进制文件的构成。其WebAssembly实现使得无需安装Go即可在浏览器中分析。同时,Datadog的优化经验表明,二进制文件大小优化具有显著的实际价值。