专题:vulkan

按该标签聚合的大模型资讯列表(自动分类与标签提取)。5 篇文章。

社区Reddit r/LocalLLaMA2026/02/09 22:0450

本文作者对 Strix Halo 模型进行了量化测试,发现自定义 imatrix Q4_K_S 版本在困惑度和模型体积上优于标准 Q4_K_M。在 ROCm 和 Vulkan 后端测试中,ROCm 在速度和能耗方面均显著优于 Vulkan,尤其是在处理长上下文时。作者计划未来主要使用 ROCm 作为 Strix Halo 的后端。

社区Reddit r/LocalLLaMA2026/02/09 19:5850

一位用户在尝试将 Qwen3-Coder 模型与 llama.cpp 和 Vulkan 结合使用时,遇到了 Safe Tensor 错误,导致模型无法正常运行。尽管用户表示 GPT OS 120B 模型在其环境中运行良好,但他仍希望能够成功部署 Qwen3。该用户正在寻求社区的帮助,以解决 Qwen3-Coder 在 Vulkan 和 llama.cpp …