大模型资讯聚合站

专题：vulkan

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 5 篇文章。

Qwen3.5系列模型在Llama-Bench测试中的性能对比分析

社区Reddit r/LocalLLaMA2026/03/04 21:103880

本文通过Llama-Bench对Qwen3.5系列模型进行性能测试，涵盖不同参数量和量化版本。测试结果展示了模型在Vulkan后端下的推理速度差异，为模型选择和优化提供参考。

通义千问3.5模型 llama‑bench Vulkan 模型量化技术推理性能

本地AI服务器搭建失败实录：成本与性能的残酷对比

社区Reddit r/LocalLLaMA2026/02/16 12:253750

本文记录了作者尝试以低成本搭建本地AI服务器的失败经历，详细列出了硬件配置和测试结果，指出本地部署在性能和成本上的劣势。核心亮点在于对云API与本地部署的对比分析，以及对个人技术认知的反思，对AI爱好者和开发者具有警示意义。

llama.cpp工具 Vulkan 本地部署硬件配置性能对比

Simplifying Vulkan one subsystem at a time

社区Hacker News2026/02/10 21:2670

Simplifying Vulkan one subsystem at a time...

Vulkan 图形API 简化软件工程

Strix Halo 模型量化与 ROCm/Vulkan 后端性能效率测试

社区Reddit r/LocalLLaMA2026/02/09 22:0450

本文作者对 Strix Halo 模型进行了量化测试，发现自定义 imatrix Q4_K_S 版本在困惑度和模型体积上优于标准 Q4_K_M。在 ROCm 和 Vulkan 后端测试中，ROCm 在速度和能耗方面均显著优于 Vulkan，尤其是在处理长上下文时。作者计划未来主要使用 ROCm 作为 Strix Halo 的后端。

Strix Halo笔记本量化技术 ROCm 框架 Vulkan llama.cpp框架

Qwen3-Coder 在 llama.cpp Vulkan 环境下遭遇 Safe Tensor 错误，寻求社区帮助

社区Reddit r/LocalLLaMA2026/02/09 19:5850

一位用户在尝试将 Qwen3-Coder 模型与 llama.cpp 和 Vulkan 结合使用时，遇到了 Safe Tensor 错误，导致模型无法正常运行。尽管用户表示 GPT OS 120B 模型在其环境中运行良好，但他仍希望能够成功部署 Qwen3。该用户正在寻求社区的帮助，以解决 Qwen3-Coder 在 Vulkan 和 llama.cpp …

Qwen 3 Coder llama.cpp框架 Vulkan Safe Tensor 错误移动端模型部署