社区Hacker News2026/04/08 03:373840
• 实现 GCS 流式音频读取并在 Mac Studio 本地微调 Whisper
• 加入 Gemma 4 多模态 LoRA 微调支持并解决 OOM 问题
作者在 M2 Ultra Mac Studio 上实现了一个从 GCS 流式读取音频并对 Whisper 进行本地微调的工具,并在 Gemma 4 发布后加入对其多模态微调的支持。文章详细说明了数据管道、LoRA 微调、内存管理等实现细节,指出了长音频导致 OOM 的挑战并提供了梯度检查点等解决方案,旨在为 Apple Silicon 开发者提供可直接使用…