专题:gemma-4

按该标签聚合的大模型资讯列表(自动分类与标签提取)。7 篇文章。

媒体AINews2026/04/09 13:445800
Gemma 4模型问题修复
本地LLM发现安全漏洞

本文汇总2026年4月AI领域关键动态,涵盖Gemma 4模型优化、本地LLM安全研究、Meta多模态模型发布及效率提升技术。重点分析模型配置参数、量化稳定性问题、多模态能力突破和缓存压缩创新,展现AI技术在部署优化与实际应用中的最新进展。

社区Hacker News2026/04/08 03:373840
实现 GCS 流式音频读取并在 Mac Studio 本地微调 Whisper
加入 Gemma 4 多模态 LoRA 微调支持并解决 OOM 问题

作者在 M2 Ultra Mac Studio 上实现了一个从 GCS 流式读取音频并对 Whisper 进行本地微调的工具,并在 Gemma 4 发布后加入对其多模态微调的支持。文章详细说明了数据管道、LoRA 微调、内存管理等实现细节,指出了长音频导致 OOM 的挑战并提供了梯度检查点等解决方案,旨在为 Apple Silicon 开发者提供可直接使用…

媒体AINews2026/04/06 13:445620
Gemma 4 本地推理受热,iPhone 17 Pro 达 40 tokens/秒
老旧 iMac G3 上成功运行轻量模型,展示低算力部署潜力

本文梳理了近期 AI 领域的关键动态:Gemma 4 在本地部署上走红,展示了移动端大模型的实用性;研究者在 1998 年 iMac G3 上实现模型运行,证明资源受限环境的可行性;OpenAI 与 Google、Broadcom 的合作及 Anthropic 获得新 TPU,显示商业与硬件布局加速;中国实验室推迟模型开源引发策略讨论;社区关注隐私安全,C…

媒体AINews2026/04/06 13:445610
Gemma 4本地部署引发关注
开源模型重塑开发流程

本文汇总AI领域近期技术动态,涵盖Gemma 4本地部署、开源模型影响、模型性能优化、OpenAI战略调整及非传统硬件应用等方向。重点分析模型普及趋势、社区讨论热点及行业政策变化,为开发者提供多维度技术参考。

媒体AINews2026/04/03 13:445750
Google 开源 Gemma 4,聚焦高效推理与多模态
在 RTX 4090 与 Mac M4 上实现出色本地性能

Google 在 Apache 2.0 许可下开源 Gemma 4,主打高效推理、自治工作流和多模态处理,参数规模仅为传统大模型的十分之一,却在性能和排名上超越 10 倍大模型。模型已兼容 vLLM、llama.cpp、Ollama、Intel 硬件、Unsloth 与 Hugging Face 推理端点,并在 RTX 4090 与 Mac mini M4…

媒体AINews2026/04/02 13:445840
Gemma 4 系列开源,Apache 2.0 许可
支持 256K 令牌长上下文和多模态输入

Google DeepMind 开源了 Gemma 4 系列多模态模型,提供 256K 令牌长上下文、文本/视觉/音频统一处理,并推出 31B 密集、26B MoE 以及面向边缘的 4B/2B 版本。Gemma‑31B 在开源榜单位列第三,GPQA Diamond 取得 85.7% 成绩。发布即获 llama.cpp、Ollama、vLLM 等框架支持,且…