大模型资讯聚合站

专题：parameter-efficiency

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 3 篇文章。

谷歌发布Gemma 4开源大模型：多模态与智能体能力升级

媒体InfoQ 中文2026/04/18 18:007800

• 谷歌发布Gemma 4开源模型

• 支持多模态与智能体功能

谷歌推出Gemma 4开源大模型，集成多模态处理与智能体功能，通过参数效率优化实现性能提升。该模型采用改进架构，支持跨模态交互，适用于复杂应用场景，开源授权促进生态发展。

多模态模型智能体框架开源模型参数效率推理性能

MegaTrain：单GPU全精度训练超百亿参数LLM

社区Hacker News2026/04/08 20:195640

• 单GPU训练超百亿参数LLM

• 全精度训练效率提升

MegaTrain是突破性训练框架，可在单GPU上完成超百亿参数LLM的全精度训练。通过算法优化和流程重构，降低硬件需求并提升效率，为资源有限环境提供高性能模型训练方案。核心亮点包括单设备训练能力、全精度保持与资源效率提升，对AI模型研发具有重要实践价值。

全精度训练显存优化大规模模型训练参数效率分布式训练

Gemma 4系列：多模态视觉处理与参数效率突破

官方Simon Willison2026/04/03 02:287960

• Gemma 4发布多模态LLM

• 采用PLE提升参数效率

谷歌发布Gemma 4系列多模态LLM，包含2B/4B/31B及26B-A4B参数模型。核心亮点包括Per-Layer Embeddings架构提升参数效率、支持视频/音频/OCR等视觉任务处理，以及通过AI Studio提供API接口。测试显示20亿参数模型运行正常，但31B模型存在输出异常，作者演示了模型生成SVG图像的应用案例。

多模态处理逐层嵌入技术开源模型视觉大模型参数效率