专题：open-source-models

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 9 篇文章。

Amazon Bedrock 强化微调（RFT）：高效定制模型的实践方法

媒体AWS Machine Learning Blog2026/04/09 03:436830

• RFT 通过奖励信号优化模型

• 无需依赖大规模标注数据

本文详解 Amazon Bedrock 平台的强化微调（RFT）技术，通过奖励信号优化模型性能，无需依赖大规模标注数据集即可提升准确率最高达 66%。重点涵盖数据集设计、奖励函数策略及超参数调整，适用于代码生成、数学推理等可验证任务及需 AI 反馈的主观任务，结合 GSM8K 数据集案例展示实际应用效果。

强化微调 Amazon Bedrock 奖励函数设计模型优化开源模型

谷歌开源Gemma系列大模型：手机端离线Agent与内存优化技术解析

原文

媒体InfoQ 中文2026/04/03 22:405860

• 谷歌开源Gemma大模型系列

• 支持手机端离线Agent运行

谷歌开源Gemma系列大模型，主打手机端离线Agent支持与内存优化技术。通过动态内存分配和量化压缩，实现轻量化部署。对比Qwen等竞品，突出其在参数规模、推理效率及资源占用方面的优势，为移动端AI应用提供新方案。

开源模型移动AI 内存优化技术 LLM代理模型对比

Google发布Gemma 4系列：开源小模型赋能移动端AI应用

原文

媒体爱范儿2026/04/03 09:006770

• Gemma 4实现完全开源与本地部署

• Apache 2.0许可证降低使用门槛

Google推出Gemma 4系列开源小模型，支持手机等设备本地运行。通过Apache 2.0许可证实现完全开源，配套专利保护机制。该模型突破数据中心依赖，满足医疗、金融等行业数据安全需求，引入多步推理与Agent模式等核心技术，推动AI技术在边缘设备的广泛应用。

开源模型移动AI 本地微调智能体框架数据隐私保护

Gemma 4系列：多模态视觉处理与参数效率突破

原文

官方Simon Willison2026/04/03 02:287960

• Gemma 4发布多模态LLM

• 采用PLE提升参数效率

谷歌发布Gemma 4系列多模态LLM，包含2B/4B/31B及26B-A4B参数模型。核心亮点包括Per-Layer Embeddings架构提升参数效率、支持视频/音频/OCR等视觉任务处理，以及通过AI Studio提供API接口。测试显示20亿参数模型运行正常，但31B模型存在输出异常，作者演示了模型生成SVG图像的应用案例。

多模态处理逐层嵌入技术开源模型视觉大模型参数效率

开放模型在代理任务中表现媲美闭源模型，成本显著降低

原文

媒体LangChain Blog2026/04/03 01:517940

• 开放模型性能媲美闭源

• 成本降低达90%以上

本文展示开放模型在代理任务中的突破性表现，GLM-5和MiniMax M2.7在核心功能上可与闭源模型媲美，成本降低90%以上。通过Deep Agents框架实现模型无缝切换，提供具体性能指标和部署方案，为开发者提供开源模型的实用评估指南。

大型语言模型模型评估开源框架性价比代理部署

Andrej Karpathy谈开源与闭源模型的生态竞争与‘龙虾’模型设计

原文

媒体InfoQ 中文2026/03/23 17:296730

• 开源与闭源模型生态竞争与合作

• ‘龙虾’模型成功源于人格设计

本文探讨了Andrej Karpathy对AI模型生态的看法，分析了开源与闭源模型的竞争与合作，强调了‘龙虾’模型在人格设计上的创新，以及其对AI技术发展的影响。文章提供了对当前AI行业趋势的深入洞察，对开发者和研究者具有参考价值。

开源模型闭源模型 AI生态系统模型人格设计 AI伦理

SAIR Foundation启动数学蒸馏挑战赛，推动AI数学推理能力突破

原文

媒体量子位2026/03/14 20:457940

• 挑战赛聚焦AI数学推理能力

• 2200万题目测试模型表现

SAIR Foundation于国际数学日启动‘数学蒸馏挑战赛’，旨在提升AI的数学推理能力。赛事聚焦等式理论，提供2200万道题目，要求参赛者将复杂代数知识浓缩于A4纸大小的策略指南中，以增强弱模型的推理能力。挑战赛分为策略测试与形式化验证两个阶段，强调开放合作与全球科研协作。

数学推理等式理论 Lean定理证明器 AI挑战赛知识蒸馏

Microsoft Foundry 集成 Fireworks AI：开放模型高性能推理新方案

原文

官方Microsoft Azure Blog2026/03/11 15:008940

• Fireworks AI集成Microsoft Foundry

• 支持多模型推理与部署选项

Microsoft Foundry 集成 Fireworks AI，为企业提供统一的开放模型推理平台。该方案支持多款主流模型，包含无服务器部署和 PTU 计费模式，日处理能力达 13 万亿 tokens，每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理，通过 BYOW 功能实现自定义权重部署，解决传统方案中工具碎片化导致的扩展难题，助力开发者高效…

模型部署模型优化 Azure AI平台微软Foundry Fireworks AI

2026年AI代理技术新进展：模型特性与开源挑战

原文

媒体AINews2026/01/28 13:447830

2026年初AI领域聚焦于代理技术与模型特性对比，GPT-5.2与Claude Opus 4.5展现不同优势，Kimi K2.5作为开源模型在代理执行和编码性能上表现亮眼，但许可问题限制其企业应用。代理工程标准化进程加快，‘clawdbot’等品牌化趋势凸显。

代理式编程自我验证机制多模态处理技能接口标准化开源模型