专题:open-source-models

按该标签聚合的大模型资讯列表(自动分类与标签提取)。9 篇文章。

媒体AWS Machine Learning Blog2026/04/09 03:436830
RFT 通过奖励信号优化模型
无需依赖大规模标注数据

本文详解 Amazon Bedrock 平台的强化微调(RFT)技术,通过奖励信号优化模型性能,无需依赖大规模标注数据集即可提升准确率最高达 66%。重点涵盖数据集设计、奖励函数策略及超参数调整,适用于代码生成、数学推理等可验证任务及需 AI 反馈的主观任务,结合 GSM8K 数据集案例展示实际应用效果。

媒体InfoQ 中文2026/04/03 22:405860
谷歌开源Gemma大模型系列
支持手机端离线Agent运行

谷歌开源Gemma系列大模型,主打手机端离线Agent支持与内存优化技术。通过动态内存分配和量化压缩,实现轻量化部署。对比Qwen等竞品,突出其在参数规模、推理效率及资源占用方面的优势,为移动端AI应用提供新方案。

媒体爱范儿2026/04/03 09:006770
Gemma 4实现完全开源与本地部署
Apache 2.0许可证降低使用门槛

Google推出Gemma 4系列开源小模型,支持手机等设备本地运行。通过Apache 2.0许可证实现完全开源,配套专利保护机制。该模型突破数据中心依赖,满足医疗、金融等行业数据安全需求,引入多步推理与Agent模式等核心技术,推动AI技术在边缘设备的广泛应用。

官方Simon Willison2026/04/03 02:287960
Gemma 4发布多模态LLM
采用PLE提升参数效率

谷歌发布Gemma 4系列多模态LLM,包含2B/4B/31B及26B-A4B参数模型。核心亮点包括Per-Layer Embeddings架构提升参数效率、支持视频/音频/OCR等视觉任务处理,以及通过AI Studio提供API接口。测试显示20亿参数模型运行正常,但31B模型存在输出异常,作者演示了模型生成SVG图像的应用案例。

媒体LangChain Blog2026/04/03 01:517940
开放模型性能媲美闭源
成本降低达90%以上

本文展示开放模型在代理任务中的突破性表现,GLM-5和MiniMax M2.7在核心功能上可与闭源模型媲美,成本降低90%以上。通过Deep Agents框架实现模型无缝切换,提供具体性能指标和部署方案,为开发者提供开源模型的实用评估指南。

媒体InfoQ 中文2026/03/23 17:296730
开源与闭源模型生态竞争与合作
‘龙虾’模型成功源于人格设计

本文探讨了Andrej Karpathy对AI模型生态的看法,分析了开源与闭源模型的竞争与合作,强调了‘龙虾’模型在人格设计上的创新,以及其对AI技术发展的影响。文章提供了对当前AI行业趋势的深入洞察,对开发者和研究者具有参考价值。

媒体量子位2026/03/14 20:457940
挑战赛聚焦AI数学推理能力
2200万题目测试模型表现

SAIR Foundation于国际数学日启动‘数学蒸馏挑战赛’,旨在提升AI的数学推理能力。赛事聚焦等式理论,提供2200万道题目,要求参赛者将复杂代数知识浓缩于A4纸大小的策略指南中,以增强弱模型的推理能力。挑战赛分为策略测试与形式化验证两个阶段,强调开放合作与全球科研协作。

官方Microsoft Azure Blog2026/03/11 15:008940
Fireworks AI集成Microsoft Foundry
支持多模型推理与部署选项

Microsoft Foundry 集成 Fireworks AI,为企业提供统一的开放模型推理平台。该方案支持多款主流模型,包含无服务器部署和 PTU 计费模式,日处理能力达 13 万亿 tokens,每秒处理 18 万请求。核心亮点在于打通模型全生命周期管理,通过 BYOW 功能实现自定义权重部署,解决传统方案中工具碎片化导致的扩展难题,助力开发者高效…