专题:ai-gateway

按该标签聚合的大模型资讯列表(自动分类与标签提取)。8 篇文章。

媒体The Cloudflare Blog2026/04/16 22:055600
统一 API 调用多供应商模型
全球边缘网络降低推理时延

Cloudflare 将 AI Gateway 与 Workers AI 打造成统一推理层,提供 70+ 模型、跨供应商 API(`AI.run()`)以及自有模型容器化支持。依托全球 330 城市边缘网络,实现低延迟、高可靠性,并具备自动故障切换和成本监控,帮助开发者高效构建多模型智能代理。

官方Vercel Blog2026/03/17 21:005760
部署GPT-5.4 Mini和Nano模型于AI Gateway平台
模型经量化压缩,适配低显存环境(8-16GB)

本文介绍在AI Gateway平台部署GPT-5.4 Mini和Nano轻量模型的全流程,适用于资源受限环境。模型通过量化压缩,在低显存下保持接近完整版的NLP性能,支持文本生成与问答任务。核心亮点是实测性能数据与平台集成方案,为边缘AI部署提供可落地参考。