媒体The Cloudflare Blog2026/04/16 22:055600
• 统一 API 调用多供应商模型
• 全球边缘网络降低推理时延
Cloudflare 将 AI Gateway 与 Workers AI 打造成统一推理层,提供 70+ 模型、跨供应商 API(`AI.run()`)以及自有模型容器化支持。依托全球 330 城市边缘网络,实现低延迟、高可靠性,并具备自动故障切换和成本监控,帮助开发者高效构建多模型智能代理。
按该标签聚合的大模型资讯列表(自动分类与标签提取)。共 2 篇文章。
Cloudflare 将 AI Gateway 与 Workers AI 打造成统一推理层,提供 70+ 模型、跨供应商 API(`AI.run()`)以及自有模型容器化支持。依托全球 330 城市边缘网络,实现低延迟、高可靠性,并具备自动故障切换和成本监控,帮助开发者高效构建多模型智能代理。
Cloudflare在Workers AI上上线Kimi K2.5大模型,支持256k上下文与多模态输入,专为智能代理优化。通过定制推理栈、前缀缓存与会话亲和性等技术,实现边缘高效推理。实际应用中,代码审查成本降低77%,Agents SDK已默认集成,推动AI代理在边缘端规模化落地。