专题:distributed_computing

按该标签聚合的大模型资讯列表(自动分类与标签提取)。4 篇文章。

媒体InfoQ 中文2026/04/17 00:515800
架构升级提升处理效率
模型优化降低推理延迟

本文分享视频审核中台性能优化实践,通过架构升级和AI技术深度应用,实现推理效率提升300%、并发处理能力增强5倍。核心亮点包括模型压缩技术、分布式计算框架和硬件加速方案的综合运用,显著降低处理时延并提升系统吞吐量,为AI内容审核场景提供可复用的优化范式。

官方Databricks Blog2026/03/10 03:004760
解耦架构提升系统扩展性
分层索引优化搜索效率

向量搜索作为AI应用的核心基础设施,尤其在RAG和推荐系统中至关重要。本文探讨了百亿级向量搜索系统的解耦架构设计,分析了传统方法的局限性,并提出基于分层索引和分布式计算的优化方案,通过实验验证了其在效率和扩展性上的优势。