专题:data_engineering

按该标签聚合的大模型资讯列表(自动分类与标签提取)。3 篇文章。

媒体InfoQ 中文2026/03/18 19:325850
DataFlow优化LLM数据处理流程
支持分布式数据加载与缓存

本文介绍北京大学DCAI团队开发的DataFlow框架,用于优化工业级LLM的数据工程流程。该框架支持分布式数据处理,提升训练和推理效率,具有模块化架构和实际应用案例,是LLM开发的重要工具。

媒体ByteByteGo Newsletter2026/03/04 00:306830
Agoda 构建统一财务数据管道 FINUDP
通过阴影测试和多级警报确保数据质量

Agoda 构建了统一的财务数据管道 FINUDP,解决了多个数据管道带来的数据不一致和维护成本问题。通过集中处理、自动化监控和严格的数据治理,提升了数据质量和可靠性,为财务分析和报告提供了统一的数据源。