Meta 构建预计算 AI 引擎，实现大型代码库的部落知识导航

AI 编码助手的效能取决于对代码库的理解。Meta 在一个跨四个代码库、三种语言、超过 4,100 个文件的大型数据处理管道中发现，普通 AI 代理缺乏必要的导航信息，导致修改效率低下。为此，Meta 研发了一套预计算引擎：由 50 多个专门设计的 AI 代理组成的团队系统化阅读每个文件，生成 59 份约 25‑35 行、约 1,000 词的上下文指南文件。这些文件把原本只存在于工程师脑中的关键信息、非显而易见的模式以及跨模块依赖以“指南而非百科全书”的形式结构化，覆盖率从原先的 5% 提升至 100%。

实现流程分为九个阶段：探索代理分析代码、模块分析师回答五个关键问题、工具生成上下文、三轮质量审核、修复与升级、角色化测试、补充处理以及最终集成测试，全部在同一会话中完成。五个关键问题包括模块负责的配置、常见修改模式、导致构建失败的隐蔽模式、模块依赖以及注释中的隐藏信息。通过此过程，Meta 发现了大量未记录的细节，如临时字段名错误、特定条件下才生效的标识符写入规则等。

生成的上下文文件仅占现代模型输入的 0.1%，并配备自动化层，可根据自然语言指令将工程师引导至正确工具，实现如“管道是否正常运行？”或“添加新数据字段”等操作的自动化。实验表明，使用预计算上下文后，每个任务的 AI 工具调用次数下降约 40%，复杂工作流从两天缩短至 30 分钟，系统评分从 3.65 提升至 4.20（满分 5.0），且所有文件路径均经验证无误。

Meta 说明，此方法针对专有、配置即代码的系统尤为有效，区别于在已有预训练知识的开源库（如 Django、matplotlib）上进行的研究。通过保持上下文简洁、按需加载并多轮审核，能够克服传统观点认为上下文会降低效率的担忧。Meta 提供了可复制的五问框架、指南编写原则以及质量审核机制，供其他拥有大型专有代码库的团队参考。

Meta 构建预计算 AI 引擎，实现大型代码库的部落知识导航

内容评分

摘要

正文

标签