首页/详情

GeoPT:合成动力学驱动的几何预训练,大幅削减物理仿真标注成本

量子位2026/02/27 16:19机翻/自动摘要/自动分类
0 阅读

内容评分

技术含量
8/10
营销水分
5/10

摘要

GeoPT 是何恺明团队提出的全新预训练范式,利用随机合成速度场将静态几何提升至动态空间,模型在无标签几何上学习轨迹演化,从而获得物理直觉。实验表明,在保持相同精度的前提下,可节省 20‑60% 的仿真数据,并使微调收敛速度提升两倍。该框架已开源,为构建通用物理仿真大模型提供了高效可扩展的路径。

正文

背景

静态 3D 资产缺少动力学信息,而获取高精度物理标签往往需要耗费数万 CPU 小时,导致数据驱动的仿真器难以规模化。传统的几何自监督(如掩码重建)只能学习形状特征,缺失“动力学”维度,容易在下游任务中出现负迁移。

核心创新 – Dynamics‑lifted Geometric Pre‑training

何恺明团队提出 GeoPT,在预训练阶段引入 Synthetic Dynamics(合成动力学),将纯几何提升到“几何+动力学”联合空间。

  • Synthetic Velocities:对每个采样点均匀抽取随机速度向量 (v),不依赖真实流场。
  • 轨迹监督:模型需预测在该合成速度场下,几何特征随时间的演化轨迹,形成自监督信号。
  • 统一接口:预训练与均接受 (几何 G, 速度 V) 作为输入,时只需将随机 V 替换为任务特定的物理条件(如入射流、冲击方向等)。

训练细节

  • 骨干网络:Transolver,提供 3M、8M、15M 参数三档模型。
  • 数据:ShapeNet‑V1 中约 100 万几何体,每体采样 3.6 万点,生成 100 种随机动力学场,形成约 5 TB 预训练数据。
  • 损失函数: $$\mathcal{L}=\frac{1}{N}\sum_{i=1}^{N}|\phi(x_i^{t+1})-\hat{\phi}(x_i^{t+1})|_2^2,$$ 其中 (\phi) 为几何特征编码,(x_i^{t+1}) 为合成轨迹的下一个采样点。
  • 效率:采用加速的射线‑三角形求交,仅 0.2 s/样本,比工业 CFD 快 10⁷ 倍,80 核 CPU 3 天即可生成完整数据集。

微调与下游任务

阶段,将合成速度替换为真实仿真条件:

  • 空气动力学:入射流速度、攻角 → (V_s)。
  • 水动力学:双相流分别编码不同 (V_s)。
  • 碰撞仿真:冲击方向与衰减力度编码为 (V_s)。 单一预训练模型即可通过简单的速度配置适配多种物理任务。

实验结果

| 任务 | 数据节省 | 收敛加速 | |------|----------|----------| | DrivAerML(汽车空气动力学) | 20‑60% | 2× | | NASA‑CRM(飞机受力) | 同上 | 同上 | | DTCHull(船舶水动力) | 同上 | 同上 | | Car‑Crash(汽车碰撞) | 同上 | 同上 | | Radiosity(辐射度) | 同上 | 同上 |

  • 随模型层数从 8 增至 32、预训练数据量提升,性能持续稳步提升,展示了“物理”的可扩展性。

开源与资源

项目已在 GitHub 开源,代码、数据生成脚本及预训练权重均可直接下载使用。

结论

GeoPT 通过合成动力学轨迹实现了几何与动力学的统一预训练,显著降低了对昂贵仿真标签的依赖,并在多任务中保持或提升精度,提供了一条可扩展的通用物理仿真基础模型路径。

标签