GeoPT：合成动力学驱动的几何预训练，大幅削减物理仿真标注成本

背景

静态 3D 资产缺少动力学信息，而获取高精度物理标签往往需要耗费数万 CPU 小时，导致数据驱动的仿真器难以规模化。传统的几何自监督（如掩码重建）只能学习形状特征，缺失“动力学”维度，容易在下游任务中出现负迁移。

核心创新 – Dynamics‑lifted Geometric Pre‑training

何恺明团队提出 GeoPT，在预训练阶段引入 Synthetic Dynamics（合成动力学），将纯几何提升到“几何+动力学”联合空间。

Synthetic Velocities：对每个采样点均匀抽取随机速度向量 (v)，不依赖真实流场。
轨迹监督：模型需预测在该合成速度场下，几何特征随时间的演化轨迹，形成自监督信号。
统一接口：预训练与均接受 (几何 G, 速度 V) 作为输入，时只需将随机 V 替换为任务特定的物理条件（如入射流、冲击方向等）。

训练细节

骨干网络：Transolver，提供 3M、8M、15M 参数三档模型。
数据：ShapeNet‑V1 中约 100 万几何体，每体采样 3.6 万点，生成 100 种随机动力学场，形成约 5 TB 预训练数据。
损失函数： $$\mathcal{L}=\frac{1}{N}\sum_{i=1}^{N}|\phi(x_i^{t+1})-\hat{\phi}(x_i^{t+1})|_2^2,$$ 其中 (\phi) 为几何特征编码，(x_i^{t+1}) 为合成轨迹的下一个采样点。
效率：采用加速的射线‑三角形求交，仅 0.2 s/样本，比工业 CFD 快 10⁷ 倍，80 核 CPU 3 天即可生成完整数据集。

微调与下游任务

在阶段，将合成速度替换为真实仿真条件：

空气动力学：入射流速度、攻角 → (V_s)。
水动力学：双相流分别编码不同 (V_s)。
碰撞仿真：冲击方向与衰减力度编码为 (V_s)。单一预训练模型即可通过简单的速度配置适配多种物理任务。

实验结果

| 任务 | 数据节省 | 收敛加速 | |------|----------|----------| | DrivAerML（汽车空气动力学） | 20‑60% | 2× | | NASA‑CRM（飞机受力） | 同上 | 同上 | | DTCHull（船舶水动力） | 同上 | 同上 | | Car‑Crash（汽车碰撞） | 同上 | 同上 | | Radiosity（辐射度） | 同上 | 同上 |

随模型层数从 8 增至 32、预训练数据量提升，性能持续稳步提升，展示了“物理”的可扩展性。

开源与资源

项目已在 GitHub 开源，代码、数据生成脚本及预训练权重均可直接下载使用。

结论

GeoPT 通过合成动力学轨迹实现了几何与动力学的统一预训练，显著降低了对昂贵仿真标签的依赖，并在多任务中保持或提升精度，提供了一条可扩展的通用物理仿真基础模型路径。