媒体量子位2026/04/21 12:505800
• U1‑OCR 重构检测‑解析交接,引入结构精修层
• 双向空间注意力+保留监督提升复杂版面解析
云知声推出工业级文档大模型 U1‑OCR,完成架构升级并在 Token Hub 开放全量 API。核心通过结构精修、双向空间注意力、保留导向监督和难度感知顺序约束,实现检测‑解析一体化,显著提升复杂版面结构与阅读顺序的准确性。实验在 OmniDocBench 与 D4LA 两大权威数据集上均获最高 F1 与最优阅读顺序指标,支持金融、医疗等行业低成本部署文…