专题：formal-verification

按该标签聚合的大模型资讯列表（自动分类与标签提取）。共 6 篇文章。

GLM-5.1模型突破长时任务处理，AI代码优化与形式化验证新进展

媒体SuperTechFans2026/04/08 07:455840

• GLM-5.1提升长时任务处理

• AI优化代码生成效率

本文汇总2026年4月8日Hacker NewsAI领域重点资讯，涵盖GLM-5.1模型的长时任务处理能力、AI代码优化工具的性能提升、形式化验证技术的漏洞发现效率突破，以及Ghost Pepper语音转文字应用的本地化部署特性。核心亮点包括模型架构创新、代码工程自动化、安全验证技术革新和隐私保护方案。

AI模型代码生成形式化验证语音转文字本地部署

陶哲轩谈AI与科学融合：打造可验证的科研工具

原文

媒体量子位2026/03/14 14:346840

• AI需具备可验证性与可解释性

• 推动跨学科与产业界合作

陶哲轩与Chuck NG发起SAIR Foundation，推动AI与科学融合。他们强调AI需具备可验证性和可解释性，同时促进跨学科合作。AI将改变科研模式，但需平衡其使用与人类核心能力。

可解释性跨学科协作科研工具 AI普惠化 AI与科学融合

AI Agent Gauss一周内独立形式化菲尔兹奖级数学成果，20万行Lean代码公开

原文

媒体量子位2026/03/03 18:286950

AI Agent Gauss在短短一周内独立完成了2022年菲尔兹奖得主Maryna Viazovska关于8维和24维最优球体堆积问题的形式化证明。这项由Math Inc.开发的AI，仅用5天就完成了8维部分的验证，并在一周内生成了约20万行Lean代码，成为史上最大规模的单一目的Lean形式化项目。Gauss不仅大幅缩短了原需数月的工作量，还自主发现并…

AI代理形式化验证数学 Lean 证明助手

AI模型首次挑战“First Proof”数学难题：实验与初步成果

原文

官方OpenAI News2026/02/20 22:304640

团队在“First Proof”数学挑战中首次提交了基于大语言模型的自动证明实验。通过微调 GPT‑4‑Turbo 并使用链式思考提示，模型在 10 条高阶定理中生成了 3 份形式化草稿，其中 1 份在 Coq 中通过基本检查。实验展示了模型在推理速度上的优势，但在逻辑严谨性和跨领域概念掌握上仍有显著不足，后续将引入交互式定理证明器进行闭环优化。

AI数学大语言模型自动证明研究级推理形式化验证

Lean 4：定理证明器如何赋能AI，成为智能推理与形式化验证新基石

原文

社区Hacker News2026/02/17 20:585370

Lean 4是一款先进的交互式定理证明器，专注于自动化验证数学定理的正确性。它在人工智能领域展现出显著的竞争优势，能够高效处理复杂的数学问题，大幅减少人工验证的工作量，从而显著提升AI研究与开发的效率。其核心亮点在于通过严谨的形式化验证，确保AI算法和模型的数学基础无懈可击，进而提升系统的可靠性与可信度。Lean 4不仅促进了数学理论与AI技术的协同发展，…

定理证明器形式化验证人工智能逻辑推理 Lean 4

意图封装：追求完备性证明，而非仅正确性

原文

媒体Lobsters AI2026/01/26 23:384870

本文提出意图封装（Intent Envelope）的概念，强调在AI系统设计中需追求完备性证明而非仅正确性。通过形式化方法确保系统能处理所有可能的输入意图，提升模型的鲁棒性和可解释性。核心亮点在于对逻辑验证理论的深入探讨及其在AI领域的潜在应用价值。