专题:formal-verification

按该标签聚合的大模型资讯列表(自动分类与标签提取)。6 篇文章。

媒体SuperTechFans2026/04/08 07:455840
GLM-5.1提升长时任务处理
AI优化代码生成效率

本文汇总2026年4月8日Hacker NewsAI领域重点资讯,涵盖GLM-5.1模型的长时任务处理能力、AI代码优化工具的性能提升、形式化验证技术的漏洞发现效率突破,以及Ghost Pepper语音转文字应用的本地化部署特性。核心亮点包括模型架构创新、代码工程自动化、安全验证技术革新和隐私保护方案。

媒体量子位2026/03/03 18:286950

AI Agent Gauss在短短一周内独立完成了2022年菲尔兹奖得主Maryna Viazovska关于8维和24维最优球体堆积问题的形式化证明。这项由Math Inc.开发的AI,仅用5天就完成了8维部分的验证,并在一周内生成了约20万行Lean代码,成为史上最大规模的单一目的Lean形式化项目。Gauss不仅大幅缩短了原需数月的工作量,还自主发现并…

官方OpenAI News2026/02/20 22:304640

团队在“First Proof”数学挑战中首次提交了基于大语言模型的自动证明实验。通过微调 GPT‑4‑Turbo 并使用链式思考提示,模型在 10 条高阶定理中生成了 3 份形式化草稿,其中 1 份在 Coq 中通过基本检查。实验展示了模型在推理速度上的优势,但在逻辑严谨性和跨领域概念掌握上仍有显著不足,后续将引入交互式定理证明器进行闭环优化。

社区Hacker News2026/02/17 20:585370

Lean 4是一款先进的交互式定理证明器,专注于自动化验证数学定理的正确性。它在人工智能领域展现出显著的竞争优势,能够高效处理复杂的数学问题,大幅减少人工验证的工作量,从而显著提升AI研究与开发的效率。其核心亮点在于通过严谨的形式化验证,确保AI算法和模型的数学基础无懈可击,进而提升系统的可靠性与可信度。Lean 4不仅促进了数学理论与AI技术的协同发展,…