专题:code-generation

按该标签聚合的大模型资讯列表(自动分类与标签提取)。67 篇文章。

媒体InfoQ 中文2026/04/19 18:006500
AI Agent深度集成开发环境
重构传统IDE交互架构

Cursor 3作为AI驱动的开发工具,推出智能体优先界面重构传统IDE交互模式。通过模块化布局和自然语言交互,实现代码生成、调试辅助、实时协作等功能整合。核心亮点在于将AI Agent深度嵌入开发流程,提升代码编写效率和问题解决能力,已通过测试验证实际应用效果。

媒体InfoQ 中文2026/04/18 00:015800
知识蒸馏整合工程师经验
百万行代码自动化生成

OpenAI开发skill系统,利用知识蒸馏技术将工程师经验注入代码生成模型。该系统能自动化生成百万行代码,通过提取专家编码模式提升代码质量与效率。核心亮点在于将人类决策过程模块化,实现代码生成的结构化优化,为AI辅助编程提供技术范式。

媒体AINews2026/04/16 13:445700
Claude Opus 4.7 正式发布,性能多项提升
定价不变,支持多云平台和开发工具

Anthropic 于 2026 年 4 月发布 Claude Opus 4.7,保持原价但在长时任务、代码生成、自我验证和知识处理上显著提升。新模型采用改进的分词机制,提高效率并降低错误率,已通过 API、AWS Bedrock、Google Vertex AI 等平台快速集成。用户反馈其在处理敏感数据时更安全,社区对其定位展开讨论,整体推动了大模型在实…

媒体David Heinemeier Hansson2026/04/15 23:066400
AI降低开源代码修改门槛
实现系统级个性化定制

本文探讨AI如何降低开源软件定制门槛,实现开放源代码的初衷。通过代码生成与理解技术,非技术用户可轻松修改应用功能,程序员也能更高效进行系统改造。重点分析Linux系统已实现的可塑性优势,对比Windows/macOS的封闭性限制,并指出该技术将推动操作系统向高度可定制方向发展。

媒体AINews2026/04/13 13:443700
多代理系统化与工程管理成关键能力
Claude Mythos 与 Gemma‑4 展示安全与 OCR 进展

本篇综述梳理了近期 AI 领域的关键技术动态,包括多代理工作流的系统化趋势、Codex 在代码管理中的实践、Claude Mythos 与 Gemma‑4 的安全与 OCR 表现、本地模型的隐私优势以及 OpenRouter 新模型 Elephant Alpha 的发布与评估,兼顾社区舆情与行业安全讨论,为技术从业者提供实用情报。

媒体量子位2026/04/12 15:005800
Claude 逆向 30 年前自定义脚本语言
一周末生成 Go/React/MongoDB 全栈复刻版

Claude Code 通过逆向自定义脚本语言,仅凭几份历史资料在一个周末重建了 1992 年的文字 MUD《未来往昔传奇》。AI 解析了 DOS 编码、隐式块结束和跨命名空间变量等语言特性,生成 Go 服务器、React 前端和 MongoDB 持久化,实现完整复刻并上线。此案例展示了 AI 在旧技术逆向、语言重构和全栈代码生成方面的强大潜力。

媒体InfoQ 中文2026/04/11 16:006700
多代理架构提升开发效率
代码生成与任务分解优化

Anthropic推出多代理编程工具Harness,通过代理协作重构AI开发流程。该产品支持代码生成、任务分解等核心功能,可提升开发效率并优化代码质量。其多代理架构设计和API集成能力是主要亮点,适用于自动化测试、代码审查等场景。

媒体InfoQ 中文2026/04/09 22:004720
Claude 3.5 Sonnet 成本低、时延快,准确率略低于 GPT‑4
多语言基准覆盖 Python、JS、Java、C#,提供 Pass@1 数据

InfoQ 对 Anthropic Claude 系列模型进行代码生成基准测试,覆盖 Python、JavaScript、Java、C# 四语言。评估指标包括 Pass@1、响应时延和每千字符成本,并与 GPT‑4、Gemini 等主流模型对比。结果显示 Claude 3.5 Sonnet 在成本和时延上具优势,准确率略逊于 GPT‑4;Claude 2.…

媒体InfoQ 中文2026/04/09 00:134740
Claude Code 最新版准确率下降约 13%。
性能回退归因于数据稀释、参数分配和采样策略。

Claude Code 在最新迭代中出现性能回退,引发开发者不满。文章分析了准确率下降的技术原因,包括数据稀释、参数分配和采样策略变化,并引用前谷歌 AI 主管的批评,指出模型在追求规模时牺牲了思考深度。Anthropic 官方回应称安全性是本次权衡重点,并计划在后续版本中恢复代码专用微调。文末提供了使用建议和后处理技巧,为开发者提供实用指引。

媒体SuperTechFans2026/04/08 07:455840
GLM-5.1提升长时任务处理
AI优化代码生成效率

本文汇总2026年4月8日Hacker NewsAI领域重点资讯,涵盖GLM-5.1模型的长时任务处理能力、AI代码优化工具的性能提升、形式化验证技术的漏洞发现效率突破,以及Ghost Pepper语音转文字应用的本地化部署特性。核心亮点包括模型架构创新、代码工程自动化、安全验证技术革新和隐私保护方案。

媒体AINews2026/04/07 13:444830
Anthropic 年收入超 300 亿美元
发布高性能模型 Claude Mythos,采用受限发布

Anthropic 年收入突破 300 亿美元,并推出高性能模型 Claude Mythos 与安全项目 GlassWing。Claude Mythos 具备更强推理和多模态能力,但因安全风险采用受限发布,仅向可信合作伙伴开放。GlassWing 提供实时监控与风险评估,结合 RLHF 与对抗训练降低有害输出。技术上,模型使用约 1800 亿参数的混合稀疏…

媒体InfoQ 中文2026/04/04 22:005750
AI Agent 实现需求‑代码‑测试全链路自动化
提供 Prompt、Tool‑Calling 与 CI 配置示例

本文系统阐述了 AI Agent 在软件工程规范化中的应用路径,涵盖需求解析、代码生成、自动化测试与审计闭环。通过实际案例展示了基于 LLM 的 Agent 编排如何提升开发效率、降低缺陷率,并提供了实现细节、工具选型与治理建议。

媒体Lobsters AI2026/04/04 21:343860
自蒸馏技术通过教师模型软标签指导学生模型训练
简化传统蒸馏流程,计算成本低且效果显著

本文提出一种极简自蒸馏技术,通过教师模型的软标签指导学生模型训练,显著提升代码生成质量。核心创新在于简化了传统蒸馏流程,仅需单向知识传递即可实现性能提升。实验在多个代码生成基准测试中验证了其有效性,尤其在处理复杂逻辑和长代码生成任务时表现优异。该技术的优势在于实现简单、计算成本低,且无需额外数据,为代码生成模型的优化提供了新思路。

媒体freeCodeCamp2026/04/02 03:265660
AI工具提升开发效率
涵盖GitHub Copilot等主流工具

本教程系统解析AI工具提升开发效率的实践方法,涵盖GitHub Copilot、Claude Code、Gemini CLI等主流AI编程助手,以及OpenClaw开源自动化和CodeRabbit代码审查工具。通过具体案例展示AI在代码生成、终端工作流优化和团队协作中的应用价值,为开发者提供可操作的本地AI助手搭建方案。

官方The GitHub Blog2026/04/01 00:007850
GitHub Copilot CLI构建代理
提示工程优化开发流程

本文探讨GitHub Copilot在代理驱动开发中的应用,通过CLI工具与Claude Opus 4.6模型构建自动化代理。实践显示该方法可显著提升开发效率,三天内完成11个代理和4项功能开发,代码质量优化率达93%。核心价值在于简化流程、增强协作、培养创新文化,为软件工程智能化提供新思路。

官方MongoDB Blog2026/03/31 21:006710
MongoDB发布Agent Skills及配套插件
解决编码代理数据库开发常见错误

MongoDB推出官方Agent Skills及插件,通过结构化指导和最佳实践提升AI编码代理的可靠性。解决代理在数据库开发中常见的规范化过度、索引策略不当等问题,支持主流开发工具集成,涵盖从连接管理到AI检索的全生命周期开发。技术亮点包括专业数据库设计策略、索引优化方法及操作安全措施,助力开发者实现更高效、更安全的代码生成。

媒体InfoQ 中文2026/03/26 18:006850
Stripe 使用 LLM 自动生成 PR
Minions 提高代码提交效率

Stripe 部署了基于 LLM 的自主智能体 Minions,用于自动化生成拉取请求。该工具显著提升了代码提交效率,展示了 AI 在工程实践中的落地应用。其核心亮点在于自动化分析与生成能力,以及与现有开发流程的无缝集成。

媒体freeCodeCamp2026/03/26 00:496880
GAN用于多智能体代码生成
生成与评审分离提升质量

本文提出利用GAN架构构建多智能体系统,实现代码生成与评审的分离,提升代码质量。通过生成器与判别器的对抗性反馈循环,系统能够在迭代中持续优化。文章结合Claude Forge项目,展示了具体实现方法,并分析了成本、效率和实施细节。