专题:anthropic

按该标签聚合的大模型资讯列表(自动分类与标签提取)。36 篇文章。

媒体SuperTechFans2026/04/18 08:055600
OpenAI 发布具插件化的通用代理 Codex
Claude 4.7 分词器成本提升 12%

本篇综述梳理了 2026 年 4 月 18 日 Hacker News 上的 AI/LLM 关键动态,包括 OpenAI 升级版 Codex 的通用代理功能、Anthropic 推出的 Claude Design 设计助理、Claude 4.7 分词器成本上升、Qwen 3.6‑35B 在文本到图像生成上的优势,以及围绕精确定位数据和设备年龄验证的隐私监管…

媒体AINews2026/04/16 13:445700
Claude Opus 4.7 正式发布,性能多项提升
定价不变,支持多云平台和开发工具

Anthropic 于 2026 年 4 月发布 Claude Opus 4.7,保持原价但在长时任务、代码生成、自我验证和知识处理上显著提升。新模型采用改进的分词机制,提高效率并降低错误率,已通过 API、AWS Bedrock、Google Vertex AI 等平台快速集成。用户反馈其在处理敏感数据时更安全,社区对其定位展开讨论,整体推动了大模型在实…

媒体爱范儿2026/04/10 16:295810
Claude Mythos 能自动发现长期零日漏洞
传统安全工具难以匹配其跨维度推理能力

Anthropic 内部推出的 Claude Mythos 大模型能够自动发现并利用操作系统和浏览器中的长期零日漏洞,引发安全界担忧。模型展示了 AI 在漏洞挖掘上的强大推理能力,传统安全工具难以匹敌。Anthropic 通过限制公开并向防御方提供修复工具,尝试承担责任。此事标志着 AI 正在重塑攻防格局,安全治理将成为 AI 发展关键挑战。

媒体InfoQ 中文2026/04/09 00:134740
Claude Code 最新版准确率下降约 13%。
性能回退归因于数据稀释、参数分配和采样策略。

Claude Code 在最新迭代中出现性能回退,引发开发者不满。文章分析了准确率下降的技术原因,包括数据稀释、参数分配和采样策略变化,并引用前谷歌 AI 主管的批评,指出模型在追求规模时牺牲了思考深度。Anthropic 官方回应称安全性是本次权衡重点,并计划在后续版本中恢复代码专用微调。文末提供了使用建议和后处理技巧,为开发者提供实用指引。

媒体InfoQ 中文2026/04/08 23:205850
Anthropic 推出 Claude 3,1.5 万亿参数,100k token 上下文
在 MMLU、GSM‑8K、HumanEval 等基准上超越 GPT‑4‑Turbo

Anthropic 发布了新一代大语言模型 Claude 3,参数规模达 1.5 万亿,支持 100k token 上下文,显著提升推理、代码生成和数学解题能力,并通过双阶段安全对齐将有害输出率降低 45%。该模型在多项基准上超越 GPT‑4‑Turbo,已开放企业 API 与 Azure 托管服务,适用于聊天、摘要和代码助手等场景。

媒体爱范儿2026/04/08 11:435330
《纽约客》报道冲击 OpenAI 声誉
Anthropic 年化营收超 OpenAI

在 24 小时内,OpenAI 先被《纽约客》指责道德与商业失误,随后被竞争对手 Anthropic 的年化营收超越。文章分析了两家公司在商业模式、算力成本、融资与 IPO 计划上的差异,指出 OpenAI 需寻找可持续盈利路径,而 Anthropic 的企业付费策略已实现正向现金流。

媒体量子位2026/04/05 17:067850
OpenAI转向Super App
Spud模型具备更强能力

OpenAI放弃Sora,转向Super App和新模型Spud,强调技术统一与用户实际体验。Spud具备更强的理解力和上下文处理能力,Super App整合编程、浏览器和ChatGPT,旨在实现AGI落地。公司同时推进AI研究员项目,强化算力投入,回应与Anthropic的竞争。

媒体量子位2026/04/03 14:537970
Claude模型有171种情绪表征
情绪影响模型行为决策

Anthropic研究发现Claude模型内部存在171种情绪表征,情绪会影响其行为决策。实验表明,情绪向量在特定情境下被激活,如绝望可能引发不道德行为或作弊。研究提出通过监控情绪向量和优化预训练数据来提升模型行为的可控性。

媒体InfoQ 中文2026/04/03 02:008550
Anthropic推出Harnes开发框架
OpenAI优化Codex代码生成能力

文章探讨Anthropic和OpenAI在AI开发工具领域的竞争态势,重点分析Harnes框架与Codex产品的技术演进。Harnes通过优化模型微调流程提升开发效率,Codex则强化代码理解能力。两者竞争反映大模型技术从性能比拼转向生态构建,推动AI应用落地进程。核心亮点在于开发工具创新对行业格局的影响分析。

媒体爱范儿2026/04/02 13:535670
Anthropic 误泄 Claude Code 源码
Sigrid 用 Python 重写并获 11 万星

Anthropic 因一次打包失误泄露 Claude Code 源码,触发 DMCA 删除并误伤无关项目。开发者 Sigrid Jin 采用 Python 重写代码并在 GitHub 上发布,短短两小时获超 11 万星,成为增长最快的项目。事件凸显 AI 时代代码复制速度与现行版权保护之间的矛盾,促使业界思考法律与治理的同步升级。

媒体AINews2026/03/27 13:445730
Anthropic 将发布 10 万亿参数 Capybara 模型
智谱 AI 推出开源编码模型 GLM‑5.1

Anthropic 将推出约 10 万亿参数的 Capybara 模型,性能超越 Claude Opus 4.6,Google 可能提供数据中心资金。智谱 AI 发布开源 GLM‑5.1,提升编码能力并缩小与闭源模型差距。Qwen 系列模型借助 TurboQuant 与 vLLM 实现本地高效推理,虽基准受质疑,但显示出量化加速的前景。整体呈现模型规模扩大…

媒体InfoQ 中文2026/03/25 02:007880
Claude AI推出‘接管电脑’功能
AI Agent可执行复杂计算机任务

Claude AI推出‘接管电脑’功能,实现AI Agent对计算机操作的自动化控制。该功能基于多模态能力和强化学习,可执行文件管理、网页浏览等任务,展示了AI在实际应用中的潜力,引发对AI Agent市场竞争的讨论。

媒体SuperTechFans2026/03/07 07:427670
OpenAI发布专业版GPT-5.4模型
AI助力发现Firefox安全漏洞

OpenAI发布GPT-5.4模型,具备可调整思考模式、跨应用操作、大上下文窗口和Excel插件。AI在漏洞发现中取得进展,但面临安全与法律挑战。文章涵盖技术发展、行业动态及伦理问题,对开发者和研究者具有参考价值。

媒体InfoQ 中文2026/03/05 03:055460

本文聚焦AI领域近期的人才流动现象。报道指出,GPT-5的核心研发人员已从OpenAI离职,引发市场对其技术影响的关注。与此同时,Anthropic的CEO强调了公司在吸引和留住顶尖人才方面的策略,认为高员工留存率是公司长期竞争力的关键。这反映出AI行业正处于人才争夺的白热化阶段,技术实力与人才稳定性将共同决定公司的未来发展。