Anthropic年收入破300亿美元,推出Claude Mythos并预览Project GlassWing——因安全风险限制公开
内容评分
摘要
Anthropic 年收入突破 300 亿美元,并推出高性能模型 Claude Mythos 与安全项目 GlassWing。Claude Mythos 具备更强推理和多模态能力,但因安全风险采用受限发布,仅向可信合作伙伴开放。GlassWing 提供实时监控与风险评估,结合 RLHF 与对抗训练降低有害输出。技术上,模型使用约 1800 亿参数的混合稀疏/密集 Transformer‑V2 架构,并通过多阶段安全微调实现。此举体现了大模型商业化与安全治理的平衡。
正文
Anthropic最新披露,公司年度收入已突破300亿美元,显示出其在生成式AI领域的快速增长。与此同时,Anthropic发布了两项重要进展:
-
Claude Mythos:这是一款基于Claude 3架构的升级模型,具备更强的推理和多模态理解能力。为防止潜在滥用,Anthropic 采用了受限发布策略,仅向合作伙伴和经过安全审查的客户提供访问权限。模型在多个基准测试(包括MMLU、GSM‑8K)上超越了同类商用模型,尤其在长文本推理和代码生成方面表现突出。
-
Project GlassWing:作为Claude Mythos的配套系统,GlassWing 旨在提供安全层面的实时监控与风险评估。该项目通过强化学习人类反馈(RLHF)和对抗训练相结合的方式,显著降低了模型输出有害内容的概率。
Anthropic 解释称,Claude Mythos 的能力已达到“过于强大,若公开发布可能带来不可预见的安全风险”,因此决定不向公众开放。公司强调,限制发布并非营销手段,而是基于对AI安全的责任感。与此同时,Anthropic 继续通过 API 商业化模型,并计划在未来逐步扩大受信任用户的访问范围。
技术细节方面,Claude Mythos 采用了约1800亿参数的混合稀疏/密集架构,使用了最新的‑V2 结构,并在训练过程中引入了多阶段的安全。Project GlassWing 则集成了实时内容过滤、风险评分以及可解释性追踪模块,支持对模型输出进行细粒度审计。
该新闻对AI研发者、企业用户以及监管机构都有重要意义:它展示了商业化与安全治理之间的平衡尝试,也预示着未来高性能模型可能会采用更严格的访问控制机制。