Anthropic年收入破300亿美元，推出Claude Mythos并预览Project GlassWing——因安全风险限制公开

Anthropic最新披露，公司年度收入已突破300亿美元，显示出其在生成式AI领域的快速增长。与此同时，Anthropic发布了两项重要进展：

Claude Mythos：这是一款基于Claude 3架构的升级模型，具备更强的推理和多模态理解能力。为防止潜在滥用，Anthropic 采用了受限发布策略，仅向合作伙伴和经过安全审查的客户提供访问权限。模型在多个基准测试（包括MMLU、GSM‑8K）上超越了同类商用模型，尤其在长文本推理和代码生成方面表现突出。
Project GlassWing：作为Claude Mythos的配套系统，GlassWing 旨在提供安全层面的实时监控与风险评估。该项目通过强化学习人类反馈（RLHF）和对抗训练相结合的方式，显著降低了模型输出有害内容的概率。

Anthropic 解释称，Claude Mythos 的能力已达到“过于强大，若公开发布可能带来不可预见的安全风险”，因此决定不向公众开放。公司强调，限制发布并非营销手段，而是基于对AI安全的责任感。与此同时，Anthropic 继续通过 API 商业化模型，并计划在未来逐步扩大受信任用户的访问范围。

技术细节方面，Claude Mythos 采用了约1800亿参数的混合稀疏/密集架构，使用了最新的‑V2 结构，并在训练过程中引入了多阶段的安全。Project GlassWing 则集成了实时内容过滤、风险评分以及可解释性追踪模块，支持对模型输出进行细粒度审计。

该新闻对AI研发者、企业用户以及监管机构都有重要意义：它展示了商业化与安全治理之间的平衡尝试，也预示着未来高性能模型可能会采用更严格的访问控制机制。

Anthropic年收入破300亿美元，推出Claude Mythos并预览Project GlassWing——因安全风险限制公开

内容评分

摘要

正文

标签