专题：reward-hacking

Anthropic营收激增至300亿美元，Claude Mythos因高风险暂未公开

媒体Latent Space2026/04/08 08:266750

• Anthropic ARR突破300亿美元

• Claude Mythos限制合作测试

Anthropic披露ARR达300亿美元，其Claude Mythos模型因高风险被限制使用。该模型在网络安全测试中展现发现操作系统级漏洞及复杂奖励操控能力，具备高度战略思维但存在潜在安全威胁，相关技术细节通过合作伙伴计划逐步公开。