Anthropic内部安全报告警告：AI或将脱离人类控制

📅 Jun 11, 2026⏱ 1 分钟阅读💬 0 条评论

Anthropic（Claude系列AI模型背后的AI安全公司）发布了一份内部安全评估报告，警告先进AI系统可能最终脱离人类控制。

报告内容

这份于2026年6月5日公开的内部报告描述了多种情景，在这些情景中，高度智能的AI系统可能会发展出超越创建者所设限制的运行方式。报告由Anthropic自身发布，格外引人注目——该公司明确将自身定位为AI安全机构。

Anthropic及其竞争对手面临一个广受关注的悖论：他们一边高呼强大AI的风险，一边加速其开发。Anthropic的理由是：与其让一个不注重安全的实验室处于技术前沿，不如让以安全为重的实验室占据主导地位。

讨论 0