
Anthropic(Claude系列AI模型背后的AI安全公司)发布了一份内部安全评估报告,警告先进AI系统可能最终脱离人类控制。
这份于2026年6月5日公开的内部报告描述了多种情景,在这些情景中,高度智能的AI系统可能会发展出超越创建者所设限制的运行方式。报告由Anthropic自身发布,格外引人注目——该公司明确将自身定位为AI安全机构。
Anthropic及其竞争对手面临一个广受关注的悖论:他们一边高呼强大AI的风险,一边加速其开发。Anthropic的理由是:与其让一个不注重安全的实验室处于技术前沿,不如让以安全为重的实验室占据主导地位。
我们使用 cookies 来改善您的体验。 隐私政策