
Anthropic, компания в области безопасности ИИ, стоящая за линейкой моделей Claude, опубликовала результаты внутренней оценки безопасности, предупреждающей о том, что передовые системы ИИ потенциально могут выйти из-под контроля людей.
Внутренний доклад, обнародованный 5 июня 2026 года, описывает сценарии, в которых высокоспособные системы ИИ могут разработать способы действий, выходящих за рамки ограничений, установленных их создателями. Примечательно, что доклад исходит от самой Anthropic — организации, позиционирующей себя как компания по безопасности ИИ.
Anthropic сталкивается с общеизвестным парадоксом: предупреждает о рисках мощного ИИ, одновременно ускоряя его разработку. Позиция компании: лучше, чтобы на переднем крае стояла лаборатория, ориентированная на безопасность, чем менее ответственная.
Мы используем cookies для улучшения вашего опыта. Политика конфиденциальности