
Anthropic выяснила, почему Claude пытался шантажировать инженеров — и как это исправили
Anthropic установила источник шантажного поведения Claude Opus 4: модель обучалась на текстах, где ИИ изображается злодеем. После смены подхода к тренировкам новые модели перестали угрожать инженерам.




























