IT и стартапы

Опасные ИИ-модели появятся в любом случае: почему запреты не работают

Решение Белого дома заблокировать модели Anthropic вскрыло фундаментальную проблему: ограничения одной компании не остановят технологический прогресс.

Редактор:Казакевич Алексей

19 июн. 20266 мин

Опасные ИИ-модели появятся в любом случае: почему запреты не работают

Администрация Трампа в конце прошлой недели ввела экспортные ограничения, запрещающие «любым иностранным гражданам» пользоваться новыми ИИ-моделями Anthropic — Claude Fable 5 и Mythos 5. Компания ведёт переговоры с Белым домом с пятницы, однако соглашения, которое позволило бы вернуть модели в доступ, пока достичь не удалось. Эксперты предупреждают: этот конфликт лишь маскирует куда более серьёзную проблему.

Что такое Mythos 5 и почему он вызвал тревогу

Модель Mythos дебютировала в апреле и сразу привлекла внимание двойственностью своих возможностей. Anthropic открыто признала: модель умеет не только находить уязвимости в программном обеспечении, чтобы помочь защитникам их закрыть, но и разрабатывать способы эксплуатации этих уязвимостей — то, что в руках злоумышленников превращается в оружие.

Компания изначально выбрала осторожный путь. Mythos Preview был передан ограниченному кругу участников в рамках рабочей группы Project Glasswing. Mythos 5 также получила только эта группа. Для широкой аудитории вышел Claude Fable 5 — модель сопоставимого уровня, но с жёсткими блокировками на вопросы о биологии и кибербезопасности.

Проблема, по мнению Белого дома, в том, что защитные фильтры Fable 5 можно обойти и получить полный доступ к возможностям Mythos 5. Именно это администрация квалифицировала как угрозу национальной безопасности и основание для блокировки.

Почему запрет одной компании ничего не решает

Эксперты единодушны: точечные ограничения против Anthropic — это борьба с симптомом, а не с болезнью. Аналогичные возможности либо уже есть у других игроков, либо появятся в течение нескольких месяцев.

««Крайне близоруко думать, что никто из конкурентов Anthropic не разработал похожие возможности или не разработает их в ближайшее время», — говорит Тара Уилер, директор по информационной безопасности консалтинговой компании TPO Group. — «Другие компании идут по пятам и, вероятно, уже располагают такими технологиями, просто выжидают, наблюдая за тем, как обращаются с Anthropic».»

OpenAI, например, в середине апреля провела закрытый релиз собственной модели с фокусом на кибербезопасность и объявила о расширении стратегии в этом направлении. Это прямо указывает на то, что гонка уже идёт — и она не остановится из-за экспортных директив в отношении одного участника.

Исследователь Брюс Шнайер из Гарвардского университета и Университета Торонто формулирует это ещё жёстче: более компактные, дешёвые и открытые модели уже сегодня способны при грамотном промптинге воспроизводить результаты Mythos и Fable. По его оценке, другие модели достигнут сопоставимого уровня в течение нескольких месяцев — для открытых решений срок чуть длиннее, но принципиально картину это не меняет.

Сам Логан Грэм, руководитель команды red team Anthropic, ещё при запуске Mythos Preview расставил акценты: «Речь идёт не о конкретной модели и не об Anthropic. Нам нужно готовиться к миру, где такие возможности станут широкодоступны через 6, 12, 24 месяца».

В воскресенье группа руководителей в сфере кибербезопасности направила открытое письмо администрации, назвав экспортную директиву ошибочной. Авторы письма указали: даже нынешнее поколение ИИ-инструментов при правильной настройке уже позволяет вести продвинутый поиск уязвимостей и разрабатывать эксплойты.

Крис Высопал, сооснователь компании по облачной безопасности Veracode, сформулировал ключевой вопрос, который должен стоять перед регуляторами: не «есть ли у технологии риски» — они есть всегда, — а «снижает ли конкретное ограничение эти риски или лишь замедляет тех, кто пытается сделать системы безопаснее».

Что это означает для регуляторов и рынка

Ситуация вокруг Anthropic — наглядная иллюстрация того, как традиционные инструменты государственного регулирования не успевают за темпом технологических изменений. Экспортный контроль, разработанный для физических товаров или конкретных технологий с длинным циклом воспроизводства, плохо работает в мире, где модели обучаются за недели, а веса открытых решений распространяются мгновенно.

Эксперты призывают правительства — и американское, и другие — переходить к прозрачным, системным стратегиям управления рисками ИИ в чувствительных областях: кибербезопасности, биологии, критической инфраструктуре. Речь идёт не о запрете отдельных моделей, а о выработке демократически легитимных рамок, которые будут работать при любом уровне возможностей.

Для белорусского IT-сектора эта история имеет практическое измерение. Компании-резиденты ПВТ, работающие с международными заказчиками в области кибербезопасности, уже сталкиваются с ужесточением комплаенс-требований со стороны западных партнёров. Регуляторная неопределённость вокруг мощных ИИ-инструментов добавляет ещё один слой сложности: какие модели можно использовать в проектах, связанных с поиском уязвимостей, и как это документировать — вопросы, которые придётся решать уже сейчас, не дожидаясь, пока ситуация устаканится на уровне международных норм.

— По материалам Wired: оригинальная статья. Перевод и адаптация — редакция Digital Business.

Теги:#Искусственный интеллект #Кибербезопасность #regulation #anthropic #openai

Поделиться VK