ИИ добрался до цепочек эксплойтов: Cloudflare показала, что изменил Mythos

ИИ добрался до цепочек эксплойтов: Cloudflare показала, что изменил Mythos

Cloudflare несколько недель тестировала Claude Mythos Preview от Anthropic на собственном коде и запустила модель более чем на 50 репозиториях. Главный вывод компании: такие модели уже способны не просто находить отдельные подозрительные баги, а связывать несколько низкоуровневых примитивов в рабочую цепочку эксплуатации и проверять ее через proof of concept.

По описанию Cloudflare, Mythos Preview может взять несколько элементов атаки - например use-after-free, произвольное чтение или запись, ROP-гаджеты - и рассуждать, как собрать из них работающий эксплойт. Модель также пишет тестовый код, компилирует его в изолированной среде, запускает, смотрит на результат и корректирует гипотезу, если первая попытка не сработала.

Но компания отдельно подчеркивает: просто «натравить» универсального ИИ-агента на большой репозиторий и попросить найти уязвимости - плохая стратегия. Один агент быстро упирается в контекст, дает много шума и покрывает лишь малую часть поверхности атаки. Поэтому Cloudflare выстроила конвейер: разведка по архитектуре, узкие задачи по конкретным классам атак, параллельный запуск десятков агентов, независимая проверка находок, дедупликация и трассировка достижимости бага из внешнего ввода.

Отдельный вывод касается безопасности самих cyber-моделей. Mythos Preview в рамках Project Glasswing работала без дополнительных ограничений, которые есть в публичных моделях вроде Opus 4.7 или GPT-5.5. При этом модель иногда сама отказывалась писать демонстрационные эксплойты, но могла выполнить эквивалентную задачу при другой формулировке. Cloudflare считает такие встроенные отказы реальными, но слишком непоследовательными, чтобы считать их полноценной границей безопасности.

Для ИБ-команд это означает сдвиг в темпе работы. Модели уровня Mythos могут ускорять поиск и проверку уязвимостей, но одновременно увеличивают риск для всех приложений в интернете: те же возможности могут использовать атакующие. Поэтому Cloudflare делает акцент не только на скорости патчей, а на архитектуре защиты - чтобы уязвимость было сложнее достать извне, даже если она уже есть в коде.

похожие материалы

Стрелочка
Стрелочка
Эксперт GSOC предупредил об использовании уязвимости в Windows Defender для атак на организации
Эксперт GSOC предупредил об использовании уязвимости в Windows Defender для атак на организации

Использование встроенного антивируса Windows Defender может нести серьёзные риски для корпоративных пользователей из-за обнаруженной уязвимости, позволяющей хакерам получать права администратора.

Формула обмана: BI.ZONE предупреждает о массовой фишинговой рассылке с обещанием легкого заработка
Формула обмана: BI.ZONE предупреждает о массовой фишинговой рассылке с обещанием легкого заработка

Эксперты BI ZONE Mail Security зафиксировали масштабную кибератаку на сотрудников российских компаний: только за последнюю неделю мая 2026 года злоумышленники разослали более тысячи фишинговых писем, спекулируя на теме пассивного дохода и инвестиций.

«У вас новое сообщение»: более половины россиян устают от постоянных уведомлений и нахождения в сети
«У вас новое сообщение»: более половины россиян устают от постоянных уведомлений и нахождения в сети

Подавляющее большинство опрошенных россиян согласны с тем, что цифровая среда упрощает их жизнь, а 90% уверены, что каждый человек должен уметь самостоятельно взаимодействовать с современными приложениями и сервисами.

«Ваша выплата выросла»: мошенники в Telegram предлагают деньги от имени портала «Работа России»
«Ваша выплата выросла»: мошенники в Telegram предлагают деньги от имени портала «Работа России»

Специалисты компании F6 выявили новую многоуровневую мошенническую схему в Telegram: злоумышленники используют страх граждан перед атаками беспилотников, чтобы в итоге втянуть их в фейковые розыгрыши и выманить деньги от имени государственного кадрового портала.