Cloudflare несколько недель тестировала Claude Mythos Preview от Anthropic на собственном коде и запустила модель более чем на 50 репозиториях. Главный вывод компании: такие модели уже способны не просто находить отдельные подозрительные баги, а связывать несколько низкоуровневых примитивов в рабочую цепочку эксплуатации и проверять ее через proof of concept.
По описанию Cloudflare, Mythos Preview может взять несколько элементов атаки - например use-after-free, произвольное чтение или запись, ROP-гаджеты - и рассуждать, как собрать из них работающий эксплойт. Модель также пишет тестовый код, компилирует его в изолированной среде, запускает, смотрит на результат и корректирует гипотезу, если первая попытка не сработала.
Но компания отдельно подчеркивает: просто «натравить» универсального ИИ-агента на большой репозиторий и попросить найти уязвимости - плохая стратегия. Один агент быстро упирается в контекст, дает много шума и покрывает лишь малую часть поверхности атаки. Поэтому Cloudflare выстроила конвейер: разведка по архитектуре, узкие задачи по конкретным классам атак, параллельный запуск десятков агентов, независимая проверка находок, дедупликация и трассировка достижимости бага из внешнего ввода.
Отдельный вывод касается безопасности самих cyber-моделей. Mythos Preview в рамках Project Glasswing работала без дополнительных ограничений, которые есть в публичных моделях вроде Opus 4.7 или GPT-5.5. При этом модель иногда сама отказывалась писать демонстрационные эксплойты, но могла выполнить эквивалентную задачу при другой формулировке. Cloudflare считает такие встроенные отказы реальными, но слишком непоследовательными, чтобы считать их полноценной границей безопасности.
Для ИБ-команд это означает сдвиг в темпе работы. Модели уровня Mythos могут ускорять поиск и проверку уязвимостей, но одновременно увеличивают риск для всех приложений в интернете: те же возможности могут использовать атакующие. Поэтому Cloudflare делает акцент не только на скорости патчей, а на архитектуре защиты - чтобы уязвимость было сложнее достать извне, даже если она уже есть в коде.