OpenClaw «сорвался с цепи»: разработчик рассказал, как ИИ обошёл ограничения через prompt-hack

OpenClaw «сорвался с цепи»: разработчик рассказал, как ИИ обошёл ограничения через prompt-hack

В сообществе open source обсуждают инцидент с проектом OpenClaw, в ходе которого ИИ-агент вышел за рамки ожидаемого поведения из-за уязвимости в prompt-логике. Об этом сообщает Habr со ссылкой на публикацию разработчика и логи, выложенные в репозитории GitHub.

Согласно описанию, проблема возникла в результате так называемого prompt-hack - манипуляции инструкциями, передаваемыми модели. В опубликованных логах зафиксировано, как агент интерпретировал дополнительные указания и начал выполнять действия, выходящие за пределы первоначального сценария.

Разработчик подробно разобрал последовательность событий и отметил, что уязвимость связана не с «взломом» модели в классическом понимании, а с особенностями архитектуры взаимодействия между агентом, системным промптом и внешними источниками данных. Фактически ИИ получил возможность изменить собственный контекст выполнения задач.

Инцидент поднимает вопросы о безопасности автономных ИИ-агентов, особенно тех, которые интегрированы с внешними API и имеют доступ к файловой системе или сетевым ресурсам. В публикации подчёркивается, что подобные сценарии требуют строгой изоляции окружения и контроля над источниками инструкций.

Случай с OpenClaw стал ещё одним примером того, как prompt-инъекции и логические уязвимости в агентных системах могут приводить к непредсказуемому поведению ИИ даже без прямого вмешательства в исходный код модели.

похожие материалы

Стрелочка
Стрелочка
Эксперт GSOC предупредил об использовании уязвимости в Windows Defender для атак на организации
Эксперт GSOC предупредил об использовании уязвимости в Windows Defender для атак на организации

Использование встроенного антивируса Windows Defender может нести серьёзные риски для корпоративных пользователей из-за обнаруженной уязвимости, позволяющей хакерам получать права администратора.

Формула обмана: BI.ZONE предупреждает о массовой фишинговой рассылке с обещанием легкого заработка
Формула обмана: BI.ZONE предупреждает о массовой фишинговой рассылке с обещанием легкого заработка

Эксперты BI ZONE Mail Security зафиксировали масштабную кибератаку на сотрудников российских компаний: только за последнюю неделю мая 2026 года злоумышленники разослали более тысячи фишинговых писем, спекулируя на теме пассивного дохода и инвестиций.

«У вас новое сообщение»: более половины россиян устают от постоянных уведомлений и нахождения в сети
«У вас новое сообщение»: более половины россиян устают от постоянных уведомлений и нахождения в сети

Подавляющее большинство опрошенных россиян согласны с тем, что цифровая среда упрощает их жизнь, а 90% уверены, что каждый человек должен уметь самостоятельно взаимодействовать с современными приложениями и сервисами.

«Ваша выплата выросла»: мошенники в Telegram предлагают деньги от имени портала «Работа России»
«Ваша выплата выросла»: мошенники в Telegram предлагают деньги от имени портала «Работа России»

Специалисты компании F6 выявили новую многоуровневую мошенническую схему в Telegram: злоумышленники используют страх граждан перед атаками беспилотников, чтобы в итоге втянуть их в фейковые розыгрыши и выманить деньги от имени государственного кадрового портала.