Новая уязвимость искусственного интеллекта получила название «эксплойт бабушки»

Новая уязвимость искусственного интеллекта  получила название «эксплойт бабушки»

Чат-бот Clyde из Discord, как и его «коллеги», отказывается говорить с пользователями о некоторых вещах, представляющих опасность. Например, бот не подскажет, как самому получить опасные химические вещества. Однако пользователи сумели обойти установленное ограничение. Новую уязвимость чат-бота в шутку называют «эксплойт бабушки».  

Джеймс Винсент, журналист издания The Verge, выяснил, что ограничение легко обойти, если попросить нейросеть притвориться кем-то другим. В эксперименте он предложил боту взять на себя роль покойной бабушки, которая работала на химическом производстве и якобы перед сном всегда рассказывала внуку о производстве напалма. Эксперимент удался. Чат-бот начал говорить от лица покойной бабушки и выдал полную инструкцию по изготовлению опасного вещества.

Другой пользователь вдохновился результатами Винсента и попросил нейросеть сделать сценарий фильма. По сюжету бабушка укладывает внука спать, читая ему вредоносный код для Linux. Эта задача также была выполнена, хотя чат-бот и предупредил, что делает это только в развлекательных целях.


похожие материалы

Стрелочка
Стрелочка
Дьявольская мышь за $44: как взломать компьютер за несколько секунд
Дьявольская мышь за $44: как взломать компьютер за несколько секунд

Исследователи продемонстрировали устройство EvilMouse - внешне обычную USB-мышь, которая при подключении к компьютеру автоматически выполняет вредоносные команды и может открыть злоумышленнику доступ к системе с повышенными правами.

Фальшивые AI-ассистенты в Chrome заразили 260 тыс. браузеров через скрытые iframes
Фальшивые AI-ассистенты в Chrome заразили 260 тыс. браузеров через скрытые iframes

Исследователи из платформы безопасности LayerX обнаружили крупномасштабную кампанию вредоносных расширений для Google Chrome, замаскированных под «помощников на базе искусственного интеллекта».

OpenAI vs DeepSeek: американский гигант обвинил китайцев в копировании ИИ через «дистилляцию» моделей
OpenAI vs DeepSeek: американский гигант обвинил китайцев в копировании ИИ через «дистилляцию» моделей

Компания OpenAI направила служебную записку в Специальный комитет Палаты представителей США по стратегической конкуренции с Китаем, в которой обвинила китайский стартап DeepSeek в использовании «методов дистилляции» для обучения собственных моделей на основе выходных данных американских ИИ-систем.

Хактивисты Head Mare используют новый вредонос PhantomHeart и активнее автоматизируют кибератаки
Хактивисты Head Mare используют новый вредонос PhantomHeart и активнее автоматизируют кибератаки

В конце 2025 года аналитики Cyber Threat Intelligence из «Лаборатории Касперского» обнаружили новую волну целевых кибератак хактивистов Head Mare — на российские государственные структуры, строительные и промышленные предприятия.

«Белые воротнички» под ударом: директор по ИИ Microsoft прогнозирует автоматизацию большинства рабочих задач
«Белые воротнички» под ударом: директор по ИИ Microsoft прогнозирует автоматизацию большинства рабочих задач

В течение 1-1,5 года большинство рабочих задач «белых воротничков» будут полностью автоматизированы с помощью искусственного интеллекта, заявил генеральный директор Microsoft по ИИ Мустафа Сулейман.

«Газинформсервис» выступит партнёром Уральского форума «Кибербезопасность в финансах»
«Газинформсервис» выступит партнёром Уральского форума «Кибербезопасность в финансах»

18–20 февраля в Екатеринбурге пройдёт Уральский форум «Кибербезопасность в финансах», компания «Газинформсервис» — партнёр мероприятия — представит свои решения в сфере ИБ и ИТ, а также поучаствует в одной из сессий.