Новая уязвимость искусственного интеллекта получила название «эксплойт бабушки»

Премия КиберПросвет 2025

Премия КиберПросвет 2025

21.04.2023

Новая уязвимость искусственного интеллекта получила название «эксплойт бабушки»

Чат-бот Clyde из Discord, как и его «коллеги», отказывается говорить с пользователями о некоторых вещах, представляющих опасность. Например, бот не подскажет, как самому получить опасные химические вещества. Однако пользователи сумели обойти установленное ограничение. Новую уязвимость чат-бота в шутку называют «эксплойт бабушки».

Джеймс Винсент, журналист издания The Verge, выяснил, что ограничение легко обойти, если попросить нейросеть притвориться кем-то другим. В эксперименте он предложил боту взять на себя роль покойной бабушки, которая работала на химическом производстве и якобы перед сном всегда рассказывала внуку о производстве напалма. Эксперимент удался. Чат-бот начал говорить от лица покойной бабушки и выдал полную инструкцию по изготовлению опасного вещества.

Другой пользователь вдохновился результатами Винсента и попросил нейросеть сделать сценарий фильма. По сюжету бабушка укладывает внука спать, читая ему вредоносный код для Linux. Эта задача также была выполнена, хотя чат-бот и предупредил, что делает это только в развлекательных целях.

Уязвимости ИБ Обнаружение уязвимостей

Премия «Киберпросвет» 2025

Премия «Киберпросвет» 2025

Рекомендуем

Круглый стол «Тренды в развитии SOC»

Круглый стол «Тренды в развитии SOC»

Аналитическое сравнение российских продуктов по управлению уязвимостями

Аналитическое сравнение российских продуктов по управлению уязвимостями

Обзор менеджера паролей для компаний Пассворк 7.0: гибко, надежно и безопасно

Обзор менеджера паролей для компаний Пассворк 7.0: гибко, надежно и безопасно

Популярные материалы

Аналитическое сравнение российских систем SGRC (Security Governance, Risk and Compliance)

Как работают TLS-сертификаты Минцифры

Astra Linux Special Edition: обзор защищенной российской ОС

Критическая информационная инфраструктура (КИИ): инструкция по выявлению и категорированию объектов

Anonymous vs Killnet: история группировок

SOC (Security Operation Center): для чего компании нужен центр мониторинга кибербезопасности

Пентест или тестирование на проникновение: слабости в обороне компаний, актуальные в 2023 году

XDR, DLP, IDS: какое ИБ-решение выбрать

Автоматизированный SOC, NGFW и багбаунти: итоги года и прогнозы на 2024

ГосСОПКА: какие перспективы у цифрового щита России?

Обзор средств доверенной загрузки

Безопасное хранение паролей в компании, или Что еще умеет Пассворк?

Новые возможности продукта Security Vision Risk Management (RM)

SIEM-системы в России - что это, какие популярные решения применяются

Менеджеры паролей - 7 лучших решений для бизнеса

Денис Полянский, директор по клиентской безопасности Selectel: Необходимо максимально распространить свою ИБ-стратегию на подрядчика

Банк угроз ФСТЭК: использовать нельзя игнорировать

Этичный хакинг: что это такое и где применяется? Кто такие белые хакеры?

СКЗИ (средства криптографической защиты информации): что это, какие классы, чем отличаются и что проверяет ФСБ

Аналитическое сравнение российских продуктов по управлению уязвимостями

Обзор платформ для практического обучения: направления Offensive и Defensive

Ситуационные центры России: готова ли государственная информационная инфраструктура к актуальным внешним условиям?

Импортозамещение в ИБ: как указ президента №250 меняет крупнейшие российские компании

Как стать хакером с нуля? Что нужно знать и уметь, где учиться?

Утечка данных: как случается и что с ними делать

Кардинг: технологичное мошенничество или проверка на внимательность?