Исследователь показал, как извлекать текст из пикселизированных изображений

17.02.2022
Исследователь показал, как извлекать текст из пикселизированных изображений

Ведущий исследователь ИБ-компании Bishop Fox Дэн Петро (Dan Petro) продемонстрировал метод, позволяющий полностью восстановить текст на изображении, которое было отредактировано с помощью пикселизации, пишет Хакер.

Данный способ искажения текста часто применяется СМИ и простыми пользователям для публикации различных конфиденциальных изображений, но эксперт пишет, что пикселизация ненадежна и безопаснее закрывать текст старыми добрыми черными полосами.

Все началось с того, что в прошлом году компания Jumpsec Labs предложила всем желающим попытаться расшифровать текст на изображении.

Петро решил «принять вызов» и засел за изучение различных методов пикселизации и деобфускации. В итоге он решил задачу, а специалисты Jumpsec Labs попросили его не публиковать полный ответ, чтобы другие желающие могли продолжить исследования.

Петро пишет, что аналогичные решения для улучшения сильно пикселизированных фотографий людей и пейзажей существуют давно, но до сих пор не было выпущено работающих инструментов для точного восстановления искаженного таким методом текста. Так, для фото существуют такие решения как Google Brain с функциональностью «zoom and enhance», а также инструменты, подобные Depix, обеспечивающие аналогичную функциональность для пикселизированных текстовых блоков. Увы, по словам эксперта, они не работают в реальных сценариях.

«Мне очень нравится концепция этого инструмента, но на практике он работает не так хорошо, как хотелось бы, — говорит Петро. — В реальных примерах вы, скорее всего, увидите мелкие искажения и шум, которые буду вставлять вам палки в колеса».

Решив задачу Jumpsec Labs, Петро, совместно с Bishop Fox, опубликовал на GitHub собственный опенсорсный инструмент под названием Unredacter, предназначенный для превращения пикселей в понятный текст. Пример работы Unredacter можно увидеть на гифке ниже, а детальное описание проделанной экспертом работы можно найти в блоге компании.

«Вывод прост: когда вам нужно отредактировать текст, используйте черные полосы, покрывающие весь текст. Никогда не используйте ничто иное. Никакой пикселизации, никакого размытия, искажений и завихрений», — в заключение предупреждает Петро.


Популярные материалы