Специалисты бразильского Центра прикладных математических наук для промышленности (Center for Mathematical Sciences Applied to Industry, CeMEAI), создали web-платформу для автоматического выявления недостоверной информации в Сети, сообщает SecurityLab.
С помощью статистических моделей и техник машинного обучения система определяет, является ли тот или иной контент на бразильском португальском языке поддельным. По данным предварительного тестирования, платформа идентифицирует фейковые новости с точностью до 96%.
Статистические методы позволяют анализировать характеристики написанного, такие как используемые слова и наиболее часто встречающиеся классы слов. Эти характеристики затем вводятся в классификатор на базе технологий машинного обучения, который отделяет шаблоны языка, словарь и семантику фейковых новостей от настоящих и автоматически определяет, является ли контент недостоверным.
Модели были обучены с помощью огромной базы данных реальных и ложных новостей, и им была представлена лексика, использованная в более чем 100 тыс. статей за последние пять лет. Исследователи намерены также использовать фейковые новости, связанные с предстоящими президентскими выборами и пандемией Covid-19, для дальнейшей калибровки моделей.
По словам самих создателей системы, несмотря на ее очевидные преимущества, она также может использоваться злоумышленниками. Так, с ее помощью авторы фейковых новостей смогут редактировать свой контент, чтобы успешнее выдавать его за настоящий.
Нажимая на кнопку, я даю Согласие на обработку персональных данных в соответствии с Политикой обработки.