Как Facebook распознает фейковые профили с помощью нейросетей

За 2019 год Facebook заблокировал 2 миллиарда фейковых аккаунтов. Мошенники используют фейковые аккаунты, чтобы распространять спам, ссылки на фишинговые сайты или малварь. 

Компания выложила детали ML-системы, которая классифицировала фейковые профили. Выделяют два типа фейковых аккаунтов:

  1. Аккаунты, которые пользователи по ошибке создали как личные страницы, а не как бизнес-страницу. Такое случается, когда владельцы магазинов или домашних питомцев заводят под бизнес или питомца личный аккаунт;
  2. Аккаунты, которые вовлечены в распространение спама и нарушают политику платформы

Систему обучили распознавать аккаунты второго типа. Инструмент, который разработали в Facebook, включает в себя вручную закодированные правила и машинное обучение. При этом система работает как с профилями на этапе регистрации, так и с активными профилями. Нейросетевая модель классифицирует фейковые профили среди активных. Deep Entity Classification (DEC) модель использует дескриптивные характеристики профиля для предсказания. Примерами признаков средний возраст и мода гендера друзей пользователя. Всего признаков, которые описывают профиль, более 20 тысяч.

Классы реальности или фейковости присваиваются профилю с помощью набора сгенерированных людьми эвристик и моделей. DEC затем предобучается на этих автоматически размеченных данных. После обучения ее подгоняют на маленьком наборе данных с точной разметкой.

Итоговая система распознает 4 типа фейковых профилей: обезличенные аккаунты, перехваченные профили реальных пользователей, спамеры и мошенники. После внедрения DEC на платформу Facebook заявляет, что они сократили процент фейковых профилей до 5% из всех активных пользователей за месяц.

Подписаться
Уведомить о
guest

0 Comments
Межтекстовые Отзывы
Посмотреть все комментарии

gogpt