fbpx
  • Как бесплатно обедать в Нью-Йорке, используя Python, машинное обучение и Instagram

    new_york

    Крис Буэтти (Chris Buetti), специалист по анализу данных, создал полностью автоматизированный аккаунт instagram. Крис решил, что обедать в Нью-Йорке дорого. Так родилась идея создать аккаунт @beautiful.newyorkcity в Instagram и заработать себе еду. Для этого он автоматизировал процесс подписки на другие аккаунты в надежде получить отклик.

    Бот уже привлёк аудиторию в 30 000 человек. Крис использовал аккаунт для получения бесплатной еды в ресторанах, программа сама предлагала ресторанам города продвижение взамен готовой еды.

    instagram machine learning
    Пример поста

    Чтобы получить такую аудиторию нужно публиковать несколько постов каждый день, что было монотонно и сложно. Крис автоматизировал эту работу. Сначала он собрал список из 50 аккаунтов instagram, где публиковались качественные изображения Нью-Йорка. Используя программное обеспечение с открытым исходным кодом, он настроил загрузку и публикацию контента из списка аккаунтов. C изображений удалялась бóльшая часть метаданных.

    Работа алгоритма

    • В 8:00, 14:00 и 19:30 python-скрипт выбирает случайное изображение и генерирует к нему заголовок.
    • Бот подписывается на 400 новых людей и отписывается от 400 тех, которые не подписывались в ответ в течение 2 дней.
    • В течение дня бот ищет бизнес аккаунты, которые занимаются ресторанами. Если в таких аккаунтах указана электронная почта, то бот отправлял шаблонное сообщение, в котором предлагал продвижение взамен на скидку/купон/подарочную карту.
    • Скрипт проверяет почту Криса, и если последовал ответ на предложение, скрипт уведомляет его и Крис начинает вести переговоры с потенциальным клиентом.

    Решение возникших проблем

    При создании этого бота Крис столкнулся с некоторыми проблемами такими как непригодность некоторых постов к публикации и качество контента.

    Слева — подходящий пост, справа — реклама

    Например, для решения проблем с рекламой в публикуемых изображениях авторов алгоритм стал смотреть на заголовки, открытость комментарий к посту и количество тегов. Эти правила отправляли большинство неподходящих постов сразу в корзину.

    Вторая проблема заключалась в том, что программа подразумевала публиковать только те изображения, которые нравились бы большей части аудитории. Количество лайков на записи не означало качество. Чтобы решить эту проблему было решено изменить условие поиска изображений, количество лайков в условии менялось на соотношение количества лайков к подписчикам.

    Курсы по data science

    Количество людей, на которых можно подписаться в instagram равно 7500. Это создавало ещё одну проблему, нужно было подписываться только на тех людей, которые с большой вероятностью ответят взаимностью. Для этого создался набор данных, с помощью которого выяснились интересные закономерности:

    • Публичные аккаунты более склонны к подписке, чем закрытые.
    • Женщины чаще подписывались на аккаунт, чем мужчины.
    • Если подписываться на людей утром, то больше шанс, что они подпишутся на вас.

    Из полученных данных можно было сделать начальный поиск пользователей. С помощью этих методов был создан шаблон, который отправлялся ресторанам для заключения сделки, в которой предлагалась реклама заведения в обмен на какую либо выгоду обед, купоны, скидки.