Сбер опубликовал в открытом доступе PyTorch-Lifestream — библиотеку алгоритмов построения векторных представлений событийных данных. Библиотека позволяет обрабатывать терабайтные объемы таких данных, как банковские транзакции, игровые события и истории покупок.
Библиотека нацелена на подготовку данных для последующего обучения моделей машинного обучения.
PyTorch-Lifestream содержит пять методов самообучения. Четыре из них были адаптированы в Сбере для последовательностей событий, а один — контрастное обучение — был полностью разработан в Sber AI Lab. Векторные представления, полученные в PyTorch-Lifestream, не будут содержать персональных данных.
Сбер разрешил использование библиотеки в исследовательских и коммерческих целях.