NVIDIA Eureka: агент для автономного обучения роботов

22 октября 2023

NVIDIA Eureka: агент для автономного обучения роботов

NVIDIA представила Eureka – агента на базе GPT-4 c открытым исходным кодом, обучающего роботов сложным навыкам, таким как выполнение трюков и работу с ножницами. Большие языковые модели ранее уже показали…

PandasAI: анализ данных с помощью языковых моделей

25 июня 2023
PandasAI framework

PandasAI: анализ данных с помощью языковых моделей

PandasAI – библиотека, позволяющая выполнить базовый анализ данных с помощью запросов на естественном языке. Пользователь указывает один или несколько датафреймов и текстовый запрос, а ответ получает в форме нового датафрейма,…

GraphWorld: бенчмарк для графовых нейросетей

9 мая 2022

GraphWorld: бенчмарк для графовых нейросетей

Google AI представила бенчмарк для графовых нейросетей GraphWorld. Бенчмарк использует несколько миллионов синтетических датасетов, воспроизводящих широкий класс графов, и генерирует обобщенную оценку нейросети на основе ее тестирования на всех датасетах.…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемый генератор синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы долларов.…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

PyTorch-LifeStream: библиотека Сбера для обработки событийных данных

5 февраля 2022

PyTorch-LifeStream: библиотека Сбера для обработки событийных данных

Сбер опубликовал в открытом доступе PyTorch-Lifestream — библиотеку алгоритмов построения векторных представлений событийных данных. Библиотека позволяет обрабатывать терабайтные объемы таких данных, как банковские транзакции, игровые события и истории покупок. Библиотека…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022
выделение атрибутов модели stylex

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…

MvM: фреймворк Microsoft для генерации изображений

3 декабря 2021

MvM: фреймворк Microsoft для генерации изображений

Microsoft представила фреймворк для генерации изображений MvM. MvM превосходит генеративно-состязательные нейросети, а также позволяет использовать новые алгоритмы обучения в задачах компьютерного зрения. Возможности генеративно-состязательных нейросетей (GAN) в задачах компьютерного зрения…

SynapseML: библиотека Microsoft для создания ML-конвейеров

19 ноября 2021

SynapseML: библиотека Microsoft для создания ML-конвейеров

Microsoft выложила в открытый доступ SynapseML — фреймворк, позволяющий создавать масштабируемые конвейеры машинного обучения. В SynapseML несколько существующих ML-платформ и новые алгоритмы Microsoft объединены в единый API, который можно использовать…

Texformer: оценка 3D-позы на основе трансформера

7 ноября 2021

Texformer: оценка 3D-позы на основе трансформера

Texformer — фреймворк для оценки 3D-позы по одному изображению с использованием архитектуры трансформера. Точность восстановления позы у Texformer выше, чем у state-of-the-art моделей на основе сверточных нейросетей. Архитектура модели приведена…

PyTorch-плагин Amazon для прямого доступа к датасетам S3

13 сентября 2021

PyTorch-плагин Amazon для прямого доступа к датасетам S3

Amazon выпустила open-source плагин для PyTorch, предназначенный для получения доступа к датасетам, хранящимся в Amazon Simple Storage Service (S3). Плагин позволяет в потоковом режиме манипулировать датасетами любого размера, устраняя необходимость…

Библиотеки Dlib и Mediapipe для трекинга ключевых точек лица

7 сентября 2021

Библиотеки Dlib и Mediapipe для трекинга ключевых точек лица

Трекинг лица используется в приложениях дополненной реальности, медицины, маркетинга и безопасности. В статье приводится описание двух библиотек, позволяющих осуществить обнаружение ключевых точек лица в реальном времени. Dlib Основным языком Dlib…

Zpy: генератор синтетических данных на основе Blender

10 августа 2021

Zpy: генератор синтетических данных на основе Blender

Zpy — open-source платформа для создания синтетических данных на Python. Инструмент разработан на основе Blender для использования в задачах компьютерного зрения. Генерация синтетических данных активно применяется в задачах компьютерного зрения…

Triton 1.0: язык программирования GPU для нейросетей

7 августа 2021

Triton 1.0: язык программирования GPU для нейросетей

OpenAI представила open-source язык программирования Triton для графических процессоров. Triton схож с Python и позволяет не имеющим опыта работы с CUDA пользователям писать высокоэффективный код. Triton, впервые представленный в 2019-м…

AlphaFold 2.0 — алгоритм, предсказывающий структуру белков

22 июля 2021

AlphaFold 2.0 — алгоритм, предсказывающий структуру белков

DeepMind опубликовал в открытом доступе исходный код AlphaFold 2.0 — алгоритма на основе искусственного интеллекта, предсказывающего структуру белков. Инструмент позволяет значительно ускорить процесс разработки лекарств и исследовать механизмы различных заболеваний.…

5 облачных сервисов для обработки видео нейросетями

14 июля 2021
обработка видео нейросетью

5 облачных сервисов для обработки видео нейросетями

Методы компьютерного зрения позволяют распознавать лица на видеозаписях, классифицировать и улучшать качество видео, а также автоматически создавать аннотации к ним. В статье приводится обзор основных облачных платформ для обработки видео…

Python-библиотеки для визуализации кода

30 июня 2021

Python-библиотеки для визуализации кода

В статье приводится обзор трех open-source библиотек Python для визуализации кода, которые помогут разработчикам наглядно визуализировать исполнение написанного кода. Эти библиотеки являются более простыми в установке и использовании аналогами модуля…

Google Research представили библиотеку DeepLab2 для задач компьютерного зрения

29 июня 2021

Google Research представили библиотеку DeepLab2 для задач компьютерного зрения

DeepLab2 — библиотека компьютерного зрения на TensorFlow2 от Google Research. Включает в себя новейшие модели для задач плотного прогнозирования, код обучения и контрольные точки. Доступна на Github. Зачем нужна библиотека…

NLPAug: Python-библиотека для аугментации текстовых данных

14 июня 2021

NLPAug: Python-библиотека для аугментации текстовых данных

Python-библиотека NLPAug позволяет устранить дисбаланс между классами данных в текстовых датасетах путем замены слов на синонимы, двойного перевода и других методов. Использование библиотеки повышает эффективность нейросетей, оперирующих с текстами, без…

TextBlob и VADER: библиотеки для анализа тональности текстов

8 июня 2021

TextBlob и VADER: библиотеки для анализа тональности текстов

В естественном языке присутствуют идиомы, сарказм и другие приемы, затрудняющие распознавание смысла текстов нейросетями. Библиотеки TextBlob и VADER позволяют с помощью нескольких строк кода оценить тональность текстов. Разберем работу с…

Microsoft представила продукт для создания приложений на разговорном языке

3 июня 2021

Microsoft представила продукт для создания приложений на разговорном языке

На конференции Build Microsoft объявила об интеграции в Microsoft Power Apps GPT-3 – модели естественного языка, разработанной OpenAI. Инструмент позволит пользователям создавать приложения без необходимости писать код. Microsoft Power Apps…