ArtAug: мультиагентный открытый фреймворк для улучшения генерации изображений

18 декабря 2024
Enhancing Text-to-Image Generation

ArtAug: мультиагентный открытый фреймворк для улучшения генерации изображений

Исследователи Alibaba Group представили фреймворк ArtAug для улучшения качества генерации изображений из текста без дополнительных вычислительных затрат на этапе инференса, используя взаимодействие между генеративными и понимающими (understanding) моделями. Архитектура ArtAug…

NVIDIA Eureka: агент для автономного обучения роботов

22 октября 2023

NVIDIA Eureka: агент для автономного обучения роботов

NVIDIA представила Eureka – агента на базе GPT-4 c открытым исходным кодом, обучающего роботов сложным навыкам, таким как выполнение трюков и работу с ножницами. Большие языковые модели ранее уже показали…

PandasAI: анализ данных с помощью языковых моделей

25 июня 2023
PandasAI framework

PandasAI: анализ данных с помощью языковых моделей

PandasAI – библиотека, позволяющая выполнить базовый анализ данных с помощью запросов на естественном языке. Пользователь указывает один или несколько датафреймов и текстовый запрос, а ответ получает в форме нового датафрейма,…

GraphWorld: бенчмарк для графовых нейросетей

9 мая 2022

GraphWorld: бенчмарк для графовых нейросетей

Google AI представила бенчмарк для графовых нейросетей GraphWorld. Бенчмарк использует несколько миллионов синтетических датасетов, воспроизводящих широкий класс графов, и генерирует обобщенную оценку нейросети на основе ее тестирования на всех датасетах.…

Генератор синтетических изображений для обучения моделей классификации

4 апреля 2022

Генератор синтетических изображений для обучения моделей классификации

Исследователи MIT разработали метод, в котором контролируемый генератор синтетических изображений интегрируется в модель классификации. Метод позволяет сократить затраты на сбор крупномасштабных датасетов. Создание датасетов для классификации может стоить миллионы долларов.…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

PyTorch-LifeStream: библиотека Сбера для обработки событийных данных

5 февраля 2022

PyTorch-LifeStream: библиотека Сбера для обработки событийных данных

Сбер опубликовал в открытом доступе PyTorch-Lifestream — библиотеку алгоритмов построения векторных представлений событийных данных. Библиотека позволяет обрабатывать терабайтные объемы таких данных, как банковские транзакции, игровые события и истории покупок. Библиотека…

StylEx: выделение ключевых атрибутов классификаторов

21 января 2022
выделение атрибутов модели stylex

StylEx: выделение ключевых атрибутов классификаторов

Google представила StylEx — инструмент для выделения атрибутов модели, влияющих на классификаторы изображений. StylEx позволяет объяснить процесс принятия решения классификатором и находить ошибки в моделях. Определение того, какие признаки на…

MvM: фреймворк Microsoft для генерации изображений

3 декабря 2021

MvM: фреймворк Microsoft для генерации изображений

Microsoft представила фреймворк для генерации изображений MvM. MvM превосходит генеративно-состязательные нейросети, а также позволяет использовать новые алгоритмы обучения в задачах компьютерного зрения. Возможности генеративно-состязательных нейросетей (GAN) в задачах компьютерного зрения…

SynapseML: библиотека Microsoft для создания ML-конвейеров

19 ноября 2021

SynapseML: библиотека Microsoft для создания ML-конвейеров

Microsoft выложила в открытый доступ SynapseML — фреймворк, позволяющий создавать масштабируемые конвейеры машинного обучения. В SynapseML несколько существующих ML-платформ и новые алгоритмы Microsoft объединены в единый API, который можно использовать…

Texformer: оценка 3D-позы на основе трансформера

7 ноября 2021

Texformer: оценка 3D-позы на основе трансформера

Texformer — фреймворк для оценки 3D-позы по одному изображению с использованием архитектуры трансформера. Точность восстановления позы у Texformer выше, чем у state-of-the-art моделей на основе сверточных нейросетей. Архитектура модели приведена…

PyTorch-плагин Amazon для прямого доступа к датасетам S3

13 сентября 2021

PyTorch-плагин Amazon для прямого доступа к датасетам S3

Amazon выпустила open-source плагин для PyTorch, предназначенный для получения доступа к датасетам, хранящимся в Amazon Simple Storage Service (S3). Плагин позволяет в потоковом режиме манипулировать датасетами любого размера, устраняя необходимость…

Библиотеки Dlib и Mediapipe для трекинга ключевых точек лица

7 сентября 2021

Библиотеки Dlib и Mediapipe для трекинга ключевых точек лица

Трекинг лица используется в приложениях дополненной реальности, медицины, маркетинга и безопасности. В статье приводится описание двух библиотек, позволяющих осуществить обнаружение ключевых точек лица в реальном времени. Dlib Основным языком Dlib…

Zpy: генератор синтетических данных на основе Blender

10 августа 2021

Zpy: генератор синтетических данных на основе Blender

Zpy — open-source платформа для создания синтетических данных на Python. Инструмент разработан на основе Blender для использования в задачах компьютерного зрения. Генерация синтетических данных активно применяется в задачах компьютерного зрения…

Triton 1.0: язык программирования GPU для нейросетей

7 августа 2021

Triton 1.0: язык программирования GPU для нейросетей

OpenAI представила open-source язык программирования Triton для графических процессоров. Triton схож с Python и позволяет не имеющим опыта работы с CUDA пользователям писать высокоэффективный код. Triton, впервые представленный в 2019-м…

AlphaFold 2.0 — алгоритм, предсказывающий структуру белков

22 июля 2021

AlphaFold 2.0 — алгоритм, предсказывающий структуру белков

DeepMind опубликовал в открытом доступе исходный код AlphaFold 2.0 — алгоритма на основе искусственного интеллекта, предсказывающего структуру белков. Инструмент позволяет значительно ускорить процесс разработки лекарств и исследовать механизмы различных заболеваний.…

5 облачных сервисов для обработки видео нейросетями

14 июля 2021
обработка видео нейросетью

5 облачных сервисов для обработки видео нейросетями

Методы компьютерного зрения позволяют распознавать лица на видеозаписях, классифицировать и улучшать качество видео, а также автоматически создавать аннотации к ним. В статье приводится обзор основных облачных платформ для обработки видео…

Python-библиотеки для визуализации кода

30 июня 2021

Python-библиотеки для визуализации кода

В статье приводится обзор трех open-source библиотек Python для визуализации кода, которые помогут разработчикам наглядно визуализировать исполнение написанного кода. Эти библиотеки являются более простыми в установке и использовании аналогами модуля…

Google Research представили библиотеку DeepLab2 для задач компьютерного зрения

29 июня 2021

Google Research представили библиотеку DeepLab2 для задач компьютерного зрения

DeepLab2 — библиотека компьютерного зрения на TensorFlow2 от Google Research. Включает в себя новейшие модели для задач плотного прогнозирования, код обучения и контрольные точки. Доступна на Github. Зачем нужна библиотека…

NLPAug: Python-библиотека для аугментации текстовых данных

14 июня 2021

NLPAug: Python-библиотека для аугментации текстовых данных

Python-библиотека NLPAug позволяет устранить дисбаланс между классами данных в текстовых датасетах путем замены слов на синонимы, двойного перевода и других методов. Использование библиотеки повышает эффективность нейросетей, оперирующих с текстами, без…

TextBlob и VADER: библиотеки для анализа тональности текстов

8 июня 2021

TextBlob и VADER: библиотеки для анализа тональности текстов

В естественном языке присутствуют идиомы, сарказм и другие приемы, затрудняющие распознавание смысла текстов нейросетями. Библиотеки TextBlob и VADER позволяют с помощью нескольких строк кода оценить тональность текстов. Разберем работу с…