Google RecurrentGemma: локальная языковая модель

14 апреля 2024

Google RecurrentGemma: локальная языковая модель

Google представила языковую модель RecurrentGemma, работающую локально на устройствах с ограниченными ресурсами, таких как смартфоны, персональные компьютеры и умные колонки. Новая архитектура Google значительно снижает требования к памяти и процессору,…

NBDT: интерпретируемые нейронные деревья решений

27 января 2021

NBDT: интерпретируемые нейронные деревья решений

NBDT — это нейросетевая архитектура деревьев решений для задач классификации. Модель объединяет в себе интерпретируемость классического алгоритма дерева решений с качеством предсказаний современных нейросетей. Разработчики тестировали модель на задаче классификации…

GOM: метрика для задачи реидентификации объекта

2 декабря 2020

GOM: метрика для задачи реидентификации объекта

GOM — это метрика для задачи реидентификации объекта. GOM оценивает state-of-the-art методы как на задачах для реидентификации объекта с использованием учителя, так и на задачах без учителя. В качестве типов…

VoiceFilter-Lite: легковесная архитектура для распознавания речи

13 ноября 2020

VoiceFilter-Lite: легковесная архитектура для распознавания речи

VoiceFilter-Lite — это легковесная архитектура для распознавания речи. Это облегченная версия модели VoiceFilter. Разработкой занимались исследователи из Google AI.  В чем проблема В то время как VoiceFilter модель выдавала state-of-the-art…

GRF: нейросеть генерирует 3D вид сцены по 2D изображениям

26 октября 2020

GRF: нейросеть генерирует 3D вид сцены по 2D изображениям

GRF — это нейронная функция для представления и рендеринга 3D сцен любой сложности на основе 2D изображений. По количественным и качественным оценкам, GRF обходит state-of-the-art методы. Подробнее про архитектуру подхода…

В Google AI измерили гендерные корреляции в NLP моделях

16 октября 2020

В Google AI измерили гендерные корреляции в NLP моделях

Исследователи из Google AI измерили гендерные корреляции в NLP моделях. Они протестировали BERT и его аналог ALBERT на наличие корреляций, связанных с гендером. Исследователи опубликовали набор рекомендаций по тестированию языковых…

CowMask: аугментация данных для self-supervised моделей

27 сентября 2020

CowMask: аугментация данных для self-supervised моделей

CowMask — это метод аугментации, который основан на маскировании. Метод позволяет обучать более устойчивые self-supervised модели. Модель с CowMask выдает state-of-the-art результаты на датасете ImageNet с использованием 10% размеченных данных…

Google опубликовали API для оптимизации TensorFlow моделей

15 августа 2020
установка Tensorflow

Google опубликовали API для оптимизации TensorFlow моделей

Google опубликовали API для оптимизации TensorFlow моделей. API позволяет сокращать размер модели с помощью методов кластеризации весов, прунинга и квантизации. Использование кластеризации весов сокращает использование памяти и увеличивает скорость работы…

EagleEye: оценка подсетей для оптимизации размера нейросети

10 июля 2020

EagleEye: оценка подсетей для оптимизации размера нейросети

EagleEye — это метод оценки подсетей для алгоритмов сжатия размера обученных нейросетей. Метод основан на адаптивной нормализации батчей. EagleEye позволяет находить корреляции между подсетями обученной нейросети и точностью их предсказаний.…

Meta-Graph: метод для предсказания связей в графах от Uber AI

2 июня 2020

Meta-Graph: метод для предсказания связей в графах от Uber AI

Meta-Graph — это нейросетевая модель для предсказания связей в графах на основе пары примеров. Кроме архитектуры модели, исследователи публикуют бенчмарки, на которых тестировали модель. Цель Meta-Graph заключается в том, что…

NBDT: интерпретируемая нейросеть на основе решающих деревьев

30 апреля 2020

NBDT: интерпретируемая нейросеть на основе решающих деревьев

Исследователи из UC Berkley предлагают интерпретируемую нейросеть, которая основана на архитектуре решающих деревьев и выдает сравнимые с state-of-the-art предсказания. Код проекта и предобученные модели доступны в открытом репозитории на GitHub.…

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

29 января 2019
resnet-neural-network

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

ResNet — это сокращенное название для Residual Network (дословно  — «остаточная сеть»), но что такое residual learning («остаточное обучение»)? Глубокие сверточные нейронные сети превзошли человеческий уровень классификации изображений в 2015…

CycleGAN: превращение текстур Fortnite в PUBG

18 января 2019
cyclegan

CycleGAN: превращение текстур Fortnite в PUBG

Перед вами перевод статьи о применении CycleGAN для переноса стиля изображений и дальнейшего применения в компьютерных играх. Автор статьи — Чинтан Триведи, ссылка на оригинал в конце текста. Если вы…

U-Net: нейросеть для сегментации изображений

30 ноября 2018
u-net

U-Net: нейросеть для сегментации изображений

U-Net считается одной из стандартных архитектур CNN для задач сегментации изображений, когда нужно не только определить класс изображения целиком, но и сегментировать его области по классу, т. е. создать маску,…

VGG16 — нейросеть для выделения признаков изображений

23 ноября 2018
vgg16 нейронная сеть

VGG16 — нейросеть для выделения признаков изображений

VGG16 — модель сверточной нейронной сети, предложенная K. Simonyan и A. Zisserman из Оксфордского университета в статье “Very Deep Convolutional Networks for Large-Scale Image Recognition”. Модель достигает точности 92.7% —…

AlexNet — свёрточная нейронная сеть для классификации изображений

1 ноября 2018

AlexNet — свёрточная нейронная сеть для классификации изображений

AlexNet — сверточная нейронная сеть, которая оказала большое влияние на развитие машинного обучения, в особенности — на алгоритмы компьютерного зрения. Сеть с большим отрывом выиграла конкурс по распознаванию изображений ImageNet LSVRC-2012…