Как сократить размер нейросети на 10-20% и не проиграть в точности

21 мая 2019

Как сократить размер нейросети на 10-20% и не проиграть в точности

На ICLR 2019 исследователи из MIT представили метод, с помощью которого можно уменьшить размер нейросети на 10-20% и не потерять при этом в точности модели. Исследователи вводят “гипотезу о выигрышных…

Как работают рекомендательные системы

15 мая 2019

Как работают рекомендательные системы

Рекомендательные системы, основанные на машинном обучении, получили широкое распространение для бизнеса в последние годы. В этой статье приведено описание принципов работы основных методов для реализации рекомендательных систем и метрик для…

Разработанный в Disney алгоритм создаёт анимации из сценария

15 апреля 2019
scripts to animation

Разработанный в Disney алгоритм создаёт анимации из сценария

Перевод текста в анимацию сложная задача и существующие модели преобразования текста в анимацию могут работать только с простыми задачами. Исследователи из компании Disney разработали алгоритм, который позволяет преобразовывать текст в анимацию.…

Почему проектами машинного обучения сложно управлять?

4 февраля 2019

Почему проектами машинного обучения сложно управлять?

Многие компании пытаются внедрить машинное обучение — некоторые преуспевают, а другие терпят неудачу. Причина часто в том, что командам ML-инженеров трудно ставить конкретные цели. Почему так происходит? На этот и…

Алгоритм Microsoft и MIT находит «слепые зоны» в обучении беспилотных автомобилей

31 января 2019
слепые зоны в обучении беспилотных автомобилей

Алгоритм Microsoft и MIT находит «слепые зоны» в обучении беспилотных автомобилей

Модель, совместно разработанная Microsoft и MIT, выявляет «слепые зоны» в обучении беспилотных автомобилей. Инженеры планируют использовать ее для повышения безопасности автономных автомобилей и роботов. Симуляция городской среды не может охватить…

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

29 января 2019
resnet-neural-network

ResNet (34, 50, 101): «остаточные» CNN для классификации изображений

ResNet — это сокращенное название для Residual Network (дословно  — «остаточная сеть»), но что такое residual learning («остаточное обучение»)? Глубокие сверточные нейронные сети превзошли человеческий уровень классификации изображений в 2015…

Неопределенность в алгоритмах — способ сделать ИИ более этичным

21 января 2019

Неопределенность в алгоритмах — способ сделать ИИ более этичным

Алгоритмы должны уметь принимать сложные этические решения. ИИ, который помогает судьям выносить приговоры, должен учитывать риски как для общества, так и для обвиняемого. Автомобили без водителя должны принимать решения в…

Accenture Research: ИИ не нужно много данных, ему нужен здравый смысл

16 января 2019
ИИ big data

Accenture Research: ИИ не нужно много данных, ему нужен здравый смысл

Исключительная роль больших данных уходит в прошлое. Будущее ИИ — это вероятностные модели и обучение на опыте. Исследователи заявляют, что в ближайшие 5 лет компьютеры станут менее «искусственными» и более «интеллектуальными».…

Обучение Inception-v3 распознаванию собственных изображений

28 декабря 2018

Обучение Inception-v3 распознаванию собственных изображений

В моем предыдущем посте мы увидели, как выполнять распознавание изображений с помощью TensorFlow с использованием API Python на CPU без какого-либо обучения. Мы использовали предобученную модель Inception-v3, которую Google уже…

Эпоха, батч, итерация — в чем различия?

27 декабря 2018
эпоха итерации батчи

Эпоха, батч, итерация — в чем различия?

Вам должны быть знакомы моменты, когда вы смотрите на код и удивляетесь: “Почему я использую в коде эти три параметра, в чем отличие между ними?”. И это неспроста, так как…

OpenAI вычисляют идеальный batch size для обучения моделей

20 декабря 2018
gradient-noise-open-ai-batch-size

OpenAI вычисляют идеальный batch size для обучения моделей

Разработчики OpenAI представили исследование, которое показывает, что можно определить идеальный размер пакета данных для обучения алгоритмов, основываясь на данных шкалы градиентного шума. Метод позволит сократить время и стоимость обучения. В…

Разработан новый алгоритм классификации без отрицательных данных в датасете

29 ноября 2018
алгоритм классификации без отрицательных данных в датасете

Разработан новый алгоритм классификации без отрицательных данных в датасете

Исследователи проекта RIKEN разработали новый метод машинного обучения, который позволяет обучать модели классифицировать объекты без отрицательных данных в обучающем датасете. В задачах классификации алгоритмы используют положительные и отрицательные данные. Например,…

Градиентый бустинг — просто о сложном

27 ноября 2018
градиентный бустинг

Градиентый бустинг — просто о сложном

Хотя большинство победителей соревнований на Kaggle используют композицию разных моделей, одна из них заслуживает особого внимания, так как является почти обязательной частью. Речь, конечно, про Градиентный бустинг (GBM) и его…

Метод обратного распространения ошибки: математика, примеры, код

26 ноября 2018
обратное распространение

Метод обратного распространения ошибки: математика, примеры, код

Обратное распространение ошибки — это способ обучения нейронной сети. Цели обратного распространения просты: отрегулировать каждый вес пропорционально тому, насколько он способствует общей ошибке. Если мы будем итеративно уменьшать ошибку каждого веса, в…

Градиентный спуск: всё, что нужно знать

20 ноября 2018
градиентный спуск метод

Градиентный спуск: всё, что нужно знать

Градиентный спуск — самый используемый алгоритм обучения, он применяется почти в каждой модели машинного обучения. Градиентный спуск — это, по сути, и есть то, как обучаются модели. Без ГС машинное обучение не…

Сверточная нейронная сеть на PyTorch: пошаговое руководство

26 октября 2018
pytorch bigraph

Сверточная нейронная сеть на PyTorch: пошаговое руководство

В предыдущем вводном туториале по нейронным сетям была создана трехслойная архитектура для классификации рукописных символов датасета MNIST. В конце туториала была показана точность приблизительно 86%. Для простого датасета, как MNIST,…

Туториал по PyTorch: от установки до готовой нейронной сети

22 октября 2018
pytorch туториал

Туториал по PyTorch: от установки до готовой нейронной сети

Если вы уже пробовали создавать собственные глубокие нейронные сети с помощью TensorFlow и Keras, то, вероятно, знакомы с чувством разочарования при отлаживании этих библиотек. Хотя они имеют API на Python,…

Обучение нейросети с учителем, без учителя, с подкреплением — в чем отличие? Какой алгоритм лучше?

19 октября 2018
обучение с без учителя, с подкреплением

Обучение нейросети с учителем, без учителя, с подкреплением — в чем отличие? Какой алгоритм лучше?

Обучить нейронную сеть можно разными способами: с учителем, без учителя, с подкреплением. Но как выбрать оптимальный алгоритм и чем они отличаются? Есть несколько способов собрать мебель из IKEA. Каждый из…

Обучение нейронных сетей: проклятие размерности

3 октября 2018
обучение нейронной сети - проклятие размерности

Обучение нейронных сетей: проклятие размерности

Представьте, что вы альпинист на вершине горы и наступает ночь. Вам нужно добраться до лагеря, что внизу скалы, но в свете тусклого фонарика вы можете видеть лишь на несколько метров.…

МРТ, чип в мозге и нейросети вернули подвижность парализованному человеку

3 октября 2018

МРТ, чип в мозге и нейросети вернули подвижность парализованному человеку

Исследователи много лет работают над методами на основе электрических импульсов, чтобы вернуть возможность двигаться людям с травмами спинного мозга и парализованными конечностями. Учёные из Университета Огайо и компании Batelle объявили, что…

Глубокое обучение (Deep Learning): краткий туториал

2 октября 2018
глубокое обучение

Глубокое обучение (Deep Learning): краткий туториал

Первым шагом к пониманию того, как работает глубокое обучение, является понимание различий между несколькими важными терминами. Нейронная сеть (искусственная нейронная сеть) — это попытка воспроизведения работы человеческого мозга на компьютере при…