В MIT разработали алгоритм, который распознает объекты по голосовому описанию

Учёные из Лаборатории информатики и искусственного интеллекта (CSAIL) в MIT представили нейросеть, которая распознаёт объекты на изображении, сопоставляя их с голосовым описанием. Исследователи считают, что разработка может улучшить технологии распознавания речи и перевод с…
lip reading

Нейросеть DeepMind читает по губам лучше, чем другие алгоритмы

DeepMind создали алгоритм, который читает по губам с 59% точностью. Максимальный результат предыдущих разработок в этой области — 33%. Для обучения модели исследователи использовали 140 000 часов видео с YouTube. Специальная система обработала…