Speech-to-speech / Нейросети и глубокое обучение

Mini-Omni: первая открытая speech-to-speech модель, ведущая диалог без задержки

2 сентября 2024

Mini-Omni: первая открытая speech-to-speech модель, ведущая диалог без задержки

Mini-Omni — первая open source языковая модель, позволяющая вести диалог голосом с минимальной задержкой ответа и без использования внешних text-to-speech моделей. Метод Any Model Can Talk позволяет интегрировать речевые возможности…

Google AI разработали нейросеть по перевода речи с одного языка на другой

18 мая 2019

Google AI разработали нейросеть по перевода речи с одного языка на другой

В Google AI обучили Translatotron — нейросеть, которая принимает на вход аудиозапись с речью и на выходе отдает аудиозапись с той же фразой, переведенной на другой язык. Translatotron может как…