Интернет-гигант Baidu разработал инструмент, который переводит с двух языков в режиме реального времени. Технология STACL обрабатывает фразы естественного языка и предугадывает слова, что делает перевод близким к результату синхронного переводчика.
Мгновенный перевод
Искусственные переводчики работают с последовательным переводом, т.е. переводят предложение только после его окончания. Перевод получается более точным, однако скорость работы снижается. Поэтому такие технологии невозможно использовать в синхронном переводе. STACL (Simultaneous Translation with Anticipation and Controllable Latency) использует синхронный перевод с контролируемой задержкой. Модель «wait-k» генерирует целевое предложение одновременно с исходным, но с опозданием в 3-5 слов. В тоже время STACL предугадывает слова. Такой принцип работы уменьшает задержки между фразой и переводом, и делает его почти мгновенным.
Обучение модели
Сейчас STACL работает с тремя языками: английским, китайским и немецким. Для обучения переводу пары английский — китайский разработчики использовали два миллиона пар предложений. Это позволило сделать перевод естественным, не смотря на то, что у этих языков очень разные структуры предложений. Например, в китайском языке глагол стоит в конце предложения, но при переводе на английский становится третьим, так как это уместнее для грамматики английского.
Разработку представили на Всемирной конференции Baidu 1 ноября 2018 года. В компании подчеркивают, что инструмент не сможет в ближайшие годы заменить синхронных переводчиков. Пока Baidu нацелена совершенствовать технологию и интегрировать её в свои продукты.