Google представила MUM – нейронную сеть, отвечающую на многоуровневые вопросы пользователей. Нейросеть в 1000 раз эффективнее BERT и обучается сразу на 75 языках.
Для получения ответа на вопрос пользователю часто приходится делать несколько поисковых запросов. Например, чтобы узнать, как подготовиться к восхождению на гору, нужно найти высоту горы, среднюю температуру воздуха, сложность пешеходных троп, правильное снаряжение для использования и многое другое. MUM («Multitask Unified Model») решает эту проблему, выполняя поиск необходимой для ответа информации в нескольких направлениях и выдавая единый ответ. Google утверждает, что с использованием MUM количество поисковых запросов для ответов на многоуровневые ответы сокращается примерно в 8 раз. Нейросеть построена на архитектуре Transformer, как и аналогичная нейросеть Google BERT, но в 1000 раз более эффективна.
MUM обучается на 75 языках, что улучшает качество предоставляемых ответов: можно задать вопрос на одном языке, а нейросеть будет искать ответ в материалах также и на других языках, чтобы найти информацию, которая может отсутствовать на языке запроса. Также нейросеть является мультимодальной, то есть принимает запросы, содержащие текст и изображения одновременно. Например, если сфотографировать походные ботинки и спросить: «Можно ли использовать их для похода на гору Фудзи?», MUM свяжет текстовый запрос с изображением и предоставит ответ. В будущем Google планирует расширить функционал нейросети, добавив распознавание запросов с аудио- и видеозаписями. Другая особенность MUM — поиск информации не только в текстах, но в изображениях и видео.
В дополнение к MUM Google представила LaMDA, нейросеть для голосового ассистента нового поколения. Она отличается от конкурентных моделей тем, что ее нужно переучивать, чтобы провести диалог на новую тему. Как следствие, LaMDA сразу может поддержать разговор на любую тему. Сейчас инструмент находится в стадии разработки, но в дальнейшем его можно будет использовать для разработки диалоговых приложений. Для того, чтобы приблизить стиль ответов LaMDA к естественному языку, Google работает над их проницательностью, остроумностью и неожиданностью без нарушения фактической точности.