Microsoft VASA-1: платформа для анимирования статичных изображений

21 апреля 2024
microsoft vasa-1

Microsoft VASA-1: платформа для анимирования статичных изображений

Microsoft представила платформу VASA-1, преобразующую изображение человека и аудиозапись с речью в видео с синхронизированными движениями губ и головы. Алгоритм работает в реальном времени со скоростью 40 кадров в секунду.…

Ученые впервые разработали лекарство с помощью генеративных моделей

10 марта 2024
искусственный интеллект разрабатывает лекарство

Ученые впервые разработали лекарство с помощью генеративных моделей

Стартап Insilico Medicine представил первое лекарство, разработанное с помощью генеративных моделей. Новый подход к созданию позволил препарату пройти первую фазы клинических испытаний всего за два года – втрое быстрее, чем…

Microsoft ViSNet: предсказание активности молекул

3 марта 2024
microsoft visnet

Microsoft ViSNet: предсказание активности молекул

Microsoft опубликовала ViSNet – графовую нейросеть, моделирующую геометрию сложных молекул для предсказания их активности. ViSNet может значительно ускорить поиск и изучение новых лекарств. Моделирование молекулярной геометрии позволяет предсказывать, как молекулярные…

Microsoft DragNUWA: генерация видео с помощью траекторий объектов

15 января 2024

Microsoft DragNUWA: генерация видео с помощью траекторий объектов

Microsoft опубликовала веса DragNUWA – кросс-доменной модели генерации видео, обеспечивающей более прецизионный контроль над получаемым результатом по сравнению с аналогичными моделями. Контроль достигается за счет одновременного использования в качестве входных…

Microsoft LeMa: обучение языковых моделей на их ошибках

4 ноября 2023
Microsoft LeMa

Microsoft LeMa: обучение языковых моделей на их ошибках

Исследователи Microsoft представили LeMa (Learning from Mistakes) – алгоритм с открытым исходным кодом для улучшения способности больших языковых моделей решать математические задачи. LeMa заставляет модель учиться на своих ошибках, имитируя…

Microsoft AutoGen: фреймворк для настройки LLM-агентов

8 октября 2023
AutoGen framework

Microsoft AutoGen: фреймворк для настройки LLM-агентов

Microsoft представила AutoGen, open-source библиотеку для создания и настройки LLM-агентов – отдельных сеансов больших языковых моделей, которые могут взаимодействовать друг с другом для совместного решения задач. LLM-агенты – перспективная область…

Microsoft Copilot и другие 150 AI-функций Windows 11

1 октября 2023
copilot

Microsoft Copilot и другие 150 AI-функций Windows 11

Microsoft выпустила обновление Windows 11, включающее более 150 AI-функций и чат-бота Copilot, поддерживающего большинство приложений операционной системы. Copilot является единой точкой входа для взаимодействия с приложениями и контентом с помощью…

Модель Phi-1 от Microsoft всего с 1.3B параметров достигла SotA в генерации кода

30 июня 2023
code generation phi-1 model

Модель Phi-1 от Microsoft всего с 1.3B параметров достигла SotA в генерации кода

Исследователи Microsoft Research представили Phi-1 — языковую модель для генерации кода всего с 1,3 миллиардами параметров, которая смогла достигнуть близкого к state-of-the-art уровня генерации кода с помощью собранного авторами датасета.…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

Модель обучили находить оптимальную схему лечения

4 февраля 2022

Модель обучили находить оптимальную схему лечения

Microsoft разработала алгоритм обучения с подкреплением, предлагающий для текущего состояния пациента наиболее эффективную тактику лечения. Модель нацелена на ускорение принятия решений в здравоохранении в условиях ограниченного количества медицинских данных. Модель…

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

19 декабря 2021
microsoft text-to-speech model

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

Microsoft представила обновление Uni-TTS — модели, преобразовывающей текст в речь. Uni-TTSv4 обеспечивает наилучшее качество речи среди аналогичных state-of-the-art моделей и в ближайшее время будет доступна в Azure более чем на…

MvM: фреймворк Microsoft для генерации изображений

3 декабря 2021

MvM: фреймворк Microsoft для генерации изображений

Microsoft представила фреймворк для генерации изображений MvM. MvM превосходит генеративно-состязательные нейросети, а также позволяет использовать новые алгоритмы обучения в задачах компьютерного зрения. Возможности генеративно-состязательных нейросетей (GAN) в задачах компьютерного зрения…

SynapseML: библиотека Microsoft для создания ML-конвейеров

19 ноября 2021

SynapseML: библиотека Microsoft для создания ML-конвейеров

Microsoft выложила в открытый доступ SynapseML — фреймворк, позволяющий создавать масштабируемые конвейеры машинного обучения. В SynapseML несколько существующих ML-платформ и новые алгоритмы Microsoft объединены в единый API, который можно использовать…

Context IQ: ИИ-функции Microsoft 365

4 ноября 2021

Context IQ: ИИ-функции Microsoft 365

Microsoft объявила о добавлении в Microsoft 365 функций на основе глубокого обучения для быстрого решения рутинных задач. Данные функции ищут и предлагают пользователю информацию и файлы, которые им могут понадобиться в…

ORBIT: датасет Microsoft изображений предметов быта

20 октября 2021

ORBIT: датасет Microsoft изображений предметов быта

ORBIT — датасет Microsoft для обучения моделей распознаванию предметов по нескольким изображениям. ORBIT включает от 1 до 10 видеозаписей 468 предметов из повседневной жизни. Обычно модели распознавания объектов обучаются на…

MT-NLG: генеративная языковая модель Microsoft и NVIDIA

16 октября 2021

MT-NLG: генеративная языковая модель Microsoft и NVIDIA

Языковая модель MT-NLG, разработанная Microsoft и NVIDIA, обладает 530 миллиардами параметров, что в 3 раза больше, чем у GPT-3. MT-NLG состоит из 105 слоев и превосходит все существующие модели обработки…

Fake It Till You Make It: датасет Microsoft синтетических изображений лиц

9 октября 2021

Fake It Till You Make It: датасет Microsoft синтетических изображений лиц

Microsoft представила датасет синтетических изображений лиц Fake It Till You Make It. Датасет нацелен на предварительное обучение алгоритмов распознавания лиц перед использованием в реальных сценариях. В биометрии уже несколько лет…

5 облачных сервисов для обработки видео нейросетями

14 июля 2021
обработка видео нейросетью

5 облачных сервисов для обработки видео нейросетями

Методы компьютерного зрения позволяют распознавать лица на видеозаписях, классифицировать и улучшать качество видео, а также автоматически создавать аннотации к ним. В статье приводится обзор основных облачных платформ для обработки видео…

Microsoft представила продукт для создания приложений на разговорном языке

3 июня 2021

Microsoft представила продукт для создания приложений на разговорном языке

На конференции Build Microsoft объявила об интеграции в Microsoft Power Apps GPT-3 – модели естественного языка, разработанной OpenAI. Инструмент позволит пользователям создавать приложения без необходимости писать код. Microsoft Power Apps…

FastSpeech: модель для генерации речи из текста от Microsoft

22 декабря 2019

FastSpeech: модель для генерации речи из текста от Microsoft

FastSpeech — это нейросетевая модель для генерации речи из текста. Нейросеть работает на инференсе быстрее state-of-the-art подходов в 38 раз. Зачем нужна FastSpeech Нейросетевые модели на текущий момент являются state-of-the-art…

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

12 ноября 2019

DialoGPT: в Microsoft GPT-2 обучили генерировать ответы в диалоге

DialoGPT — это диалоговая модель, которую обучили на 147 миллионах комментариев в Reddit. Нейросеть генерирует ответы на реплики пользователя (single-turn dialogue). DialoGPT базируется на GPT-2. Обучающая выборка состояла из цепочек…