SCIN: датасет изображений дерматологических заболеваний
25 марта 2024
SCIN: датасет изображений дерматологических заболеваний
Google вместе со Stanford Medicine представила SCIN – открытый датасет с 10 000 изображениями дерматологических заболеваний. Обученные на его основе модели смогут удаленно диагностировать аллергические, воспалительные и инфекционные состояния кожи,…
В Midjourney добавили функцию переноса персонажа на новое изображение
17 марта 2024
В Midjourney добавили функцию переноса персонажа на новое изображение
В сервисе генерации изображений Midjourney появилась возможность переноса персонажа на новое изображение путем указания в запросе ссылки на уже существующее с ним изображение. Функция позволит использовать сервис для создания новых…
Ученые впервые разработали лекарство с помощью генеративных моделей
10 марта 2024
Ученые впервые разработали лекарство с помощью генеративных моделей
Стартап Insilico Medicine представил первое лекарство, разработанное с помощью генеративных моделей. Новый подход к созданию позволил препарату пройти первую фазы клинических испытаний всего за два года – втрое быстрее, чем…
Microsoft ViSNet: предсказание активности молекул
3 марта 2024
Microsoft ViSNet: предсказание активности молекул
Microsoft опубликовала ViSNet – графовую нейросеть, моделирующую геометрию сложных молекул для предсказания их активности. ViSNet может значительно ускорить поиск и изучение новых лекарств. Моделирование молекулярной геометрии позволяет предсказывать, как молекулярные…
Tableau Pulse: персонализированная суммаризация дашбордов
25 февраля 2024
Tableau Pulse: персонализированная суммаризация дашбордов
Salesforce представила Tableau Pulse – платформу, генерирующую персонализированную ленту с ключевыми изменениями метрик на основе дашбордов компании-пользователя Tableau. Tableau Pulse использует запросы на естественном языке и визуализацию данных для отображения…
Sora: диффузионная text-to-image модель OpenAI
18 февраля 2024
Sora: диффузионная text-to-image модель OpenAI
OpenAI представила Sora – диффузионную text-to-image модель, генерирующую видео длительностью 60 секунд. Ключевые преимущества модели OpenAI по сравнению с решениями конкурентов (включая Runway, Pika, Stability AI и Google) – высокое…
Apple MGIE: мультимодальные модели для редактирования изображений
12 февраля 2024
Apple MGIE: мультимодальные модели для редактирования изображений
Apple совместно с Калифорнийским университетом разработала open-source модель MGIE для редактирования изображений по текстовому запросу. Модель решает различные классы задач, включая модификацию изображений в стиле Photoshop, глобальную оптимизацию фотографий и…
Google MobileDiffusion: генерация изображений на мобильных устройствах
4 февраля 2024
Google MobileDiffusion: генерация изображений на мобильных устройствах
Google представила MobileDiffusion – модель преобразования текста в изображение в реальном времени, полностью работающую на мобильных устройствах. На Android- и iOS-устройствах с процессорами последних поколений генерация изображения с разрешением 512×512…
You.com обучили отвечать на многоэтапные поисковые запросы
28 января 2024
You.com обучили отвечать на многоэтапные поисковые запросы
В поисковый сервис You.com, предоставляющий персонализированные ответы с помощью языковых моделей, добавили три новых режима – Genius, Create и Research. В данных режимах сервис выдает ответ в виде сгенерированных изображений…
В Deepmind обучили модель AlphaGeometry решать олимпиадные геометрические задачи
21 января 2024
В Deepmind обучили модель AlphaGeometry решать олимпиадные геометрические задачи
Deepmind представила AlphaGeometry – модель, решающую геометрические задачи на уровне победителей Международной математической олимпиады. AlphaGeometry решила 25 из 30 задач олимпиады, в то время как в среднем победители олимпиады решают…
Microsoft DragNUWA: генерация видео с помощью траекторий объектов
15 января 2024
Microsoft DragNUWA: генерация видео с помощью траекторий объектов
Microsoft опубликовала веса DragNUWA – кросс-доменной модели генерации видео, обеспечивающей более прецизионный контроль над получаемым результатом по сравнению с аналогичными моделями. Контроль достигается за счет одновременного использования в качестве входных…
Pika 1.0: веб-платформа для генерации видео
7 января 2024
Pika 1.0: веб-платформа для генерации видео
Стартап Pika Labs запустил Pika 1.0 – бесплатную веб-платформу для генерации и редактирования видео с помощью текстовых запросов. Сервис создает как реалистичные видео, так и 3D-анимацию в различных стилях. При…
Диффузионную модель обучили прогнозировать химические реакции
27 декабря 2023
Диффузионную модель обучили прогнозировать химические реакции
Ученые MIT разработали модель, прогнозирующую вероятность достижения молекулой переходного состояния – состояния, определяющего вероятность протекания химической реакции. Модель будет использоваться в исследованиях реакций и катализаторов для разработки новых видов топлива…
VideoPoet: языковая модель Google для генерации и редактирования видео
23 декабря 2023
VideoPoet: языковая модель Google для генерации и редактирования видео
Google представила VideoPoet – языковую модель для мультимодальной работы с видеоконтентом, способную преобразовывать текст и изображение в ролики, стилизовать существующие видео и генерировать аудиодорожки к ним без подсказок. VideoPoet обучает…
Google MusicFX: создание музыки по текстовому запросу
17 декабря 2023
Google MusicFX: создание музыки по текстовому запросу
Google запустил MusicFX – онлайн-сервис для генерации музыки по текстовому запросу. В продукте используется модель Google MusicLM, а каждый аудиофайл содержит незаметный для слушателя водяной знак, сгенерированный с помощью DeepMind…
FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами
14 декабря 2023
FractalGPT запустил агента вопросно-ответной системы для общения с загруженными документами
Разработчики FractalGPT запустили QA-агента FractalGPT для работы с документами, который позволяет использовать в диалогах загруженные пользователями PDF, TXT и DOCX файлы. Ключевые особенности FractalGPT QA: Обработка документов любой длины, без типичного…
Shopping Muse: рекомендательная система Mastercard
10 декабря 2023
Shopping Muse: рекомендательная система Mastercard
Mastercard представила Shopping Muse – модуль для интернет-магазинов в формате чат-бота, рекомендующий покупателю товары на основе его истории покупок и поиска, региона и других признаков. Shopping Muse работает на базе…
Google представила набор языковых моделей Gemini
7 декабря 2023
Google представила набор языковых моделей Gemini
Google сообщила о создании Gemini – набора из трех языковых моделей, превосходящих конкурентов в 30 из 32 бенчмарках. Старшая модель Gemini Ultra доступна через API, средняя Gemini Pro будет использоваться…
Нейросеть DeepMind GNoME открыла 2 миллиона новых материалов
3 декабря 2023
Нейросеть DeepMind GNoME открыла 2 миллиона новых материалов
DeepMind разработала графовую нейросеть GNoME, прогнозирующую стабильность материалов. GNoME обнаружила 2,2 миллиона новых материалов, 380 тысяч из которых являются стабильными и могут быть применены для разработки компьютерных чипов, аккумуляторов и…
Stable Video Diffusion: генератор видео по изображению от Stability AI
26 ноября 2023
Stable Video Diffusion: генератор видео по изображению от Stability AI
Компания Stability AI объявила о выпуске Stable Video Diffusion – набора из двух моделей, генерирующих видео продолжительностью до 4 секунд по входному изображению. Обе модели опубликованы в открытом доступе. Модели…
LCM-LoRA: генерация изображений в реальном времени
19 ноября 2023
LCM-LoRA: генерация изображений в реальном времени
Исследователи Университета Цинхуа разработали алгоритм LCM-LoRA, позволяющий в реальном времени генерировать изображения по текстовому описанию или наброску. Наиболее популярным text-to-image моделям, таким как Stable Diffusion, Midjourney и DALLE-3, требуется от…