Полиция Сан-Франциско собирается применять боевых роботов для убийства подозреваемых

28 ноября 2022
lethal robot

Полиция Сан-Франциско собирается применять боевых роботов для убийства подозреваемых

Департамент полиции Сан-Франциско (SFPD) разработал новые правила, позволяющие использовать боевых роботов для применения летальной силы к подозреваемым в совершении преступлений. Убивать подозреваемых с использованием боевых роботов планируется «в редких и…

Waymo получила разрешение на запуск беспилотного такси в Калифорнии

23 ноября 2022
waymo robotaxi

Waymo получила разрешение на запуск беспилотного такси в Калифорнии

Waymo, подразделение Alphabet для разработки беспилотных автомобилей, сделает беспилотное такси доступным для заказа в своем приложении в ближайшие недели. Waymo получила от Калифорнийской комиссии по коммунальным предприятиям (CPUC) разрешение на…

Nvidia представила генератор 3D-модели по текстовому описанию — Magic3D

23 ноября 2022
Magic3D model by Nvidia

Nvidia представила генератор 3D-модели по текстовому описанию — Magic3D

Исследователи из Nvidia 18 ноября представили Magic3D — генератор 3D-модели по текстовому описанию. После ввода текстовой подсказки, например «Синяя ядовитая лягушка, сидящая на кувшинке», Magic3D создает 3D модель с цветной…

Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

21 ноября 2022
LLM Carbon footprint

Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

У больших языковых моделей (LLM) есть «грязный секрет»: до сих пор остается загадкой, насколько велик углеродный след этих моделей. AI-стартап Hugging Face разработал способ оценки выбросов, производимых в течение всего…

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

16 ноября 2022
andromeda cerebras

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Компания Cerebras, производящая самый крупный в мире чип Wafer Scale Engine 2 (WSE-2), представила свой суперкомпьютер Andromeda. Andromeda объединяет 16 чипов WSE-2 размером около 20 сантиметров в один кластер с…

В графический редактор Canva добавили преобразователь текста в изображение

12 ноября 2022
canva text to image sample

В графический редактор Canva добавили преобразователь текста в изображение

Инструмент для создания изображений по текстовой подсказке, встроенный в редактор Canva, основан на text-to-image генераторе Stable Diffusion с открытым исходным кодом. Пользователи могут бесплатно создавать до 100 изображений в день.…

Российский стартап представил чатбота-психолога Sabina AI

7 ноября 2022
chatbot-sabina-ai

Российский стартап представил чатбота-психолога Sabina AI

Российский стартап Аватар Машина выпустил генеративного чатбота-психолога с искусственным интеллектом Sabina AI. Бот мгновенно генерирует полные и развернутые ответы на заданную психологическую проблему или ситуацию, описанную пользователем. Sabina уже доступна…

Google показала генератор текста Wordcraft на основе LaMDA на конференции в Нью-Йорке

5 ноября 2022
lamda wordcraft

Google показала генератор текста Wordcraft на основе LaMDA на конференции в Нью-Йорке

13 профессиональных авторов тестировали языковую модель Google LaMDA (Language Model for Dialogue Applications) в течение нескольких месяцев. Результатом стала презентация Wordcraft — редактора текстов со встроенными рекомендациями, на конференции GoogleAI…

OpenAI открыла доступ к DALL-E без списка ожидания

28 октября 2022

OpenAI открыла доступ к DALL-E без списка ожидания

OpenAI объявила, что пользователям больше не придется ждать своей очереди для получения доступа к сервису генерации изображений DALL-E AI. Теперь сервис доступен после прохождения регистрации на сайте: пользователю требуется подтвердить…

Джо Роган «взял интервью» у Стива Джобса на сервисе podcast.ai

12 октября 2022
стив джобс и джо роган podcast

Джо Роган «взял интервью» у Стива Джобса на сервисе podcast.ai

На сервисе podcast.ai вышло 20-минутное интервью со сгенерированными голосами Стива Джобса и Джо Рогана. Интервью было создано с использованием GPT-3 и генератора речи на основе текста, а воссозданный голос Джобса…

Google представил нейросеть для детекции туберкулеза на радиограммах

8 сентября 2022
x ray google ai model TB

Google представил нейросеть для детекции туберкулеза на радиограммах

Каждый год туберкулез убивает 1,4 миллиона человек по всему миру. Google присоединился к борьбе с болезнью, разработав нейронную сеть для автоматизации обнаружения и ускорения лечения туберкулеза. Применять ее планируется в…

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

26 августа 2022

Первый в мире NLP ассистент на базе GPT-3 доступен в Appstore

ParagraphAI готов изменить наше представление о писательстве: приложение мгновенно генерирует оригинальные и точные абзацы текста на заданную тему с правильной грамматикой и возможностью коррекции тона. ParagraphAI уже месяц доступен для…

META опубликовала модель для перевода текста на 200 языков

10 июля 2022
META AI Model translate 200 languages

META опубликовала модель для перевода текста на 200 языков

Meta выложила в открытый доступ модель NLLB-200 для перевода текста на 200 языков. Проект «No Language Left Behind» является частью планов Meta по поддержке редко используемых языков и разработке универсального…

В Сан-Франциско началось расследование аварии с беспилотным такси Cruise

9 июля 2022
cruise taxi

В Сан-Франциско началось расследование аварии с беспилотным такси Cruise

Национальная администрация безопасности дорожного движения (НАБДД) расследует аварию с участием беспилотного такси Cruise. Агентство начало расследование аварии, произошедшей 3 июня в Сан-Франциско, в результате которой пассажиры обоих автомобилей получили легкие…

Google Imagen: генерация фотореалистичных изображений по описанию

29 июня 2022

Google Imagen: генерация фотореалистичных изображений по описанию

Google представила Imagen — модель, трансформирующую текстовое описание в изображение c разрешением 1024×1024 пикселей. Imagen превзошла OpenAI DALL-E 2 по степени реалистичности изображений. Imagen является комбинацией языковых моделей-трансформеров, используемых для…

Lang: анализ диалогов клиентов со службой поддержки

28 мая 2022

Lang: анализ диалогов клиентов со службой поддержки

Стартап Lang разработал систему, которая интегрируется со службой поддержки и CRM для автоматического распознавания темы разговора и выявления трендов в причинах обращений клиентов. Инструмент использует неконтролируемую модель обучения для адаптации…

LAION-5B: крупнейший датасет пар изображение-текст

28 мая 2022

LAION-5B: крупнейший датасет пар изображение-текст

LAION-5B — датасет пар изображение-текст, собранных в Интернете. LAION-5B содержит более 5 миллиардов пар, что делает его крупнейшим среди аналогичных датасетов. AION-5B был собран путем парсинга датасета Common Crawl для…

Deepmind представила универсальную модель Gato

28 мая 2022

Deepmind представила универсальную модель Gato

DeepMind представила кросс-модальную универсальную модель с 1.2 миллиардами параметров Gato. Gato может выполнять более 600 задач, таких как воспроизведение видеоигр, создание субтитров к изображениям и управление роботами. DeepMind обучила Gato…

Mastercard запустила тестирование оплаты по биометрии

28 мая 2022

Mastercard запустила тестирование оплаты по биометрии

Mastercard начала тестирование программы для розничных магазинов, предлагающей оплату покупок с помощью распознавания лиц или сканирования отпечатков пальцев. Компания планирует в ближайшие годы развернуть новую схему оплаты на весь мир…

Модель обучили выполнять кросс-модальный поиск действий

9 мая 2022

Модель обучили выполнять кросс-модальный поиск действий

В MIT разработали модель кросс-модального поиска действий в текстовом, аудио- и видеоконтенте. Модель позволяет определить, где в видео происходит определенное действие, и идентифицировать его. Алгоритм обучен представлять данные таким образом,…

Flamingo: мультимодальная модель DeepMind

9 мая 2022

Flamingo: мультимодальная модель DeepMind

Flamingo – мультимодальная модель DeepMind, генерирующая текстовое описание фото, видео и звуков. Модель превосходит предыдущие state-of-the-art модели в 16 задачах, а ее особенностью является возможность обучаться на нескольких примерах. Обычно…