Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

21 ноября 2022
LLM Carbon footprint

Стартап HuggingFace подсчитал, сколько тонн углекислого газа выделяется при создании LLM моделей

У больших языковых моделей (LLM) есть «грязный секрет»: до сих пор остается загадкой, насколько велик углеродный след этих моделей. AI-стартап Hugging Face разработал способ оценки выбросов, производимых в течение всего…

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

16 ноября 2022
andromeda cerebras

Cerebras представила суперкомпьютер Andromeda: 2,6 триллиона 7-нм транзисторов, 850 000 ядер, мощность 15 кВт

Компания Cerebras, производящая самый крупный в мире чип Wafer Scale Engine 2 (WSE-2), представила свой суперкомпьютер Andromeda. Andromeda объединяет 16 чипов WSE-2 размером около 20 сантиметров в один кластер с…

Deepmind представила универсальную модель Gato

28 мая 2022

Deepmind представила универсальную модель Gato

DeepMind представила кросс-модальную универсальную модель с 1.2 миллиардами параметров Gato. Gato может выполнять более 600 задач, таких как воспроизведение видеоигр, создание субтитров к изображениям и управление роботами. DeepMind обучила Gato…

Mastercard запустила тестирование оплаты по биометрии

28 мая 2022

Mastercard запустила тестирование оплаты по биометрии

Mastercard начала тестирование программы для розничных магазинов, предлагающей оплату покупок с помощью распознавания лиц или сканирования отпечатков пальцев. Компания планирует в ближайшие годы развернуть новую схему оплаты на весь мир…

GraphWorld: бенчмарк для графовых нейросетей

9 мая 2022

GraphWorld: бенчмарк для графовых нейросетей

Google AI представила бенчмарк для графовых нейросетей GraphWorld. Бенчмарк использует несколько миллионов синтетических датасетов, воспроизводящих широкий класс графов, и генерирует обобщенную оценку нейросети на основе ее тестирования на всех датасетах.…

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

1 апреля 2022

Jigsaw: инструмент Microsoft для работы с text-to-code моделями

Microsoft представила Jigsaw – инструмент откладки выдачи text-to-code моделей путем предоставления примеров выходных данных. При работе с Python Pandas инструмент позволил повысить точность Codex более чем в два раза. C…

Система компьютерного зрения уменьшает задержки вылетов самолетов

28 февраля 2022

Система компьютерного зрения уменьшает задержки вылетов самолетов

Израильский стартап IntellAct разработал систему мониторинга действий сотрудников аэропорта для уменьшения задержек рейсов. Предварительные испытания системы, проведенные авиакомпанией El Al в аэропорту Бен-Гурион, показали, что она сокращает задержки вылетов на 15%.…

Датасеты для генерации и анализа музыки

27 февраля 2022

Датасеты для генерации и анализа музыки

В статье приводится обзор датасетов с музыкальными произведениями. Датасеты разработаны для обучения моделей генерации, распознавания и анализа музыки. NSynth Крупнейший датасет, состоящий из 305 979 музыкальных нот, включая высоту звука,…

Модель обучили предсказывать потенциально опасные штаммы коронавируса

24 января 2022

Модель обучили предсказывать потенциально опасные штаммы коронавируса

Компании BioNTech и InstaDeep разработали «систему раннего предупреждения» для выявления новых опасных вариантов коронавируса. Система выявила 12 из 13 вариантов коронавируса, которые Всемирная организация здравоохранения выделила как потенциально опасные. Система нацелена…

HyperStyle: фотореалистичное редактирование изображений

24 января 2022

HyperStyle: фотореалистичное редактирование изображений

HyperStyle — нейросеть, модифицирующая отдельные параметры объектов на фотографиях. C помощью HyperStyle можно изменить прическу человека или цвет машины. Нейросеть, обученная на изображениях объектов одного типа, позволяет практически в реальном времени…

Boomy: генерация песен для публикации в стримингах

22 января 2022

Boomy: генерация песен для публикации в стримингах

Boomy — сайт и приложение, которое позволяет создавать песни на основе алгоритмов машинного обучения. С момента запуска сервиса его пользователи опубликовали более 100 000 песен в стриминговых сервисах. После выбора…

На швейцарских железных дорогах внедрили систему мониторинга безопасности

21 января 2022

На швейцарских железных дорогах внедрили систему мониторинга безопасности

Baselland Transport AG, швейцарская компания общественного транспорта, внедрила систему обнаружения угроз для обеспечения безопасности железнодорожных перевозок. Система применяет технологии компьютерного зрения и машинного обучения для мониторинга и анализа состояния железнодорожного…

В Нидерландах открылись роботизированные магазины

12 января 2022

В Нидерландах открылись роботизированные магазины

Одна из крупнейших китайских e-commerce платформ JD.com открыла в Нидерландах два полностью роботизированных магазина. В магазинах Ochama роботы собирают заказы и выдают их клиентам или предлагают оформить доставку. Магазины JD.com…

John Deere представила беспилотный трактор

7 января 2022

John Deere представила беспилотный трактор

Крупнейшая в мире компания-производитель сельскохозяйственной техники John Deere приступила к серийному выпуску первого беспилотного трактора. Он может самостоятельно выполнять простые задачи и передавать данные в центр управления. Разработка и тестирование…

Приложение Google ищет похожих животных на картинах

26 декабря 2021

Приложение Google ищет похожих животных на картинах

Google добавила в iOS- и Android-приложение Google Arts & Culture функцию Pet Portraits. Pet Portraits выполняет поиск двойника животного на объектах искусства. Схожая функция была доступна с 2018-го года для…

В OpenAI обучили модель искать ответы на вопросы в Интернете

19 декабря 2021

В OpenAI обучили модель искать ответы на вопросы в Интернете

OpenAI представила WebGPT — модель, выполняющую поиск ответа на вопрос в Интернете. WebGPT комбинирует информацию из нескольких источников и генерирует текст ответа. Языковые модели, такие как GPT-3, полезны для многих…

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

19 декабря 2021

Uni-TTSv4: модель Microsoft, преобразовывающая текст в речь

Microsoft представила обновление Uni-TTS — модели, преобразовывающую текст в речь. Uni-TTSv4 обеспечивает наилучшее качество речи среди аналогичных state-of-the-art моделей и в ближайшее время будет доступна в Azure более чем на…

Amazon представила инструменты AWS на основе машинного обучения

12 декабря 2021

Amazon представила инструменты AWS на основе машинного обучения

На конференции re: Invent 2021 Amazon анонсировала продукты на основе машинного обучения, позволяющие повысить безопасность кода и автоматически анализировать содержание диалогов с клиентами в колл-центрах. Помимо этого, Amazon представила инстансы…

RETRO: языковая модель DeepMind

10 декабря 2021

RETRO: языковая модель DeepMind

DeepMind представила языковую модель RETRO, в которой реализована схема обучения, основанная на использовании внешней памяти. RETRO демонстрирует сравнимые с GPT-3 результаты несмотря на то, что она имеет в 25 раз…

Нейросеть NASA обнаружила 301 экзопланету

29 ноября 2021

Нейросеть NASA обнаружила 301 экзопланету

NASA разработала нейронную сеть Exominer, идентифицирующую космические объекты по затуханию излучения от звезд. На основе данных миссии Kepler нейросеть обнаружила более 300 ранее неизвестных экзопланет. Когда планета проходит между Землей…

Расширенные возможности обработки естественного языка в Watson Discovery

28 ноября 2021

Расширенные возможности обработки естественного языка в Watson Discovery

IBM объявила о добавлении новых функций обработки естественного языка в Watson Discovery — платформе для поиска и анализа текста, которая может извлекать важную информацию, скрытую в корпоративных данных. Добавленный функционал включает…