FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000

24 сентября 2023
FLM 101B evaluating growth strategy

FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000

Исследователи из Пекинского университета представили FLM-101B — открытую большую языковую модель с 101 миллиардом параметров, обученную с нуля на 300 миллиардах токенов при затратах «всего лишь» $100 000. Обучение таких…

NudsTopBot: нейросеть, которая раздевает по фотографии

23 сентября 2023
нейросеть раздевает по фото

NudsTopBot: нейросеть, которая раздевает по фотографии

NudsTopBot — это нейросеть, которая раздевает людей по фото, работает в виде Telegram-бота. Для начала работы с нейросетью нужен Telegram-аккаунт и фото девушки или мужчины в одежде. Качество раздевания ботом…

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

20 сентября 2023
Dalle-3

Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT

OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E…

В чат-бота Bard добавили интеграцию с сервисами Google

19 сентября 2023
bard_with_google_services

В чат-бота Bard добавили интеграцию с сервисами Google

Google представил обновление чат-бота Bard, в котором появилась интеграция с сервисами компании — почтой, документами, таблицами, картами, Youtube. В качестве персонального помощника Bard получил конкурентное преимущество перед ChatGPT, который умеет…

Нейросеть применили для дистанционной диагностики неврологических расстройств

17 сентября 2023
нейросеть удаленно диагностирует неврологические расстройства

Нейросеть применили для дистанционной диагностики неврологических расстройств

Ученые MIT разработали нейросеть, которая анализирует видеозаписи пациентов с двигательными или неврологическими расстройствами и оценивает их клиническое состояние в режиме реального времени. Инструмент работает на большинстве мобильных устройств и позволяет…

Würstchen: открытая text-to-image модель, которая обучается в 16 раз быстрее Stable Diffusion 1.4

14 сентября 2023
Würstchen approach

Würstchen: открытая text-to-image модель, которая обучается в 16 раз быстрее Stable Diffusion 1.4

Würstchen — открытая text-to-image модель, которая генерирует изображения быстрее, чем диффузные модели, такие как Stable Diffusion, и при этом потребляет гораздо меньше памяти, достигая сравнимых результатов. Подход основан на пайплайне…

Stable Audio: нейросеть для генерации музыки и звуков из текста от Stability AI

14 сентября 2023
Stable Audio - music generation AI

Stable Audio: нейросеть для генерации музыки и звуков из текста от Stability AI

Stability AI представила Stable Audio — нейросеть для генерации музыки и звуков по текстовой подсказке заданной пользователем длины. Stable Audio способна генерировать 95 секунд стереоаудио с частотой дискретизации 44,1 кГц…

Взгляд в будущее через технологические достижения

14 сентября 2023
технологические достижения (1)

Взгляд в будущее через технологические достижения

Мир движется к инновационному и продуктивному будущему благодаря многочисленным технологическим достижениям. Компании уже начали использовать цифровые аватары вместо людей на основе таких передовых технологий, как искусственный интеллект, компьютерное зрение и…

Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU

11 сентября 2023
persimmon-8b-llm

Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU

Исследователи из Adept представили open source языковую модель Persimmon-8B c длиной контекста 16k токенов, что в 4 раза больше самой компактной Llama 2 и text-davinci-002, используемой в GPT-3.5. Длинный контекст…

Hiber3D: создание метавселенных с помощью естественного языка

10 сентября 2023
Hiber3D creating metaverses with LLM

Hiber3D: создание метавселенных с помощью естественного языка

Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…

Falcon 180B: самая крупная открытая языковая модель превзошла результаты Llama 2 и GPT 3.5

6 сентября 2023
falcon 180b model intro

Falcon 180B: самая крупная открытая языковая модель превзошла результаты Llama 2 и GPT 3.5

Институт Технологических Инноваций из ОАЭ представил Falcon 180B — крупнейшую открытую языковую модель, потеснившую Llama 2 с первого места в рейтинге предобученных open-access языковых моделей от HugginFace. Модель была обучена…

OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала

5 сентября 2023
chatgpt for teachers

OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала

OpenAI в преддверии нового учебного года рассказала, как учителя могут использовать ChatGPT для автоматизации процесса обучения. В статье «Teaching with AI» компания предложила 4 конкретных промпта-инструкции, которые можно использовать учителям…

PhotoGuard: защита изображений от изменения генеративным моделями

5 сентября 2023
photoguard

PhotoGuard: защита изображений от изменения генеративным моделями

Исследователи MIT представили PhotoGuard – алгоритм защиты изображений от несанкционированных изменений генеративными моделями, позволяющий гарантировать подлинность изображений. Широкое распространение генеративных моделей (таких, как DALL-E и Midjourney) сделало простым даже для…

GigaGAN: open source модель генерирует изображения размером 512px за 0,13 секунды

1 сентября 2023
GIGAGAN

GigaGAN: open source модель генерирует изображения размером 512px за 0,13 секунды

GigaGAN — open source модель с 1 миллиардом параметров, которая генерирует изображения размером 512×512 пикселей за 0,13 секунды, что на порядки быстрее, чем диффузные и авторегрессионные модели. Кроме того, исследователи…

17 бесплатных курсов по машинному обучению, data science, анализу данных и python на русском языке

30 августа 2023
free machine learning data science analysis python courses

17 бесплатных курсов по машинному обучению, data science, анализу данных и python на русском языке

Бесплатные курсы по машинному обучению, data science, анализу данных и python основаны на образовательных программах от ведущих университетов — МФТИ, Stanford, Harvard, John Hopkins. Большинство курсов по машинному обучению представлены…

Code Llama: что умеет и как использовать state-of-the-art в написании кода

28 августа 2023
code llama model

Code Llama: что умеет и как использовать state-of-the-art в написании кода

Модель Code Llama — дообученная Llama 2 для написания, завершения и исправления кода, распространяемая бесплатно для коммерческих и исследовательских целей. Code Llama ускоряет написание кода, снижает порог входа для начинающих…

Топ 10 нейросетей для генерации изображений по текстовому описанию. Рейтинг на сентябрь 2023

28 августа 2023
нейросети генерируют картинки по текстовому описанию

Топ 10 нейросетей для генерации изображений по текстовому описанию. Рейтинг на сентябрь 2023

Какая нейросеть рисует изображения по словам с максимально качественно и с минимальными временными затратами? Мы провели исследование, чтобы выяснить, какие нейросети для генерации изображений из текста лучшие в создании фотореалистичных…

Google VRDU: обучение моделей пониманию содержания документов

27 августа 2023
google vrdu 2

Google VRDU: обучение моделей пониманию содержания документов

Google опубликовала в открытом доступе VRDU – датасет и бенчмарк для обучения моделей пониманию содержания документов. VRDU нацелен на ускорение развития моделей, обрабатывающих сложные документы для повышения эффективности бизнес-процессов и…

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

22 августа 2023
GPT 3.5 turbo finetuning

OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач

GPT-3.5 Turbo от OpenAI получил обновление, позволяющее разработчикам дообучать модель для использования в своих приложениях, что позволит разработчикам возможность максимально раскрыть потенциал GPT-3.5. Теперь разработчики могут делать тонкую настройку (finetuning)…

Arthur Bench: фреймворк для оценки языковых моделей

20 августа 2023
arthur bench

Arthur Bench: фреймворк для оценки языковых моделей

Американский стартап Arthur опубликовал в открытом доступе фреймворк Bench для оценки и сравнения производительности больших языковых моделей. Инструмент позволит пользователям выбрать языковую модель, наиболее подходящую для решения конкретной задачи, укажет…

ReLoRA: метод увеличения производительности обучения больших языковых моделей

16 августа 2023
relora method

ReLoRA: метод увеличения производительности обучения больших языковых моделей

ReLoRA — метод обучения больших языковых моделей-трансформеров с использованием матриц низкого ранга, который увеличивает производительность обучения. Эффективность метода возрастает с увеличением масштабов моделей. На модели с 1,3 миллиардами параметров использование…