FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000
24 сентября 2023
FLM-101B: языковую модель со 101 миллиардом параметров обучили с нуля «всего» за $100 000
Исследователи из Пекинского университета представили FLM-101B — открытую большую языковую модель с 101 миллиардом параметров, обученную с нуля на 300 миллиардах токенов при затратах «всего лишь» $100 000. Обучение таких…
NudsTopBot: нейросеть, которая раздевает по фотографии
23 сентября 2023
NudsTopBot: нейросеть, которая раздевает по фотографии
NudsTopBot — это нейросеть, которая раздевает людей по фото, работает в виде Telegram-бота. Для начала работы с нейросетью нужен Telegram-аккаунт и фото девушки или мужчины в одежде. Качество раздевания ботом…
Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT
20 сентября 2023
Dall-E 3 выйдет в начале октября. OpenAI анонсировала интеграцию нейросети с ChatGPT
OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E…
В чат-бота Bard добавили интеграцию с сервисами Google
19 сентября 2023
В чат-бота Bard добавили интеграцию с сервисами Google
Google представил обновление чат-бота Bard, в котором появилась интеграция с сервисами компании — почтой, документами, таблицами, картами, Youtube. В качестве персонального помощника Bard получил конкурентное преимущество перед ChatGPT, который умеет…
Нейросеть применили для дистанционной диагностики неврологических расстройств
17 сентября 2023
Нейросеть применили для дистанционной диагностики неврологических расстройств
Ученые MIT разработали нейросеть, которая анализирует видеозаписи пациентов с двигательными или неврологическими расстройствами и оценивает их клиническое состояние в режиме реального времени. Инструмент работает на большинстве мобильных устройств и позволяет…
Würstchen: открытая text-to-image модель, которая обучается в 16 раз быстрее Stable Diffusion 1.4
14 сентября 2023
Würstchen: открытая text-to-image модель, которая обучается в 16 раз быстрее Stable Diffusion 1.4
Würstchen — открытая text-to-image модель, которая генерирует изображения быстрее, чем диффузные модели, такие как Stable Diffusion, и при этом потребляет гораздо меньше памяти, достигая сравнимых результатов. Подход основан на пайплайне…
Stable Audio: нейросеть для генерации музыки и звуков из текста от Stability AI
14 сентября 2023
Stable Audio: нейросеть для генерации музыки и звуков из текста от Stability AI
Stability AI представила Stable Audio — нейросеть для генерации музыки и звуков по текстовой подсказке заданной пользователем длины. Stable Audio способна генерировать 95 секунд стереоаудио с частотой дискретизации 44,1 кГц…
Взгляд в будущее через технологические достижения
14 сентября 2023
Взгляд в будущее через технологические достижения
Мир движется к инновационному и продуктивному будущему благодаря многочисленным технологическим достижениям. Компании уже начали использовать цифровые аватары вместо людей на основе таких передовых технологий, как искусственный интеллект, компьютерное зрение и…
Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU
11 сентября 2023
Persimmon-8B: открытая модель с длиной контекста 16k токенов, работающая на одном GPU
Исследователи из Adept представили open source языковую модель Persimmon-8B c длиной контекста 16k токенов, что в 4 раза больше самой компактной Llama 2 и text-davinci-002, используемой в GPT-3.5. Длинный контекст…
Hiber3D: создание метавселенных с помощью естественного языка
10 сентября 2023
Hiber3D: создание метавселенных с помощью естественного языка
Компания Hiber, разрабатывающая инструменты для создания метавселенных, объявила об интеграции с Google PaLM. Обновление Hiber3D позволит пользователям создавать и модифицировать 3D-сцены c помощью запросов на естественном языке. С помощью no-code…
Falcon 180B: самая крупная открытая языковая модель превзошла результаты Llama 2 и GPT 3.5
6 сентября 2023
Falcon 180B: самая крупная открытая языковая модель превзошла результаты Llama 2 и GPT 3.5
Институт Технологических Инноваций из ОАЭ представил Falcon 180B — крупнейшую открытую языковую модель, потеснившую Llama 2 с первого места в рейтинге предобученных open-access языковых моделей от HugginFace. Модель была обучена…
OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала
5 сентября 2023
OpenAI предложила учителям использовать ChatGPT для подготовки к урокам и проверки изученного материала
OpenAI в преддверии нового учебного года рассказала, как учителя могут использовать ChatGPT для автоматизации процесса обучения. В статье «Teaching with AI» компания предложила 4 конкретных промпта-инструкции, которые можно использовать учителям…
PhotoGuard: защита изображений от изменения генеративным моделями
5 сентября 2023
PhotoGuard: защита изображений от изменения генеративным моделями
Исследователи MIT представили PhotoGuard – алгоритм защиты изображений от несанкционированных изменений генеративными моделями, позволяющий гарантировать подлинность изображений. Широкое распространение генеративных моделей (таких, как DALL-E и Midjourney) сделало простым даже для…
GigaGAN: open source модель генерирует изображения размером 512px за 0,13 секунды
1 сентября 2023
GigaGAN: open source модель генерирует изображения размером 512px за 0,13 секунды
GigaGAN — open source модель с 1 миллиардом параметров, которая генерирует изображения размером 512×512 пикселей за 0,13 секунды, что на порядки быстрее, чем диффузные и авторегрессионные модели. Кроме того, исследователи…
17 бесплатных курсов по машинному обучению, data science, анализу данных и python на русском языке
30 августа 2023
17 бесплатных курсов по машинному обучению, data science, анализу данных и python на русском языке
Бесплатные курсы по машинному обучению, data science, анализу данных и python основаны на образовательных программах от ведущих университетов — МФТИ, Stanford, Harvard, John Hopkins. Большинство курсов по машинному обучению представлены…
Code Llama: что умеет и как использовать state-of-the-art в написании кода
28 августа 2023
Code Llama: что умеет и как использовать state-of-the-art в написании кода
Модель Code Llama — дообученная Llama 2 для написания, завершения и исправления кода, распространяемая бесплатно для коммерческих и исследовательских целей. Code Llama ускоряет написание кода, снижает порог входа для начинающих…
Топ 10 нейросетей для генерации изображений по текстовому описанию. Рейтинг на сентябрь 2023
28 августа 2023
Топ 10 нейросетей для генерации изображений по текстовому описанию. Рейтинг на сентябрь 2023
Какая нейросеть рисует изображения по словам с максимально качественно и с минимальными временными затратами? Мы провели исследование, чтобы выяснить, какие нейросети для генерации изображений из текста лучшие в создании фотореалистичных…
Google VRDU: обучение моделей пониманию содержания документов
27 августа 2023
Google VRDU: обучение моделей пониманию содержания документов
Google опубликовала в открытом доступе VRDU – датасет и бенчмарк для обучения моделей пониманию содержания документов. VRDU нацелен на ускорение развития моделей, обрабатывающих сложные документы для повышения эффективности бизнес-процессов и…
OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач
22 августа 2023
OpenAI открыла возможность дообучать модель GPT-3.5 Turbo для конкретных задач
GPT-3.5 Turbo от OpenAI получил обновление, позволяющее разработчикам дообучать модель для использования в своих приложениях, что позволит разработчикам возможность максимально раскрыть потенциал GPT-3.5. Теперь разработчики могут делать тонкую настройку (finetuning)…
Arthur Bench: фреймворк для оценки языковых моделей
20 августа 2023
Arthur Bench: фреймворк для оценки языковых моделей
Американский стартап Arthur опубликовал в открытом доступе фреймворк Bench для оценки и сравнения производительности больших языковых моделей. Инструмент позволит пользователям выбрать языковую модель, наиболее подходящую для решения конкретной задачи, укажет…
ReLoRA: метод увеличения производительности обучения больших языковых моделей
16 августа 2023
ReLoRA: метод увеличения производительности обучения больших языковых моделей
ReLoRA — метод обучения больших языковых моделей-трансформеров с использованием матриц низкого ранга, который увеличивает производительность обучения. Эффективность метода возрастает с увеличением масштабов моделей. На модели с 1,3 миллиардами параметров использование…