OpenAI объявила о выходе Dall-E 3 в интерфейсе ChatGPT в начале октября. В анонсе исследователи рассказали, что новая версия нейросети для генерации изображений значительно превосходит Dall-E-2 по нескольким критериям. Dall-E 3 досконально учитывает каждое слово в промпте, на изображениях корректно выводиться текст. Улучшена проработка сцены и взаимосвязь между объектами на изображении, отрисовка рук и других частей тела.
Сравните изображения, сгенерированные Dall-E 2 (слева) и Dall-E 3:
Интеграция с ChatGPT
Поиск правильного промпта для создания изображения упростится. Dall-E будет полностью интегрирована с ChatGPT, который станет играть роль промпт-инженера. Достаточно описать картинку простыми словами в любом порядке и чат-бот составит подробный промпт для создания качественного изображения. Сгенерированное изображение можно будет поправить о довести до идеального состояния, общаясь с ChatGPT.
Дата выхода Dall-E 3
Dalle-3 станет доступна в первой половине октября для пользователей платных версий ChatGPT и через API. Сгенерированные изображения также как и сейчас будут свободными для использования в любых целях без дополнительных условий.
Примеры изображений, созданных в новой версии нейросети:
Ограничения
Пользователям будет запрещено генерировать изображение, если в описании указан ныне живущий художник или фотограф с целью защиты авторских прав. Алгоритм будет отклонять запросы, в которых упоминаются известные личности: политики, музыканты, общественные деятели. Также исследователи OpenAI разрабатывают с «классификатор происхождения» — внутренний инструмент, который выявляет изображения, созданные с помощью Dall-E 3. По сообщению исследователей, этот классификатор поможет понять, как используются сгенерированные изображения.