Искусственный интеллект DALL-E по генерации изображений из текста научили редактировать фотографии
Дебютировавший в 2021 году искусственный интеллект на основе OpenAI получил обновление. Теперь DALL-E, который преобразовывал текст в изображения, может редактировать уже существующие фотографии.
Для редактирования ИИ нужно указать область, которую следует изменить, и он может или удалить объект, или поместить вместо него другой. Как пример разработчики приводят фотографию комнаты с бассейном, и DALL-E добавляет надувной круг в виде фламинго, учитывая даже тени в комнате.
Другое новшество – инструмент создания изображения из нескольких. Пользователи могут загрузить начальное изображение и создать несколько похожих на него вариантов. Алгоритм может смешивать несколько изображения, создавая одну из элементов обоих. DALL-E создает сгенерированные изображения размером 1024×1024 пикселя, хотя в первоначальном варианте ИИ создавались картинки с 256×256 пикселями.
DALL-E основан на CLIP, системе компьютерного зрения, которую OpenAI также анонсировала в прошлом году.
«Первый вариант ИИ просто брал подход GPT-3 из языка и применял его для создания изображения: мы сжали изображения в набор слов и научились предсказывать, что будет дальше».
Ученый-исследователь OpenAI Прафулла Дхаривал
Полная модель DALL-E никогда не публиковалась, но разработчики могут зарегистрироваться, чтобы протестировать систему. В OpenAI надеются позже сделать ее доступной для использования в сторонних приложениях.
Ведущий ученый OpenAI предположил существование ИИ с зачатками сознания, чем вызвал бурную реакцию у коллег