Stability AI выпустила «самую совершенную» версию своей модели синтеза изображений – с 3,5 млрд параметров
Стартап Stability AI продолжает совершенствовать свои модели генеративного ИИ и выпускает Stable Diffusion XL 1.0 – доступную в открытом коде на GitHub, в дополнение к API Stability и программам ClipDrop и DreamStudio.
«Самая совершенная», по словам Stability AI, версия обеспечивает более яркие и более точные цвета, лучший контраст, тени и освещение по сравнению с предшественницами.
Techcunch пишет, что Stable Diffusion XL 1.0 содержит 3,5 млрд параметров и может создавать полные изображения с разрешением 1 мегапиксель «за секунды» в нескольких соотношениях сторон. («Параметры» – это части модели, полученные из обучающих данных, которые, по сути, определяют навыки технологии в генерировании медиа или текста).
Предыдущая версия Stable Diffusion XL 0.9 тоже могла создавать изображения с более высоким разрешением, но требовала большей вычислительной мощности.
Помимо вышеперечисленного, Stable Diffusion XL 1.0 сможет лучше генерировать текстовые надписи – раньше логотипы получались не слишком разборчивыми. Модель поддерживает функции «дорисовки», то есть расширения изображений, и «подсказку к подсказке», когда пользователи с помощью текста могут обновить сгенерированное изображение.
Stable Diffusion XL 1.0 также подразумевает сложные текстовые инструкции, состоящие из нескольких частей.
В то же время, как и предыдущие версии Stable Diffusion XL 1.0 может столкнуться с этическими проблемами. Ее доступность в открытом коде могут использовать злоумышленники для создания вредоносного контента, например дипфейков. Компания говорит, что приняла «дополнительные меры», чтобы предотвратить это путем фильтрации учебных данных и блокирования проблемных терминов в инструменте.
Другая проблема – модель снова использовала для обучения работы художников, выступавших против такого заимствования. Stability AI утверждает, что защищена от юридической ответственности доктриной добросовестного использования, по крайней мере в США, но принимает во внимание «запросы» художников.
Параллельно с запуском обновленной модели Stability AI выпускает бета-версию функции тонкой настройки для своего API, которая разрешит использовать только пять изображений, чтобы специализировать генерацию на конкретных людей, продукты и т.д. Компания также переносит Stable Diffusion XL 1.0 на Bedrock, облачную платформу Amazon для размещения генеративных моделей ИИ, расширяя ранее объявленное сотрудничество с AWS.