«Самая совершенная» модель Stability AI напугала сеть изображениями людей-мутантов — зато пальцы на месте
На днях Stability AI выпустила свою новую модель генерации изображений Stable Diffusion 3 Medium, которую рекламировала как «самую совершенную» — однако ограничения в учебных данных нейросети привели к проблеме в воспроизведении человеческой анатомии.
Stable Diffusion 3 Medium генерирует жуткие изображения трехруких, трехногих или безголовых людей. Судя по сообщениям в соцсетях, проблемы чаще всего возникают, если запрос включает фон на траве или в воде (но непонятно с чем это связано).
В комментариях предполагают, что выдача изображений с «людьми-мутантами», связана с ограниченными учебными данными новой модели Stability AI, поскольку компания, вероятно, цензурировала большинство снимков с людьми.
Британский стартап рекламировал Stable Diffusion 3 Medium, как «самую совершенную открытую модель преобразования текста в изображение». Она содержит 2 млрд параметров, должна обеспечивать фотореалистичные результаты и устранять «типичные ошибки на руках и лице» — похоже, проблему с неправильным количеством пальцев таки исправили, но, как видим, общая анатомия тела крайне ухудшилась.
Сейчас пользователи могут протестовать Stable Diffusion 3 Medium через API Stability.
Основанный в 2020 году стартап Stability AI был быстро признан одним из новых лидеров генеративного искусственного интеллекта вместе с такими конкурентами как Midjourney и Dall-E от OpenAI. В 2022 году инвесторы оценивали компанию в $1 млрд. В то же время уже в 2023 году Stability AI столкнулась с рядом исков от художников, гендиректор компании Эмад Мостак ушел в отставку в марте, а компания задумалась о продаже из-за кризиса наличных.