Sora — новая ИИ-модель от OpenAI, которая генерирует видео из текста
Последняя модель OpenAI превращает текстовые подсказки в «сложные реалистичные сцены с несколькими персонажами, определенными типами движения и точными деталями объекта и фона» — продолжительностью до минуты.
Компания также отмечает, что Sora может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции». Модель также может генерировать видео на основе неподвижного изображения и заполнять недостающие кадры в существующем видео или расширять его.
Сгенерированные Sora демо-ролики, опубликованные на X, включают в частности пролет камеры по заснеженной улице Токио — правда, если внимательно присмотреться, можно отыскать признаки работы искусственного интеллекта (например, разъединенные со стволами кроны деревьев).
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
Несколько лет назад именно генераторы текста в изображения, такие как Midjourney, привлекли большое внимание к отрасли ИИ, однако сейчас такие компании, как Runway и Pika взялись совершенствовать технологию для видео. Lumiere от Google сейчас можно считать основным конкурентом OpenAI в этой сфере (хотя продолжительность ролика у этой модели ограничена до 5 секунд).
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
Сейчас Sora доступна только для «красных команд», которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также предлагает доступ для некоторых художников, дизайнеров и режиссеров, чтобы получить отзывы.
Ранее в этом месяце OpenAI объявила, что добавляет водяные знаки к своему инструменту для преобразования текста в изображение DALL-E 3, но отмечает, что их можно «легко удалить».
Присоединяйся к конкурса авторов ИТС! Выигрывай крутые призы от наших партнеров Logitech — профессиональный игровой руль и низкопрофильные игровые клавиатуры.