Новостями про искусственный интеллект никого уже не удивить. Люди постепенно привыкают к нейросетям, и даже перестают их бояться. К тому же, согласитесь, что с приходом ИИ в нашу повседневную жизнь, решение многих задач, которые требовали особых навыков и отнимали немалое количество времени, стало намного проще.
Написать короткий текст – пожалуйста, нарисовать по описанию картинку – нет ничего проще. И вот теперь при помощи нейросети, которую, кстати, зовут Sora, можно будет создавать короткие видео. Достаточно будет дать искусственному интеллекту небольшие текстовые подсказки. О том, что умеет Sora и как на результаты ее работы реагирует публика, расскажем в нашей статье.
Кто такая Sora и что она умеет?
Новую систему генеративного искусственного интеллекта по имени Sora создала компания OpenAI. В отличие от многих других нейросетей она сочетает в себе как функции трансформера, так и инструменты диффузной модели. Чтобы было понятнее – трансформеры чаще всего используются в больших языковых моделях. Самый известный ИИ такого типа – ChatGPT. А диффузные модели обычно лежат в основе нейросетей, которые генерируют изображения.
Иными словами Sora является так называемой «моделью диффузного трансформатора». Что означает, что она умеет и то, и другое. Однако дело не только в простом арифметическом соединении определенных навыков. Эту нейросеть отличает иной качественный подход к генерации.
Например, если взять ИИ, который создает картинки, то, в целом, из последовательности изображений можно сделать видео. Но при этом между кадрами не будет никакой согласованности, они будут выглядеть просто как быстро мелькающие слайды. Для того, чтобы сделать полноценный ролик, нужно понимать – как именно картинки связаны между собой, как одно возникает из другого. И вот тут Sora «включает» архитектуру преобразователя. Для этого ей приходится задействовать свои таланты трансформера. Только если тот же CahtGPT ищет закономерности и смысловые связки среди слов, образующих текст, то Sora использует маркеры пространства и времени.
О том, как искуственный интеллект представляют себе писатели, вы узнаете,прочитав статью «Будущее не за горами: топ книг про ИИ»
Лучшая из лучших
Нейросети, генерирующие видео, уже существуют. Например, совсем недавно компания Google представила свою версию ИИ такого типа – Lumiere. Однако все другие модели явно уступают Sore в качестве генерируемого видео. Начать с того, что с первого взгляда невозможно определить, что ролики созданы искусственным интеллектом, столько в них логики, красоты и жизни. Создается впечатление, что видео снято отличным оператором, который отлично разбирается в своем деле.
Кроме того, в отличие от других от других ИИ, новая нейросеть умеет создавать длинные видео (до 60 секунд) высокого разрешения (1920 х 1080 пикселей), да еще и с различным соотношением сторон. Lumiere, например, такого не умеет. А еще она умеет редактировать ролики, создавать их из других видео, и нескольких изображений, «доснимать» продолжение и многое другое. В общем – умница, да и только.
Будущее Sora
Хотя сегодня уже поднимаются вопросы о том, что нейросети или роботы не обязательно должны иметь практическое применение, они могут существовать просто на радость людям, к Sora это не относится. Безусловно, у нее есть большое будущее. И дело даже не в том, что любой желающий сможет создать потрясающую фантастическую зарисовку, всего лишь заказав «фотореалистичное видео крупным планом двух пиратских кораблей, сражающихся друг с другом, когда они плывут внутри чашки кофе». Хотя и это, согласитесь, уже неплохо. Ведь так можно будет создавать видеоролики для образования или рекламы.
Симулятор мира
На самом деле в сопроводительном техническом документе все серьезно, без шуток. Sora и ей подобные, может быть, более масштабные версии, в этом тексте называется «симуляторами физического и цифрового мира, а также объектов, животных и людей, которые в них живут». И это означает не только возможность научного применения для физических, химических или социальных экспериментов. Но и серьезные этические риски. Ведь если мы стоим на пороге искусственно созданного мира, который никак не отличается от настоящего, то не очутиться бы ненароком в матрице.