Альманах "Наследие"

Знакомьтесь – Sora

OpenAI анонсировала новую нейросеть по имени Sora, которую создатели называют «симулятором мира». Что умеет нейросеть  – рассказываем в статье

Новостями про искусственный интеллект никого уже не удивить. Люди постепенно привыкают к нейросетям, и даже перестают их бояться. К тому же, согласитесь, что с приходом ИИ в нашу повседневную жизнь, решение многих задач, которые требовали особых навыков и отнимали немалое количество времени, стало намного проще. 

Видео, сгенерированное нейросетью Sjra
Источник digitaltveurope.com // Видео, сгенерированное нейросетью Sjra

Написать короткий текст – пожалуйста, нарисовать по описанию картинку – нет ничего проще. И вот теперь при помощи нейросети,  которую, кстати, зовут Sora, можно будет создавать короткие видео.  Достаточно будет дать искусственному интеллекту небольшие текстовые подсказки. О том, что умеет Sora и как на результаты ее работы реагирует публика, расскажем в нашей статье.

Кто такая Sora и что она умеет?

Новую систему генеративного искусственного интеллекта по имени Sora создала компания OpenAI. В отличие от многих других нейросетей она сочетает в себе как функции трансформера, так и инструменты диффузной модели. Чтобы было понятнее – трансформеры чаще всего используются в больших языковых моделях. Самый известный ИИ такого типа – ChatGPT. А диффузные модели  обычно лежат в основе нейросетей,  которые генерируют изображения. 

Иными словами Sora является так называемой  «моделью диффузного трансформатора». Что означает, что она умеет и то, и другое.  Однако дело не только в простом арифметическом соединении определенных  навыков. Эту нейросеть отличает иной качественный подход к генерации. 

Например, если взять ИИ, который создает картинки, то, в целом, из последовательности изображений можно сделать видео. Но при этом между кадрами не будет никакой согласованности, они будут выглядеть просто как быстро мелькающие слайды. Для того, чтобы сделать полноценный ролик, нужно понимать – как именно картинки связаны между собой, как одно возникает из другого. И вот тут Sora «включает» архитектуру преобразователя. Для этого ей приходится задействовать свои таланты трансформера. Только если тот же CahtGPT ищет закономерности и смысловые связки среди слов, образующих текст, то Sora использует маркеры пространства и времени. 

О том, как искуственный интеллект представляют себе писатели, вы узнаете,прочитав статью «Будущее не за горами: топ книг про ИИ»

Лучшая из лучших

Нейросети, генерирующие видео, уже существуют. Например, совсем недавно компания Google представила свою версию ИИ такого типа – Lumiere. Однако все другие модели явно уступают Sore в качестве генерируемого видео. Начать с того, что с первого взгляда невозможно определить, что ролики созданы искусственным интеллектом, столько в них логики, красоты и жизни. Создается впечатление, что видео снято отличным оператором, который отлично разбирается в своем деле. 

Кроме того, в отличие от других от других ИИ, новая нейросеть умеет создавать длинные видео (до 60 секунд) высокого разрешения (1920 х 1080 пикселей), да еще и с различным соотношением сторон. Lumiere, например, такого не умеет. А еще она умеет редактировать ролики, создавать их из других видео, и нескольких изображений, «доснимать» продолжение и многое другое. В общем – умница, да и только. 

Будущее Sora

Хотя сегодня уже поднимаются вопросы о том, что нейросети или роботы не обязательно должны иметь практическое применение, они могут существовать просто на радость людям, к Sora это не относится. Безусловно, у нее есть большое будущее. И дело даже не в том, что любой желающий сможет создать потрясающую фантастическую зарисовку, всего лишь заказав «фотореалистичное видео крупным планом двух пиратских кораблей, сражающихся друг с другом, когда они плывут внутри чашки кофе». Хотя и это, согласитесь, уже неплохо. Ведь так можно будет создавать видеоролики для образования или рекламы.

Видео, сгенерированное нейросетью Sjra
Источник gizchina.com // Видео, сгенерированное нейросетью Sjra

Симулятор мира

На самом деле в сопроводительном техническом документе все серьезно, без шуток. Sora и ей подобные, может быть, более масштабные версии,  в этом тексте называется «симуляторами физического и цифрового мира, а также объектов, животных и людей, которые в них живут». И это означает не только возможность научного применения для физических, химических или социальных экспериментов. Но и серьезные этические риски. Ведь если мы стоим на пороге искусственно созданного мира, который никак не отличается от настоящего, то не очутиться бы ненароком в матрице.  

Оставьте ваши координаты для записи на консультацию Цифровой капсулы времени «Первый шаг»


    Поделиться:

    Ранее по теме

    ИИ не может быть умным сам по себе, любую нейросеть...

    Поиск в интернете не всем дается легко – сложно...

    26.07.2024 ИИ

    Недавно был проведен первый в своем роде конкурс...

    Сегодня существуют самые разные нейросети. Одни умеют...

    01.07.2024 ИИ

    Российские учёные обучили искусственный интеллект...

    05.06.2024 Наследие

    Может ли ИИ симулировать детскую психику, притворяясь...

    10.04.2024 Человек