Найти в Дзене

Чё это за нейросеть, которая рисует видео из текста? (Sora)

Всем привет! Чё по техно? Я всегда считал, что нейросети, которые генерируют картинки по запросу — это уже верх чудес. Ну, знаете, вводишь «космонавт, катающийся на скейтборде в стиле поп-арт», и получаешь шедевр. Я думал, что это потолок. А нет! Ребята из мира ИИ опять взяли и подняли планку так высоко, что я чуть не выронил телефон. Встречайте — Sora от OpenAI. Эта штука не рисует картинки. Она снимает видео. Итак, представьте: вы пишете в строку что-то вроде: «Пушистый котёнок в космическом скафандре смотрит на Землю из иллюминатора». Раньше нейросеть нарисовала бы вам просто картинку. Часто кривую, но картинку. Sora делает нечто невоторимое. Она создаёт ВИДЕО. Тот самый котёнок не статично висит, а поворачивает голову, его усы шевелятся, а в глазах отражается Земля. У меня волосы встали дыбом. Это не монтаж — это ИИ сгенерировал каждый пиксель и каждое движение с нуля. Как Sora это делает? Если очень грубо, то эта нейросеть проглотила миллионы часов самого разного видео. Она и
Оглавление

Всем привет! Чё по техно? Я всегда считал, что нейросети, которые генерируют картинки по запросу — это уже верх чудес. Ну, знаете, вводишь «космонавт, катающийся на скейтборде в стиле поп-арт», и получаешь шедевр. Я думал, что это потолок.

Космонавт, катающийся на скейтборде в стиле поп-арт
Космонавт, катающийся на скейтборде в стиле поп-арт

А нет! Ребята из мира ИИ опять взяли и подняли планку так высоко, что я чуть не выронил телефон. Встречайте — Sora от OpenAI. Эта штука не рисует картинки. Она снимает видео.

От картинки к целому миру в движении

Итак, представьте: вы пишете в строку что-то вроде: «Пушистый котёнок в космическом скафандре смотрит на Землю из иллюминатора».

Пушистый котёнок в космическом скафандре смотрит на Землю из иллюминатора
Пушистый котёнок в космическом скафандре смотрит на Землю из иллюминатора

Раньше нейросеть нарисовала бы вам просто картинку. Часто кривую, но картинку.

Sora делает нечто невоторимое. Она создаёт ВИДЕО. Тот самый котёнок не статично висит, а поворачивает голову, его усы шевелятся, а в глазах отражается Земля. У меня волосы встали дыбом. Это не монтаж — это ИИ сгенерировал каждый пиксель и каждое движение с нуля.

Как эта магия работает?

Как Sora это делает? Если очень грубо, то эта нейросеть проглотила миллионы часов самого разного видео. Она изучила, как двигается вода, как колышется листва, как меняется мимика. Она выучила физику нашего мира по видеоданным.

И теперь, когда вы даёте ей запрос, она не просто собирает кадр, а предсказывает, как эта сцена должна развиваться во времени. Это как очень талантливый режиссёр-мультипликатор, который живёт в сервере и работает со скоростью света.

Конечно, есть косяки.

Машина может проехать сквозь стену, а у собаки — появиться лишняя лапа. Но важно другое: эти ошибки с каждой версией становятся всё менее заметными. Год назад мы радовались смазанным картинкам, а сегодня спорим, реалистично ли выглядит отражение в луже. Это колоссальный скачок!

Собачий «беспредел»
Собачий «беспредел»

А чё с фейками?

Любая мощная технология — это как острый нож. Можно приготовить ужин, а можно... получить проблемы.

Вот и здесь начинается тёмная сторона. Sora в плохих руках — оружие для дезинформации. Реалистичное видео, где политик говорит то, чего не говорил. Отличить подделку будет почти невозможно. Это огромный вызов для общества.

Чё это меняет?

Вот мы и подошли к главному. Чё это меняет? Всё.

  • Кино и реклама. Дорогая сцена с бегущей собакой в поле тюльпанов? Больше не нужно ехать в Нидерланды. Просто пишем запрос в Sora. Стоимость производства рухнет, а креативность взлетит до небес.
  • Блогеры и контент. Нам, создателям, это откроет невероятные возможности. Красивая заставка? Иллюстрация для мысли? Вместо долгих поисков — быстрая генерация своего, уникального видео.
  • Образование. Учебники превратятся в визуальные энциклопедии. Хочешь увидеть битву при Аустерлице или деление клетки? Sora сможет это показать в динамике.

Лично я смотрю на Sora с восторгом и лёгким страхом. Технология, которая стирает границу между реальностью и вымыслом, уже здесь. И она заставляет меня задаться вопросом: а чё мы увидим завтра?

Ставь лайк и подписывайся на канал «Чё по техно?» — будем разбираться в этом будущем вместе.