Добавить в корзинуПозвонить
Найти в Дзене

ИИ научился «видеть» и «слышать» одновременно. Что это значит для нас с вами? Не то, о чем вы подумали

На этой неделе произошла тихая революция, которую многие пропустили. Компания OpenAI представила новую модель GPT-4o, где «o» означает omni (всеобъемлющий). Если предыдущие ИИ были либо «слепыми» (работали только с текстом), либо «глухими» (обрабатывали картинки без контекста), то этот — первый настоящий «универсальный солдат». Проще говоря, ИИ наконец-то научился воспринимать мир так, как это делаем мы: одновременно видя, слыша и понимая контекст. Что это на самом деле значит? Забудьте про сухие техновости, вот как это изменит вашу жизнь через год: Почему это прорыв? Раньше это было так: Представьте, что у вас три разных переводчика: один читает текст, второй смотрит на картинки, третий слушает аудио. Потом они совещаются и выдают вам общий ответ. Это медленно и не всегда точно. Теперь это выглядит так:
Один универсальный помощник, который смотрит, слушает и читает одновременно, понимая связь между всем сразу. Как человек. Что ждет нас завтра? Это огромный шаг к настоящим персональным

На этой неделе произошла тихая революция, которую многие пропустили. Компания OpenAI представила новую модель GPT-4o, где «o» означает omni (всеобъемлющий). Если предыдущие ИИ были либо «слепыми» (работали только с текстом), либо «глухими» (обрабатывали картинки без контекста), то этот — первый настоящий «универсальный солдат».

Проще говоря, ИИ наконец-то научился воспринимать мир так, как это делаем мы: одновременно видя, слыша и понимая контекст.

-2

Что это на самом деле значит? Забудьте про сухие техновости, вот как это изменит вашу жизнь через год:

  1. Ваш личный домашний мастер. Вы можете направить камеру смартфона на стиральную машину, которая издает странный звук, и сказать: «Эй, ИИ, послушай, что это гудит?». Он проанализирует и видео, и звук, и, сверившись с базой данных, вероятно, скажет: «Это сломанный подшипник, код запчасти XJ-123, вот видео, как его заменить».
  2. Репетитор, который видит ваши ошибки. Вы решаете математическую задачу на листке бумаги. Достаточно направить камеру, и ИИ не просто сверит ответ, а проанализирует ход ваших мыслей, увидит, на каком именно шаге вы ошиблись, и объяснит, как нужно было сделать.
  3. «Живой» переводчик с пониманием контекста. Вы показываете камеру на вывеску в незнакомом городе. Он не просто переведет текст, но и объяснит, что это за место: «Это не просто "Красный дракон", а название известного здесь паба, основанного в 18 веке».
-3

Почему это прорыв? Раньше это было так:

Представьте, что у вас три разных переводчика: один читает текст, второй смотрит на картинки, третий слушает аудио. Потом они совещаются и выдают вам общий ответ. Это медленно и не всегда точно.

Теперь это выглядит так:
Один универсальный помощник, который смотрит, слушает и читает одновременно, понимая связь между всем сразу. Как человек.

Что ждет нас завтра?

Это огромный шаг к настоящим персональным ассистентам, похожим на Джарвиса из «Железного человека». Ассистенты, которые не просто выполняют команды, а понимают ситуацию, в которой вы находитесь, и предлагают помощь заранее.

А что вы думаете? Готовы ли вы доверить ИИ такие задачи? Или, может, вас пугает эта технология? Пишите в комментариях — обсудим самое интересное вместе! 🤖👁️👂