Найти в Дзене
ИИ-Практикум

YouTube подсаживает на ИИ: теперь можно будет болтать с Gemini прямо с дивана

Представьте, вы смотрите на большом экране кулинарное шоу, и тут же, не отвлекаясь от просмотра, спрашиваете у телевизора: «А сколько соли в этом маринаде?». Еще вчера это требовало смартфона в руках. Сегодня – это кнопка на пульте. Google официально подтвердила расширение эксперимента с разговорным искусственным интеллектом в YouTube . Функция «Ask» («Спросить»), построенная на базе флагманской нейросети Gemini, теперь добирается до самых консервативных платформ, умных телевизоров, игровых консолей и стриминговых приставок. Разбираемся, как это работает и зачем это нужно, лежа на диване. Суть функции предельно проста: зритель получает возможность вести диалог с видео, не сворачивая его и не отвлекаясь на второй экран. Если вы попали в число счастливчиков (пока это ограниченное тестирование), во время просмотра любого ролика под плеером появится новая кнопка «Ask», украшенная значком Gemini в виде блесток . При её нажатии открывается интерфейс для общения с ИИ. Два способа задать вопро
Оглавление

Представьте, вы смотрите на большом экране кулинарное шоу, и тут же, не отвлекаясь от просмотра, спрашиваете у телевизора: «А сколько соли в этом маринаде?». Еще вчера это требовало смартфона в руках. Сегодня – это кнопка на пульте.

Google официально подтвердила расширение эксперимента с разговорным искусственным интеллектом в YouTube . Функция «Ask» («Спросить»), построенная на базе флагманской нейросети Gemini, теперь добирается до самых консервативных платформ, умных телевизоров, игровых консолей и стриминговых приставок. Разбираемся, как это работает и зачем это нужно, лежа на диване.

Как это выглядит и работает

Суть функции предельно проста: зритель получает возможность вести диалог с видео, не сворачивая его и не отвлекаясь на второй экран.

Если вы попали в число счастливчиков (пока это ограниченное тестирование), во время просмотра любого ролика под плеером появится новая кнопка «Ask», украшенная значком Gemini в виде блесток . При её нажатии открывается интерфейс для общения с ИИ.

Два способа задать вопрос:

  1. Экранные подсказки: Система сама предложит несколько релевантных вопросов к текущему видео. Например, для обзора смартфона это может быть «Показать тесты Geekbench» или «Сколько стоит эта модель?».
  2. Голосовое управление: Самый естественный способ. Если у вашего пульта есть кнопка с микрофоном, просто нажмите её и спросите . Например: «О чем эта песня?» или «Какие ингредиенты они используют?» .

Google подчеркивает, что ответы генерируются в реальном времени на основе контекста происходящего на экране .

Под капотом: кто отвечает и как понимает

Для пользователей, следящих за развитием ИИ, важна техническая подоплека. За кулисами работает мультимодальная модель Gemini.

Что это значит на практике? ИИ не просто ищет ключевые слова в названии ролика. Он анализирует три слоя информации одновременно:

  • Видеоряд (объекты, люди, действия на экране).
  • Аудиодорожку и транскрипцию (что именно говорят в кадре).
  • Метаданные (описание, теги, субтитры).

Именно поэтому вы можете спросить про «ингредиенты в миске» или «момент, где упоминается частота процессора». Технология понимает контекст сцены.

С точки зрения пользовательского опыта (UX), это нетривиальная задача. Разработчикам пришлось решать проблему ввода на ТВ. Решение нашлось в неинвазивном интерфейсе, чат открывается в виде боковой панели, не перекрывая основное видео полностью, а голосовой ввод стал главным способом коммуникации, чтобы не мучить зрителя виртуальной клавиатурой .

Доступность и язык

Новость хорошая, но с оговорками. Как и положено серьезным экспериментам, функция запущена в «песочнице» YouTube Labs для Premium-подписчиков, и то лишь для «небольшой группы пользователей» .

Где работает:
Список совместимых платформ широк: Google TV, Android TV, Samsung Tizen, LG webOS, а также игровые консоли (PlayStation, Xbox) и стрим-палки вроде Roku .

Языки:
Пока Google тестирует функцию в «избранных регионах» и только на пяти языках: английском, хинди, испанском, португальском и корейском.

Русского языка в списке нет. Однако сам факт включения хинди и корейского говорит о глобальных амбициях: YouTube тестирует технологию не только для США, но и для крупнейших азиатских рынков, где голосовой поиск часто популярнее текстового.

Почему это важно

На первый взгляд, это просто очередная «фишка» с ИИ. Но на самом деле это сигнал о смене парадигмы в потреблении контента.

  1. Конец пассивного просмотра. Телевизор перестает быть просто «ящиком для картинок». Он превращается в ассистента. Вы не просто смотрите шоу, вы взаимодействуете с данными внутри него. Это мощный шаг к контекстному поиску, когда не нужно формулировать сухие запросы, а можно просто спросить «по ситуации» .
  2. Удержание внимания. TikTok и Reels давно приучили нас к интерактиву. Перенося ту же логику на двухчасовые ролики на ТВ, YouTube решает проблему удержания зрителя. Чем проще получить ответ (не вставая с дивана и не хватая телефон), тем дольше человек остается в приложении .
  3. Новая эра для геймеров. Владельцы консолей смогут запрашивать справку по прохождению, лору вселенной или характеристикам оружия прямо во время стрима или летсплея, не сворабчивая игру.

Как верно подмечают обозреватели, Google методично превращает YouTube из «видеоплеера» в «информационный центр», способный отвечать на вопросы, опираясь на гигантскую базу видео .

Заключение

Мы стоим на пороге, где пульт от телевизора превращается в инструмент общения с искусственным интеллектом. Тест на консолях и ТВ, это проверка того, готовы ли мы разговаривать с техникой так же свободно, как с живым собеседником.

Если вы вдруг увидели кнопку «Ask» у себя на экране — делитесь в комментариях, работает ли функция на русскоязычных видео и насколько адекватно ИИ понимает контекст? Следим за обновлениями, чтобы рассказать о новых языках первыми.