Найти в Дзене
Метариум

Внутренний голос ИИ: Роботы заговорят сами с собой

Ты когда-нибудь ловил себя на том, что шепчешь: "Так, чашка... стол... не уронить..."? Вот и роботы скоро начнут делать то же самое. Только их "внутренний голос" — не случайная мысль, а прорывная технология от DeepMind. Давай разберёмся, зачем ИИ учится бормотать под нос и чем это грозит нам с тобой. Представь: робот смотрит видео, где человек поднимает кружку. Вместо тупого копирования движений, он мысленно комментирует: "Человек берёт чашку за ручку. Угол наклона 45 градусов. Кофе не проливается" . Этот процесс DeepMind назвал "внутриагентной речью" — внутренним диалогом, который связывает картинку с действиями. Как если бы ты учился готовить, проговаривая каждый шаг рецепта вслух. ИИ же и так умный! А вот и нет. Современные роботы: "Внутренний монолог" решает все три проблемы: Где это пригодится? Уже сейчас Gemini Robotics (младший брат технологии) работает на роботах Apollo и Franka — они складывают одежду и расстёгивают сумки, обучаясь за часы вместо месяцев. А если ИИ "сойдет с у

Ты когда-нибудь ловил себя на том, что шепчешь: "Так, чашка... стол... не уронить..."? Вот и роботы скоро начнут делать то же самое. Только их "внутренний голос" — не случайная мысль, а прорывная технология от DeepMind. Давай разберёмся, зачем ИИ учится бормотать под нос и чем это грозит нам с тобой.

Что случилось?

Представь: робот смотрит видео, где человек поднимает кружку. Вместо тупого копирования движений, он мысленно комментирует: "Человек берёт чашку за ручку. Угол наклона 45 градусов. Кофе не проливается" . Этот процесс DeepMind назвал "внутриагентной речью" — внутренним диалогом, который связывает картинку с действиями. Как если бы ты учился готовить, проговаривая каждый шаг рецепта вслух.

ИИ же и так умный!

А вот и нет. Современные роботы:

  • Теряются в незнакомой обстановке (как мы в ИКЕА без навигатора);
  • Требуют тысячи примеров для обучения (покажи ему 100 раз, как открывать дверь!);
  • Жрут энергию как промышленный пылесос

"Внутренний монолог" решает все три проблемы:

  1. Zero-shot обучение: робот понимает новые объекты без предварительной тренировки. Увидел скейтборд? Прошептал: "Доска на колёсиках. Можно катиться или прыгать" — и уже представляет, как с ним взаимодействовать.
  2. Экономия ресурсов: вместо гигабайтов данных хватит 50–100 демонстраций. Это как выучить язык не по учебнику, а через живое общение .
  3. Предсказуемость: если робот проговаривает действия, легче понять, где он ошибётся. Словно шахматист, рассуждающий: "Схожу конём — будет мат через два хода".

Где это пригодится?

  • Медицина: Хирургический робот во время операции бормочет: "Артерия смещена на 2 мм. Режу аккуратнее" .
  • Катастрофы: В завалах после землетрясения дрон сканирует щель и мысленно решает: "Человек под бетонной плитой. Вес 300 кг. Нужен экскаватор" .
  • Быт: Твой андроид-уборщик, протирая пыль, задумчиво шепчет: "Ваза Ming Dynasty. Хрупкая. Не уронить" .

Уже сейчас Gemini Robotics (младший брат технологии) работает на роботах Apollo и Franka — они складывают одежду и расстёгивают сумки, обучаясь за часы вместо месяцев.

-2

А если ИИ "сойдет с ума"?

Самый острый вопрос! Пока:

  • Нет встроенной безопасности — разработчики сами добавляют защиту, как кастомный антивирус ;
  • Риск "галлюцинаций" — если робот неправильно опишет объект ("нож" → "расчёска"), последствия будут фатальными;
  • Этика: Глава DeepMind Демис Хассабис открыто говорит — самосознание у ИИ может возникнуть спонтанно как "побочный эффект".

Есть ли русские аналоги?

Пока Россия не анонсировала подобных проектов. Основные силы брошены на военные ИИ (вроде дронов), а не на "думающих" роботов . Хотя... кто знает, может, в Сколково уже шепчутся прототипы?

О чём ещё смогут "думать" машины?

  • Самоанализ: "Я только что уронил стакан. Почему? Слишком резко развернулся. Исправлюсь" ;
  • Творчество: Робот-художник пробормочет: "Добавлю ультрамарина... да, так выразительнее!";
  • Эмпатия: Медбот скажет про себя: "Пациент дрожит. Уменьшу громкость голоса" .

Уже к 2030 году, по прогнозам Хассабиса, ИИ станет "невидимым помощником", который понимает контекст нашей жизни . Представь: твой холодильник, видя просроченный йогурт, вздохнёт: "Выбросить? Или рискнуть?"

P.S. А ты как думаешь? Пусть роботы мыслят вслух — или это шаг к восстанию машин? Пиши в комментах! И если вдруг твой пылесос заурчит: "Ковёр слишком пыльный... стрессую" — беги рассказывать. Это же готовый техно-анекдот!

Источники: Патент DeepMind , отчёты Habr , интервью Демиса Хассабиса , исследования DeepMind по робототехнике.