Когда-то бесплатные сервисы собирали наши клики. Теперь технологиям нужны движения рук, бытовые привычки и устройство пространства. IT World разбирался, как меняется цена данных, когда ИИ учится действовать в реальном мире.
Генеральная уборка редко укладывается в пару часов. Обычно это отдельный день, который начинается с верхних полок, продолжается плитой, холодильником и окнами, а заканчивается обещанием больше не доводить квартиру до такого состояния. Поэтому предложение бесплатной уборки звучит почти неприлично заманчиво. Кто не хотел бы переложить эту работу на кого-то другого?
Именно такую модель предложил в Нью-Йорке стартап Shift. Компания готова бесплатно убирать квартиры, если клиент разрешит записывать процесс на камеру от первого лица. На сайте Shift написано, что записи уборки нужны для обучения нового поколения домашних роботов, а ценность таких данных позволяет временно покрывать стоимость клининга.
Shift обещает анонимизировать видео, размывать имена, лица, документы, экраны и другие чувствительные детали. По словам компании, записи не публикуются открыто и не используются для рекламы. При этом обработка включает передачу видео специалистам по разметке данных, которые готовят записи для обучения ИИ и робототехники.
На первый взгляд, такая схема понятна. У клиента становится чисто дома. Компания получает обучающие данные. Разработчики роботов получают материал, которого им не хватает. Но квартира — слишком плотное и личное пространство, чтобы считать ее обычным фоном для технической съемки. Даже без лица владельца в кадре по ней можно многое понять.
Паспортные данные опасно потерять из-за риска мошенничества, но видео квартиры иногда дает злоумышленнику не меньше. Оно показывает планировку, технику, уровень достатка, рабочее место, наличие детей или пожилых родственников, привычки, лекарства, вид из окна. Это уже не абстрактная строка в базе, а почти инструкция по дому и человеку.
История Shift показывает, что для обучения ИИ все чаще нужны данные из физического мира, в числе которых не только тексты, изображения и клики, но и записи обычных действий в реальной квартире.
Почему роботам нужна обычная квартира
Большие языковые модели учились на цифровом мире. Тексты, изображения, видео, код, документы и сайты уже существовали в интернете. Робототехнике сложнее. Чтобы машина научилась действовать в физической среде, ей нужны записи реальных действий.
Как человек берет губку. Как открывает шкаф. Как переставляет предметы. Как возвращается к пятну на плите. Как действует, когда дверца открывается не до конца или нужная вещь лежит не там, где ожидалось. Домашняя среда плохо поддается стандартизации. В лаборатории можно заранее поставить чашку на стол, а в квартире все будет зависеть от привычек конкретных людей.
Business Insider в материале о Shift обращает внимание именно на эту логику. Клинеры записывают работу на камеры, закрепленные на голове, а сложные и захламленные условия могут быть особенно полезны для обучения, потому что дают более реалистичные сценарии для будущих автономных систем.
Что для человека выглядит как беспорядок, для модели становится разнообразием. Демонстрационная кухня слишком аккуратна. Обычная кухня после завтрака, ванная с множеством мелких предметов или шкаф, который давно пора разобрать, дают робототехнике материал из реальной жизни.
Android Authority подал историю Shift через знакомое правило цифровой экономики: если сервис бесплатный, товар – это пользователь. В случае с уборкой в эту формулу попадает уже не поведение в приложении, а физическое пространство, где человек живет.
Бытовые действия становятся подработкой
Shift — заметный инфоповод, но не единственный пример. Вокруг бытовых действий уже формируется отдельный рынок данных.
WIRED описал эксперимент, в котором журналист неделю записывал собственные домашние дела для платформ Kled, Luel и Waffle Video. В заданиях были обычные действия вроде выноса мусора, мытья посуды, наливания воды и завязывания шнурков. За неделю он заработал $21,55.
Такой заработок выглядит символическим, но хорошо показывает механику нового рынка. Платформы собирают короткие записи бытовых действий и превращают их в обучающий материал для робототехники. Постепенно появляется новая форма микрозанятости. Раньше люди размечали картинки, проверяли ответы чат-ботов, модерировали контент. Теперь они могут записывать, как выполняют самые обычные физические действия. Для ИИ это недостающий слой данных о реальном мире.
Интерес к видео от первого лица в исследовательской среде появился не вчера. Например, датасет Ego4D включает тысячи часов egocentric video, снятого участниками в разных странах, и создавался для развития систем, способных понимать действия и среду с человеческой точки зрения. Но бытовой сервис устроен иначе, чем исследовательский проект с отдельной процедурой участия. Человек приходит за уборкой, а не за ролью поставщика данных для робототехники.
Где начинается вопрос согласия
Проблема не в факте записи. Камеры давно используются в такси, логистике, рознице, на складах и в сервисных службах. Вопрос в месте съемки, цели и дальнейшей судьбе данных.
Клиент может понимать, что клинер будет записывать работу. Гораздо сложнее заранее представить весь маршрут этой записи. Кто увидит исходное видео? Как его будут размечать? Кому его можно будет передать? Сколько времени оно останется в обороте? Что произойдет, если человек передумает после обработки данных?
У Shift этот вопрос особенно заметен в условиях сервиса. В FAQ говорится, что данные анонимизируются, обрабатываются и лицензируются для обучения ИИ и робототехники, а подготовка включает передачу видео специалистам по разметке данных. Между квартирой клиента и будущей моделью появляется цепочка участников.
В Cleaning Terms формулировки весьма прямолинейные. Клиент, бронируя уборку, соглашается на запись от первого лица в течение всего визита для целей AI and robotics training data collection. Там же указано, что клиент подтверждает право дать такое согласие в отношении помещения и всех присутствующих людей. Shift отдельно фиксирует, что является платформой, а не клининговой компанией, и максимально ограничивает свою ответственность за саму услугу.
И вот здесь появляется практический вопрос. В квартире могут быть родственники, дети, гости, няня, другой работник. В кадр могут попасть предметы, по которым легко понять образ жизни человека. Размытые лица и документы снижают риск, но дом все равно остается информативным. Планировка, вещи, привычки хранения и бытовые детали тоже многое говорят.
Поэтому согласие на запись в таких сервисах трудно считать технической галочкой. Пользователю нужно понимать, зачем собираются данные, кто будет их обрабатывать, как они лицензируются и можно ли остановить их дальнейшее использование.
Индийский кейс показал, что реакция может быть жесткой
Похожая история уже стала поводом для скандала в Индии. Стартап Pronto, который занимается домашними сервисами, столкнулся с критикой из-за пилота с видеозаписью бытовых задач для physical AI и робототехники. Economic Times писал, что компания называла функцию добровольной и ограниченной, но эксперты указывали на более широкий вопрос прозрачности: понимает ли пользователь, что именно происходит с данными из его дома.
Inc42 описала этот спор как сигнал для всего рынка домашних услуг. После резонанса другие сервисы, включая Snabbit и Urban Company, публично заявили, что не записывают видео внутри домов клиентов. Сам факт таких заявлений показателен. Камера в квартире ради обучения ИИ оказалась чувствительной темой даже для компаний, которые работают в цифровой среде и привыкли к сбору данных.
Юристы и эксперты по безопасности в индийских медиа обращали внимание на риски, которые плохо укладываются в привычные представления о персональных данных. Домашняя запись позволяет не только увидеть человека или предметы в квартире. Из нее можно выводить поведенческие сценарии, привычки, режим жизни, устройство пространства. Economic Times отдельно отмечал риски continuous observation, behavioural profiling and inferential analysis.
Этот кейс важен как предупреждение. Пока запись бытовых действий выглядит нишевой практикой для стартапов и робототехники. Но доверие к сервису легко потерять, если клиент узнает о второй жизни своих данных из медиа, инвесторской презентации или публичного конфликта.
Где здесь персональные данные
В российском праве нет отдельной категории «видео квартиры». Закон о персональных данных работает с информацией, которая относится к прямо или косвенно определенному или определяемому человеку. Поэтому сам по себе кадр с плитой, шкафом или диваном не всегда автоматически будет персональными данными.
В реальном сервисе видео редко существует отдельно от человека. Оно связано с заказом, адресом, датой, аккаунтом, исполнителем, перепиской, согласием на запись. В кадр могут попасть лица, голоса, документы, экраны, лекарства, детские вещи, рабочие материалы. В такой связке появляются данные, которые прямо или косвенно описывают конкретного человека.
Здесь и возникает более широкий вопрос. Закон хорошо работает с понятными идентификаторами: ФИО, номером телефона, паспортом, фотографией, биометрией. Видео квартиры устроено сложнее. С точки зрения риска оно может оказаться очень чувствительным, потому что показывает образ жизни, слабые места в быту и безопасности, рабочие привычки, состав семьи и уровень достатка.
Такие данные не всегда легко уложить в привычные юридические категории. Но их нельзя считать безобидными только потому, что на записи размыли лицо.
Отдельно стоит вопрос согласия. Статья 9 152-ФЗ требует, чтобы согласие на обработку персональных данных было конкретным, предметным, информированным, сознательным и однозначным. В действующей редакции также указано, что согласие должно быть оформлено отдельно от иной информации и документов, которые подтверждает или подписывает субъект персональных данных.
Для сервисов с записью бытовых действий это важная логика. Разрешение на съемку во время выполнения услуги и разрешение использовать видео для обучения ИИ должны быть понятны человеку как разные сценарии использования. Особенно если запись передается специалистам по разметке данных, лицензируется или может использоваться в дальнейшем обучении моделей.
Если изображение человека применяется для установления личности по физиологическим или биологическим признакам, возникает режим биометрических персональных данных. Статья 11 152-ФЗ говорит, что такие данные могут обрабатываться при наличии письменного согласия субъекта, за исключением предусмотренных законом случаев. Не всякое видео является биометрией, но при идентификации требования становятся строже.
Цель закона тоже важна для этой темы. В статье 2 152-ФЗ говорится о защите прав и свобод человека при обработке персональных данных, включая неприкосновенность частной жизни, личную и семейную тайну. Видео квартиры может оказаться как раз в той зоне, где формальные признаки персональных данных и реальная чувствительность материала не всегда совпадают.
Не только квартира
Российскому бизнесу эта тема может показаться далекой. Нью-Йорк, бесплатная уборка, домашние роботы, стартапы. Но сама логика сбора данных для physical AI легко переносится в корпоративную среду.
Сначала камера появляется как инструмент контроля качества или безопасности. Ее можно представить у сервисного инженера, монтажника, сотрудника склада, курьера, специалиста выездной поддержки. Запись помогает разбирать ошибки, обучать новичков, подтверждать выполнение работ.
Потом у архива появляется вторичная ценность. Его можно использовать для анализа процессов, создания инструкций, обучения ассистентов, разработки моделей, которые подсказывают следующий шаг. В какой-то момент компания обнаруживает, что собрала не просто видеоотчеты, а датасет о том, как на самом деле выполняется работа.
Какие вопросы появятся в таком сценарии? Сотрудник соглашался на съемку для контроля качества или на обучение модели? Клиент понимал, что его помещение попадет в запись? Можно ли использовать архив для новой цели? Что делать с коммерческой тайной, экранами, документами, оборудованием и людьми, которые оказались в кадре случайно?
Для ИТ и ИБ — это не мелочь. Видео реального процесса часто показывает то, что не попадает в регламенты. Где лежит ключ. Как обходят неудобную процедуру. Какие системы открыты на рабочем месте. Какие зоны плохо контролируются. В утечке такие записи могут оказаться опаснее стандартной базы с именами и телефонами.
Почему эта история цепляет
История Shift работает именно из-за своей бытовой простоты. Человеку нужна уборка. Компании нужны данные. Между ними появляется сделка, которая выглядит удобной и добровольной.
Кто-то на нее согласится. Для части пользователей бесплатная уборка будет стоить больше, чем абстрактные риски приватности. Кто-то решит, что при нормальной анонимизации ничего страшного не происходит. Для других сама идея камеры в квартире окажется неприемлемой.
Обе реакции понятны. Люди по-разному оценивают приватность и по-разному относятся к бытовому дискомфорту. Гораздо важнее другое. То, что рынок данных постепенно заходит туда, где раньше не было цифрового обмена. В комнату, на кухню, к шкафу, на рабочее место, в сервисный выезд.
До сих пор ИИ в основном учился на том, что уже было в цифровой среде. Следующий этап требует физического мира. Роботам нужны движения, предметы, ошибки, повседневные маршруты и человеческие способы справляться с неудобной средой.
Бесплатная уборка оказывается ранним примером новой цены данных. Раньше бесплатный сервис просил наши клики и внимание. Теперь он может попросить показать, как устроена жизнь за закрытой дверью.