Фантастические романы и фильмы изобилуют сценами общения людей и роботов. И человек не задает команды, но говорит так, как будто ведет беседу с коллегой или другом. Примерно как Тони Старк из вселенной Марвел беседовал со своим персональным дворецким и защитником Джарвисом. Но тут вот какая история. Научить робота понимать обычную речь уже практически не проблема сегодня. Однако дальше этого процесса дело идет довольно туго. То есть вы можете сказать что -то вроде: «Джарвис, принеси мне костюм из шкафа!». Но робот, который отлично поймет что такое «шкаф», «костюм» и «принести», не сможет выполнить вашу просьбу, потому что не знает как это сделать. Сама процедура «подойти к шкафу, взять вешалку с костюмом, принести человеку» для него просто не описана. А робот нуждается в тренировке каждого движения.
И что делать?
ИИ модели вроде ChatGPT оказались столь быстро обучаемы просто потому, что, во-первых, действительно быстро учаться, а во-вторых, получили огромную базу в виде всей сети для тренировки своих навыков. И в этом смысле роботы в гораздо худшем положении, хотя также нуждаются в тщательных и многоразовых именно двигательных тренировках. Значит, для их «образования» нужно собрать эту самую базу. Чем человечество с некоторых пор и занимается.
И уже, конечно, задаются пока еще философские вопросы на тему «а не пилим ли сук, на котором сидим». Потому что граница невозможного пока еще отделяет нас от высокоэффективных антропоморфных машин. Однако уже сегодня появились специальные платформы для найма и обучения ИИ. И одна из них, называвшаяся сначала Micro One, а теперь сменившая лого на micdro1, предлагает людям относительно небольшой, но стабильный заработок, превращая их в датасеты
Что? Во что? Автор, по русски нельзя объяснить?
Датасет — это в принципе любая каким-либо образом структурированная база данных, подготовленная для удобного анализа и обычно использующаяся для обучения ИИ. Человек в данном конкретном случае выступает как коллекционер, эти данные систематизирующий для обучения роботов тем самым простым с нашей точки зрения процедурам, которые мы выполняем не особенно задумываясь. Что делают люди - датасеты? Они надевают камеру на лоб, чтобы вид был от первого лица, и выполняют обычные, рутинные, часто бытовые операции. Гладят белье, кладут посуду в посудомойку, готовят еду и т.д. Только одна micro1 наняла 4000 человек в 71 стране, каждый из которых обязался отослать компании 160K часов видео в месяц. Другая организация — DoorDash — теперь является не только одним их крупнейших доставщиков еды и повседневных товаров в США, но также предлагает своим курьерам подзаработать в качестве датасета. А стартап из Лос Анджелеса с той же целью рассылает желающим камеры на запястье. В Китае, как обычно, решили, что мелочиться не стоит, и там существуют специальные государственные центры для сбора необходимой информации, где роботов обучают в том числе наглядно, на своем примере. Человек надевает VR шлем и выполняет элементарные операции, к примеру, поднимает или опускает руку, а находящийся поблизости робот пытается повторить его движения.
Без тренировки никуда
Напомню, что весь массив собираемых данных идет для тренировки тех инстинктивно выполняемых процессов, о существовании которых мы даем себе отчет только в очень редких случаях, когда это действительно необходимо. Но ученые, которые занимаются обучением наших будущих помощников, говорят, что им нужны миллиарды часов видеоконтента для того, чтобы просто обучить антропоморфного робота какой именно набор движений нужно произвести, чтобы правильно открыть дверь, обойти стул, полить цветы или выгладить белье. Все эти процедуры разбираются на множество процессов-движений, и затем «скармливаются» обучающимся «железкам». И, что интересно, Figure 02 от компании Figure AI уже неплохо себя зарекомендовал, участвуя в сборке 30 тысяч BMW X3 на заводе немецкого концерна в Южной. Каролине. Но при этом для того, чтобы научить робота правильно ставить чайник на плиту, каждое движение, участвующее в этом процессе, нужно повторить на менее 1250 раз.
В 2025 году в зарождающуюся индустрию гуманоидных роботов было вложено по разным оценкам от $6 до $8 миллиардов. Из этой суммы около $100 миллионов было потрачено на труд кибер-рабочих, как теперь называют людей, непосредственно участвующих в сборе информации для роботов или их обучении. Специалисты предсказывают, что первых серьезных успехов в индустрии и массовых поставок гуманоидных механических помощников, которые смогут спасти «любовную лодку», чтобы та, как сказано у поэта Маяковского, не «разбилась о быт», можно ожидать уже в начале 30ых годов. И тогда, вероятно, фантастика 60ых годов прошлого века окончательно станет частью нашей реальности.