Соня ей 20 лет, она студентка Высшей Школы Экономики. В начале весны Соня начала работать в качестве разметчика в Training Data, а уже сейчас она занимает должность Junior Product Manager в Data Market.
В этом интервью мы попросили Соню поделиться её опытом работы с разметкой, оговорить недостатки профессии и рассказать о приемах, которые помогли ей добиться повышения.
Расскажи о себе? Какой опыт у тебя был до Training Data?
Моё имя – Соня, в настоящее время я изучаю социологию и социальную информатику на третьем курсе НИУ ВШЭ.
Перед тем, как я начала работать в Training Data, у меня не было опыта в этой сфере. Я лишь имела кратковременные стажировки из ВУЗа и подработки. Но моя специализация связана с анализом данных, базами данных и алгоритмами машинного обучения, то есть с тем, что я в настоящее время делаю.
Почему ты решила стать разметчиком? Как ты выбрала Training Data?
Я искала способы заработать, и мне пришла идея попробовать себя в области разметки данных. Когда я увидела объявление о вакансии и ознакомилась с условиями, меня заинтересовало это предложение, и я отправила свою кандидатуру.
Я прослушала презентацию компании, и мне понравилось, как всё было организовано. Особенно Telegram-канал, где предоставлялась информация о тестовых заданиях. Ещё я была заинтересована гибким графиком работы: это позволяло мне составить расписание, учитывая мои лекции.
Также мне понравились условия работы. Сравнивая Training Data с другими крупными компаниями, я заметила, что оплата здесь выше, а также всегда есть доступные проекты. На платформах для фриланса задания могут быть совершенно разными, что означает, что каждый раз нужно вникать в новые ТЗ. Из-за этого ты не можешь "набить руку" в конкретной области разметки и увеличить продуктивность работы.
При вступлении в коллектив у меня была возможность попробовать размечать разнообразные типы данных: изображения и аудиозаписи. В итоге я начала работать над проектом транскрибации аудио.
Как проходил процесс отбора? Как была организована работа?
Я начала работать в конце марта 2023 года. Сначала я откликнулась на вакансию на HH.RU, затем мне было предоставлено тестовое задание. Все инструкции и описание каждого вида разметки были предоставлены в Telegram-канале. Это позволяло оценить, подходит ли эта работа исходя из постановки задач. В этом же канале я нашла все необходимые ресурсы.
Затем мы встретились с представителями Training Data, чтобы обсудить актуальные проекты: оплату, необходимое количество рабочих часов в день и подробности задания. Мне очень понравился подход к коммуникации: до того, как добавить нас в общий чат, была создана группа для новичков, где нам было предложено потренироваться на заданиях для нашего проекта. Это позволило понять, чего ожидать в процессе работы.
В компании существует общий чат для всех разметчиков, в котором были разделы от обсуждения популярных вопросов до общения. Все было устроено так, чтобы каждый мог найти необходимую информацию и легко интегрироваться в коллектив.
Также у нас всегда была возможность общения с менеджером проекта. Мой руководитель быстро реагировал на вопросы. Он создал документ, где мы, разметчики, могли записывать все, что нас интересовало. Затем он согласовывал детали с заказчиком и давал нам обратную связь.
В чём заключалась твоя работа и сколько времени она занимала?
Во время моей работы с разметкой мой рабочий день выглядел следующим образом: я тратила примерно полтора часа на проект утром, затем уделяла время учебе и личным делам, а в вечернее время отводила еще один с половиной или два часа на разметку. Продолжительность рабочего времени зависела от проекта. Например, на моем проекте по транскрибации минимальное время составляло три часа в день.
Процесс работы начинался с открытия CVAT, после чего я прослушивала и размечала аудиозаписи. Вначале я работала очень медленно, часто переслушивая сегменты записей, чтобы ухватить все детали. Но с опытом я стала размечать аудио на полной скорости. Чем больше опыта у тебя есть, тем быстрее ты справляешься с объемами работы.
Что нравилось и не нравилось в работе?
Мне очень нравилась гибкость в выборе времени работы. В разные моменты удобнее было сосредотачиваться на задачах либо утром, либо вечером.
Но могу сказать, что работа над однообразными задачами иногда утомляла. Хотя, конечно, это дело вкуса – для многих людей повторяющаяся деятельность проще. Для меня же три часа транскрибации казались намного длительнее, чем то же время на моей новой должности с разнообразными задачами.
Какие сложности возникали во время работы?
Вначале я допускала множество ошибок, особенно из-за неоднозначных моментов в технических заданиях. Я тогда работала над проектом, где требовалась транскрибация для одного из крупных клиентов. Порой мне было не ясно, следует ли использовать дефис, даже если он предписан правилами русского языка. Например, в слове "подойди-ка".
Однако, в целом, других трудностей не возникало: вся информация очень детально объяснялась в начальный период, а затем, приступая к конкретному проекту, я могла найти все необходимые детали в техническом задании.
Что следует учитывать тем, кто хочет заняться разметкой?
Перед тем как начать работу, стоит задать себе вопрос, что именно в области разметки вас интересует, и готовы ли вы к выполнению однообразных задач.
Также важно осознавать, что это в значительной степени самостоятельная работа, и вы сами должны структурировать свой рабочий день. От умения управлять временем зависит и ваша оплата: чем более организованно вы планируете свои действия, тем больше успеете выполнить и, соответственно, выше будет ваш заработок.
Также важно сохранять концентрацию: качество разметки играет огромную роль. В начале лучше не торопиться, тщательно изучать технические задания и тщательно выполнять работу. Это может занять больше времени, но это позволит выполнить задачи более качественно. С опытом вы приобретете навык разметки быстрее, при этом поддерживая высокое качество.
Какие советы можешь дать новичкам в разметке?
Для меня помогала техника Помодоро: я устанавливала таймер на 25 минут, затем делала 5-минутный перерыв. После 4 таких циклов я давала себе более продолжительный отдых в 20 минут. Это сильно помогало мне поддерживать фокус и избегать прокрастинации.
Также рекомендую составлять план работы на всю неделю заранее: это помогает лучше организовать свои действия и следовать расписанию, сочетая работу с учебой. Многим удобно выполнить все задачи сразу, не растягивая рабочее время. Например, закончив все дела утром, можно не возвращаться к работе позже.
О работе в Data Market
Как ты перешла в Data Market?
После трех недель работы в Training Data, я увидела объявление о вакансии Junior Project Manager в Data Market, что идеально подходило под мои интересы. Мне понравились задачи и гибкий график, учитывая, что я все еще учусь в университете и не могу работать полный рабочий день.
В вакансии были описаны все требования к кандидату. Среди прочего, требовалось знание Python, опыт работы с разметкой, а также умение работать с Kaggle и Notion. Я подходила почти под все критерии, за исключением знания Power BI.
Сначала мне предстояло провести собеседование с HR-специалистом, выполнить тестовое задание, а также пройти собеседование с командой. После этого мне отправили официальное приглашение.
Какие задачи ты выполняешь сейчас?
Мой рабочий день в Data Market выглядит совершенно иначе: теперь я отвечаю за развитие платформы Hugging Face, загружаю датасеты на разные платформы, создаю образцы и PDF-карточки для датасетов.
Каждую неделю я также выполняю новые задачи: постоянно появляются новые идеи, над которыми мы работаем.
Какие изменения произошли в рабочих процессах с момента твоего повышения?
В разметке все задачи выполняются самостоятельно, и вы отвечаете только за свою работу. В Data Market же часто приходится работать с командой. Следовательно, здесь нельзя так свободно планировать свой рабочий день: приходится согласовывать действия с коллегами для выполнения общей задачи.
Кроме того, работа здесь далеко не монотонна: мне постоянно выпадает возможность делать что-то новое и интересное. Я чувствую, что мои профессиональные навыки постоянно развиваются, и я всегда учусь.