Дата-сайентист Анатолий Карпов окончил психологический факультет СПбГУ, преподавал статистику, работал аналитиком во «ВКонтакте», а сейчас переехал в Москву и занимается аналитикой в отделе рекламы Mail.ru. Анатолий — автор нескольких популярных онлайн-курсов по математической статистике и анализу данных. Он рассказал «Цеху», как пришел в профессию, где учился и какие первые шаги сегодня стоит делать начинающим дата-сайентистам.
«Еще 20 лет назад невозможно было представить, что человек мог чему-то научиться вне университета»
Я учился на факультете психологии, и сначала ничто не предвещало работы в IT-сфере. Впрочем, психология бывает разная: есть направления, которые решают прикладные задачи, — это психологическое консультирование, а есть академическая психология, куда входит статистика, анализ данных и программирование. В процессе обучения меня все больше интересовали именно академические исследования. У нас на психфаке был сложный курс «Методы математической модели», который сильно всех напугал. Я же во всем разобрался, начал объяснять материал нашим ребятам и со временем понял, что мне это даже нравится.
Мой хороший друг в то время открывал для студентов программу по обучению биоинформатике и искал преподавателя по статистике. Он мне позвонил и спросил: «Толя, ты статистику знаешь?». Я ответил, что нет. Тогда он продолжил: «Переформулируем вопрос: ты курс по статистике сможешь прочитать?». Я согласился, и в итоге этот опыт дал мне многое. Самый правильный способ чему-то научиться — начать учить других. Занятия в институте проходили раз в неделю: перед каждым уроком я готовился, полностью разбирал темы, а потом с неподдельным восторгом рассказывал ребятам базовые вещи про статистику и анализ данных.
Спустя некоторое время мне предложили пройти собеседование на позицию аналитика «ВКонтакте». Я долго не решался: в этой социальной сети работают самые хардкорные ребята, а я занимался IT постольку-поскольку и чувствовал себя самозванцем. Собеседование прошло довольно ожидаемо: я хорошо ответил на все вопросы по анализу данных и статистике, но плавал в программировании. Тем не менее, ребята, которые со мной разговаривали, решили дать мне шанс. После этого я проходил еще несколько этапов собеседования, делал тестовые задания, не спал ночами (больше от переживаний), но в итоге стал аналитиком в команде бизнеса и рекламы.
Первые несколько месяцев было очень тяжело. Ситуация, когда все вокруг умнее тебя, полезна для развития и приобретения новых навыков, но эмоционально это нелегко. Моя команда всегда была готова помочь, но иногда я чувствовал, что они не понимали, в чем моя проблема, для них это были очевидные вещи. В то время, в 2017 году, нас было всего пять человек, во «ВКонтакте» царила атмосфера стартапа. Мы все были и аналитиками, и разработчиками — на энтузиазме вытаскивали такие задачи, которые решают обычно человек 50. За время работы в соцсети я понял, как устроены многие процессы в IT-командах, и в какой-то момент решил больше времени уделять своим проектам. Недавно я переехал в Москву и начал работать аналитиком в отделе рекламы Mail.ru.
Моя история — хороший пример еще одного метода обучения: сразу сформулировать задачу и начать действовать. Например, твоя цель — научиться делать что-то в Python. Запрос уже сформирован, дальше можно взять несколько курсов, где разбирают эту темы, но не проходить их полностью, а посмотреть только то, что тебе интересно и важно. Я, наверное, изучил все курсы по программированию на Stepik, Coursera и EdX, но ни один из них не прошел до конца.
Я сменил профессию благодаря онлайн-образованию. Еще 20 лет назад невозможно было представить, что человек мог чему-то научиться вне университета. С появлением крупных проектов в онлайн-образовании можно стать очень крутым специалистом, не имея высшего. В IT-индустрии этим уже никого не удивишь: например, Сева Жидков еще не окончил школу, а уже возглавлял команду разработки «ВКонтакте».
«Аналитик — это и программист, и маркетолог, и немного дата-сайентист»
Термин «аналитик» сформулирован максимально широко, что отлично характеризует текущее положение дел на рынке. Самый первый пласт задач аналитика — организация процесса работы с данными в компании. Все должно лежать в одном месте, к которому будет доступ у каждого сотрудника. Следующий пласт — задачи на стыке машинного обучения и статистики, что уже интереснее. Пример из моей работы: во «ВКонтакте» пользователи могут размещать рекламные объявления в ленте новостей. Ещё до того, как человек запустит объявление, мы можем предсказать, насколько оно будет успешным. Если на этапе создания объявления мы уже понимаем, что оно не позволит достичь поставленных целей, можно сразу подсказать пользователю, как стоит улучшить настройки объявления и уберечь его от бесполезной траты денег. Такие предсказания на основе имеющихся данных тоже могут быть задачей аналитика.
Он также должен разбираться в Data Science. Дата-сайентист — это тот, кто понимает, как из данных, которые есть у бизнеса, извлечь полезные закономерности, описать их математически и решить таким образом определенные задачи. Самый банальный пример: если у нас есть онлайн-магазин, можно сделать систему умной рекомендации. Товары будут предлагаться с учетом предыдущего поведения клиента. Более сложный пример машинного обучения — научить беспилотные автомобили автоматически распознавать, где находится пешеход, а где другие транспортные средства. Дата-сайентисты — это, в первую очередь, эксперты в машинном обучении. Они применяют сложные математические модели, алгоритмы и нейронные сети, которые позволяют программам самостоятельно обучаться сложным навыкам. Например, если мы хотим научить нейросеть распознавать собачек и котиков на фотографии, нужно создать сложный математический алгоритм. Мы покажем ему десять тысяч фотографий котиков и собачек, представим их в виде некоего набора цифр и добьемся от алгоритма, чтобы он сам нашел отличия между животными и начал это применять.
Каждый раз, когда вы разблокируете телефон при помощи Face ID, вы видите результат машинного обучения. В телефоне есть хитрый алгоритм, который научили понимать, что перед ним именно лицо владельца, а не распечатанная фотография или другой человек. Машинное обучение используется и в персонализации контента: ленты социальных сетей, рекомендации сериалов на Netflix, даже внешнее оформление сайта может отличаться в зависимости от предпочтений пользователя.
Подробнее о Data Science и образовательных курсах для аналитиков-новичков в продолжении текста на сайте «Цеха»!
Анастасия Котлякова
«Цех» — медиа о непрерывном образовании взрослых людей. Мы целиком захвачены идеей постоянного развития личности — профессионального, интеллектуального, эмоционального и даже духовного. Мы исследуем, как, чему и где лучше всего учиться и, главное, зачем. Если вам понравился этот материал, подпишитесь, пожалуйста, на нашу почтовую рассылку.