Найти в Дзене

Собеседования на Аналитика данных в 2026. Или: как я вышел на рынок в в текущем году и прифигел

Всем привет! Я - практикующий исследователь данных, и на этом канале делюсь тем, что реально работает в IT. Никакой сухой теории, только личный опыт, рабочие инструменты и грабли, на которые я уже наступил за вас. Рад, что вы здесь!🧸 Сначала я написал статью, а потом добавил в заголовок год. Пока печатал, осознал: с каждым годом требования на одни и те же вакансии растут, вопросы усложняются, а задачи становятся всё заковыристее. В IT прохождение собеседований я, как и многие, считаю важным навыком, который нужно постоянно тренировать. Даже если ты сейчас работаешь в «компании мечты» - это лишний повод убедиться в своем выборе или, наоборот, вовремя посмотреть по сторонам. Навыки навыками, но меня подтолкнула и текущая ситуация на работе. Последние 7 месяцев я руководил проектом по разработке и внедрению DWH (корпоративного хранилища данных). Мы собрали весь исторический массив и разрозненные данные в единое аналитическое хранилище на базе ClickHouse. В рамках проекта также настроили
Оглавление

Всем привет! Я - практикующий исследователь данных, и на этом канале делюсь тем, что реально работает в IT. Никакой сухой теории, только личный опыт, рабочие инструменты и грабли, на которые я уже наступил за вас. Рад, что вы здесь!🧸

Сначала я написал статью, а потом добавил в заголовок год. Пока печатал, осознал: с каждым годом требования на одни и те же вакансии растут, вопросы усложняются, а задачи становятся всё заковыристее.

В IT прохождение собеседований я, как и многие, считаю важным навыком, который нужно постоянно тренировать. Даже если ты сейчас работаешь в «компании мечты» - это лишний повод убедиться в своем выборе или, наоборот, вовремя посмотреть по сторонам.

Але-хоп
Але-хоп

Ситуация: почему я снова в игре

Навыки навыками, но меня подтолкнула и текущая ситуация на работе. Последние 7 месяцев я руководил проектом по разработке и внедрению DWH (корпоративного хранилища данных). Мы собрали весь исторический массив и разрозненные данные в единое аналитическое хранилище на базе ClickHouse.

В рамках проекта также настроили ансамблевые модели для прогнозирования спроса. В итоге получился готовый пакет продуктов: ETL, КХД, BI, ML. На словах звучит просто, но поверьте — это колоссальный труд целой команды и сотни бессонных часов.

Сейчас система работает практически автономно: нужно лишь иногда добавлять новые метрики или объекты. Проект перешел в стадию поддержки. На днях директор IT озвучил мне (и еще половине команды), что новых крупных внедрений пока не планируется, расходы нужно минимизировать, и, хотя мы можем «работать как работали», желательно «иметь запасной вариант».

Итого: неделю назад я обновил резюме и начал откликаться. Результат за неделю: около 6 скринингов и 3 технических собеса. Я немного удивился новым требованиям (давно не выходил на рынок). Об этом ниже, а бонусом опишу участие в Weekend Offer в компании, которая, собственно, и владеет Дзеном (название писать не буду 😄).

Аналитик данных. Скрининг (Вопросы от HR)

Здесь вроде бы ничего нового, но стали встречаться вопросы, на которые нет однозначного ответа, и технические термины, которые раньше на первом этапе не спрашивали:

  • Расскажите о себе.
  • Ваша ожидаемая зарплата (вилка)?
  • Какие запросы пишете на SQL?
  • Какие бывают оконные функции?
  • Знаете, что такое CUPED? (Довольно глубоко для скрининга!)
  • Знаете, что такое NS-метрика?
  • Проверка на адекватность: «Чем отличается река от озера? Море от океана?»
  • Что делаете, если не согласны с заказчиком?
  • Как поступите, если коллега переходит на личности?

Техническое собеседование (Аналитика / Теорвер / Секции)

Раньше почти везде было одно «техно» и один финальный «полутехнический» созвон с командой. Сейчас почти поголовно: 2-3 жестких этапа.

Меня удивил «дурдом» с позициями: уже две компании собеседовали меня не по той вакансии, на которую я откликался. На мой немой вопрос «Что происходит?» отвечали: «Ну, у нас несколько вакансий, давайте мы вас заодно погоняем на Data Engineer / DWH-разработчика вместо Аналитика...». Ребят, я ведь не просто так откликаюсь на DS/Analyst. Зачем меня мучить глубоким пониманием кластеров и движков таблиц, если я хочу работать с данными, а не с «железом»?

Основные вопросы на техсекции:

  • Статистическая значимость и p-value.
  • T-test, медиана, мода, среднее.
  • В каких случаях нельзя проводить А/Б тест?
  • Примеры постановки гипотез.
  • Типы джоинов (Join) и различия между ними.
  • Что такое хинты (hints) и как они работают?
  • Разница между RANK и DENSE_RANK.
  • Python: группировка в Pandas, агрегация, распаковка JSON без готовых функций.

Задачи: SQL и Статистика

Сами задачи скопировать не удалось (Live-coding в Яндекс.Контесте с расшаренным экраном), но суть такая:

  1. SQL: Дают таблицу и просят вывести сложную метрику. Проверяют не только синтаксис, но и логику: какие вопросы ты задаешь, как строишь формулу. Без CTE, CASE и сложных джоинов не обойтись.
    Крутой кейс: Даны две таблицы по 15-20 строк. Нужно написать все виды джоинов и сказать, сколько строк (min и max) получится на выходе. Мозги кипят, очень советую потрениться.
  2. Теорвер: Расписать А/Б тест «из головы», объяснить физический смысл коэффициентов.
  3. Логика: Задача про игральную кость. Начальник дает два броска, сколько выпадет - столько окладов премии получишь. Нужно рассчитать матожидание и решить, когда стоит остановиться на первом броске, а когда - рискнуть и бросить второй раз. И всё это масштабировать на бюджет для 100 сотрудников.
  4. Алгоритмы: Они добрались и до аналитиков! Дали задачу с LeetCode на ноды (узлы). Зачем это нужно человеку, который будет рисовать дашборды в Superset и делать ad-hoc отчеты - загадка. Видимо, чтобы жизнь медом не казалась 🥴.

Резюмируя

Собеседования стали чуть сложнее, но главная проблема - конкуренция. На одну вакансию сейчас может падать по 1200-1500 откликов. Даже если ты идеальный кандидат, ты можешь просто затеряться в этой массе. Из 50 человек, дошедших до «техно», минимум 10 будут такими же матерыми, как и ты.

Интересно, сколько реально людей просматривают HR при таком потоке? Или просто собирают базу? Вопросов много, ответы - где-то на поверхности. Если кто знает, поделитесь пожалуйста в комментариях.

Я не претендую на последнюю инстанцию, я пишу о своём пути и опыте. Спасибо что дочитали до конца. Подпишитесь👇👇👇, ставьте лайки 👍🏽👍🏽👍🏽 впереди много интересных статей про навыки, инструменты, обучение, лайфхаки и пути аналитика.