Найти в Дзене
Учимся на практике: решаем реальные ML-задачки Это наша регулярная рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Плюс, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Пятая задача: прогнозирование спроса на товар Что нужно сделать: Узнать, сколько единиц товара будет продано завтра или на следующей неделе. Как можно сделать: ▪️ Использовать признаки: история продаж, день недели, сезон, скидки, реклама; ▪️ Добавить лаги и скользящие средние; ▪️ Попробовать: Prophet, XGBoost, ARIMA. Данные можно взять на Kaggle: hwww.kaggle.com/...ing Готовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
3 дня назад
Что такое скрининг резюме и как его пройти
Думаем, вы уже знаете, что любое резюме в первую очередь сейчас рассматривает ATS, а не человек. Это не плохо и не хорошо, но это нужно учитывать, если вы хотите попасть на собеседование с реальным человеком. Скрининг, это первичная оценка релевантности резюме к вакансии. Сначала алгоритм ищет ключевые слова из вакансии и базовую совместимость формата. Затем человек проверяет здравый смысл: кто вы и что делали. Цель этого этапа - понять, стоит ли инвестировать время в интервью с вами. Теперь поговорим о том, как работает ATS...
6 дней назад
Завтра мы будем записывать третью часть подкаста: Виктор Кантор x Валерий Бабушкин Если не смотрели первые две части, вас ждет замечательный вечер. Посмотреть выпуски можно на канале На этот раз мы поговорим про спортивную дисциплину, процессы в ML и многом другом. И именно сейчас у вас есть возможность повлиять на содержание подкаста. В комментариях вы можете написать свои вопросы Валерию Бабушкину, мы отберем самые интересные и передадим Виктору. Если хотите что-то узнать про ML System Design, работу в бигтехе или о чем-то еще - ждем вас в комментариях.
1 неделю назад
Сможете найти ошибку в коде? Да, это наша регулярная рубрика Code Detective. Тут мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но помните, что ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: import pandas as pd df = pd.DataFrame({   'A': [1, 2, 3],   'B': [4, 5, 6] }) # Хотим изменить B там, где A > 1 df.loc[df['A'] > 1]['B'] = 99 print(df) Тут всё хорошо. Или нет? Есть какая-то ошибка? Если есть, напишите в комментариях: 1. Какую ошибку нашли; 2. Варианты её исправления. Ответ мы опубликуем завтра, а посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside
1 неделю назад
Типичные ошибки во время испытательного срока
Когда вы только пришли в новую команду, хочется всем доказать, что вас взяли не зря – закрыть задачи быстрее всех и не задавать лишних вопросов. Парадокс в том, что именно эта стратегия чаще всего приводит к провалу испытательного срока. Ведь в это время команда смотрит не только на скорость работы, но и на то, как вы входите в контекст, как коммуницируете с командой и руководителем, как расставляете приоритеты и удерживаете ли стабильный темп работы. Мы собрали самые частые ошибки, которые допускают даже опытные специалисты во время испытательного срока: ▪️Ошибка 1...
1 неделю назад
Учимся на практике: решаем реальные ML-задачки
Это рубрика #петпроект_MLinside и тут мы публикуем задачи из реальных проектов, чтобы лучше запомнить теорию. Бонусом, упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Четвертая задача: Предсказание отказа оборудования Что нужно сделать: По данным с датчиков (температура, давление, вибрация) предсказать, сломается ли устройство Как можно сделать: ▪️ Поработать с временными...
2 недели назад
Продолжаем нашу регулярную рубрику Code Detective Напомним правила – мы публикуем фрагмент кода, а вы смотрите, что с ним не так. Но трюк в том, что ошибки может и не быть. Так что если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: import pandas as pd df = pd.DataFrame({   'group': ['X', 'X', 'Y', 'Y'],   'value': [10, 20, 30, 40] }) df['mean_diff'] = df.groupby('group').transform('mean') - df['value'] Тут всё хорошо. Или нет? Есть какая-то ошибка? Если есть, напишите в комментариях: 1. Какую ошибку нашли; 2. Варианты её исправления. Ответ мы опубликуем завтра, а посты этой рубрики можно посмотреть по хэштегу: #CodeDetective_MLinside
3 недели назад
Первая задача джуна
Начинать что-то новое всегда страшно. Кто-то откладывает реальную работу, потому что боится работать с продуктом, пока не разберется в нем «очень глубоко внутри», а кто-то считает, что для успешного начала нужно подтянуть теорию, еще порешать задачки. Но всё сводится к прокрастинации работы. Поэтому, мы подобрали пять типовых задач для ML инженера позиции джуниор, чтобы вы понимали – как они выглядят в жизни и к какому результату вы должны прийти. Это рутина, которая делает все остальное возможным...
3 недели назад
Учимся на практике: решаем реальные ML-задачки Решение задач из реальных проектов помогает лучше запомнить теорию и упоминание об этом можно включить в портфолио, что определенно поможет вам на собеседованиях. Поэтому мы запустили эту рубрику с мини-кейсами по ML, которые можно решать вместе с нами. Третья задача: Сегментация клиентов магазина Что нужно сделать: Разделить клиентов на группы по их поведению без заранее заданных меток Как можно сделать: ▪️ Использовать признаки: общий чек, частота покупок, возраст, доход ▪️ Нормализовать данные ▪️ Применить K-Means или DBSCAN ▪️ Визуализировать кластеры через PCA Данные можно взять на Kaggle: htwww.kaggle.com/...honГотовы попробовать? Делитесь своими результатами в комментариях. Все посты этой рубрики можно посмотреть по тэгу: #петпроект_MLinside
1 месяц назад
Возвращаемся с нашей регулярной рубрикой Code Detective
Если хотите прокачать навык чтения и анализа чужого кода, а это крайне полезный навык в работе ML-инженера, рубрика вам пригодится. Вот фрагмент кода: import pandas as pd data = pd.DataFrame({'value': [10, 15, 20, 25, 30]}) filtered = data[data['value'] > 20] for i in range(len(filtered)): print(f"Элемент {i}: {filtered['value'][i]}") Тут всё хорошо...
1 месяц назад
Как не потеряться на Kaggle: пошаговый гайд для новичков
Если вы только начинаете изучать машинное обучение, Kaggle может показаться чем-то вроде закрытого клуба. Но на самом деле, это лучшая площадка, чтобы перейти от теории к практике и понять, как всё работает. Это крупнейшее сообщество специалистов по данным: здесь можно участвовать в соревнованиях, работать с реальными датасетами, делиться кодом и смотреть решения других. Площадка бесплатная, так что порог вхождения, это ваши знания и навыки. Создайте аккаунт и оформите профиль. Kaggle можно назвать соцсетью для датасайентистов, так что это поможет потом найти единомышленников...
1 месяц назад
Главная боль собеседований
Как правило, на собеседовании проверяют не только ваши технические навыки, но и умение размышлять и доносить свои мысли структурно. Поэтому, привычные вопросы могут звучать в непривычной формулировке. А если к этому добавить общий стресс, то даже простая задачка кажется чем-то невообразимо сложным. Поэтому, мы подготовили для вас фрейм. Просто идете по нему сверху вниз, фиксируете допущения и всегда связываете ответ с бизнес целью. Так, любой ответ будет структурированым и вы спокойно будете двигаться дальше...
1 месяц назад