163 читали · 3 года назад
Overfitting в Машинном обучении простыми словами
Переобучение – это случай, когда значение Функции потери (Loss Function) действитеьно малó, но Модель (Model) Машинного обучения (ML) ненадежна. Это связано с тем, что модель «слишком много учится» на обучающем наборе данных. Когда мы входим в сферу ML, появляются двусмысленные термины: Переобучение, Недообучение (Underfitting) и Дилемма смещения-дисперсии (Bias-Variance Trade-off). Эти концепции лежат в основе Машинного обучения в целом. Почему нам вообще должно быть до этого дело? Возможно, модели машинного обучения преследуют одну единственную цель: хорошо обобщать...
2 месяца назад
Собеседование на позицию Data Scientist: разбираем вопросы для новичков
Привет! На связи Merion Academy - платформа доступного IT образования. Во время собеседования на должность специалиста Data Science (науки о данных) интервьюер будет задавать вопросы из различных областей. Например, статистика, программирование, анализ данных, предварительная обработка данных или моделирование. В этой статье собрали для вас самые распространенные вопросы, которые вам могут встретиться на интервью. Логистическая регрессия — это популярный алгоритм, который используется для решения задач классификации...