363 читали · 3 года назад
EDA в Машинном обучении простыми словами, часть 2
Разведочный анализ данных (Exploratory Data Analysis) – предварительное исследование Датасета (Dataset) с целью определения его основных характеристик, взаимосвязей между признаками, а также сужения набора методов, используемых для создания Модели (Model) Машинного обучения (ML). Итак, в первой части статьи мы познакомились со следующими этапами разведочного анализа: И теперь продолжим глубже знакомиться с особенностями датасета. Одномерный анализ Описательная статистика Прежде чем применять те или иные методы обучения, нам необходимо удостовериться, что они применимы к текущему датасету...
1 год назад
100 Вопросов по Машинному обучению (Machine Learning) - Вопрос_11
🔠Вопрос_11: На сегодняшний день существует множество алгоритмов машинного обучения. Если дан набор данных, как определить, какой алгоритм следует использовать для этого? ✔️Ответ: При выборе алгоритма машинного обучения для конкретного набора данных, необходимо учитывать несколько факторов: 1. Тип задачи: классификация, регрессия или кластеризация. 2. Масштаб данных: количество объектов и признаков. 3. Структура данных: присутствуют ли пропущенные значения, выбросы, корреляции между признаками...