🏷 Ресурсы, которые дадут очень прочную основу для начала работы с машинным обучением. Набор тем, ранжированных по темам. Градиентный спуск Метрики — классификация ▪Матрицы неточностей, точность, прецезионность, recall, чувствительность ▪F1-оценка ▪TPR, TNR, FPR, FNR ▪Ошибки I и II типов ▪Кривые AUC-Roc Метрики — регрессия ▪Общая сумма квадратов, объясненная сумма квадратов, остаточная сумма квадратов ▪Коэффициент детерминации и его скорректированная форма ▪AIC и BIC ▪Преимущества и недостатки RMSE, MSE, MAE, MAPE Компромисс отклонение-дисперсия, Over/Under-Fitting ▪Метод k-ближайших соседей ▪Random Forests ▪Асимптотические свойства ▪Проклятие размерности Выбор модели ▪k-Fold кросс-Валидация (перекрестная проверка) ▪L1 и L2 регуляризация ▪Байесовская оптимизация Sampling ▪Классовый дисбаланс при обучении классифицирующих моделей ▪SMOTE ▪Несбалансированность классов в независимых переменных ▪Систематическая ошибка выборки Модели регрессии ▪Глубокие нейронные сети для проблем регрессии ▪Случайная лесная регрессия ▪Регрессия XGBoost ▪ARIMA / SARIMA ▪Байесовская линейная регрессия ▪Регрессия на основе гауссовского процесса Алгоритмы кластеризации ▪Метод К-средних ▪Иерархическая кластеризация ▪Процессы Дирихле Классификационные модели ▪Логистическая регрессия ▪Множественная регрессия ▪XGBoost ▪Метод опорных векторов @machinelearning
Класс – метка, характеризующая принадлежность Наблюдения (Observation) к тому или иному виду характеристики. К примеру, в Модели (Model) Классификации (Classification) пациентов на здоровых и больных раком, классами как раз и будут два вида пациентов – здоровые и больные...