Машинное обучение. Логические методы классификации. К.В. Воронцов, Школа анализа данных, Яндекс.
Random Forest в Машинном обучение
Случайный лес – метод Машинного обучения (ML), использующий Ансамбль (Ensemble) Деревьев решений (Decision Tree) для задач Классификации (Classification). Каждое отдельное дерево в таком лесу дает предсказание класса, и набравший наибольшее количество голосов Класс (Class), становится предсказанием Модели (Model). Он использует Бэггинг (Bagging) и случайность признаков при построении каждого отдельного дерева, чтобы создать некоррелированный лес из деревьев, прогноз которого "комитетом" более точен, чем прогноз любого отдельного дерева...
10. Cлучайный лес
Случайный лес (Random Forest) — алгоритм машинного обучения с учителем, который состоит из множества отдельных независимых «решающих деревьев». Чтобы повысить качество предсказаний, в машинном обучении используют ансамбли — алгоритмы, сочетающие сразу несколько моделей. Метод случайного леса предложен Лео Брейманом и Адель Катлер. Алгоритм применяется для задач классификации (предсказание класса, например, к какому семейству принадлежит растение), регрессии (предсказание непрерывной величины — на сколько градусов повысится средняя температура зимой) и кластеризации...