Предыдущий урок: Урок 6. Деревья решений — как компьютер “задаёт вопросы” и принимает решения В предыдущем уроке мы познакомились с деревьями решений — удивительно простыми, визуальными и понятными моделями, которые принимают решение, задавая цепочку логических вопросов. Они работают почти как человек: «Если ширина лепестка больше X, то это…». Мы увидели, что такие модели действительно хороши, но у них есть слабое место: деревья очень легко переобучаются. Стоит им дать слишком много свободы — и они начинают запоминать данные вместо того, чтобы учиться мыслить обобщённо. То есть одно дерево — умное, но капризное. Оно может быть блестящим на тренировке и странным в реальности. И вот тут возникает идея: а что если взять много деревьев? Много независимых моделей, каждая из которых обучается по-своему, а потом дать им возможность проголосовать. Звучит почти как коллективный разум — и именно так и работает один из самых популярных и надёжных алгоритмов в машинном обучении: Random Forest, или
Публикация доступна с подпиской
Базовый