Анализ главных компонент – это метод понижения размерности Датасета (Dataset), который преобразует больший набор переменных в меньший с минимальными потерями информативности. Уменьшение количества переменных в наборе данных происходит в ущерб точности, но хитрость здесь заключается в том, чтобы потерять немного в точности, но обрести простоту. Поскольку меньшие наборы данных легче исследовать и визуализировать, анализ данных становится намного проще и быстрее для Алгоритмов (Algorithm) Машинного обучения (ML) ...
В эфире уже практически традиционная рубрика «базовые алгоритмы ML». Сегодня мы поговорим про решающие деревья. Вы наверняка уже встречались с методом решающих деревьев в машинном обучении. Причём, скорее всего, в максимально далёких от ML областях: в инструкциях по обслуживанию оборудования, психологических тестах, детских журналах… Это похоже на игру: вы делаете выбор, переходите по стрелке, делаете новый выбор — пока не доберётесь до результата в конце страницы. В широком смысле решающее дерево...