Слава - Стань сильней
День 16: [Decision Tree #3] Обучаем модель и измеряем точность
Ранее мы получили более иль менее подготовленные данные и мы можем начать обучение модели. Но в первую очередь мы должны определиться с тем как мы будем проверять, что модель обучилась хорошо и её результатам можно верить. А что такое хорошо? Для определённости неплохо было бы оперировать числовыми метриками, а не описательными. И естественно такие есть у каждой модели. Какие из этих метрик качества общие для ряда моделей, какие-то специфичные для конкретной модели. Как правило используют сразу несколько метрик для анализа качества модели...
День 14: [Decision Tree #1] Формулируем задачу и собираем DataFrame
Decision Tree - алгоритм с учителем для классификации или регрессии. Немного терминологии: Алгоритмы с обучением или "с учителем" прежде чем использовать нужно обучить на размеченных данных. Алгоритмы "без учителя" используются напрямую без необходимости обучения. Размеченные данные - данные, которые уже включают в себя правильный результат. Их стоит рассматривать как примеры, которые используют обучающиеся алгоритмы для обучения. Задачи машинного обучения делят по основным типам: 1) Задачи регрессии...