Ранее мы получили более иль менее подготовленные данные и мы можем начать обучение модели. Но в первую очередь мы должны определиться с тем как мы будем проверять, что модель обучилась хорошо и её результатам можно верить. А что такое хорошо? Для определённости неплохо было бы оперировать числовыми метриками, а не описательными. И естественно такие есть у каждой модели. Какие из этих метрик качества общие для ряда моделей, какие-то специфичные для конкретной модели. Как правило используют сразу несколько метрик для анализа качества модели. Каждая метрика раскрывает это самое качество со своей стороны. Самое простое, что можно придумать в плане метрик - это процент угаданных классов - так называемая точность или accuracy. Для этой метрики нам нужны "правильные ответы". Берут их как правильно из тех же данных, что заготовлены для обучения модели. Но если мы возьмём прямо те же данные, на которых модель обучалась, она очевидно покажет лучший результат, чем на данных, которые она не видел
День 16: [Decision Tree #3] Обучаем модель и измеряем точность
19 июня 201919 июн 2019
300
2 мин