Визуализация — это язык, который позволяет нам видеть данные и понимать их смысл. Простой и эффективный способ диагностики результатов работы модели на различных объектах заключается в анализе разницы между прогнозами и целями. Он может показать, что в некоторых группах поведение модели имеет особенности, например, склонность к завышению или занижению прогнозов. Для демонстрации того, как строится такая визуализация загрузим набор данных: Разобьем датасет на две группы для обучения и оценки: Теперь построим модель и сделаем предсказания: Аналитический прием, о котором шла речь выше, заключается в визуализации распределения разности между целями и прогнозами (ошибками). Это можно сделать, например, путем построения гистограммы или графика разброса точек с координатами по оси y - ошибки, x - предсказания. Объявим функцию с соответствующими свойствами и вызовем ее: На графике ошибки распределены равномерно относительно нуля, их среднее и медиана почти совпадают и равны 0. Аналогичные виз
Визуализация ошибок, как навигатор к скрытым проблемам модели
12 мая 202412 мая 2024
9
1 мин