Почему постановка задачи — основа машинного обучения В машинном обучении всё начинается не с кода, не с модели и даже не с данных — а с того, как именно сформулирована задача.
Если с самого начала неправильно определить её тип, модель будет решать не то, что нужно, а все последующие шаги окажутся бессмысленными. Постановка задачи включает: понимание, что мы хотим предсказать, определение типа целевой величины, выбор класса задачи: классификация, регрессия или иной вид обучения. Правильная постановка создаёт ясную рамку, внутри которой модель сможет работать корректно и осмысленно. Пример: предсказание итоговой оценки ученика Представим задачу: по данным за полугодие нужно предсказать итоговую школьную оценку.
Формально значений всего пять — от 1 до 5 — и кажется, что это классификация. Но оценки упорядочены: 3 хуже 4, 4 хуже 5.
В таком случае корректнее использовать регрессию, потому что она учитывает шкалу значений и позволяет предсказывать величину, а не просто выбирать категорию.