https://t.me/machine_learning_explained 7-минутная статья о том, как разбивать данные на train-validation-test сеты, если данные - это временные ряды. Вкратце, разбивать надо вдоль оси времени. То есть, тренировочные данные идут хронологически до валидационных. Валидационные до тестовых. Потому что модель не должна иметь никакую информацию о будущем. В статье есть очень понятные картинки о том, как именно разбивать...
Статья подготовлена для студентов курса «Data Scientist» в образовательном проекте OTUS. Представьте, что мы построили модель для решения задачи по анализу временных рядов и хотим понять, хорошо ли она работает. Точнее, нам необходимо выбрать из некоторых моделей наилучшую. Сделать это поможет перекрёстная проверка на временном ряду, то есть Cross-Validation. При выполнении кросс-валидации на временных рядах нужно понимать, что данные зависят друг от друга, то есть их последовательность важна...