Найти в Дзене
Machine Learning Explained

Кросс-валидация для временных рядов

https://t.me/machine_learning_explained 7-минутная статья о том, как разбивать данные на train-validation-test сеты, если данные - это временные ряды. Вкратце, разбивать надо вдоль оси времени. То есть, тренировочные данные идут хронологически до валидационных. Валидационные до тестовых. Потому что модель не должна иметь никакую информацию о будущем. В статье есть очень понятные картинки о том, как именно разбивать. Кроме этого в scikit-learn есть класс TimeSeriesSplit, но он разбивает только на train-test, валидацию все равно делать самим. Статья: https://towardsdatascience.com/time-series-nested-cross-validation-76adba623eb9 TimeSeriesSplit: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html

https://t.me/machine_learning_explained

7-минутная статья о том, как разбивать данные на train-validation-test сеты, если данные - это временные ряды.

Вкратце, разбивать надо вдоль оси времени. То есть, тренировочные данные идут хронологически до валидационных. Валидационные до тестовых. Потому что модель не должна иметь никакую информацию о будущем.

В статье есть очень понятные картинки о том, как именно разбивать.

Кроме этого в scikit-learn есть класс TimeSeriesSplit, но он разбивает только на train-test, валидацию все равно делать самим.

Статья: https://towardsdatascience.com/time-series-nested-cross-validation-76adba623eb9

TimeSeriesSplit: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.TimeSeriesSplit.html