Когда начинаешь свой путь в освоение инструментов машинного обучения/анализа данных не понятно, где взять данные. Давайте решим эту проблему. 1. Датасеты sklearn Для начала необходимо установить библиотеку scikit-learn c помощью команды: pip install scikit-learn. С помощью нее мы можем получить данные для анализа sklearn.datasets.[name_of_library]. Еще одна полезная функция sklearn, это разделение датасета на тренировочную и тестовую выборку. from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = train_test_split(X, y,stratify=y,test_size=0.25,shuffle=True) 2. UCI dataset На данном сайте можно найти множество датасетов для тренировки. (смахните изображение) 3. Сбор данных Увы, как бы нам не хотелось, некоторые данные для анализа придется получать самим. Для этого используют библиотеки: selenium, useragent, bs4,requests - чтобы выполнить запрос. pip install selenium - эта библиотека, позволяет создать эмулятор действий пользователя, например: когда м