1 часть, 2 часть, 3 часть, 4 часть , 5 часть... Предисловие Перейдём к работе с реальными данными и наконец зайдёмся машинным обучением. В качестве 1 набора данных я выбрал довольно классический "Титаник". В планах рассмотреть на нём как можно больше алгоритмов(пока что исключим из списка алгоритмов нейросети из-за того, что кол-во данных слишком мало и на +-1300 примерах мы не получим внятный результат) и по возможности проанализировать почему некоторые работают хуже, а некоторые лучше. Анализ данных Прежде чем работать с данными нам надо посмотреть какие данные мы получили, проанализировать их и по возможности предъобработать. Импортируем необходимую для прочтения данных библиотеку import pandas as pd Посмотрим что в данных для обучения(забыл сказать, что тут у нас все данные уже разделены на тренировочные и тестовые с соответствующим их разделением на "для предсказания" и "для проверки ответа") titanic_data = pd.read_csv('train.csv') titanic_data.head(15) Как мы видим по столбцу