1 часть, 2 часть, 3 часть, 4 часть , 5 часть... Предисловие Перейдём к работе с реальными данными и наконец зайдёмся машинным обучением. В качестве 1 набора данных я выбрал довольно классический "Титаник". В планах рассмотреть на нём как можно больше алгоритмов(пока что исключим из списка алгоритмов нейросети из-за того, что кол-во данных слишком мало и на +-1300 примерах мы не получим внятный результат) и по возможности проанализировать почему некоторые работают хуже, а некоторые лучше. Анализ...
Импорт библиотек и данных </></></></></></></></></></></></></>
import pandas as pd
import numpy as np
from sklearn.preprocessing import LabelEncoder, StandardScaler
import seaborn as sns
import matplotlib.pyplot as plt
# Загрузка данных
from google.colab import files
uploaded = files.upload()
# Предполагаем, что файлы train.csv и test.csv были загружены
train_data = pd.read_csv('train.csv')
test_data = pd.read_csv('test.csv')
</></></></></></></></></></></></></> Модуль A: Парсинг и предобработка данных Шаг 1: Загрузка данных
</></></></></></></></></></></></></>
# Просмотр первых строк данных
train_data...