1 часть, 2 часть, 3 часть, 4 часть, 5 часть... Перед тем как перейти к машинному обучению нам осталось всего ничего, разделить обучающие данные. y = titanic_data.Survived X = X.drop(['Survived'], axis=1) Оставить от 2 колонок в ответе для теста только 1. gender_submission = gender_submission['Survived'] И произвести с test те же самые действия, что и с titanic_data в прошлой статье(разве что придётся заполнять не Embarked, а Fare и не стандартным значением, а средним(просто потому что у подавляющего большинства примерно одна цена, а отсутствует всего одно значение). test = test.drop(['PassengerId','Name','Cabin','Ticket'], axis=1) test = test.fillna({'Age':test.Age.median(),'Fare':test.Fare.median()}) test = pd.get_dummies(test) Сейчас обучим модель на дереве и не будем подбирать параметры, а уже начиная с леса будем использовать GridSearchCV(сейчас мы просто смотрим как всё будет работать). clf = tree.DecisionTreeClassifier() clf.fit(X, y) clf.score(test, gender_submission) Итого у ме