189 прочтений · 1 год назад
Grid Search в Машинном обучении простыми словами
Алгоритм поиска по сетке – это метод подбора оптимальных гиперпараметров для Модели (Model) путем перебора всех возможных комбинаций значений Гиперпараметров (Hyperparameter) из заданного набора. Гиперпараметры – это параметры модели, которые не оптимизируются во время процесса обучения, а задаются до его начала. Их оптимальный выбор влияет на качество и обобщающую способность модели. Допустим, мы создали Дерево решений (Decision Tree) для банковского кредитного датасета. С полным кодом модели вы можете ознакомиться в этом ноутбуке...
88 прочтений · 3 года назад
Fraud Detection в Машинном обучении
Обнаружение мошеннических операций – одна из популярнейших задач Машинного обучения (ML), нацеленная на выделение правонарушений из общего потока событий. Рассмотрим в качестве примера распознавание воровства средств с банковских карт. Для начала импортируем необходимые библиотеки: Импортируем хронологию операций: Посмотрим, из чего состоит Датасет (Dataset): Кроме Признаков (Feature) «Время» (Time), «Количество» (Amount) и «Класс» (Class) другие не стоит интерпретировать в одиночку. Но все мы знаем, что значения столбцов V1 - V28 были преобразованы с помощью Анализа главных компонент (PCA)...