282 читали · 4 года назад
Статистические типы данных, используемые в машинном обучении
Введение в статистику Статистика — это наука об изучении данных. Знания в этой области позволяют использовать подходящие методы сбора и анализа данных, а также эффективно представлять результаты такого анализа...
2 года назад
Последовательный отбор признаков для модели машинного обучения
Как известно, некоторые признаки, характеризующие объекты в моделях машинного обучения могут оказаться фиктивными или избыточными. Соответственно, их включение в пайплайн может привести к снижению качества прогнозов. Рассмотрим, один из популярных способов оптимизации набора признаков, который заключается в формировании их множества путем последовательного добавления по одному наиболее эффективному. То есть сначала работа модели тестируется на каждом отдельном признаке и выбирается максимизирующий...