Шум – записи в наборе данных, не укладывающиеся в ту или иную концепцию Классификации (Classification). Такие Наблюдения (Observation) вызваны человеческой ошибкой при создании Датасета (Dataset) или иными причинами. Реальные данные имеют ряд факторов, которые могут повлиять на вероятность появления шума. Его существование – неизбежная проблема, но это поддается решению. Люди склонны совершать ошибки при сборе данных, а инструменты могут быть ненадежными: это и приводит к ошибкам. Шум в Модели (Model) Машинного обучения (ML) может вызвать проблемы, поскольку Алгоритм (Algorithm) интерпретирует такие записи как закономерность и начнет обобщать на основании имеющихся данных. Зашумленный набор наносит ущерб всему Пайплайну (Pipeline). Зашумленность измеряется как отношение чистых данных – сигнала к шуму. Существует много методов, используемых для искоренения шума. Анализ главных компонент Анализ главных компонент (PCA) — это арифметический метод, преобразующий потенциально коррелирующие п
Noise в Машинном обучении простыми словами
19 марта 202219 мар 2022
199
2 мин