Артамонов С.А. - Машинное обучение для решения прикладных задач - 9. Снижение размерности данных
Задача снижения размерности в машинном обучении (ML) Задача снижения размерности в машинном обучении сводится к уменьшению числа признаков набора данных. Наличие в наборе избыточных, неинформативных признаков снижает эффективность модели. После снижения размерности модель упрощается, а размер набора данных в памяти уменьшается. Ускоряется работа алгоритмов машинного обучения. На практике приходится работать с данными очень больших размерностей. Изображения размером 224×224 пикселей или данные финансовых изменений во времени представляются в виде векторов. Исследователю нужна простая и понятная визуализация и скорость для расчетов. Где применяется: 🔹 распознавание изображений, 🔹 банковские транзакции, 🔹 аналитика больших данных. Основные методы: 🔹 Метод главных компонент (PCA) 🔹 Метод k-средних (K-Means) 🔹 Линейный дискриминант Фишера (LDA) 🔹 Стохастические вложение соседей (t-SNE) При подготовке текста использовали источник: ссылка 👉@aisimple
Алгоритм машинного обучения t-SNE - отличный инструмент для снижения размерности в Python
Источник: Nuances of Programming Вступление Продвинутый специалист в области обработки данных владеет широким спектром алгоритмов машинного обучения и может разъяснить результаты работы каждого алгоритма заинтересованным лицам. Однако не у каждого заинтересованного лица достаточно квалификации, чтобы понять эти разъяснения из-за сложности МО. К счастью, их можно сделать наглядными, используя методы уменьшения размерности для создания визуального представления данных высокой размерности. В этой статье вы познакомитесь с одним из таких методов...