Добавить в корзинуПозвонить
Найти в Дзене
DenoiseLAB

Вступительные задачи по Data Science №15. Важнейшие алгоритмы

👋Ребята всем привет Тема данного поста это разбор важнейших алгоритмов, которые вам понадобятся для успешного прохождения интервью и последующей работы. Сегодня на разборе: метод главных компонент (РСА)/SVD. Это один из основных алгоритмов машинного обучения. При помощи данного алгоритма возможно производить уменьшение размерности даных, при незначительной потере исходной информации. Наиболее актуально для задач распознавания образов, сжатии данных, и различных приложениях связанных с компьютерным зрением. Математика, лежащая в основе данного алгоритма сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к так называемому сингулярному разложению матриц данных. Данный метод был предложен в 1901 г. Карлом Пирсоном. Его так же часто называют преобразованием Кархунена-Лёве (Karhunen-Loeve transform) или преобразованием Хотеллинга (Hotelling transform). Задача метод состоит в аппроксимации (приближении) данных линейными многообраз
Фото: ВышМат
Фото: ВышМат

👋Ребята всем привет

Тема данного поста это разбор важнейших алгоритмов, которые вам понадобятся для успешного прохождения интервью и последующей работы. Сегодня на разборе: метод главных компонент (РСА)/SVD.

Это один из основных алгоритмов машинного обучения. При помощи данного алгоритма возможно производить уменьшение размерности даных, при незначительной потере исходной информации. Наиболее актуально для задач распознавания образов, сжатии данных, и различных приложениях связанных с компьютерным зрением.

Математика, лежащая в основе данного алгоритма сводится к вычислению собственных векторов и собственных значений ковариационной матрицы исходных данных или к так называемому сингулярному разложению матриц данных.

Данный метод был предложен в 1901 г. Карлом Пирсоном. Его так же часто называют преобразованием Кархунена-Лёве (Karhunen-Loeve transform) или преобразованием Хотеллинга (Hotelling transform).

Задача метод состоит в аппроксимации (приближении) данных линейными многообразиями меньшей размерности. Далее следует поиск подпространства меньшей размерности, в ортогональной проекции на которые разброс данных (то есть среднеквадратичное отклонение от среднего значения) максимален. Затем ищут подпространства меньшей размерности, в ортогональной проекции на которые среднеквадратичное расстояние между точками максимально. В этом случае оперируют конечными множествами данных.

Подписывайтесь на наш канал и делитесь инфой с друзьями!

https://dzen.ru/id/62cfd02dce2f2915341e0942

DenoiseLAB

#python #datamining #datascience #analytics #bigdata #coding