Найти тему
Программист о Data Science

День 6: Визуализируем данные. Matplotlib.

В предыдущей статье я уже использовал эту библиотеку для визуализации точки минимума функции. Сегодня посмотрим подробнее как это было сделано.

Но прежде чем пойти дальше напомню о важности обратной связи. Подписывайтесь, если понравилось, оставляете комментарии или пишите в личку, если есть вопросы, идеи или замечания.

Для начала не забываем доустановить необходимые пакеты и импортировать соответствующие модули:

Вероятно помимо самого matplotlib понадобится установить другие пакеты
Вероятно помимо самого matplotlib понадобится установить другие пакеты
То же что и "from matplotlib import pyplot as plt"
То же что и "from matplotlib import pyplot as plt"

С Matplotlib можно работать на разных уровнях абстракции. Сегодня я рассмотрю наиболее простой интерфейс через plot функцию и прямой передачи координат.

Нет ничего проще чем захардкодить конкретные значения координат
Нет ничего проще чем захардкодить конкретные значения координат

Если взять чуть больше точек, то можно увидеть закономерности плавных непрерывных функций. Воспользуемся библиотекой NumPy для создания вектора значений.

Не забываем, что оператор возведения в степень применяется ко всем элементам NumPy массива.
Не забываем, что оператор возведения в степень применяется ко всем элементам NumPy массива.

При этом если вызвать plot функцию несколько раз, то графики отобразятся на одном рисунке:

Не забываем про "?" префикс к строке чтобы получить справку по функции.
Не забываем про "?" префикс к строке чтобы получить справку по функции.
Так удобно сравнивать как изменяется график при той или иной модификации функции.
Например так видно что уменьшение отрицательного аргумента функции нахождения экспоненты приподымает график функции.
Например так видно что уменьшение отрицательного аргумента функции нахождения экспоненты приподымает график функции.

Имея малое количество дискретных значений x и y можно найти такую функцию, которая на промежутке данных значений сможет найти "промежуточные значения" - функции интерполяции.

Такие функции реализованы в библиотеки SciPy. Воспользуемся ими, чтобы сделать наш график экспонент более гладким:

Можем использовать другой тип интерполяции, чтобы получить другие промежуточные значения, например без резкие изменений.

-8
Имейте ввиду, что функция интерполяции работает крайне плохо на зашумлённых данных (данные, в которых есть неправильные, нерепрезентативные значения), а именно с такими данными обычно и приходится иметь дело. Поэтому она не может применяться как есть для восстановления закономерности по данным.
Наука
7 млн интересуются