915 читали · 3 года назад
Python. Простая визуализация данных
В этой статье я покажу, как быстро и просто визуализировать данные, которые представлены в виде таблицы Excel или CSV-файла. Визуализировать будем при помощи библиотек pandas и matplotlib, используя обычный график, гистограмму и круговую диаграмму ("пирог"). Готовим данные Для этой статьи я нашел на просторах сети файл со статистическими данными, в котором были собраны популярные "русские" имена на просторах Америки. Некоторые имена показались мне странными, но правдивость данных не тема этой статью, поэтому перейдем к делу...
112 читали · 5 лет назад
Делаем проект по машинному обучению на Python. Часть 3
Многим не нравится, что модели машинного обучения представляют собой чёрные ящики: мы кладём в них данные и безо всяких объяснений получаем ответы — часто очень точные ответы. В этой статье мы постараемся разобраться, как созданная нами модель делает прогнозы и что она может рассказать о решаемой нами задаче. И завершим мы обсуждением самой важной части проекта по машинному обучению: задокументируем сделанное и представим результаты. В первой части мы рассмотрели очистку данных, разведочный анализ, конструирование и выбор признаков...