Найти тему

АНАЛИТИЧЕСКИЙ ПРОЦЕСС

Я работаю аналитиком всего лишь около 5 месяцев. Соглашусь, опыт небольшой. Но его вполне достаточно, чтобы составить некоторое общее впечатление о том, чем занимаются аналитики.

Начнем с того, что предмет деятельности аналитика - это информация. Цель - привести её к такой форме, которая позволит использовать её для принятия решений. К примеру, что производить, кому продавать, как оптимизировать внутренние процессы предприятия.

В общем и целом, работу аналитика можно разбить на следующие блоки:

1. Сбор данных
2. Организация хранения данных
3. Анализ данных
4. Представление информации

Эти блоки образуют целостный бизнес-процесс. Входом является постановка цели заказчиком. Выходом - принятие решения на основе полученной информации.

-2

В принципе, всю эту работу может осуществлять один аналитик. Однако в крупных компаниях есть специализация. Рассмотрим каждый из них подробнее.

Процесс сбора данных во-многом зависит от места, где работает аналитик и природы этих данных. Если компания занимается социологическими исследованиями, то большинство данных будет собираться путем опроса. Если компания разрабатывает новые материалы или лекарства, то львиная часть данных будет поступать от экспериментов. Но сегодня чаще всего данные можно получить через всемирную сеть.

Поэтому одним из наиболее ценных навыков аналитика, специализирующегося на сборе данных является умение написать парсер. Парсер (или синтаксический анализатор) - это программа, которая самостоятельно собирает данные из сети и приводит их в вид, пригодный для дальнейшей обработки. В принципе, такую программу можно написать на любом языке, поэтому аналитик здесь не ограничен в инструментах.

Организация и хранение данных необходимы, если данных много, они представляют коммерческую ценность и/или они используются с определенной регулярностью. То есть в большинстве случаев. Данные хранят в базах; чаще всего - реляционных. Если упрощать, то реляционная база данных состоит из нескольких таблиц, которые можно соединить друг с другом по ключам - столбцам, общим для этой таблицы.

-3

На рисунке - простая база, состоящая из двух таблиц. В каждой из них - по 4 столбца. Эти таблицы можно соединить через ID пациента, который для. При этом нас могут интересовать только некоторые из столбцов (допустим ФИО пациента и ФИО врача) и строчек (например, все пациенты Иванова И.И.). Реляционные базы позволяют сделать такую выборку данных через язык запросов SQL. Сам же процесс создания базы также требует знания этого языка + навыки работы в СУБД (системы управления базами данных). Напоследок отмечу, что, помимо реляционных существуют и другие виды баз данных. Но эта тема для отдельной статьи.

Анализ данных, наверное, один из самых сложных и нетривиальных процессов из этой цепочки. Сложность заключается в многообразии методов и целей этого анализа. Но я все же попробую как-то систематизировать их.

Ну, во-первых, все виды анализа можно условно поделить на логические и математические. Первые представляют собой определенные способы мышления, с помощью которых аналитик устанавливает взаимосвязи между явлениями и погружается в суть вещей. Такими вещами занимаются системные аналитики.

Математические методы в свою очередь можно условно подразделить на три группы: описательные, доказательные и многомерные. Описательные методы имеют цель свести совокупность данных к небольшому количеству показателей, пригодных для восприятия и интерпретации человеком. Так, замерив у большого количества людей их рост, вы можете свести все значения к одному показателю - среднему росту. Доказательная статистика используется для проверки различных гипотез. А основная цель многомерных методов - установить структуру взаимосвязей между различными явлениями, описав их в виде математической модели.

-4

Для решения части задач, связанных с обработкой данных достаточно Microsoft Excel. Однако профессионалы используют для анализа данных более совершенные инструменты - R, Python, SPSS и т.д.

Последний процесс - представление информации; её визуализация. Превращение таблиц в диаграммы и графики, доступные и понятные для человека. Это - отдельное направление, важность которого трудно переоценить. Ведь неправильно представленные данные могут привести к ошибкам при принятии решений, в случае если эти решения принимает человек.

Аналитик, решающий задачи представления данных, помимо специфического программного обеспечения (отдельные библиотеки для R и Python), должен владеть навыками построения отчётов и презентаций и знать основные закономерности восприятия человеком информации.

Итак, мы рассмотрели цепочку бизнес-процессов, составляющих работу аналитиков: сбор, организация хранения, обработка и представление информации. Остальное определяется спецификой организации, в которой работает аналитик. Отметим также, что не все элементы цепочки могут присутствовать - так данные иногда покупают, а не собирают, а в организациях, где решения отданы на откуп компьютеру нет необходимости в представлении данных.

Как мы могли увидеть, это достаточно сложная работа, которая подразделяется на несколько специализаций, требующих специфических знаний, умений и навыков. Но, тем не менее, её важность не составляет сомнений - без правильной информации не бывает правильных решений.

От себя скажу, что это по-настоящему интересная работа, которая может дать резкий толчок к саморазвитию. Так что, если вы задумывались над тем, чтобы стать аналитиком - пробуйте. Возможно это понравится вам также, как и мне.

Подписывайтесь на Яндекс.Дзен и вступайте в группу ВК.