Здравствуйте, уважаемые читатели! Я начинаю цикл публикаций о базовых возможностях аналитической платформы KNIME в решении задач анализа данных. В этой статье мы познакомимся с данными ПАО Сбербанк, которые представлены в открытом доступе. Нас будет интересовать структура данных, наличие пропущенных значений в строках датасета, а также сбалансированность данных по группам. Сперва в нескольких предложениях расскажу что же такое KNIME Analytics Platform, поскольку в русскоязычном интернете очень мало о ней информации. KNIME - бесплатная система для интеллектуального анализа данных, которая даже в базовой версии обладает хорошим функционалом. Данная платформа предлагает интуитивно понятную рабочую среду без необходимости программировать. Сам процесс анализа проводится в виде графа. Вершины графа - это настраиваемые узлы, которые имеют вход (входы) и могут иметь выход (выходы). Поступаемая на вход узла информация, преобразуется согласно правилам, которые определил аналитик, и доступ