1. Введение Docker – это платформа, которая предназначена для разработки, развертывания и запуска приложений в контейнерах.
Упрощенно говоря, Docker – это виртуальная машина, на которой уже установлено окружение, которое потребуется для проекта. Возникает вопрос, зачем нужен Docker в DS-проектах? Скорость. Docker позволяет быстро создать среду разработки для data scienceпроекта. Вам не потребуется отдельно устанавливать python, anaconda или библиотеки для data science. Все, что нужно – найти подходящий образ Docker и запустить контейнер...
Как правило все начинается с данных. Данные могут быть в абсолютно разном формате, например в виде csv-файлов (достаточно распространённый случай). Прежде чем двигаться дальше убедитесь, что вы зарегистрированы в kaggle и у вас установлен CLI клиент kaggle - <ссылка на kaggle нарратив> Подробнее о том, что это такое можно почитая здесь. Возьмём небольшой набор данных о студентах в формате CSV (comma separated values). Читаем данные с помощью shell команд Первое, что логично было бы сделать - посмотреть что это за данные...