Рассмотрим способ повышения комфорта работы в среде Jupyter при обработке больших объемов информации. Речь идет о наболевшей ситуации, когда после долгих ресурсоемких вычислений требуется прервать сессию, однако особого желания повторять вычисления не возникает. Решить эти проблемы поможет библиотека dill, которая сохраняет состояние и позволяет загрузить его снова. Одновременно становится возможным делиться сессией и восстанавливать ее на другом компьютере.
Устанавливает библиотека просто с помощью менеджера пакетов pip:
Теперь перейдем к применению. Сначала создадим демонстрационные данные:
Сохранение сессии осуществляется функцией dump_session, которая получает имя файла:
Затем для восстановления вызывается функция load_session с именем файла с сессией:
Для проверки работы сначала сделаем рестарт ядра и попробуем запустить ячейку с обращение к переменной:
Теперь вызовем load_session:
Следует упомянуть, что под капотом dill использует pickle и следовательно не является безопасным форматом для передачи данных по сети. Ее использование целесообразно в случае полной уверенности, что файл не подвергнут вмешательству злоумышленника.