За удобство облачных сервисов приходится расплачиваться некоторыми особенностями работы с удаленной машиной. Одной из них является загрузка данных для работы. В целом имеются различные способы решения этой проблемы, на них мы и остановимся в этой статье.
Чтение массива по ссылке средствами Pandas
Вызываем функции (например, pd.read_csv, pd.read_excel) с адресом в качестве параметра:
Закачка файла в облако из локального компьютера
Жмете соответствующую кнопку на панели в левой верхнем углу и выбираете файл:
Закачка файла в облако по ссылке в Интернете
Сработают и некоторые команды работы с Bash:
Клонирование проекта из Git репозитория
Для этого достаточно создать ячейку и набрать команду:
Закачка из Yandex Disk
О ней подробнее можно прочитать здесь. В статье разберем кейс загрузки файла. Обращаемся в раздел Snippets (там можно одним кликом создать ячейку для решения различных сценариев закачивания данных) и выбираем Yandex Disk-> Get file:
Появляется ячейка c необходимыми командами и инструкциями. Например, сказано, что перед запуском создается приложение (после потребуется ввести его id и secret, а также код подтверждения):
Распаковка
Зачастую папки и файлы распространяются в виде архивированных файлов, поэтому вам могут пригодиться следующие ячейки: