3 месяца назад
Скачать файлы с помощью python по ссылкам из датафрейма
Как скачать файлы по URL-ссылкам, которые хранятся в таблице? Входные данные... Есть excel-файл (или любой другой: csv, json, xml...), в котором хранятся URL-адреса файлов для скачивания и в отдельной колонке лежат ID файлов. Определена директория для выгрузки файлов. Нужно скачать все файлы, которые доступны к скачиванию и назвать скачиваемые файлы по ID из таблицы. Открываем Jupyter Notebook: Функция выгрузки принимает на вход исходный датафрейм, столбец с URL-адресами файлов. А также столбец...
424 читали · 2 года назад
Асинхронно скачиваем файлы c Python.
Имея список ссылок на картинки, которые нужно скачать, мы можем это сделать используя простой цикл for, тем самым скачав их последовательно одна за одной. Но в таких ситуациях как эта (скачивание огромного количества небольших файлов) распараллеливание задачи существенно ускорит процесс. Для этого воспользуемся функцией ThreadPoolExecutor из стандартного пакета concurrent.futures. Она позволяет запустить нашу функцию, в нескольких екземплярах в параллельных потоках. В конструкторе необходимо указать максимальное количество потоков, которые будут одновременно запущены...