Источник: Nuances of Programming Исследователям данных часто приходится работать с достаточно объемными наборами данных, которые трудно обработать компьютеру. Эта проблема не нова и, как и любая другая, не имеет универсального решения. Лучший выход из положения будет зависеть от конкретных данных и задач приложения. И все же попытаемся выделить из три наиболее оптимальных решения. 1. Сокращение используемой памяти путем оптимизации типов данных При загрузке данных с использованием Pandas типы определяются автоматически (если не указана иная задача)...
Годнота для всех, кто работает с данными. Статья раскрывает разные подходы к обработке больших файлов — от простых итераторов до распределенных вычислений. Сохраняй себе, точно пригодится в работе! Данная статья является переводом. Ссылка на оригинал. Работа с большими текстовыми файлами в Python может показаться настоящим вызовом. Когда файлы достигают гигабайтов, попытка загрузить их в память целиком может привести к сбою программы. Но не переживай — Python предлагает несколько методов для эффективной обработки таких файлов без излишней нагрузки на память и потери производительности...