Файлы с расширением CSV (Comma Separated Values) представляют собой текстовые файлы, в которых данные структурированы в виде таблицы. Каждая строка такого файла — это запись, а значения в строках разделены запятыми или другими символами-разделителями (например, точкой с запятой или табуляцией). CSV-файлы часто используются для передачи данных между различными приложениями, особенно в контексте работы с таблицами и базами данных. В этой статье рассмотрены различные способы открытия и редактирования файлов CSV на популярных операционных системах, а также онлайн-инструменты...
Классная практическая статья Working with large CSV files in Python from Scratch рассказывает о хитростях работы с большими CSV-файлами.
В статье рассматриваются примеры:
— подсчёт строк в большом файле. Для этого применяется mmap, который использует низкоуровневое API операционной системы. Это позволяет ускорить чтение большого файла. Сам mmap заслуживает отдельной статьи. В ней с примерами на питоне объясняется, откуда берётся ускорение, плюс другие интересности, в том числе уровня системных вызовов...