Vaex В этом руководстве мы разрабатываем комплексный аналитический и моделирующий конвейер в производственном стиле с использованием Vaex для эффективной работы с миллионами строк без материализации данных в памяти. Мы генерируем реалистичный крупномасштабный набор данных, разрабатываем расширенные поведенческие и городские характеристики с использованием отложенных выражений и приблизительной статистики, а затем агрегируем полученные сведения в большом масштабе. Затем мы интегрируем Vaex с scikit-learn для обучения и оценки прогнозной модели, демонстрируя, как Vaex может выступать в качестве основы для высокопроизводительного исследовательского анализа и рабочих процессов машинного обучения. Установка необходимых библиотек ```python !pip -q install "vaex==4.19.0" "vaex-core==4.19.0" "vaex-ml==0.19.0" "vaex-viz==0.6.0" "vaex-hdf5==0.15.0" "pyarrow>=14" "scikit-learn>=1.3" ``` ```python import os, time, json, numpy as np, pandas as pd import vaex import vaex.ml from vaex.ml.sklearn
Руководство по программированию для создания масштабируемого конвейера аналитики и машинного обучения на миллионах строк с использованием
3 марта3 мар
2 мин