Инструмент массовой загрузки и выгрузки данных под названием DSBulk от DataStax, помогает посчитать количество строк в таблице кейспейса (keyspace), потому что классическим селектом (select from) этого не сделать.
Вот как это делается:
- забираем DSBulk на ноду / виртуальную машину
- запускаем через команду:
./dsbulk count -k inbox -t messages -h vm-hostname -port 9042 -u username -p password
В моем примере, на тестовых данных запрос отбежал за 4 минуты и выдал 39870555 строк. Кластер из 3 нод и одним дата центром (DC).
Ссылка на GitHub: https://github.com/datastax/dsbulk