66 подписчиков

ПРОГНОЗ: по результатам сравения методов пагинации PostgreSQL

9 декабря 20259 дек 2025

2 мин

Вопрос Используя информацию о размерах таблиц, схеме баз данных и тестовых запросах, дай прогноз и обоснование - какой тестовый запрос покажет большую производительность для нагрузочного тестирования с параллельной нагрузкой от 5 до 22 сессий для СУБД PostgreSQL 17 c ресурсами CPU=8 RAM=8GB Реальные данные эксперимента Ответ нейросети Прогноз: Наибольшую производительность при параллельной нагрузке (5–22 сессии) покажет запрос plan-2 (Deferred Join). Обоснование: 1. Анализ планов выполнения plan-1 (OFFSET-LIMIT): Выполняет полное сканирование индекса tickets_pkey для пропуска строк (OFFSET), что приводит к высокой стоимости I/O и CPU при большом смещении. Execution Time: ~8.45 сек — неэффективно при параллельных запросах, так как каждый сеанс будет конкурировать за ресурсы индекса. plan-2 (Deferred Join): Сначала выбирает 100 строк через Index Only Scan (только индекс tickets_pkey), затем присоединяет остальные данные. Execution Time: ~1.73 сек — в 4.9 раза быстрее plan-1. Минимизи

Оглавление

Вопрос
Реальные данные эксперимента
Ответ нейросети

Вопрос

Используя информацию о размерах таблиц, схеме баз данных и тестовых запросах, дай прогноз и обоснование - какой тестовый запрос покажет большую производительность для нагрузочного тестирования с параллельной нагрузкой от 5 до 22 сессий для СУБД PostgreSQL 17 c ресурсами CPU=8 RAM=8GB

Реальные данные эксперимента

Оптимизация пагинации в PostgreSQL: сравнительный анализ производительности методов выборки случайных данных

Postgres DBA9 декабря 2025

Ответ нейросети

Прогноз:

Наибольшую производительность при параллельной нагрузке (5–22 сессии) покажет запрос plan-2 (Deferred Join).

Обоснование:

1. Анализ планов выполнения

plan-1 (OFFSET-LIMIT):
Выполняет полное сканирование индекса tickets_pkey для пропуска строк (OFFSET), что приводит к высокой стоимости I/O и CPU при большом смещении.
Execution Time: ~8.45 сек — неэффективно при параллельных запросах, так как каждый сеанс будет конкурировать за ресурсы индекса.
plan-2 (Deferred Join):
Сначала выбирает 100 строк через Index Only Scan (только индекс tickets_pkey), затем присоединяет остальные данные.
Execution Time: ~1.73 сек — в 4.9 раза быстрее plan-1.
Минимизирует чтение данных из heap, снижает нагрузку на память и блокировки.
plan-3 (Keyset):
Использует CTE для выбора случайной точки старта, затем Nested Loop с фильтром.
Execution Time: ~8.21 сек — медленнее plan-2 из-за обработки 6.2M строк в цикле (Rows Removed by Join Filter: 6284350).
При параллельных сессиях Nested Loop может создать конкуренцию за ресурсы.

2. Факторы параллельной нагрузки

Конкуренция за I/O:
Index Only Scan (plan-2) читает только индекс, что снижает нагрузку на диск и кэш.
Index Scan с полным чтением (plan-1, plan-3) увеличивает contention при множественных сессиях.
Использование памяти:
При 8 GB RAM данные индекса tickets_pkey (~300 MB) могут кэшироваться, что ускоряет Index Only Scan.
Полное сканирование индекса (plan-1) вытесняет другие данные из кэша.
Блокировки:
Deferred Join выполняет быстрый поиск по индексу с минимальным временем удержания блокировок.
OFFSET (plan-1) требует длительного сканирования, увеличивая contention.

3. Масштабируемость при 5–22 сессиях

plan-2 хорошо масштабируется:
Каждый запрос делает два быстрых индексных скана (подзапрос + join).
Общее время выполнения растёт линейно, но остаётся приемлемым.
plan-1 и plan-3 будут деградировать:
Высокий I/O и CPU при параллельных сессиях приведут к увеличению latency и возможным таймаутам.

4. Рекомендация для нагрузочного тестирования

Тестировать plan-2 как наиболее эффективный.
Мониторить во время теста:
pg_stat_user_indexes — активность индекса tickets_pkey.
pg_locks — конкуренция за блокировки.
BUFFERS в EXPLAIN (ANALYZE, BUFFERS) — чтения из кэша/диска.

Итог:

Запрос plan-2 (Deferred Join) оптимален для параллельной нагрузки благодаря минимальному чтению данных, использованию покрывающего индекса и низкому времени выполнения.

Вероятная пропускная способность системы при 22 сессиях: ~22 * (100 строк / 1.73 сек) ≈ 1270 строк/сек.