648 подписчиков

Как реализовать ограничение количества запросов (Rate Limiting) в API?

17 апреля17 апр

7 мин

Оглавление

Понимание необходимости ограничения скорости в API
Почему ограничение скорости запросов необходимо
Основные концепции ограничения скорости

Ограничение скорости запросов (rate limiting) — важнейший механизм контроля доступа к API, позволяющий регулировать количество запросов от клиентов в заданный промежуток времени. Правильно реализованный rate limiting защищает серверные ресурсы от перегрузки, обеспечивает справедливое использование API всеми пользователями и предотвращает злонамеренные атаки. В этой статье рассмотрим различные алгоритмы, подходы к реализации и лучшие практики для внедрения эффективного ограничения скорости в API.

Понимание необходимости ограничения скорости в API

Rate limiting играет критически важную роль в современной архитектуре API, выполняя несколько ключевых функций, влияющих на стабильность, безопасность и экономическую эффективность сервиса.

Почему ограничение скорости запросов необходимо

Защита серверных ресурсов. Каждый запрос потребляет вычислительные ресурсы, и при отсутствии контроля пиковые нагрузки могут привести к снижению производительности или отказу системы.
Повышение безопасности. Rate limiting защищает от DDoS-атак и других форм злоупотреблений, когда боты создают повторяющиеся запросы, блокируя обслуживание законных пользователей.
Обеспечение справедливого использования ресурсов. Гарантирует, что ни один клиент не сможет монополизировать все доступные мощности, что особенно важно при разных уровнях подписок.
Контроль затрат на инфраструктуру. Предотвращая чрезмерное использование ресурсов, rate limiting обеспечивает прогнозируемость расходов и повышает рентабельность API.

Основные концепции ограничения скорости

Квота запросов: количество запросов, которое клиент может совершить за заданный интервал (например, 100 запросов в минуту).
Идентификация клиентов: способ однозначного определения источника запросов (API-ключ, IP-адрес, токен и др.).
Политика ограничения: набор правил, определяющих алгоритм, квоты и действия при превышении лимита.
Коды ответа: стандартные HTTP-коды для информирования клиентов, чаще всего при превышении лимита возвращается 429 (Too Many Requests).

Основные алгоритмы ограничения скорости запросов

Fixed Window (Фиксированное окно)

Использует фиксированный временной интервал (например, 1 минута) и счетчик запросов. Если число запросов в окне достигает лимита, остальные блокируются до начала следующего окна.

Плюсы: простота реализации.
Минусы: неравномерное распределение запросов на границах окон.

Sliding Window (Скользящее окно)

Учитывает запросы за скользящий временной интервал (например, последние 60 минут), обеспечивая более равномерное распределение трафика и избегая пиков на границах окон.

Плюсы: плавный контроль нагрузки.
Минусы: требует отслеживания временных меток запросов.

Token Bucket (Корзина токенов)

В корзине хранится ограниченное число токенов, которые пополняются с фиксированной скоростью. Каждый запрос «тратит» один токен. Если токенов нет — запрос блокируется.

Плюсы: гибкость, позволяет обрабатывать всплески трафика.
Минусы: сложнее в реализации.

Пример на Java:

import java.time.Duration;
import java.time.Instant;
import java.util.concurrent.atomic.AtomicLong;

public class TokenBucketRateLimiter {
private final long capacity;
private final AtomicLong tokens;
private final Duration refillPeriod;
private volatile Instant lastRefillTime;

public TokenBucketRateLimiter(long capacity, Duration refillPeriod) {
this.capacity = capacity;
this.tokens = new AtomicLong(capacity);
this.refillPeriod = refillPeriod;
this.lastRefillTime = Instant.now();
}

public synchronized boolean isAllowed() {
refillTokens();
long currentTokens = tokens.get();
if (currentTokens > 0) {
tokens.decrementAndGet();
return true; // Запрос разрешен
}
return false; // Запрос не разрешен
}

private synchronized void refillTokens() {
Instant now = Instant.now();
long timeElapsed = Duration.between(lastRefillTime, now).toMillis();
long tokensToAdd = timeElapsed / refillPeriod.toMillis();
if (tokensToAdd > 0) {
lastRefillTime = now;
tokens.getAndUpdate(currentTokens -> Math.min(capacity, currentTokens + tokensToAdd));
}
}
}

Leaky Bucket (Дырявое ведро)

Запросы поступают в ведро, а обрабатываются с постоянной скоростью через «дырку». Если ведро переполнено — новые запросы отклоняются.

Плюсы: равномерная обработка и нагрузка.
Минусы: возможны задержки из-за ожидания в очереди.

Стратегии реализации ограничения скорости

Реализация на уровне приложения

Можно встроить rate limiting в код приложения с помощью библиотек и фреймворков.

Пример для ASP.NET Core (.NET 7+):

var builder = WebApplication.CreateBuilder(args);

// Добавление сервисов rate limiting
builder.Services.AddRateLimiter(options =>
{
options.GlobalLimiter = PartitionedRateLimiter.Create<HttpContext, string>(httpContext =>
{
// Получение идентификатора клиента (например, IP-адрес или API-ключ)
var clientId = httpContext.Connection.RemoteIpAddress?.ToString() ?? "anonymous";
return RateLimitPartition.GetFixedWindowLimiter(clientId,
_ => new FixedWindowRateLimiterOptions
{
AutoReplenishment = true,
PermitLimit = 10,
Window = TimeSpan.FromMinutes(1)
});
});

// Настройка ответа при превышении лимита
options.OnRejected = async (context, token) =>
{
context.HttpContext.Response.StatusCode = StatusCodes.Status429TooManyRequests;
await context.HttpContext.Response.WriteAsync("Слишком много запросов. Пожалуйста, попробуйте позже.", token);
};
});

var app = builder.Build();

// Использование middleware для rate limiting
app.UseRateLimiter();

Использование Redis для распределенного ограничения скорости

Для масштабируемых систем с несколькими экземплярами приложения Redis позволяет централизованно хранить счетчики.

Пример с FastAPI и Redis (Python):

import redis
from fastapi import FastAPI, APIRouter, Request, Response
from fastapi.params import Depends

app = FastAPI()
router = APIRouter()

# Создаем клиент Redis
redis_client = redis.from_url("redis://localhost", encoding="utf-8", decode_responses=True)

# Функция для проверки ограничения скорости
async def rate_limit(request: Request):
# Получаем IP клиента в качестве идентификатора
client_ip = request.client.host
# Создаем ключ для Redis с меткой времени (текущая минута)
current_minute = int(time.time() / 60)
rate_limit_key = f"rate_limit:{client_ip}:{current_minute}"

# Увеличиваем счетчик и устанавливаем срок его действия (60 секунд)
current_count = redis_client.incr(rate_limit_key)
if current_count == 1:
redis_client.expire(rate_limit_key, 60)

# Проверяем, не превышен ли лимит (например, 5 запросов в минуту)
if current_count > 5:
raise HTTPException(
status_code=429,
detail="Превышен лимит запросов. Пожалуйста, попробуйте позже."
)

# Устанавливаем заголовки для информирования клиента о лимитах
headers = {
"X-RateLimit-Limit": "5",
"X-RateLimit-Remaining": str(max(0, 5 - current_count)),
"X-RateLimit-Reset": str((current_minute + 1) * 60)
}

return headers

# Применяем ограничение к маршруту
@router.get("/", dependencies=[Depends(rate_limit)])
def base_route(request: Request):
return {"response": "ok"}

app.include_router(router)

Ограничение скорости на уровне API Gateway

API Gateway (например, NGINX, AWS API Gateway, Kong) предоставляет встроенные механизмы для централизованного ограничения скорости.

Пример конфигурации NGINX:

http {
# Определяем зону для хранения состояния ограничения скорости
# $binary_remote_addr используется как ключ для идентификации клиентов
# 10m - размер зоны в памяти (примерно 16000 IP-адресов)
# 10r/s - ограничение до 10 запросов в секунду
limit_req_zone $binary_remote_addr zone=api_limit:10m rate=10r/s;

server {
location /api/ {
# Применяем ограничение с возможностью всплеска до 20 запросов
limit_req zone=api_limit burst=20 nodelay;

# Проксирование запросов к бэкенду
proxy_pass http://backend_servers;
}
}
}

Типы ограничений скорости и их применение

На уровне API-ключа: точный контроль по уникальным ключам, подходит для многоуровневых моделей доступа.
Глобальное: общий лимит на весь трафик, защищает от перегрузки.
На основе пользователя: персонализированные квоты, интеграция с подписками.
На основе IP-адреса: эффективная защита от автоматизированных атак.

Лучшие практики для эффективного ограничения скорости

Анализ трафика: изучайте шаблоны использования API для установки адекватных лимитов.
Выбор алгоритма: подбирайте алгоритм под специфику нагрузки.
Дифференцированные лимиты: разные лимиты для разных эндпоинтов и операций.
Информирование клиентов: используйте HTTP-заголовки (X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset).
Динамическое ограничение: адаптация лимитов в зависимости от нагрузки.
Кэширование: уменьшайте количество повторяющихся запросов.
Мониторинг: отслеживайте использование, анализируйте превышения лимитов и корректируйте политику.

Заключение

Эффективное ограничение скорости запросов требует сбалансированного подхода, который защищает ресурсы и обеспечивает комфорт для пользователей. Комбинация различных алгоритмов и уровней ограничения, регулярный мониторинг и адаптация настроек помогут создать надежную систему контроля доступа к вашему API.

Пожалуйста, оставляйте свои комментарии, делитесь мнением, подписывайтесь и ставьте лайки! Ваше участие помогает нам делать материалы еще лучше.

Какова роль API-шлюзов в архитектуре микросервисов?

ОК17 апреля

Что такое API?

ОКей Мир18 апреля