Добавить в корзинуПозвонить
Найти в Дзене
StableDif

💢 МОДЕЛИ С ПЕРМАНЕНТНО БЕСПЛАТНЫМ API

​RPM / RPD — запросы в минуту / день.
​TPM / TPD — токены в минуту / день.
​RPS — запросы в секунду.
​[Конт / Выв] — размер контекста / макс. вывод. ​ ​🔹 Google Gemini ​Gemini 2.5 Flash: [1M / 65K] Мульти | 10 RPM, 250 RPD ​Gemini 2.5 Flash-Lite: [1M / 65K] Мульти | 15 RPM, 1000 RPD ​🔹 Mistral AI ​Mistral Small 4: [256K / 256K] Текст/Код | ~1 RPS, 500K TPM ​Mistral Medium 3: [128K / 128K] Текст | ~1 RPS, 500K TPM ​Mistral Large 3: [256K / 256K] Текст | ~1 RPS, 500K TPM ​Mistral Nemo: [128K / 128K] Текст | ~1 RPS, 500K TPM ​Codestral: [256K / 256K] Код | ~1 RPS, 500K TPM ​Pixtral Large: [128K / 128K] Мульти | ~1 RPS, 500K TPM ​🔸 Cerebras ​gpt-oss-120b: [128K / 8K] Текст | 30 RPM, 14.4K RPD, 1M TPD ​qwen-3-235b: [131K / 8K] Текст | 30 RPM, 14.4K RPD, 1M TPD ​🔸 Cloudflare ​llama-3.3-70b: [131K] Текст | 10K neurons/day ​llama-4-scout-17b: [10M] Мульти | 10K neurons/day ​mistral-small-3.1-24b: [128K] Текст | 10K neurons/day ​gemma-4-26b: [256K] Текст | 10K neurons/day ​qwq-32b: [3
Оглавление

Сокращения используемые в статье

​RPM / RPD — запросы в минуту / день.
TPM / TPD — токены в минуту / день.
RPS — запросы в секунду.
[Конт / Выв] — размер контекста / макс. вывод.

​🟢 ПРОВАЙДЕРЫ МОДЕЛЕЙ

​🔹 Google Gemini

Gemini 2.5 Flash: [1M / 65K] Мульти | 10 RPM, 250 RPD

Gemini 2.5 Flash-Lite: [1M / 65K] Мульти | 15 RPM, 1000 RPD

​🔹 Mistral AI

Mistral Small 4: [256K / 256K] Текст/Код | ~1 RPS, 500K TPM

Mistral Medium 3: [128K / 128K] Текст | ~1 RPS, 500K TPM

Mistral Large 3: [256K / 256K] Текст | ~1 RPS, 500K TPM

Mistral Nemo: [128K / 128K] Текст | ~1 RPS, 500K TPM

Codestral: [256K / 256K] Код | ~1 RPS, 500K TPM

Pixtral Large: [128K / 128K] Мульти | ~1 RPS, 500K TPM

​🟣 ПРОВАЙДЕРЫ ИНФЕРЕНСА

​🔸 Cerebras

gpt-oss-120b: [128K / 8K] Текст | 30 RPM, 14.4K RPD, 1M TPD

qwen-3-235b: [131K / 8K] Текст | 30 RPM, 14.4K RPD, 1M TPD

​🔸 Cloudflare

​llama-3.3-70b: [131K] Текст | 10K neurons/day

llama-4-scout-17b: [10M] Мульти | 10K neurons/day

mistral-small-3.1-24b: [128K] Текст | 10K neurons/day

gemma-4-26b: [256K] Текст | 10K neurons/day

qwq-32b: [32K] Текст | 10K neurons/day

deepseek-r1-distill-qwen-32b: [32K] Текст | 10K neurons/day

​🔸 Groq

llama-3.3-70b-versatile: [131K / 32K] Текст | 30 RPM, 14.4K RPD

llama-3.1-8b-instant: [131K / 131K] Текст | 30 RPM, 14.4K RPD

llama-4-scout: [131K / 8K] Мульти | 30 RPM, 14.4K RPD

​llama-4-maverick: [131K / 8K] Мульти | 15 RPM, 500 RPD

qwen3-32b: [131K / 131K] Текст | 30 RPM, 14.4K RPD

gpt-oss-120b: [131K / 32K] Текст | 30 RPM, 14.4K RPD

kimi-k2-instruct: [262K / 262K] Текст | 30 RPM, 14.4K RPD

deepseek-r1-distill-70b: [131K / 8K] Текст | 30 RPM, 14.4K RPD

whisper-v3 / turbo: Аудио | 20 RPM, 2000 RPD

​🔸 Hugging Face

​Llama-3.1-8B-Instruct: [128K / ~4K] Текст | ~1000 RPD

Mistral-7B-Instruct-v0.3: [32K / ~4K] Текст | ~1000 RPD

Mixtral-8x7B-Instruct-v0.1: [32K / ~4K] Текст | ~1000 RPD

Phi-3.5-mini-instruct: [128K / ~4K] Текст | ~1000 RPD

Qwen2.5-7B-Instruct: [131K / ~4K] Текст | ~1000 RPD

​🔸 Kilo Code

dola-seed-2.0-pro: Текст | ~200 req/hr

grok-code-fast-1: Код | ~200 req/hr

nemotron-3-super-120b: [262K / 32K] Текст | ~200 req/hr

trinity-large-thinking: Текст | ~200 req/hr

​🔸 LLM7.io

deepseek-r1-0528: Текст | 30 RPM

deepseek-v3-0324: Текст | 30 RPM

gemini-2.5-flash-lite: Мульти | 30 RPM

gpt-4o-mini Мульти: | 30 RPM

mistral-small-3.1-24b: [32K] Текст | 30 RPM

qwen2.5-coder-32b: Текст | 30 RPM

​🔸 ModelScope

Qwen3.5-35B-A3B: Мульти | <=500 RPD

Qwen3.5-27B: Текст | <=500 RPD

Qwen-Image: Фото | <=500 RPD

​🔸 NVIDIA NIM

deepseek-r1: [128K / ~163K] Текст | ~40 RPM

nemotron-3-super-120b: [262K / 262K] Текст | ~40 RPM

nemotron-3-nano-30b: [128K / 32K] Текст | ~40 RPM

​qwen2.5-72b: [128K / 8K] Текст | ~40 RPM

​gemma-4-31b: [128K / 8K] Текст | ~40 RPM

mistral-large-2: [128K / 4K] Текст | ~40 RPM

nemotron-nano-2-vl: [128K / 8K] Мульти | ~40 RPM

minimax-m2.7: [128K / 8K] Текст | ~40 RPM

​🔸 Ollama Cloud

llama3.1, deepseek-r1, qwen2.5: [128K] Текст | Session limits

mistral [32K], gemma2 [8K]: Текст | Session limits

​🔸 OpenRouter

​deepseek-r1-0528: [163K / 163K] Текст | 20 RPM, 200 RPD

deepseek-chat-v3-0324: [163K / 163K] Текст | 20 RPM, 200 RPD

qwen3.6-plus: [1M / 65K] Текст | 20 RPM, 200 RPD

qwen3-coder-480b: [262K / ~32K] Текст | 20 RPM, 200 RPD

llama-4-scout: [10M / 16K] Мульти | 20 RPM, 200 RPD

llama-4-maverick: [1M / 16K] Мульти | 20 RPM, 200 RPD

gemma-4-31b-it: [256K / ~8K] Мульти | 20 RPM, 200 RPD

nemotron-3-super-120b: [1M / ~32K] Текст | 20 RPM, 200 RPD

​gpt-oss-120b: [131K / 131K] Текст | 20 RPM, 200 RPD

minimax-m2.5: [196K / 8K] Текст | 20 RPM, 200 RPD

devstral-2512: [256K / ~32K] Текст | 20 RPM, 200 RPD

​🔸 SiliconFlow

Qwen3-8B: [131K / 131K] Текст | 1000 RPM, 50K TPM

DeepSeek-R1-0528: [~33K / 16K] Текст | 1000 RPM, 50K TPM

DeepSeek-R1-Distill-Qwen: [131K] Текст | 1000 RPM, 50K TPM

glm-4-9b-chat: [32K / 32K] Текст | 1000 RPM, 50K TPM

GLM-4.1V-9B-Thinking: [66K / 66K] Мульти | 1000 RPM, 50K TPM

DeepSeek-OCR [8K]: Вижн | 1000 RPM, 50K TPM