Бесплатные API нейросетей в 2026 году: кто реально даёт, а кто просто обещает

22 июня22 июн

5 мин

Честный разбор: какие ИИ-провайдеры дают рабочие бесплатные лимиты через API, а у каких вместо ответа прилетает «ресурсы заняты» Представьте такую картину. Вы нашли нейросеть с привлекательной колонкой Free в таблице тарифов. Зарегистрировались. Получили ключ. Написали код. Запустили — и тут же получили в ответ 503 Service Unavailable или загадочное Resource exhausted. Бесплатный лимит формально есть, только воспользоваться им нельзя: сервер «занят» раньше, чем успеваешь отправить первый запрос. Так устроен большой рынок ИИ в 2026 году. Бесплатные лимиты есть у многих — но реально работают единицы. В этой статье только те провайдеры, чьи квоты существуют не в красивом PDF, а в реальном времени: отправляешь запрос — получаешь ответ. Google — единственный крупный игрок, у которого бесплатный тир работает как полноценный инструмент для разработчика. Без кредитной карты, без пробного периода на 7 дней. Однако реальные лимиты из личного кабинета немного отличаются от того, что пишут в офиц

Оглавление

Google Gemini API: формально бесплатно, но есть нюанс
Что реально показывает дашборд
Лайфхак с десятью проектами: умножаем лимиты

Честный разбор: какие ИИ-провайдеры дают рабочие бесплатные лимиты через API, а у каких вместо ответа прилетает «ресурсы заняты»

Представьте такую картину. Вы нашли нейросеть с привлекательной колонкой Free в таблице тарифов. Зарегистрировались. Получили ключ. Написали код. Запустили — и тут же получили в ответ 503 Service Unavailable или загадочное Resource exhausted. Бесплатный лимит формально есть, только воспользоваться им нельзя: сервер «занят» раньше, чем успеваешь отправить первый запрос.

Так устроен большой рынок ИИ в 2026 году. Бесплатные лимиты есть у многих — но реально работают единицы. В этой статье только те провайдеры, чьи квоты существуют не в красивом PDF, а в реальном времени: отправляешь запрос — получаешь ответ.

Google Gemini API: формально бесплатно, но есть нюанс

Google — единственный крупный игрок, у которого бесплатный тир работает как полноценный инструмент для разработчика. Без кредитной карты, без пробного периода на 7 дней. Однако реальные лимиты из личного кабинета немного отличаются от того, что пишут в официальных описаниях.

Что реально показывает дашборд

Зайдите на aistudio.google.com/apikey → раздел Rate Limits — и увидите примерно такую картину:

Картина честная и немного неожиданная. Большинство моделей — включая новейший gemini-3.5-flash — дают всего 20 запросов в день. Хватает на тест, не хватает на работу.

Настоящие рабочие варианты на бесплатном тире — это gemini-3.1-flash-lite-preview с 500 RPD и Gemma 4 с 1500 RPD. Gemma — это open-source модель от Google, не Gemini, но она работает через тот же Gemini API с тем же ключом и даёт самый щедрый бесплатный лимит в линейке.

Важный технический момент: Модели семейства 3.x обязательно нужен суффикс -preview в API-запросе. gemini-3.1-flash-lite-preview — правильно, gemini-3.1-flash-lite — получите 404 или 429. Это нигде не написано крупными буквами, а люди теряют время.

Лайфхак с десятью проектами: умножаем лимиты

Здесь самое интересное. Google привязывает квоты не к аккаунту и не к API-ключу — а к проекту. Десять ключей в одном проекте делят одну квоту — бесполезно. Но десять разных проектов получают независимые квоты каждый.

Инструкция:

Заходите на aistudio.google.com/apikey
Нажимаете «Create API key in new project» — именно в новом, не в существующем
Повторяете до 10 раз, по ключу на проект

Итог с реальными лимитами:

10 проектов × 1 500 RPD (Gemma 4) = 15 000 запросов в сутки бесплатно
10 проектов × 500 RPD (3.1-flash-lite) = 5 000 запросов в сутки бесплатно

Google официально разрешает множество проектов на одном аккаунте — это не обход правил, а штатный сценарий. В коде достаточно держать список ключей и переключаться при 429. Лимиты обнуляются каждый день около 10 утра по Москве (полночь по Тихоокеанскому времени).

Ложка дёгтя. Google иногда выдаёт новому проекту ещё меньше — 20 RPD вместо ожидаемого лимита. Просто «actual capacity may vary», как написано в их документации. Если первый проект дал 20/день — создаёте следующий. Ещё один момент: на бесплатном тире ваши данные используются для обучения моделей Google. Для конфиденциальных задач — только платный тир.

Z.AI: бесплатная модель без дневного потолка

Китайская платформа Z.AI, построенная на моделях GLM от Zhipu AI, предлагает кое-что нетипичное для рынка: бесплатную модель без ограничения по количеству запросов в день.

Не 20 в день. Не 500. Просто без потолка.

Бесплатны две модели:

glm-4.5-flash — стабильная и надёжная, рекомендуется как основная
glm-4.7-flash — чуть умнее, но имеет известный баг: 30-секундный таймаут на стриминге. Если генерация длинная — соединение может оборваться на полуслове

Нумерация моделей идёт 4.5 → 4.6 → 4.7 → 5. Никакого glm-4.8 и glm-4.9 не существует — просто так решили разработчики.

Почему это удобно для разработчика

API полностью совместим с форматом Anthropic Messages. Если у вас уже есть код под Claude — переключение занимает две строки:

# Было (например, Anthropic)

base_url = "https://api.anthropic.com/v1"

# Стало (Z.AI, бесплатно)

base_url = "https://api.z.ai/api/anthropic/v1"

api_key = "ваш_ключ_z_ai" # заголовок x-api-key, не Authorization: Bearer

Модель: glm-4.5-flash. Регистрируется без VPN из России. Для задач автоматизации — суммаризация, классификация текстов, генерация структурированных данных, простые агенты — справляется достойно.

Остальные: красивые таблицы, грустная реальность

Было бы нечестно умолчать о других участниках рынка. Они формально предлагают бесплатные лимиты — но практика расходится с обещаниями.

OpenRouter (модели с суффиксом :free). Теоретически: 50 запросов в день, доступ к бесплатным вариантам Llama, Qwen, DeepSeek через единый API. Практически: каждый второй запрос возвращает No available model provider. Бесплатные слоты разбирают мгновенно. Работает иногда, в непредсказуемое время — строить на этом автоматизацию невозможно.

GitHub Models (Microsoft). Теоретически: 50–150 запросов в день, доступ к GPT-4o и Grok. Практически: время ожидания в часы пик — минуты. Резервный канал, но не основной.

Groq (быстрый инференс Llama, Mixtral). Один из лучших по скорости — когда работает. Но 429 прилетает неожиданно, лимиты меняются без предупреждения, модели периодически исчезают из доступного списка.

DeepSeek API. Умные модели, разумные цены на платном тире. Из России — connection refused или вечный таймаут. Нужен прокси, а это дополнительная точка отказа.

Вместо заключения

Реальных рабочих вариантов на сегодня два.

Google — если нужна мультимодальность (картинки, PDF) и объём: создаёте 10 проектов и получаете либо 15 000 запросов в сутки через Gemma 4, либо 5 000 через gemini-3.1-flash-lite-preview. Gemini 3.5 Flash и другие флагманские модели на бесплатном тире дают только 20 RPD — для экспериментов, не для работы.

Z.AI — если нужна стабильность без дневного потолка: glm-4.5-flash работает бесплатно без ограничений и без кредитной карты. Отличный выбор для фонового агента или инструмента с нерегулярной нагрузкой.

Рынок меняется быстро. Сервис, который сегодня отдаёт «ресурсы заняты», через месяц может открыть щедрый тир — и наоборот. Но описанные выше два варианта работают стабильно достаточно долго, чтобы на них можно было строить реальные проекты.

Знаете живой бесплатный API, которого нет в списке? Пишите в комментарии — обновлю статью.