Честный разбор: какие ИИ-провайдеры дают рабочие бесплатные лимиты через API, а у каких вместо ответа прилетает «ресурсы заняты»
Представьте такую картину. Вы нашли нейросеть с привлекательной колонкой Free в таблице тарифов. Зарегистрировались. Получили ключ. Написали код. Запустили — и тут же получили в ответ 503 Service Unavailable или загадочное Resource exhausted. Бесплатный лимит формально есть, только воспользоваться им нельзя: сервер «занят» раньше, чем успеваешь отправить первый запрос.
Так устроен большой рынок ИИ в 2026 году. Бесплатные лимиты есть у многих — но реально работают единицы. В этой статье только те провайдеры, чьи квоты существуют не в красивом PDF, а в реальном времени: отправляешь запрос — получаешь ответ.
Google Gemini API: формально бесплатно, но есть нюанс
Google — единственный крупный игрок, у которого бесплатный тир работает как полноценный инструмент для разработчика. Без кредитной карты, без пробного периода на 7 дней. Однако реальные лимиты из личного кабинета немного отличаются от того, что пишут в официальных описаниях.
Что реально показывает дашборд
Зайдите на aistudio.google.com/apikey → раздел Rate Limits — и увидите примерно такую картину:
Картина честная и немного неожиданная. Большинство моделей — включая новейший gemini-3.5-flash — дают всего 20 запросов в день. Хватает на тест, не хватает на работу.
Настоящие рабочие варианты на бесплатном тире — это gemini-3.1-flash-lite-preview с 500 RPD и Gemma 4 с 1500 RPD. Gemma — это open-source модель от Google, не Gemini, но она работает через тот же Gemini API с тем же ключом и даёт самый щедрый бесплатный лимит в линейке.
Важный технический момент: Модели семейства 3.x обязательно нужен суффикс -preview в API-запросе. gemini-3.1-flash-lite-preview — правильно, gemini-3.1-flash-lite — получите 404 или 429. Это нигде не написано крупными буквами, а люди теряют время.
Лайфхак с десятью проектами: умножаем лимиты
Здесь самое интересное. Google привязывает квоты не к аккаунту и не к API-ключу — а к проекту. Десять ключей в одном проекте делят одну квоту — бесполезно. Но десять разных проектов получают независимые квоты каждый.
Инструкция:
- Заходите на aistudio.google.com/apikey
- Нажимаете «Create API key in new project» — именно в новом, не в существующем
- Повторяете до 10 раз, по ключу на проект
Итог с реальными лимитами:
- 10 проектов × 1 500 RPD (Gemma 4) = 15 000 запросов в сутки бесплатно
- 10 проектов × 500 RPD (3.1-flash-lite) = 5 000 запросов в сутки бесплатно
Google официально разрешает множество проектов на одном аккаунте — это не обход правил, а штатный сценарий. В коде достаточно держать список ключей и переключаться при 429. Лимиты обнуляются каждый день около 10 утра по Москве (полночь по Тихоокеанскому времени).
Ложка дёгтя. Google иногда выдаёт новому проекту ещё меньше — 20 RPD вместо ожидаемого лимита. Просто «actual capacity may vary», как написано в их документации. Если первый проект дал 20/день — создаёте следующий. Ещё один момент: на бесплатном тире ваши данные используются для обучения моделей Google. Для конфиденциальных задач — только платный тир.
Z.AI: бесплатная модель без дневного потолка
Китайская платформа Z.AI, построенная на моделях GLM от Zhipu AI, предлагает кое-что нетипичное для рынка: бесплатную модель без ограничения по количеству запросов в день.
Не 20 в день. Не 500. Просто без потолка.
Бесплатны две модели:
- glm-4.5-flash — стабильная и надёжная, рекомендуется как основная
- glm-4.7-flash — чуть умнее, но имеет известный баг: 30-секундный таймаут на стриминге. Если генерация длинная — соединение может оборваться на полуслове
Нумерация моделей идёт 4.5 → 4.6 → 4.7 → 5. Никакого glm-4.8 и glm-4.9 не существует — просто так решили разработчики.
Почему это удобно для разработчика
API полностью совместим с форматом Anthropic Messages. Если у вас уже есть код под Claude — переключение занимает две строки:
# Было (например, Anthropic)
base_url = "https://api.anthropic.com/v1"
# Стало (Z.AI, бесплатно)
base_url = "https://api.z.ai/api/anthropic/v1"
api_key = "ваш_ключ_z_ai" # заголовок x-api-key, не Authorization: Bearer
Модель: glm-4.5-flash. Регистрируется без VPN из России. Для задач автоматизации — суммаризация, классификация текстов, генерация структурированных данных, простые агенты — справляется достойно.
Остальные: красивые таблицы, грустная реальность
Было бы нечестно умолчать о других участниках рынка. Они формально предлагают бесплатные лимиты — но практика расходится с обещаниями.
OpenRouter (модели с суффиксом :free). Теоретически: 50 запросов в день, доступ к бесплатным вариантам Llama, Qwen, DeepSeek через единый API. Практически: каждый второй запрос возвращает No available model provider. Бесплатные слоты разбирают мгновенно. Работает иногда, в непредсказуемое время — строить на этом автоматизацию невозможно.
GitHub Models (Microsoft). Теоретически: 50–150 запросов в день, доступ к GPT-4o и Grok. Практически: время ожидания в часы пик — минуты. Резервный канал, но не основной.
Groq (быстрый инференс Llama, Mixtral). Один из лучших по скорости — когда работает. Но 429 прилетает неожиданно, лимиты меняются без предупреждения, модели периодически исчезают из доступного списка.
DeepSeek API. Умные модели, разумные цены на платном тире. Из России — connection refused или вечный таймаут. Нужен прокси, а это дополнительная точка отказа.
Вместо заключения
Реальных рабочих вариантов на сегодня два.
Google — если нужна мультимодальность (картинки, PDF) и объём: создаёте 10 проектов и получаете либо 15 000 запросов в сутки через Gemma 4, либо 5 000 через gemini-3.1-flash-lite-preview. Gemini 3.5 Flash и другие флагманские модели на бесплатном тире дают только 20 RPD — для экспериментов, не для работы.
Z.AI — если нужна стабильность без дневного потолка: glm-4.5-flash работает бесплатно без ограничений и без кредитной карты. Отличный выбор для фонового агента или инструмента с нерегулярной нагрузкой.
Рынок меняется быстро. Сервис, который сегодня отдаёт «ресурсы заняты», через месяц может открыть щедрый тир — и наоборот. Но описанные выше два варианта работают стабильно достаточно долго, чтобы на них можно было строить реальные проекты.
Знаете живой бесплатный API, которого нет в списке? Пишите в комментарии — обновлю статью.