21 подписчик

1️⃣1️⃣ Как не разориться на дорогих LLM-моделях

5 февраля5 фев

1 мин

Стоимость работы в лучших моделях начинается с 20 долларов и уходит в бесконечность, если работаете по API. Если вы, как и я, предпочитаете приложения от производителя, то держать подписки везде накладно. Вот что я делаю с веб-решениями: ✨ Для простых задач использую бесплатные версии или агрегаторы. Syntx - там все передовые модели для текстов, изображений, аудио и видео, плюс есть бот в телеграме. ✨ Dewiar - еще больше интересных инструментов под разные задачи. Это позволяет экономить дорогие лимитированные модели типа Opus 4.5 для действительно сложной работы. ✨Отдельно отмечу Qwen - пока бесплатный, но очень сильный. На аналитических задачах он справляется даже лучше, чем Gemini и ChatGPT. Проверяла сама, была удивлена. ✨ Спасибо Anthropic (создатель Claude) за гибкость: когда лимит заканчивается, не жду 3-4 часа до восстановления. Можно докупить немного токенов и закончить работу вовремя, не переходя на план MAX за 100 долларов. ❗️Для тех, кто работает через API, тот же принцип,

Вот что я делаю с веб-решениями:

✨ Для простых задач использую бесплатные версии или агрегаторы. Syntx - там все передовые модели для текстов, изображений, аудио и видео, плюс есть бот в телеграме.

✨ Dewiar - еще больше интересных инструментов под разные задачи. Это позволяет экономить дорогие лимитированные модели типа Opus 4.5 для действительно сложной работы.

✨Отдельно отмечу Qwen - пока бесплатный, но очень сильный. На аналитических задачах он справляется даже лучше, чем Gemini и ChatGPT. Проверяла сама, была удивлена.

✨ Спасибо Anthropic (создатель Claude) за гибкость: когда лимит заканчивается, не жду 3-4 часа до восстановления. Можно докупить немного токенов и закончить работу вовремя, не переходя на план MAX за 100 долларов.

❗️Для тех, кто работает через API, тот же принцип, но ставки выше.

GPT-5.2 Pro стоит $168 за миллион выходных токенов. Если гонять топовые модели на простых задачах, счет растет быстро. Сравнительную информацию по стоимости разных моделей можно посмотреть, к примеру, тут. Очень наглядно видно разницу в ценах.

Исследователи из Стэнфорда предложили каскадный подход: дешевая модель оценивает сложность запроса. Простое - на Flash за копейки. Сложное - на Pro. Экономия 40-60% без потери качества на критичных задачах. Весь прошлый год тестировала на себе - точно работает!

💡Еще нюанс: модели тратят токены, когда "думают". В промте прошу использовать символы и сокращения для внутренних рассуждений, а не развернутые фразы. Мелочь, а экономит.

Типизация задач и подбор модели под сложность - это не жадность. Это разумный подход к инструменту, по крайней мере для меня.

Всем здоровья, мира и добра!

#ИИпромтингв2026