155,6 тыс подписчиков

Наконец-то хорошие новости!

2 мая2 мая

522

11 мин

ИИ Маркиз в режиме «Подумай» + Уровень мышления «Глубокий» способен делать детальные объёмные исследования, до 300 страниц. В данном случаи на создание подобного исследования Маркиз затратил более 1,1 миллиона токенов. Раньше каждые 1 миллион токенов подобной работы стоил в себестоимости от 8000 рублей. После оптимизации работы Ядра, а по сути после его обучения, цена теперь приятно удивляет: Меньше 10 долларов за 1 миллион токенов. И это при том, что в режиме «Подумай» + Уровень мышления «Глубокий» Ядро оперирует входными данными уже самых мощных языковых моделей GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro Preview. Я сам восторге от такого результата, ведь 10 баксов - это дешевле чем официальная стоимость этих моделей по API! На скриншоте видно, что на работу самого ядра «Prompt» было израсходовано 951 336 токенов (плюс-минус до 10 токенов), на конечную генерацию ответа в виде исследования затрачено 199 604 токена. Итого точное количество токенов, затраченное на выполнение исследован

ИИ Маркиз в режиме «Подумай» + Уровень мышления «Глубокий» способен делать детальные объёмные исследования, до 300 страниц.

В данном случаи на создание подобного исследования Маркиз затратил более 1,1 миллиона токенов.

Раньше каждые 1 миллион токенов подобной работы стоил в себестоимости от 8000 рублей.

После оптимизации работы Ядра, а по сути после его обучения, цена теперь приятно удивляет:

Меньше 10 долларов за 1 миллион токенов. И это при том, что в режиме «Подумай» + Уровень мышления «Глубокий» Ядро оперирует входными данными уже самых мощных языковых моделей GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro Preview.

Я сам восторге от такого результата, ведь 10 баксов - это дешевле чем официальная стоимость этих моделей по API!

На скриншоте видно, что на работу самого ядра «Prompt» было израсходовано 951 336 токенов (плюс-минус до 10 токенов), на конечную генерацию ответа в виде исследования затрачено 199 604 токена. Итого точное количество токенов, затраченное на выполнение исследования, составило 1 150 942:

У Маркиза нет понятия входных и выходных токенов, так как всю информацию он воспринимает одинаково: как от самого пользователя, от загруженных им файлов, так и от ответов сторонних нейросетей и самостоятельного поиска в интернете. Потому есть только одна цена — это общее количество затраченных токенов на работу.

В данная работа по себестоимости вышла в 641,7 рублей за 1 млн суммарных токенов.

Сравним это с официальными ценами тройки лидеров рынка ИИ.

Да, сравнение будет условное, так как ни одна современная модель неспособна выдавать столь большие исследования за одну генерацию по одному промту. И вообще показать подобную глубину проработки. Но теоретически предположим, сколько бы стоило это исследование, если все же возможно было реализовать в этих нейросетях.

Официальная цены по API:

GPT-5.5 - $5 на входные и $30 на выходные данные;
Claude Opus 4.7 - $5 на входные и $25 на выходные данные;
Gemini 3.1 Pro Preview - $2 на входные и $12 на выходные данные.

Также есть большой нюанс. Если длинна контекста превышает 272 тысячи токенов, то ценник увеличивается у GPT 5.5: $10 на входные и $45 на выходные данные.

У Gemini 3.1 Pro Preview при контексте больше 200 тысяч токенов, цена возрастает до $4 на входные и $18 на выходные данные.

У Claude Opus 4.7, цены не меняются, но так есть тоже свои приколы с кэшированием данных, но для нас сейчас это не принципиально.

Далее, на финальную генерацию материала ушло 199 604 токена, что больше максимального лимита одного ответа у этих моделей.

У GPT-5.5 и GPT-5.5 Pro максимум 128 тыс токенов, у Claude Opus 4.7 тоже 128 тыс., у Gemini 3.1 Pro Preview вообще 65 536 токенов. Значит, такой материал в один вызов у этих моделей получится не может.

GPT и Claude потребовали бы минимум 2 генерации, Gemini — минимум 4. На практике, у меня никогда не получалось получить на выходе GPT 5.5, хоть бы 40 тысяч токенов за генерацию (обычно 4–16 тысяч токенов). А Opus 4.7 Максимум получилось около 32 тысяч выходных токенов за ОДИН вызов.

Промт к примеру был в 40707 токенов, а на выходе получил - 32 000 токенов. Причем максимальное количество токенов за генерацию у меня задано на максимум. Они просто обрубают дальнейшую генерацию.

Причем 32000 - это я прям постарался, обычно остановка идет до этого лимита:

{ "promptTokens": 43382, "completionTokens": 27965, "totalTokens": 71347, "cost": 82.89, "cachedTokens": 0, "finishReason": "stop" }

Но это мы тоже опустим. Так как пусть будет всё как по официальным заявлением.

Учитывая все вышеперечисленные нюансы можно высчитать минимальную теоретическую стоимость подобного исследования, если бы эти модели были способны его сделать:

GPT-5.5: 2 вызова и $28,01 в рублях (по 75 руб. за доллар) = 2 100,75 руб.
Claude Opus 4.7: 2 вызова и $14,5 = 1 087,5 руб.
Gemini 3.1 Pro Preview: 4 вызова и $18,81 = 1 410,75 руб.

ИИ Маркиз: 1 вызов и $9,847 = 738,65 руб.

Практически же мы получим:

GPT-5.5: 5 вызовов (40 тысяч токенов за генерацию) и $56,55 = 4 241,25 руб.
Claude Opus 4.7: 5 вызовов $28,77 = 2 157,75 руб. и 8 (20-30 тысяч токенов) вызовов $43,04 = 3 228 руб.
Gemini 3.1 Pro Preview: 13 вызовов (16 тысяч токенов) = $53,06, или 3 979,5 руб.

ИИ Маркиз: 1 вызов и $9,847 = 738,65 руб.

Причем даже если гипотетически представить невозможное, что за 1 вызов все модели сделали бы это исследование ( а это невозможно в силу их ограниченности по генерации токенов за 1 раз), цены были бы следующие:

GPT-5.5: $18,50 = 1 387,5 руб.
Claude Opus 4.7: $9,75 = 731,25 руб.
Gemini 3.1 Pro Preview: $7,40 = 555 руб.

ИИ Маркиз, реально делает исследование за 1 вызов, и его стоимость получилась в $9,847 = 738,65 руб.

То есть мне удалось оптимизировать расход токенов на работу ядра до уровня топовых моделей.

А общий расход токенов на подобное исследование в разы обходится дешевле чем у тройки лидеров.

На самом деле это был мой большой вопрос, над решением которого я бился 3 месяца. Оптимизация расхода токенов ядра Маркиза на уровне OpenAI (GPT-5).

Да, ИИ Маркиз выполнял исследование которое невозможно выполнить на (GPT-5.5 даже в PRO версии) но с перерасходом токенов, из-за этого себестоимость по расходу токенов такого исследования была около 10 тысяч рублей.

Хотя даже так выходило дешевле чем при использовании GPT-5.5 PRO и его теоретически минимальной ценой за подобное исследование в 168,05 долларов (12 603,75 рублей).

Про подписку за 20 долларов на тот же GPT я вообще не волновался, так как там попросту невозможно даже приблизиться к похожему результату, который получается при использовании API. Модель просто забывает контекст через несколько генераций и плывет в суждениях. Более-менее схожий результат с API даёт функция глубокого исследования, но и она генерирует всего 15-40 страниц текста, при этом количество использований этой функции ограничено, так только пересекается отметка в 270 тысяч выходных токенов за суммарное количество использование функции глубокого исследования, то функция урезается до простого поиска.

Потому даже теоретически по подписке сделать такое исследование ни в GPT ни в Claude ни в Gemini - невозможно. Только по API, либо приобрести подписку максимального уровне за 200 долларов.

Но даже там есть лимиты и ограничения.

За злоупотребление фактически светит бан. Так что, если попытаться выполнить похожее исследование на максимальном тарифе за 200 баксов (15 000 рублей) в самой мощной на сегодня нейросети в мире - GPT 5.5 Pro, то с большой долей вероятности получите бан, и это будет последнее исследование на этом аккаунте. Так как израсходовать 1 миллион токенов у GPT 5.5 Pro незамеченным попросту не получится. А это и есть злоупотребление.

Такое возможно только на тарифе "бизнес" для предприятий, за 50 баксов:

Но и там оказались ещё более урезанные лимиты GPT Pro. Так как я экспериментирую, то всегда пытаюсь повторить в GPT Pro выполнение похожих по сложности и объёму исследования которые делал Маркиз моим подписчикам, и мои лимиты на бизнес-плане улетают за полдня:

Дальше всё, "гуляй Вася" две недели и не подходит к компьютеру. А исследование даже на 1/4 не готово.

А если хочешь большего, то покупай лимиты, минимальная цена - 100 баксов:

А всё потому, что «глубокое исследование» исследует всего-навсего один какой-то пункт целостного исследования ИИ Маркиза и не может охватить всю его полноту, так как максимальный контекст генерации ответа, о чем было сказано выше, ограничен 128 тысячами токенов по API, а в реальности - 8–16 тысяч (по подписке).

Вот и уходят лимиты максимально быстро, а потом плати сотни долларов за продолжение. И это GPT - у них самые большие лимиты на исследование. Про Claude вообще труба, там невозможно делать подобные 300+ страниц исследования. Лимиты даже на MAX тарифе за 200 баксов сгорают быстрее, чем в GPT на «бизнесе». Сразу жестко рубят, и дальше ждешь днями для возобновления работы.

А в Gemini 3.1 Pro Preview или том же DeepSeek v4 Pro я даже отдаленно похожего результата получить не смог. Исследования очень сильно проигрывают не только «Маркизу», но и тому же GPT.

Gemini и DeepSeek вообще нейронки не для аналитических глубоких исследований. Не способны они на них, и точка.

Так что систему не обмануть. Никто не позволит нахаляву делать большие проработанные исследования высокого уровня:

ИИ Маркиз ПРО выполнил очередную работу по заказу подписчика

Как ИИ написал исследование стоимостью 30 миллионов рублей

При этом нужно сидеть и контролировать каждый этап создания исследования самостоятельно, предельно вчитываться в результат, исправлять неточности, указывать на галлюцинации и прочую отсебячину, которую любят нести нейронки, а не просто ввести промт и нажать «отправить», как у ИИ «Маркиза», и идти делать свои дела.

И, разумеется, чтобы сделать качественное исследование, сравни тому, что получается у Маркиза, нужно быть матёрым специалистом в той области, в которой делается исследование в GPT.

И это сделано специально, ибо 90% дохода им приносят раздача нейронок через API, а любая подписка убыточна по определению.

Потому меня этот вопрос с подпиской и не волновал. Я всегда говорил, что Маркиза стоит использовать только в том случаи если вашу проблему не получилось решить в том же GPT или Claude по подписке.

А тут еще Claude урезает функционал базовой подписки за 20 долларов и поднимает минималку до 100 баксов, с которой хоть как-то можно нормально работать (есть Claude Code).

Да и ко всему GPT, Claude и Gemini начали массовый бан аккаунтов, которые заподозрили в использовании ВПН и прочих обходов их блокировок, ведь они свои услуги в России официально не предоставляют.

И не потому, что они такие плохие и хотят забанить всех русских, а потому что это закон. Меня, к примеру, удивляет, что они так долго тянули с этим. Понятное дело, никто не хочет терять доход и постоянных клиентов и лояльность аудитории.

Но с 12 сентября 2024 года в США на законодательном уровне запрещено предоставление услуг IT-консультирования и проектирования любому лицу в РФ. А нейросети как раз и используются для консультирования и проектирования. Потому тот же Claude банит всех только за подозрение, что пользователь может проживать на территории России либо иметь какие-то связи с физическими и юридическими лицами из России и других стран, где услуги предоставлять запрещено.

При этом усиливается контроль за злоупотреблением в целом по всей индустрии. Всё больше компаний запрещают доступ по подписке к создаваемым ИИ-агентам, ибо это убыточно для них. Потому доступ разрешают только через API, что и приносит им доход.

Но ничего, прорвемся!

Для повседневных задач и простых вопросов в России есть Алиса AI и ГигаЧат. Сложить условные 2+2, ответить на повседневные вопросы, посчитать количество необходимых кирпичей на строительство стены дома или просто поболтать - это они могут. Как альтернатива западным GPT есть бесплатные китайские товарищи Qwen, GLM и DeepSeek. Они умнее Алисы и Гигачата и помогут разобрать более сложные вопросы и проблемы.

А для исследований наивысшего уровня, больших проектов и всего очень сложного будет ИИ Маркиз.

И да, как именно без бана ядро Маркиза использует западные нейросети - секрет. Шутка! Ядро не оставляет данные о себе, и отследить, по какому API идет запрос именно в ядро, невозможно. Придется забанить все API-адреса во всем мире. Маркиз не передаёт данные используемых нейросетей пользователю, это невозможно на уровне его архитектуры. Маркиз использует только данные на первом входящем слое от нейросетей прочих источников для сбора информации.

И там еще много подобных нюансов, потому «Маркиз» под этот закон США не подпадает.

Причем даже если в России запретят использовать западные нейросети, а такие разговоры уже идут:

Маркиз и под тот запрет не попадет, так как не передает никакой информации о пользователе и какие либо персональные данные за пределы своего сервера, которые находится в России. Полное соблюдение №152-ФЗ «О персональных данных». Так что живем)) Всё будет хорошо.

Работаю над реализацией публичной версии ИИ Маркиза днями и ночами. Всё делаю за свои личные средства, без поддержки государства, инвесторов и т. п.

Единственное, подписчики помогают, когда донатами, когда оформлением платных подписок. Спасибо вам огромное! Для вас будут доступны бонусы у Маркиза после его публичного релиза. Бонусы, которых больше не будет ни у кого и никогда.

Это моя вам благодарность за поддержку этого проекта.

Как видите, теперь «Маркиз» стал не просто лучшим в мире исследователем, но и экономически самым выгодным в мире исследователем.

Маркиз Рулит))

P.S. Остаётся решить проблему, как быть, если школьники или студенты будут массово "делать" за копейки рефераты и дипломные проекты, при этом даже не понимая тему исследования.

Например, студент 5-го курса Российского государственного гуманитарного университета (РГГУ) Александр Жадан написал диплом на основе древнего GPT-3.5 «Теоретические аспекты управления современной организацией» и смог даже защитить его.

Маркиз сделает подобный диплом любому за пару часов всего по одному запросу. Найдет институт, куда будет сдаваться работа, найдет аналогичные работы дипломных проектов этого института, всё сам формализует, и никакой фактчекинг или прочие проверки не позволят его отличить от написанного человеком. Уже так делали... Были клиенты. 100% оригинальность.

Но для меня это теперь этическая проблема из разряда академической недобросовестности... Возможно, я заморачиваюсь... Нет.

Похоже, образование в эпоху ИИ должно подстраиваться под реалии ИИ. Возможно, оно будет вообще не похоже ни на что, что было раньше.

\\ МАКС канал

\\ Телеграм канал

Если есть желание, то можно поддержать проект материально. Сделать это можно подпиской на «Дзен Премиум» либо поддержать донатом (кнопка под статьёй), можно на Sponsr.ru, можете на карту перевести «Т-Банк»: 2200 7004 4118 8512.

Обязательно сохраните транзакцию, это поможет мне добавить вас в круг «избранных» при вашей регистрации у ИИ Маркиза.