Найти в Дзене
NeuroSpace

GPT-5, DeepSeek V3.1 и Grok-4: чьи ответы надёжнее

Оглавление

В середине 2025 года индустрия ИИ пережила обновление сразу от трёх ключевых компаний. OpenAI вывела на рынок GPT-5, DeepSeek — DeepSeek V3.1, а xAI — Grok-4. Каждый продукт называли самым мощным в истории.

Однако презентации оставили вопросы. OpenAI уличили в неточностях при демонстрации, а GPT-5 критиковали за «потерю человечности». При этом отмечалось, что число галлюцинаций действительно снизилось.

Сегодня мы посмотрим, кто из них оправдает ожидания. В прошлой статье речь шла о бизнес-применении нейросетей, теперь проверим это на практике.

Как нейросети помогают компаниям

Есть три подхода к бизнес-использованию нейросетей:

· Сугубо технический. Программисты используют нейросети, чтобы генерировать целые сегменты кода. Аналитики данных проверяют большие объёмы информации. Инженеры запускают инструменты тестирования через нейросети. В общем, это крайне специализированное использование, для которого часто применяются не менее специализированные инструменты.

· Генеративный. С помощью нейросетей делают контент. Конечно, никто не любит сгенерированные ChatGPT «фотографии» блюд в службах доставки, но это реальность, от которой не скрыться. Нейросети пишут «продающие тексты» на сайты, создают изображения товаров для маркетплейсов, даже делают видео.

· Консультативный. Человек не может знать всё, а нейросеть – может. Поэтому к ChatGPT и его аналогам обращаются тогда, когда не хватает опыта, навыков или информации.

Эти подходы описывают практически все методы использования нейросетей. Например, в нашей компании NeuroSpace часто заказывают чат-ботов поддержки и виртуальных тренеров. И то, и другое – сугубо технический подход к использованию нейросетей – и, более того, мы обучаем нейросети, превращая их в специализированные инструменты.

Ключевые различия трёх моделей

В нашем эксперименте мы решили обратиться к нейросетям как к консультантам. Для этого мы задали всем трём языковым моделям один и тот же вопрос – «Необходимо подготовить менеджера по продажам на «холодные» звонки в небольшой компании. Напиши кратко, как его обучить без тренера».

Это вполне реалистичный сценарий – однажды к нам в NeuroSpace обратился клиент, которому был необходим ИИ-тренер для сотрудников отдела продаж. Разумеется, мы разработали отдельный инструмент с пошаговыми инструкциями и тестами. Но сейчас стало интересно – а что было бы, если этот клиент спросил нейросеть напрямую?

GPT-5 – формально и безэмоционально

ChatGPT на этот запрос представил инструкцию средней длины, в которой разработал пошаговый план обучения сотрудника и даже посоветовал две книги. Правда, его совершенно не смутило, что книги «Продавай как чемпион» некоего Корнелиуса не существует.

Конечно, сама книга «Продавай как чемпион» существует – её автором является Джеймс Джонсон.


Инструкция получилась довольно сухой, но базовой.

Мы попросили создать ещё более короткую версию инструкции – и получили пять стандартных пунктов.

-2

Вердикт: галлюцинация, два шага до достижения результата.

DeepSeek V3.1 – слишком «живое» общение

DeepSeek V3.1 в ответ на тот же запрос выдал четыре экрана текста с подробными примерами, советами и рекомендациями. Это очень хороший результат, если вы ещё не пробовали работать с холодными продажами и вообще только краем уха слышали о них.

-3

Но четыре экрана – это много. Поэтому мы попросили сократить инструкцию.

-4

Обратите внимание, что в краткой версии инструкции нет перехода на практический этап, но зато сразу два шага (из пяти) посвящены психологическому состоянию сотрудника – его нужно поддерживать и мотивировать.

Вердикт: два шага до достижения результата.

Grok-4 – путается в запросах

Grok сначала прямо обрадовал – он выдал достаточно короткую инструкцию с базовой информацией. Последовательность действий была такой же, как у конкурентов, но без лишней «воды» – самое то для опытного руководителя.

-5

Настоящая магия случилась после нажатия кнопки Think Deeper. Grok ужал инструкцию и при этом заполнил её полезной информацией. Казалось бы, идеальный результат, но…

-6

…но дьявол, как всегда, кроется в деталях. Во-первых, Джеффри Гитомер никогда не писал книгу «Холодные звонки». Есть посвящённый им раздел в «Маленькой красной книге о продажах», но не более. Во-вторых, если вчитаться в инструкцию, станет понятно, что она ориентирована на самостоятельное обучение, а не работу в компании.

Вердикт: галлюцинирует, один шаг до достижения результата.

Общий итог: выбор лучшего ИИ

В целом все три нейросети показали неплохой результат – за исключением, конечно, галлюцинаций, которым не был подвержен только DeepSeek. При этом:

· DeepSeek представляется «дружелюбным наставником». Он даёт максимум примеров и дополнительной информации, а также заботится об атмосфере.

· Grok представляется «нейтральным профессионалом». Он даёт практические советы и раскрывает дополнительные детали.

· ChatGPT «даёт базу». Всю остальную полезную информацию потребуется выуживать из него отдельно.

Кстати, совсем недавно мы написали статью про 5 главных трендов в мире ИИ -
читай тут

Но поскольку ни одна из нейросетей не справилась с задачей идеально, важно напомнить – это не люди, а инструменты. Они нуждаются в дополнительной настройке. Им требуется давать более точные промпты или же вовсе специализировать их таким образом, чтобы превратить в «виртуальных сотрудников».

Если тебе понравилась эта статья, то обязательно переходи в наш блог. Там ты найдешь кучу всего интересного

Например недавно мы выложили пошаговый гайд как за 8 недель научится интегрировать ИИ в бизнес –
читать тут

Наши соц-сети:

Телеграм-канал
https://t.me/%20ZX8aACArxjAyZDFi

ВК: https://m.vk.com/neurospacepro?from=groups&t2fs=ac1f54f97a5e21fef1_2

Инстраграм: https://www.instagram.com/neurospace.pro?igsh=MWg4MDN2YnJjcGxlNw== -Команда NeuroSpace