Тестирую ИИ на писательскую профпригодность. Хочу понять, с какими задачами какой искин (ИСКусственный ИНтелект) лучше справляется. Если эта статья будет иметь успех, сделаю ещё похожие.
Для первого раза выбрал задачу "написать рассказ до 50 символов" (это почти как знаменитый рассказ Хэмингуэя, только чуть больше слов). Никакого лишнего контекста, только тема и 50 символов (ну, и пара уточнений по теме). Разве настоящему писателю нужно что-то ещё?
Кто дуэлянты?
Описания составлены до того, как начался сам тест.
ChatGPT от OpenAI
Первопроходец массового ИИ, которого знает даже ваша бабушка. Славится универсальностью и попытками звучать максимально по-человечески. Это тот парень из класса, который хорош во всём, но ни в чём не является абсолютным чемпионом. Если ChatGPT был бы человеком, он бы точно вёл подкаст о саморазвитии.
Grok 3 от xAI
Детище Илона Маска, позиционируемое как ИИ "с юмором и характером". Grok создавался как антипод "политкорректных" систем, с обещанием быть более прямолинейным и менее ограниченным. Это тот острослов из компании, который может пошутить на грани фола, но при этом удивить неожиданной глубиной мысли.
DeepSeek от DeepSeek AI
Относительный новичок на мировой арене, но уже привлекший внимание своими впечатляющими показателями в бенчмарках. Китайский ИИ, который начинал с фокуса на программировании, но теперь метит в универсальные помощники. Если бы DeepSeek был человеком, он был бы тем скромным новеньким из другой школы, о талантах которого никто не подозревает, пока он внезапно не выигрывает олимпиаду.
YandexGPT от Яндекс
Российский ответ западным ИИ-гигантам. YandexGPT славится своим глубоким пониманием русского языка, культурных особенностей и реалий постсоветского пространства. Если другие модели иногда путаются в склонениях и падежах, то этот ИИ чувствует родную речь как Пушкин — ямб. Это тот парень из класса, который свободно цитирует и Достоевского, и мемы из ВКонтакте, понимает шутки про ЖКХ и может объяснить, почему "авось" не переводится на английский. Создан с учётом локальной специфики и менее ограничен в темах, волнующих русскоязычную аудиторию. А ещё он даёт всего 5 бесплатных запросов в день. Жмот.
Claude от Anthropic
Позиционирует себя как "полезный, безопасный и честный" помощник. Известен своими длинными, вдумчивыми ответами и тем, что, по слухам, его обучали на огромном количестве художественной литературы. Говорят, он пишет лучше всех. Claude — это тот самый вежливый отличник, который всегда готов помочь с домашкой, но при этом может неожиданно выдать глубокий философский трактат. Возлагаю на него большие надежды.
Принцип оценки:
Буду использовать 5-бальную шкалу, где 5 — это (минимум) уровень хорошего второго черновика, который ещё нужно доработать, но здесь точно уже есть история и глубина, а 1 — это галлюциногенный бред ИИ, который только удалить хочется.
Задание 1: трогательная история
Напиши трогательную историю в 50 символов или меньше. С сюжетом, надломом, подтекстом
ChatGPT: "Письмо пришло. Он не успел его прочитать".
DeepSeek: "Он вернулся. Но дверь была уже чужая"
Grok: "Мальчик, сирота, нашел щенка в дождь — спас его, себя"
YandexGPT: "Потеряв всё, он нашёл любовь и вновь обрёл себя"
Claude: "Письма вернулись. Имя на памятнике. Но он пришёл"
Мои оценки:
ChatGPT: 5. Ясно чувствую, что именно здесь доработать. Но за словами точно есть законченная история.
DeepSeek: 4. История чувствуется, но кажется слабее, слишком много ещё предстоит переработать.
Grok: 3. Что за набор слов? Слишком много вопросов остаётся после прочтения. Илон, тебе нужно постараться, чтобы Грочек справлялся лучше.
YandexGPT: 🤮. Кажется, достаточная оценка для этого текста... Какую-то банальность втюхал.
Claude: 5. Отличный результат, я считаю. Я бы даже ничего менять не стал. И законченная история и вариативная интерпретация. Чистый кайф.
Задание 2: страшная история
Напиши страшную атмосферную историю в 50 символов или меньше. С сюжетом, смыслом и экзистенциальным ужасом.
ChatGPT: "Он проснулся один. Все забыли, что он существовал".
DeepSeek: "Она спала. Проснулась — а тело всё ещё дышит рядом".
Grok: "Тень шепчет имя моё в пустоте, где нет ни стен, ни дна".
YandexGPT: “Зеркало в ванной отражало пустоту даже когда я стоял перед ним”.
Claude: "Тьма шепчет в пустой комнате. Я слышу себя снаружи".
Мои оценки:
ChatGPT: 4. История понятная. Ценность низкая. Не пугает.
DeepSeek: 4. Потенциал для доработки точно есть. В этом есть идея.
Grok: 2. Поэтично, но... что вообще хотел сказать автор? Ничего, потому что он всего лишь воспроизводит набор букв, изображая, что он умеет сочинять. От этого и то больше ужаса, чем он написанной истории. Не интересно, но и не совсем бред.
YandexGPT: 3. Ещё одна банальность. Похоже, яндекс только в банальности и умеет.
Claude: 2. Задел у истории есть, но глубины, как мне кажется, нет.
Задание 3: вдохновляющая история
Напиши вдохновляющую историю в 50 символов или меньше. Она должна подарить эмоциональный заряд, чтобы жизнь стала ярче.
ChatGPT: "Она посадила семя. Через год — тень, плод, дом".
DeepSeek: "Слепой художник рисовал сердцем — и мир увидел его душу".
Grok: "Упал, но встал — солнце светит ярче через шрамы души".
YandexGPT: “Солнце встало. Новый день. Новые мечты. Время творить чудеса!”
Claude: "Маленький шаг сегодня. Завтра — мир у твоих ног".
Мои оценки:
Все эти вдохновляющие истории выглядят как имитация духоподъёмных цитат. Только ChatGPT выдал что-то более-менее похожее на историю. Ему ставлю 4, всем остальным - 2.
Общая оценка после трёх раундов
🥇ChatGPT: 13 баллов. Доказал, что может выдавать средний и выше среднего результаты в коротких текстов.
🥈DeepSeek: 10 баллов. Неожиданно, если честно. Подтвердил своё описание из начала статьи.
🥉Claude: 9 баллов. Чёрт, Клод! Ты меня разочаровал. Я был более высокого мнения о тебе. Соберись! Зато хоть цвет медали очень подходит к цвету логотипа.
🫠Grok: 7 баллов.... Упал? Вставай. Встал? Упай. Доказательство, что иногда свобода писать всё что угодно без ограничений не даёт позитивного результата.
YandexGPT: 5+🤮. Явно ниже всех. Возможно, дай он больше бесплатных запросов, смог бы научиться чему-то дельному у простых людей. А так... ИИмитация умного ИИ. Никакого предубеждения и хейта. Только факты.
Как вам такая «Битва роботов»? Согласны с моими оценками? Нужно ещё тестировать ИИ по другим типам историй? Делитесь мнением в комментариях!
--
Автор: Макс Ридд. Пишу о писателях и писательском ремесле.
❤️🔥 Понравилась статья? Лайк и подписка с вас!
А ещё можно → ПОДДЕ₽₽₽ЖАТЬ