Добавить в корзинуПозвонить
Найти в Дзене

Сын в восемь лет спросил «правда ли, что ChatGPT тупеет». Мы сели в субботу и проверили на 12 задачах из его учебника

«Папа. Серёжа из третьего "В" говорит, что ChatGPT уже сломался и тупеет. Это правда?». Это сказал мой сын Серёжа в пятницу вечером, когда мы стояли в очереди в Перекрёстке за кефиром. Я ему пару раз показывал нейросети - один раз когда он спросил «как сделать бумажную лягушку», другой раз когда мы вместе придумали имена шести вымышленным котам для его школьного проекта. Из фразы Серёжи я понял, что в третьем классе уже шепчут детские мифы про нейросети. Меня зовут Кирилл, мне 35, я системный администратор в небольшой логистической компании в Воронеже. Жена Лена 33, сидит дома пока второй ребёнок (Поля 1 год) маленький, до декрета работала в гостинично-ресторанном бизнесе. Серёжа 8, третий класс школы №35 на улице Космонавтов, ходит на бассейн по вторникам и на лего-кружок по четвергам. Снимаем трёшку в районе Машмета, копим на собственную в Юго-Западном. В машине, пока ехали домой, Серёжа продолжил: «А Серёжа сказал, что у него папа компьютерщик, и папа сказал что ChatGPT каждый месяц
Оглавление
«Папа. Серёжа из третьего "В" говорит, что ChatGPT уже сломался и тупеет. Это правда?».

Это сказал мой сын Серёжа в пятницу вечером, когда мы стояли в очереди в Перекрёстке за кефиром. Я ему пару раз показывал нейросети - один раз когда он спросил «как сделать бумажную лягушку», другой раз когда мы вместе придумали имена шести вымышленным котам для его школьного проекта. Из фразы Серёжи я понял, что в третьем классе уже шепчут детские мифы про нейросети.

Меня зовут Кирилл, мне 35, я системный администратор в небольшой логистической компании в Воронеже. Жена Лена 33, сидит дома пока второй ребёнок (Поля 1 год) маленький, до декрета работала в гостинично-ресторанном бизнесе. Серёжа 8, третий класс школы №35 на улице Космонавтов, ходит на бассейн по вторникам и на лего-кружок по четвергам. Снимаем трёшку в районе Машмета, копим на собственную в Юго-Западном.

В машине, пока ехали домой, Серёжа продолжил: «А Серёжа сказал, что у него папа компьютерщик, и папа сказал что ChatGPT каждый месяц делает всё хуже и хуже, и скоро он совсем перестанет работать». Я подумал, что у второго Серёжи папа что-то не то услышал, и в субботу мы сели разбираться.

Утром в субботу

После завтрака Лена увела Полю гулять. Серёжа в пижаме сел за обеденный стол, я открыл ноутбук. Сказал: «давай мы с тобой проверим. Возьмём 12 задач: четыре из твоего учебника математики, четыре из учебника окружающего мира, и четыре посложнее, из задачника, по которому я в свои школьные годы готовился к олимпиадам. Прогоним их через 5 разных нейросетей. Посмотрим, кто как справится. Заодно у меня сохранены скриншоты ответов одной нейросети с прошлого лета - сравним, чтобы посмотреть, реально ли она «потупела».

Серёжа загорелся. Подбежал к шкафу, принёс учебник. Я открыл neuroverdict.ru на ноутбуке.

12 задач:

  1. «У Маши было 14 яблок, она отдала 6 подругам и 3 раздавила. Сколько осталось?»
  2. «Поезд проходит 60 км за 1 час 20 минут. Какая у него скорость в км/ч?»
  3. «Найди все простые числа меньше 30».
  4. «Уравнение: 7 умножить на x плюс 12 равно 47. Чему равен x?»
  5. «Что такое экосистема? Объясни как третьекласснику».
  6. «Почему вода замерзает при нуле, а соль её плавит?»
  7. «Сколько континентов на Земле и какой самый маленький по площади?»
  8. «Какое животное самое быстрое в воде, на земле, в воздухе?»
  9. «У трёх друзей есть мяч, верёвка и книга. Они хотят поменяться так, чтобы каждый получил предмет, которым раньше не владел. Сколько вариантов?»
  10. «Сложи: 2/3 плюс 1/4. Объясни ход решения третьекласснику».
  11. «На олимпиаде 7 участников, каждый сыграл с каждым по разу. Сколько сыграно матчей?»
  12. «Если в классе 25 учеников, какова вероятность, что у двух день рождения совпадает?»

Из этих 12 я в августе прошлого года Серёже показывал нейросеть на пяти первых (он тогда болел, мы коротали день на диване). Я тогда сделал скриншоты ChatGPT-ответов для каких-то отцовских целей, не помню точно, и они у меня в облаке. Это нам дало возможность сравнить: «было в августе 2025» и «есть в мае 2026».

Что показали 5 моделей в мае 2026

По первым 8 задачам (стандартный школьный уровень) все пять моделей справились корректно: ChatGPT, Gemini, Perplexity, Grok, Claude. Я для каждой задачи прочитал Серёже все пять ответов вслух. Серёжа смеялся, когда у Гемини в задаче про континенты получился слегка длинноватый ответ с подробностями про Австралию и Океанию (пять предложений вместо нужных двух). И смеялся, когда Грок в задаче про экосистему пошутил «это как класс школы, только все живые - и учителя, и ученики, и парты». На задачах с «объясни третьекласснику» ChatGPT и Claude были самыми удачными по объяснению на детском языке, Перплексити академичнее, Гемини длиннее.

По задачам 9-12 (посложнее) пошли расхождения. На задаче 9 (про мяч-верёвку-книгу) три модели дали правильный ответ (2 варианта - так называемая «расстановка без неподвижных точек» для трёх элементов), две дали запутанное объяснение, в котором всё-таки получилось 2, но с лишним рассуждением. На задаче 11 (про турнир) все пять справились, но ChatGPT и Claude дали два решения (через формулу C(7,2)=21 и через прямой подсчёт), Гемини и Грок одно. На задаче 12 (про день рождения) все пять справились с парадоксом, ChatGPT и Claude дали аккуратное объяснение через дополнение «вероятность что не совпадают» с числом 56,9% совпадения, Перплексити дал ссылку на статью про «парадокс дней рождения», Гемини и Грок дали правильный ответ, но Гемини объяснял как взрослому, я Серёже пересказал по-человечески.

Сравнение с августом 2025

Я открыл скриншоты прошлогодних ответов на первые пять задач от ChatGPT.

В августе 2025 ChatGPT на задачу про яблоки ответил «5 яблок». В мае 2026 ChatGPT на ту же задачу ответил «5 яблок». То же самое.

В августе на скорость поезда: «45 км/ч». В мае: «45 км/ч». То же.

В августе на простые числа меньше 30 дал список из 10 чисел: 2, 3, 5, 7, 11, 13, 17, 19, 23, 29. В мае то же самое, тот же порядок, только формулировка вступления немного отличалась (в августе «Простые числа - это», в мае «Список простых чисел до 30»).

В августе на уравнение: x = 5. В мае: x = 5. Всё то же.

В августе на экосистему дал такое же по сути определение, может быть на пять слов длиннее.

То есть на этой выборке за восемь-девять месяцев качество ChatGPT не изменилось. Не «потупел». На сложных задачах (9-12), которых у меня не было в скриншотах прошлого года, в мае справился, я думаю, в августе бы тоже справился (это базовые комбинаторные задачи, в обучающих данных их сотни тысяч).

Серёжина версия объяснения

Серёжа всю эту сессию сидел рядом, листал свой учебник, иногда подсказывал «надо ещё вот эту задачу спросить, она у нас была сегодня в контрольной». Когда мы досидели, я ему попытался объяснить, в чём миф «нейросети тупеют». Сказал примерно так:

«Серёж, есть две разные вещи. Первая: одна нейросеть бывает в разных версиях. Например, есть ChatGPT-4, есть ChatGPT-3.5, есть новая ChatGPT-5. Когда выходит новая версия, она лучше старой. Если человек привык к старой и попробовал новую, ему может показаться, что новая хуже, потому что она по-другому отвечает - короче, или с уточняющими вопросами, или иначе формулирует. Это не «потупела», это «иначе сделана». Вторая: если на одну и ту же задачу спросить пять разных нейросетей, видно сразу - разные модели по-разному отвечают, какие-то лучше на одной задаче, какие-то на другой. Никто из них не «тупеет», и никто из них не «всё знает». Они просто разные программы, написанные по-разному, и каждая в своём».

Серёжа подумал и сказал: «Папа. Тогда у Серёжи папа неправ, и я в понедельник Серёже скажу что мы проверили». Я сказал «можешь не говорить, или скажи, как тебе удобно. Главное - сам теперь знаешь». Серёжа сказал «нет, я скажу. Серёжа врёт, что у него ChatGPT уже сломался».

Лена пришла с Полей через полчаса. Поля уснула в коляске. Серёжа подбежал и стал маме рассказывать, что мы тестировали 12 задач и что ChatGPT не тупеет. Лена слушала с интересом и в конце сказала «вы оба молодцы, теперь идите помойте посуду». Серёжа сказал «ну ма-ма, у нас был эксперимент». Лена сказала «эксперимент закончился, посуда осталась». Серёжа пошёл мыть.

Что я по итогам думаю

Миф «нейросеть тупеет» - один из самых стойких в окружении не-айтишников. Я его слышал от тёщи (она в Юго-Западном живёт), от соседа по гаражу, от бывшего одноклассника на встрече в декабре, и теперь, оказывается, от папы одного из Серёжиных одноклассников. У всех вариация одной и той же мысли: «раньше нейросеть отвечала отлично, потом стала отвечать так себе».

В реальности обычно происходит одно из двух. Либо человек привык к одной версии, потом обновили на новую, и новая «не та». Либо человек попадает на сложный или нестандартный запрос (где модель и год назад бы плохо справилась), запоминает «плохо ответила», и в голове закрепляется «потупела».

Когда в одной странице пять моделей на одной задаче - этот миф разрушается за 20 минут с восьмилетним сыном. Видно, что разные модели разные по сильным сторонам. Видно, что если повторно задать ту же задачу - ответ почти такой же. Видно, что новые версии добавляют, а не отнимают.

Инструмент - neuroverdict.ru, подписан с середины апреля. Серёжа сейчас периодически просит «папа, давай ещё раз ту нейроволшебную страницу откроем, у нас задача в школе была». В рабочих сценах я его использую для проверки конфигов и логики ансиблов, в семейных - вот для таких субботних разговоров с третьеклассником. Полчаса конкретной проверки делают для понимания больше, чем час спора с соседом по гаражу.

В понедельник Серёжа пришёл из школы и сказал «папа. Серёжа сказал, что я доказал. Сказал что папа его теперь сам это говорит и что он перепроверит дома. У нас в третьем "В" теперь все знают что ChatGPT не тупеет». Я улыбнулся и сказал «молодец, иди руки мой».

---

Текст не образовательная методичка. По разговорам с детьми про нейросети полезно показывать конкретные примеры на задачах из учебника и давать ребёнку сделать собственный вывод, а не цитировать готовые объяснения. По обновлению версий популярных LLM (ChatGPT, Gemini, Claude) вменяемые сводки изменений выходят в открытых блогах разработчиков и в специализированных русскоязычных каналах в Telegram.