12 подписчиков

👏Головоломки против AI: тестируем новые возможности GPT-4.1

23 мая 202523 мая 2025

1 мин

👏Головоломки против AI: тестируем новые возможности GPT-4.1 Заметили тихий выход новой версии ChatGPT — GPT-4.1? Казалось бы, ничего особенного, но этот апдейт серьёзно поднял уровень возможностей системы именно там, где мы ценим точность и ясность решений: логика и программирование. Однако рассказывая о новых функциях, инженеры OpenAI часто погружаются в такие технические подробности, что обычные пользователи быстро теряют интерес. Решив лично испытать новую версию, автор провёл своеобразный эксперимент-игру между тремя моделями: обновлённой GPT-4.1, стандартной GPT-4o и специализированной моделью O3, предназначенной для решения сложных аналитических задач. Первым делом проверяли способность решать классические загадки и головоломки. Например, известная задача про кота, спрятанного в коробке, где каждую ночь животное перемещается в соседнюю ячейку. Задача простая, но требует точного планирования действий. Все три модели дали правильные решения, однако GPT-4.1 продемонстрировала са

Заметили тихий выход новой версии ChatGPT — GPT-4.1? Казалось бы, ничего особенного, но этот апдейт серьёзно поднял уровень возможностей системы именно там, где мы ценим точность и ясность решений: логика и программирование. Однако рассказывая о новых функциях, инженеры OpenAI часто погружаются в такие технические подробности, что обычные пользователи быстро теряют интерес.

Решив лично испытать новую версию, автор провёл своеобразный эксперимент-игру между тремя моделями: обновлённой GPT-4.1, стандартной GPT-4o и специализированной моделью O3, предназначенной для решения сложных аналитических задач.

Первым делом проверяли способность решать классические загадки и головоломки. Например, известная задача про кота, спрятанного в коробке, где каждую ночь животное перемещается в соседнюю ячейку. Задача простая, но требует точного планирования действий. Все три модели дали правильные решения, однако GPT-4.1 продемонстрировала самую подробную стратегию захвата животного, подробно поясняя каждый шаг.

Затем было задание на физическое мышление: определить количество вина в бочке без измерений. Здесь вновь победила новая версия, предложив изящное решение — слегка наклонив ёмкость и проверив видимость дна.

Завершил серию испытаний языковой ребус: «Что встречается один раз в минуте, два раза в моменте и никогда в тысяче лет?» Буква «М». И снова победа GPT-4.1 оказалась самой убедительной благодаря детальной аргументации.

Итоги эксперимента оказались предсказуемыми: все три модели показали отличные результаты, но разница проявлялась в стиле изложения. GPT-4.1 выдавала наиболее детализированные объяснения, O3 работала оперативно и конкретно, а стандартная GPT-4o стремилась сделать своё объяснение доступным и человеческим языком.

Подводя итог, можно сказать, что выбор модели зависит исключительно от ваших предпочтений: хотите быстрое решение — выбирайте O3, нужен полный анализ — доверяйте GPT-4.1. Но самое удивительное открытие заключается в том, что обычный пользователь вряд ли ощутит разницу, потому что каждая из версий справляется отлично.