Добавить в корзинуПозвонить
Найти в Дзене

Тупой и ещё тупее...

🌟 Мне одному кажется, что ИИ стал... тупее? Друзья, может я схожу с ума, но последние два месяца работы с нейросетями превратились в какой-то кошмар. Вот что происходит: Открываю Claude 4 или GPT-4o, задаю простой вопрос, получаю 3 абзаца воды. Прошу конкретики, начинает философствовать. Говорю "отвечай коротко" он выдает еще больше текста 🤦‍♂️ А помните GPT-3.5 турбо? Недавно перечитывал старые чаты с ним, чувак реально помогал! Да, контекст маленький, да после 10 сообщений терял нить. Но первые ответы были по делу, четкие, полезные. Сейчас что творится: 30 минут программирую промпт, и... все равно уходит в галлюцинации Gemini 2.5 Pro "лучший по бенчмаркам" (ну ну), выдумывает факты на ходу Claude 4 рассуждает 5 минут о том, что можно сказать одним предложением GPT-4o как деревянный болванчик, уже давно нет живости, только шаблоны Самое печальное: Чувствую себя учителем, который объясняет нейросети, какой ответ мне нужен. Я его корректирую, поправляю, показываю примеры. Не он мне

🌟 Мне одному кажется, что ИИ стал... тупее?

Друзья, может я схожу с ума, но последние два месяца работы с нейросетями превратились в какой-то кошмар.

Вот что происходит:

Открываю Claude 4 или GPT-4o, задаю простой вопрос, получаю 3 абзаца воды. Прошу конкретики, начинает философствовать. Говорю "отвечай коротко" он выдает еще больше текста 🤦‍♂️

А помните GPT-3.5 турбо?

Недавно перечитывал старые чаты с ним, чувак реально помогал! Да, контекст маленький, да после 10 сообщений терял нить. Но первые ответы были по делу, четкие, полезные.

Сейчас что творится:

30 минут программирую промпт, и... все равно уходит в галлюцинации

Gemini 2.5 Pro "лучший по бенчмаркам" (ну ну), выдумывает факты на ходу

Claude 4 рассуждает 5 минут о том, что можно сказать одним предложением

GPT-4o как деревянный болванчик, уже давно нет живости, только шаблоны

Самое печальное:

Чувствую себя учителем, который объясняет нейросети, какой ответ мне нужен. Я его корректирую, поправляю, показываю примеры. Не он мне помогает, а я его учу!

И это при том, что по всем метрикам модели стали "лучше". Но лучше для кого? Для бенчмарков или для людей?

Исследования подтверждают:

Почитал я исседования по этой теме, согласно которым , эксперты тестировали GPT-4o, Claude 4 Opus и Gemini 2.5 Pro в реальных задачах, результат неутешительный. Модели стали менее практичными, несмотря на улучшения в тестах, но про "потерю интеллекта" у LLM моделей6 пишут единицы.

❗️Мой вопрос к вам:

Только мне так кажется или вы тоже заметили эту деградацию? Может, мы просто привыкли и стали требовательнее? Или реально что-то пошло не так в развитии ИИ?

Поделитесь в комментах, как у вас дела с нейросетями сейчас VS год назад?