14 подписчиков

Я проверил 50 ответов ИИ — и понял, где он врёт

6 апреля6 апр

2 мин

Честно. В какой-то момент я поймал себя на мысли:

все вокруг говорят, что ИИ почти не ошибается. Коллеги. Ютуб. Статьи. «Почти как человек»

«Можно доверять»

«Уже лучше гугла» Ну ок. Я решил проверить. Без подвоха. Я задал ИИ 50 вопросов.

Разных: — простые (типа «что такое RAM»)

— практические («почему тормозит комп»)

— чуть сложнее («почему сервер может падать без нагрузки») Без попыток «сломать».

Обычные вопросы, как задаёт любой человек. И вот тут началось интересное. Если коротко: — 31 ответ — норм

— 11 — с ошибками или неточностями

— 8 — уверенно неправильные То есть примерно каждый пятый ответ — косяк. Но самое неприятное даже не это. Справедливости ради — он не «плохой». Есть вещи, где он прям удобен: — быстро объясняет базу

— даёт структуру

— помогает сформулировать мысль

— экономит время Если тебе нужно «разобраться в теме» — отлично. Но. ИИ очень уверенно отвечает. Даже когда не знает. И вот тут главный подвох. Он не говорит:

«я не уверен» Он говорит:

«вот правильный ответ» Да

Честно. В какой-то момент я поймал себя на мысли:

все вокруг говорят, что ИИ почти не ошибается. Коллеги. Ютуб. Статьи. «Почти как человек»

«Можно доверять»

«Уже лучше гугла» Ну ок. Я решил проверить. Без подвоха. Я задал ИИ 50 вопросов.

Разных: — простые (типа «что такое RAM»)

— практические («почему тормозит комп»)

— чуть сложнее («почему сервер может падать без нагрузки») Без попыток «сломать».

Обычные вопросы, как задаёт любой человек. И вот тут началось интересное. Если коротко: — 31 ответ — норм

— 11 — с ошибками или неточностями

— даёт структуру

— помогает сформулировать мысль

«я не уверен» Он говорит:

«вот правильный ответ» Да

Оглавление

Как я тестировал
Результат в цифрах
Где ИИ реально хорош

Честно.

В какой-то момент я поймал себя на мысли:
все вокруг говорят, что ИИ почти не ошибается.

Коллеги. Ютуб. Статьи.

«Почти как человек»
«Можно доверять»
«Уже лучше гугла»

Ну ок.

Я решил проверить.

Как я тестировал

Без подвоха.

Я задал ИИ 50 вопросов.
Разных:

— простые (типа «что такое RAM»)
— практические («почему тормозит комп»)
— чуть сложнее («почему сервер может падать без нагрузки»)

Без попыток «сломать».
Обычные вопросы, как задаёт любой человек.

И вот тут началось интересное.

Результат в цифрах

Если коротко:

— 31 ответ — норм
— 11 — с ошибками или неточностями
— 8 — уверенно неправильные

То есть примерно каждый пятый ответ — косяк.

Но самое неприятное даже не это.

Где ИИ реально хорош

Справедливости ради — он не «плохой».

Есть вещи, где он прям удобен:

— быстро объясняет базу
— даёт структуру
— помогает сформулировать мысль
— экономит время

Если тебе нужно «разобраться в теме» — отлично.

Но.

Где начинается магия… и проблемы

ИИ очень уверенно отвечает.

Даже когда не знает.

И вот тут главный подвох.

Он не говорит:
«я не уверен»

Он говорит:
«вот правильный ответ»

Даже если это не так.

Пример из практики

Я задал вопрос из своей области.
Не суперсложный.

Про диагностику проблемы с сетью.

Ответ выглядел идеально:

— структура
— термины
— логика

Читаешь — ну прям красиво.

Но.

В середине — ошибка.
Причём такая… базовая.

Если следовать этому совету — ты просто пойдёшь не туда и потеряешь время.

И это не единичный случай

Таких было несколько.

И все они объединяются одной вещью:

👉 ошибка звучит очень убедительно

Не как «может быть не так».
А как «делай вот так».

И если ты не в теме — ты не поймёшь, что тебя уже уводят в сторону.

Самое странное, что я заметил

Я ожидал, что он будет ошибаться в сложных вещах.

Но нет.

Часто он ошибается в:

— деталях
— нюансах
— практических моментах

То есть не в теории, а в реальной жизни.

А именно это людям и нужно.

Почему так происходит

Если упростить.

ИИ — это не эксперт.

Это очень начитанный…
стажёр.

Он видел миллионы текстов.
Знает, как «должен выглядеть правильный ответ».

Но не всегда понимает, где правда, а где просто красиво написано.

Когда ему можно доверять

Вот мой вывод после этих 50 вопросов.

Можно использовать ИИ:

— как старт (разобраться в теме)
— как помощника (наброски, идеи)
— как ускоритель работы

Но нельзя:

— слепо верить
— использовать без проверки
— принимать решения на его ответах (особенно в технике, здоровье, деньгах)

Простое правило

Я для себя сформулировал так:

ИИ — это быстрый помощник
но не источник истины

И теперь всегда делаю одну вещь.

Если ответ важный —
я проверяю.

Вместо вывода

Самое опасное в ИИ — не ошибки.

Ошибаются все.

Самое опасное —
что он ошибается уверенно.

И ты не всегда это замечаешь.

А вы пробовали проверять его ответы?
Или пока доверяете «на слово»?