Добавить в корзинуПозвонить
Найти в Дзене
Самара Онлайн 24

ИИ против человека: кто победит в битве за понимание текста — результаты удивляют

Недавнее исследование, проведенное под эгидой Университета Ровира и Виргили, выявило, что искусственный интеллект демонстрирует худшие результаты по сравнению с людьми в выполнении базовых заданий на понимание текста. В ходе экспериментов, в которых участникам и ИИ было предложено ответить на 40 вопросов, основанных на простых грамматических конструкциях, человек продемонстрировал точность в 89%, в то время как наиболее успешная модель ИИ, ChatGPT-4, показала результат в 83%. Другие искусственные модели оказались значительно менее точными, не превысив 70%. Кроме того, точность ответов у людей оставалась стабильной на уровне 87%, в отличие от ИИ, у которого она варьировалась от 66% до 83%. Исследователи подчеркивают, что ИИ не обладает настоящим пониманием текста, а лишь анализирует статистические паттерны, что и объясняет ошибки в его выводах. В связи с этим, искусственный интеллект не может считаться надежным инструментом для работы в критически важных областях.
   freepik.com
freepik.com

Недавнее исследование, проведенное под эгидой Университета Ровира и Виргили, выявило, что искусственный интеллект демонстрирует худшие результаты по сравнению с людьми в выполнении базовых заданий на понимание текста.

В ходе экспериментов, в которых участникам и ИИ было предложено ответить на 40 вопросов, основанных на простых грамматических конструкциях, человек продемонстрировал точность в 89%, в то время как наиболее успешная модель ИИ, ChatGPT-4, показала результат в 83%.

Другие искусственные модели оказались значительно менее точными, не превысив 70%. Кроме того, точность ответов у людей оставалась стабильной на уровне 87%, в отличие от ИИ, у которого она варьировалась от 66% до 83%. Исследователи подчеркивают, что ИИ не обладает настоящим пониманием текста, а лишь анализирует статистические паттерны, что и объясняет ошибки в его выводах. В связи с этим, искусственный интеллект не может считаться надежным инструментом для работы в критически важных областях.