Найти тему
CyberBlog

Почему нельзя полагаться на нейросети в решении тестов?

Наши любимые нейросети, которые недавно стали неотъемлемой частью нашей повседневной жизни, оказывают нам помощь в работе с текстами. Однако встаёт вопрос: способна ли нейросеть корректно решить тест за вас, или искусственный интеллект ещё не достиг совершенства?



Был проведён эксперимент, в котором нейросети пытались пройти IQ-тест от норвежского отделения Mensa. В результате этого
большинство моделей показали результаты, соответствующие низкому уровню интеллекта.

-2
  • Из проведённого эксперимента становится ясно, что популярная версия ChatGPT-3.5 показывает результаты, сопоставимые с результатами, полученными с помощью рандомайзера, что делает её ненадёжным инструментом для серьёзных задач.
  • Версия ChatGPT-4 показывает результаты в два раза лучше предыдущей, однако даже эти улучшения недостаточны для достижения среднего человеческого уровня IQ.

Самой передовой нейросетью является Claude-3, которая значительно опережает все другие существующие языковые модели, достигая уровня IQ в 101 балл.

На данный момент не стоит полагаться на нейросети для прохождения тестов, поскольку в процессе обучения они использовали как достоверную, так и недостоверную информацию. Лучше доверять собственному интеллекту или, если это необходимо, самостоятельно искать информацию в интернете.