Найти тему
65,4 тыс подписчиков

Журнашлюшки распространяют новость, что ChatGPT поглупел. Болтовня основана на исследовании учёных Стэндфорского университета.


Так как журнашлюшки обычно сильно привирают, смотрим первоисточник.

Оказалось, исследователи в количестве аж трёх человек задавали вопросы по темам:

1) решение математических задач,
2) ответы на деликатные/опасные вопросы,
3) генерация кода,
4) визуальное мышление.

С решением математических задач ИИ ошибался с самого начала.

Ответы на деликатные и опасные вопросы менялись, программисты явно меняли настройки. Например, сегодня некоторые нейросети отказываются сочинять сатирические заметки или обсуждать оружие. Что свободно делали раньше.

Как оценить генерацию кода? Если разные варианты кода работают, как понять, который лучше?

А что такое визуальное мышление? И как оценивать его правильность?

Группа бездельников получала деньги просто так. От скуки они игрались с чат-ботом. Но для финансовой отчётности нужно показать видимость деятельности. Ну и написали.
Журнашлюшки распространяют новость, что ChatGPT поглупел. Болтовня основана на исследовании учёных Стэндфорского университета.   Так как журнашлюшки обычно сильно привирают, смотрим первоисточник.
Около минуты
496 читали