Недавние исследования напомнили очевидную, но часто игнорируемую вещь: нейросети говорят так, как говорят их источники. У ChatGPT значимая часть обучения пришлась на Reddit — платформу с живыми обсуждениями, спорами, субъективными формулировками (так мы ловко заменили интернет-троллей). У Яндекса в нейроответах чаще всего встречаются Wikipedia, Дзен и VK, то есть, источники с более структурированными текстами и объяснениями. Разница чувствуется в ответах. Где-то они аккуратные и справочные, где-то — уверенные, обобщающие и слегка категоричные. Чувство юмора и эмоциональный текст тоже пока остаются прерогативой живого автора. И это не «характер модели», а отражение среды, из которой она училась. Из этого следует простой вывод: качество и тип источников напрямую формируют стиль и точность ответов. Нейросети не столько «думают», сколько воспроизводят привычную логику текста. А если вдруг в ответ звучит уверенное "дважды два будет пять", возможно, это просто отголосок старого форумн
💬 Почему все нейросети отвечают по-разному и при чём тут источники
19 декабря19 дек
~1 мин