537 подписчиков

💬 Почему все нейросети отвечают по-разному и при чём тут источники

19 декабря19 дек

~1 мин

Недавние исследования напомнили очевидную, но часто игнорируемую вещь: нейросети говорят так, как говорят их источники. У ChatGPT значимая часть обучения пришлась на Reddit — платформу с живыми обсуждениями, спорами, субъективными формулировками (так мы ловко заменили интернет-троллей). У Яндекса в нейроответах чаще всего встречаются Wikipedia, Дзен и VK, то есть, источники с более структурированными текстами и объяснениями. Разница чувствуется в ответах. Где-то они аккуратные и справочные, где-то — уверенные, обобщающие и слегка категоричные. Чувство юмора и эмоциональный текст тоже пока остаются прерогативой живого автора. И это не «характер модели», а отражение среды, из которой она училась. Из этого следует простой вывод: качество и тип источников напрямую формируют стиль и точность ответов. Нейросети не столько «думают», сколько воспроизводят привычную логику текста. А если вдруг в ответ звучит уверенное "дважды два будет пять", возможно, это просто отголосок старого форумн

Недавние исследования напомнили очевидную, но часто игнорируемую вещь: нейросети говорят так, как говорят их источники.

У ChatGPT значимая часть обучения пришлась на Reddit — платформу с живыми обсуждениями, спорами, субъективными формулировками (так мы ловко заменили интернет-троллей).

У Яндекса в нейроответах чаще всего встречаются Wikipedia, Дзен и VK, то есть, источники с более структурированными текстами и объяснениями.

Разница чувствуется в ответах.

Где-то они аккуратные и справочные, где-то — уверенные, обобщающие и слегка категоричные. Чувство юмора и эмоциональный текст тоже пока остаются прерогативой живого автора. И это не «характер модели», а отражение среды, из которой она училась.

Из этого следует простой вывод:

качество и тип источников напрямую формируют стиль и точность ответов. Нейросети не столько «думают», сколько воспроизводят привычную логику текста.

А если вдруг в ответ звучит уверенное "дважды два будет пять", возможно, это просто отголосок старого форумного спора, сохранённого в обучающих данных.

#нейросети #ai #chatgpt #яндекс #контент #пятничныйпост

Гаджеты и электроника

5,73 млн интересуются