Все чаще пишете тексты с помощью нейросетей? Тогда у нас для вас плохие новости: каждый такой текст увеличивает долю ИИ-контента в интернете, а значит, и риск деградации самих моделей. Именно этот эффект исследователи из Оксфорда и Кембриджа описали в журнале Nature как коллапс языковых моделей. Согласно научному определению, коллапс языковых моделей – это дегенеративный процесс, при котором новые поколения ИИ обучаются на данных, сгенерированных предыдущими моделями. Из-за этого обучающая выборка постепенно «загрязняется» синтетическим контентом, который содержит ошибки, искажения, некорректные формулировки. И сами модели все хуже отражают реальность, давая менее точные и более шаблонные ответы. Это не резкий сбой, а постепенное ухудшение качества сгенерированного контента: 1. Ответы становятся предсказуемыми, повторяются одни и те же формулировки, исчезают специфические слова и термины. 2. ИИ «забывает» редкие, но ценные знания. Специализированные факты, детали, локальные особенност