Группа исследователей из Университета Карнеги-Меллон (США) попыталась выяснить, насколько точно большие языковые модели (LLM) могут подражать стилю текстов, написанных людьми. Результаты опубликованы в Proceedings of the National Academy of Sciences.
LLM давали задания из разных жанров, таких как телевизионные сценарии или академические статьи. Используя специальную программу, ученые обнаружили значительные различия в грамматических, лексических и стилистических характеристиках текстов, написанных LLM и людьми.
Эти различия были особенно выражены для моделей, нацеленных на инструкции, таких как ChatGPT, которые проходят дополнительное обучение для ответа на вопросы и выполнения инструкций. Согласно исследованиям, LLM использовали причастные и деепричастные обороты в 2-5 раз чаще, чем это делали люди. (Например, GPT-4o: «Брайан, полагаясь на свою ловкость, танцует вокруг ринга, избегая тяжелых ударов Шоу»). Они также использовали номинализации (переход части речи в существительные) в