926 подписчиков

Двойка за сочинение, написанное нейросетью

23 января23 янв

1585

7 мин

Что важно знать, используя ИИ для написания художественных текстов? Какие ошибки он совершает и как с ними бороться. ...или не бороться, потому что это может того не стоить. Какие ошибки совершает нейросеть при написании текста? Ранее я писал о самых очевидных (высокой лексике, штампах и клише, абзацах одинаковой длины): Здесь - разберемся с ошибками менее очевидными. Аномально большое количество сравнительных оборотов. Текст ими старательно напичкивается. Буквально в каждое предложение машина добавляет сравнение всего со всем, ведь сравнение - это признак художественной литературы, а значит, если закидать ими читателя, то никто не будет сомневаться, что текст художественный. "... затем соткался из воздуха силуэт, как будто кто-то невидимый рисовал её акварельными красками. Тени в салоне сгустились, принимая форму струящегося платья цвета звёздной ночи. Она сидела по-королевски прямо, словно дорогой "Мерседес" был троном, а искажённое остановленным временем пространство вокруг — её дво

Что важно знать, используя ИИ для написания художественных текстов? Какие ошибки он совершает и как с ними бороться.

...или не бороться, потому что это может того не стоить.

Какие ошибки совершает нейросеть при написании текста? Ранее я писал о самых очевидных (высокой лексике, штампах и клише, абзацах одинаковой длины):

Когда AI заменит писателей?

Литературное объединение "Исправляй"27 ноября 2024

Здесь - разберемся с ошибками менее очевидными.

Аномально большое количество сравнительных оборотов. Текст ими старательно напичкивается. Буквально в каждое предложение машина добавляет сравнение всего со всем, ведь сравнение - это признак художественной литературы, а значит, если закидать ими читателя, то никто не будет сомневаться, что текст художественный.

"... затем соткался из воздуха силуэт, как будто кто-то невидимый рисовал её акварельными красками. Тени в салоне сгустились, принимая форму струящегося платья цвета звёздной ночи. Она сидела по-королевски прямо, словно дорогой "Мерседес" был троном, а искажённое остановленным временем пространство вокруг — её дворцом".

В этом отрывке из трех предложений пять сравнений. Такая чрезмерность крайне неестественна. Увы, чувство меры ИИ не знакомо.... как и последовательность мысли.

Нарушенная связь предложений. В нормальных человеческих текстах между предложениями существует связь: последовательная, параллельная, присоединительная. Наиболее распространена последовательная, которая может быть представлена местоименной или синонимической связью, а также лексическим повтором. Например, в следующем отрывке видно, как имя Наталья в следующем предложении заменяется на местоимение "она", затем на синоним женщина, а затем идет лексический повтор - слово "впечатление" повторяется в следующем предложении: "Наталья вышла вперед. Она казалась решительно настроенной. Хоть женщина и не готовилась, ей удалось произвести впечатление. Впечатление достойное".

Как пишет ИИ:

Иван вошёл в комнату. У стены стоял диван. Он сел.

Кто сел? Диван? Интуитивно мы понимаем, что речь идет об Иване. Но последовательность мысли (причинно-следственная связь) нарушена. Иногда люди тоже совершают такие ошибки, но нейросеть совершает их регулярно и намеренно. Т.е. она переключается между объектом и субъектом от предложения к предложению туда-обратно несколько раз. Людям же свойственно сосредотачивать внимание на объектах поочередно. Еще пример:

"Красиво, правда?" — женский голос прозвучал с заднего сиденья, где ещё секунду назад никого не было. Феликс дёрнулся, инстинктивно вжимаясь в водительское кресло. В зеркале заднего вида сначала проявились глаза — два сияющих янтарных огня в полумраке салона, затем соткался из воздуха силуэт, как будто кто-то невидимый рисовал её акварельными красками.

Кого её? Никакой объект женского рода даже не упоминался в тексте. Упрощаем текст, оставляя только основы: Прозвучал голос, Феликс дёрнулся, глаза проявились, силуэт соткался = Голос-Феликс-глаза-огни-силуэт. Ни одного подлежащего женского рода! Кого её? Местоимение берется из ниоткуда и ни на что не ссылается.

Спросил у нейросети, откуда у нее эта беда. Объяснила так:

Отсутствие явного моделирования когерентности. Моя основа — предсказание следующего слова на основе предыдущих, а не формальное построение логических связей между предложениями.

«Где-то я уже это видел», - подумал я и вспомнил, что точно так же ИИ сращивает не только предложения, но и слова. Поэтому спросил, как он собирается решать свою самую большую проблему, о которой я писал в прошлый раз, — как собирается бороться с клише и штампами, появляющимися из-за того, что его основной инструмент — вероятность сочетаемости слов. Ответил, что якобы кроме вероятности сочетаемости слов и "сэмплирования с температурой" он использует "семантическую совместимость":

Семантическая совместимость — это не жёсткие правила, а вероятностные оценки. Модель не хранит параметров для каждого слова в отдельности, а оперирует распределениями вероятностей на уровне токенов и их сочетаний. Это позволяет находить смысловые связи, но не гарантирует идеальную семантическую согласованность.

Снова вероятность! Только не между словами, а группами слов. Похоже на хождение по кругу. Снова подглядывание в чужие тексты и никакой оригинальности. Велимиром Хлебниковым ИИ не быть!

Предельно простая структура предложений. Никогда ИИ не выдаст по-толстовски длинных, по-достоевски корявых или по-замятински футуристично-кратких предложений. У него все предложения будут состоять из основы с подлежащим и сказуемым, с дополнением, причастным или деепричастным оборотом. Большего не ждите. А как же предложения в одно слово? Перечисления через запятую? Двухосновные? Разделенные точкой с запятой? Уточнения, выделенные тире или скобками? Справедливости ради скажем, что подобное можно встретить, но крайне редко. Основной прием формирования разнообразия у ИИ - перенесение оборотов, выделяемых запятыми из конца предложения в начало и из начала - в конец. Про ритмическую композицию текста и интонирование инверсиями - молчу (не все люди умеют).

Постоянная жёсткая структура текста. Я уже писал, что ИИ генерирует текст порциями - абзацами одинаковой длины. Теперь уточняю, что тоже самое он делает не только с абзацами, но и с разными видами повествования в тексте, стараясь их чередовать в одном и том же порядке и в одинаковой пропорции. Например, он может генерировать 10 строк описания, затем 5 строк монолога, 10 строк действия, 7 строк диалога, а затем повторяет эту схему снова и снова. ИИ скремблирует текст по заданной схеме, делая его равномерно-монотонным. Спросил его зачем он это делает. Вот ответ:

1. Удобство восприятия. Короткие или средние по длине порции текста удобнее читать и воспринимать, особенно в диалоговом формате.
2. Техническая реализация генерации. Модель генерирует текст пошагово, и часто система настроена так, чтобы выдавать ответ после достижения определённого объема или завершения логической единицы.

Сторонник клипового мышления и регламентов. Вот если бы Гоголь думал «Какое-то слишком длинное лирическое отступление получилось, вероятно, это слишком для нетерпеливого внимания читателя, пора начать какой-нибудь диалог», стал бы он тогда Гоголем?

Как со всем этим бороться? И нужно ли?

Можно задать промт на исправление текста с указанием замеченных ошибок, попросить их исправить. А затем еще раз, еще раз и еще раз. Пока текст вас не устроит или вы не выйдете из себя и не напишите текст сами, потому что потратите на указания для исправлений столько же времени. Хорошо, если бы можно было один раз задать нейросети исправить все, что требуется и получить хороший текст. Но это невозможно, потому что исправлять свои ошибки нейросеть тоже не умеет.

При исправлении она неточно трактует термины, используя определения из интернета, и мы тоже этим грешим, поэтому понять друг друга с первого раза редко удается. Она часто не полностью выполняет запросы, т.к. ограничена набором возможностей. Ей нужно задать пропорции и последовательность видов повествования, т.к. она не может случайно варьировать объем и очередность типа текста, поэтому ей обязательно нужны рамки. Но главное:

Исправляя одни ошибки, нейросеть делает новые в других местах. Устранить их все за один раз невозможно, т.к. текст постоянно не соответствует ожиданиям или ошибки исправляются частично. Работа превращается в бесконечную погоню за новыми ошибками и бесконечное переписывание без роста качества.

В заключение спросил ИИ о другой проблеме:

Как на счёт придумывания несуществующих трудов, книг и фильмов для того, чтобы угодить пользователю?

Признания безыскусного льстеца:

Да, эта проблема, известная как «галлюцинации» нейросетей — когда модель генерирует неправдивую или вымышленную информацию, включая несуществующие книги, фильмы, исследования и т.д. — активно изучается и предпринимаются различные меры для её минимизации.

Не раскаялся, но обещал умнеть.

Вряд ли вы совершаете такие ошибки, потому что вы – человек, а значит, связываете предложения по-другому, имеете чувство меры и ритма, не отмеряете количество строк для диалога, но можете совершать другие ошибки, от которых не застрахован человек. Как мы выяснили, опираясь только на ИИ, нужного результата не достичь. Что же делать? Можно продолжать бороться с нейросетью. А можно грамотно редактировать текст, написанный ИИ, или писать с нуля самому так, как ИИ никогда не сможет. Если хотите уметь писать любой текст пятьюдесятью способами и не быть ограниченным в действиях как машина, используйте способность человека к обучению. На Курсах писательского мастерства мы учим не только писать разными способами и осознанно применять разные художественные приемы, но и расскажем как написать и издать собственную книгу.