Большие языковые модели (БЯМ) получили широкое распространение и интегрированы в различные сферы повседневной деятельности человека. Данное распространение потенциально оказывает влияние на формирование когнитивных процессов пользователей, включая восприятие информации и принятие решений. Примером такого влияния может служить использование БЯМ в новостных агрегаторах и рекомендательных системах, которые, основываясь на алгоритмах машинного обучения, селективно представляют информацию пользователю, опосредованно воздействуя на формирование его картины мира. Одной из актуальных проблем, связанных с широким применением БЯМ, является недостаточная прозрачность механизмов их работы для конечного пользователя. Это обстоятельство затрудняет критическую оценку информации, предоставляемой БЯМ, и может приводить к неосознаваемому принятию пользователем предложенных моделью интерпретаций и выводов. Функционирование БЯМ в повседневных задачах, таких как поиск информации или автоматическое составление текстов, может имплицитно влиять на когнитивные процессы и поведение пользователей, что ставит вопрос о границах и этических аспектах такого влияния. Восприятие и интерпретация сущности и возможностей БЯМ варьируются в зависимости от уровня информированности и когнитивных установок пользователя. В обыденном сознании могут сосуществовать различные, подчас противоречивые, представления о БЯМ: от упрощенного понимания их как инструментов для решения узкоспециализированных задач до необоснованной атрибуции им квазичеловеческих свойств и способностей.
Несмотря на широкое распространение БЯМ, большинство пользователей не имеют полного представления о принципах их функционирования и механизмах осуществления коммуникации между человеком и машиной. В частности, для непрофессиональных пользователей остаются непрозрачными онтологические и семантические аспекты взаимодействия с БЯМ, что обусловливает необходимость проведения дальнейших исследований в данной области. Отсутствие у пользователей понимания внутренних механизмов работы БЯМ создает потенциальные риски, связанные с неконтролируемым влиянием этих моделей на когнитивные процессы и принятие решений.
В качестве основного инструмента взаимодействия пользователя с БЯМ в настоящее время рассматривается промпт (prompt) – текстовый запрос, инициирующий генерацию ответа моделью. Однако, термин «промпт» в его обиходном понимании не отражает всей сложности и многоаспектности процесса взаимодействия пользователя с БЯМ. Промпт представляет собой не просто текстовую команду, а структурированный запрос, который может включать в себя элементы различных методологий, используемых для решения конкретной задачи с помощью БЯМ. Формулировка промпта, таким образом, является своего рода мета-процессом, в котором пользователь, явно или неявно, задействует свои знания и представления о принципах работы БЯМ для достижения желаемого результата.
Промпт следует рассматривать как методологическую категорию, обладающую признаками системности. Он представляет собой сложную структуру, состоящую из взаимосвязанных элементов, которые могут быть классифицированы на основе различных критериев. В частности, в структуре промпта можно выделить подсистемы, соответствующие различным категориям и понятиям, задействованным в процессе взаимодействия с БЯМ.
В зависимости от поставленной задачи, промпт может имплицитно активировать различные методологические подходы, соответствующие той или иной предметной области. Например, запрос на генерацию текста в определенном стиле предполагает использование методов литературоведческого анализа, запрос на решение математической задачи – методов математики, а запрос на анализ данных – методов статистики. Интеграция этих методологий в рамках единого запроса обеспечивает комплексный подход к решению поставленной задачи.
Функционирование БЯМ основано на использовании статистических моделей, обученных на больших массивах текстовых данных. Промпт, поступающий на вход модели, активирует определенные паттерны в этой статистической модели, что приводит к генерации текста, соответствующего заданным в промпте параметрам. Этот процесс можно условно представить как поиск наиболее вероятного продолжения текста, инициированного промптом, на основе статистических закономерностей, выявленных моделью в процессе обучения.
В зависимости от поставленной задачи, промпт может имплицитно активировать различные методологические подходы, соответствующие той или иной предметной области. Например, запрос на генерацию текста в определенном стиле предполагает использование методов литературоведческого анализа, запрос на решение математической задачи – методов математики, а запрос на анализ данных – методов статистики. Интеграция этих методологий в рамках единого запроса обеспечивает комплексный подход к решению поставленной задачи. Функционирование БЯМ основано на использовании статистических моделей, обученных на больших массивах текстовых данных. Промпт, поступающий на вход модели, активирует определенные паттерны в этой статистической модели, что приводит к генерации текста, соответствующего заданным в промпте параметрам. Этот процесс можно условно представить как поиск наиболее вероятного продолжения текста, инициированного промптом, на основе статистических закономерностей, выявленных моделью в процессе обучения.
Следовательно, промпт является не только инструментом получения ответа от БЯМ, но и средством исследования возможностей самой модели, а также инструментом для экспериментов с различными методологическими подходами. Это открывает новые перспективы для изучения когнитивных процессов, связанных с взаимодействием человека и машины.
Прослеживается определенная аналогия между промптом и формуляром – стандартизированной формой документа, предназначенной для заполнения определенной информацией. Подобно тому, как домохозяйка, не обладая специальными знаниями, способна корректно заполнить различные формуляры, пользователь, не имеющий глубоких познаний в области искусственного интеллекта, может эффективно взаимодействовать с БЯМ посредством промптов.
Каждый формуляр обладает имплицитной структурой, определяемой его назначением и регулируемой соответствующими нормативными актами. Данная аналогия с формуляром не случайна. Принципы структурирования информации, используемые в формулярах, находят свое отражение в источниковедческом формулярном анализе – методе исследования исторических документов, основанном на выявлении устойчивых структурных элементов и их семантических связей. Человек, даже не будучи знаком с теорией формулярного анализа, интуитивно следует этим принципам в своей повседневной коммуникации, что проявляется в способности различать и создавать тексты различного назначения и формата.
Следовательно, освоение навыков взаимодействия с БЯМ посредством промптов не представляет собой принципиальной методологической проблемы для пользователя, уже обладающего опытом работы с различными текстовыми форматами. Промпт, по сути, является еще одним видом текста, подчиняющимся определенным структурным и семантическим правилам, которые могут быть усвоены в процессе практического взаимодействия.
При взаимодействии с БЯМ важно учитывать, что они не являются универсальными источниками знаний и не обладают способностью к мышлению в человеческом понимании этого слова. Распространенные в массовой культуре представления о БЯМ как о всезнающих и всемогущих системах не соответствуют действительности и являются результатом упрощенного, а зачастую и искаженного понимания принципов их работы.
В основе работы БЯМ лежит вероятностное прогнозирование следующего элемента последовательности (слова, символа) на основе предшествующего контекста. Данный механизм не предполагает понимания смысла текста в человеческом понимании, а основывается на статистических закономерностях, выявленных в процессе обучения модели на больших массивах текстовых данных. БЯМ не обладают способностью к интерпретации контекста, эмоций и намерений пользователя, выходящих за рамки явным образом выраженной в тексте информации. Для повышения эффективности взаимодействия с БЯМ и минимизации риска получения нерелевантного ответа используется промпт – структурированный запрос, содержащий инструкции для модели. Промпт позволяет пользователю задать контекст, определить желаемый формат и стиль ответа, а также ограничить область поиска информации, тем самым повышая вероятность получения релевантного результата.
Таким образом, промпт выполняет функцию спецификации, определяющей параметры генерации текста БЯМ. Взаимодействие с БЯМ представляет собой итеративный процесс, в котором пользователь играет активную роль, формулируя запросы, оценивая результаты и корректируя свои действия для достижения желаемого результата. Эффективность этого взаимодействия напрямую зависит от понимания пользователем принципов работы БЯМ и его умения составлять адекватные промпты. Для эффективного взаимодействия с БЯМ не требуется специальных знаний в области программирования или машинного обучения. Пользовательский интерфейс современных БЯМ, как правило, интуитивно понятен и позволяет осуществлять взаимодействие на естественном языке.
Подобно тому, как человек подвержен влиянию методов нейролингвистического программирования, БЯМ также демонстрируют чувствительность к стилистическим и семантическим особенностям формулировки запроса. Это обусловлено тем, что вероятностное прогнозирование, лежащее в основе работы БЯМ, осуществляется на основе статистических закономерностей, включающих в себя не только лексический состав, но и стилистические и риторические приемы, используемые в тексте. Для структурирования взаимодействия с БЯМ и повышения его эффективности используется понятие, которое мы, для целей данного исследования, будем обозначать термином «формуляр», следуя аналогии с источниковедческим понятием формуляра документа. Формуляр в контексте взаимодействия с БЯМ представляет собой набор инструкций и параметров, определяющих процесс генерации текста моделью. Он позволяет пользователю задать контекст, определить желаемый формат и стиль ответа, а также ограничить область поиска информации, тем самым повышая вероятность получения релевантного результата.
Переходя к рассмотрению структуры формуляра для взаимодействия с БЯМ, введем понятие абстрактного формуляра. В источниковедении под абстрактным формуляром понимается обобщенная схема, отражающая типовые структурные элементы и связи, характерные для определенного класса документов. Применительно к взаимодействию с БЯМ, абстрактный формуляр представляет собой минимальный набор компонентов, необходимых для эффективной коммуникации с моделью.
Абстрактный формуляр включает в себя несколько основных компонентов, каждый из которых выполняет определенную функцию в процессе взаимодействия с БЯМ. Эти компоненты взаимосвязаны и образуют единую систему, обеспечивающую эффективную коммуникацию между пользователем и моделью. Важно отметить, что абстрактный формуляр не является жесткой, фиксированной структурой. Он обладает определенной гибкостью и может быть модифицирован в зависимости от конкретных задач и контекста взаимодействия с БЯМ. Допускается изменение последовательности компонентов, добавление новых элементов или исключение существующих, что позволяет адаптировать формуляр к различным потребностям пользователя. Введем понятие «базового формуляра», который будет представлять собой конкретную реализацию абстрактного формуляра, предназначенную для решения определенного класса задач. Базовый формуляр, как и абстрактный, является разновидностью документа в широком смысле этого слова, поскольку он представляет собой структурированный набор инструкций, предназначенный для передачи информации БЯМ.
Поскольку базовый формуляр определяется как разновидность документа, он, в соответствии с принципами системного подхода, должен обладать внутренней структурой, состоящей из взаимосвязанных элементов. Структура базового формуляра должна обладать свойством устойчивости, то есть способностью сохранять свою целостность и основные характеристики при незначительных изменениях входных данных или контекста взаимодействия. Кроме того, структура базового формуляра должна обладать свойством динамического гомеостаза, то есть способностью адаптироваться к изменениям в запросе пользователя или контексте взаимодействия, сохраняя при этом свою общую функциональность и эффективность.
Структура базового формуляра должна обладать свойством адаптивности, то есть способностью изменять свои внутренние связи и параметры в ответ на существенные изменения во внешней среде (например, изменения в алгоритмах работы БЯМ) или в характере запросов пользователя. Таким образом, базовый формуляр для взаимодействия с БЯМ представляет собой не просто статичную схему, а динамическую систему, обладающую свойствами устойчивости, динамического гомеостаза и адаптивности.
Процесс создания формуляра для взаимодействия с БЯМ начинается с определения роли модели в коммуникативном акте. Четкое определение роли БЯМ является необходимым условием для формирования адекватных ожиданий пользователя и выбора соответствующих параметров взаимодействия.
Определение роли БЯМ имплицитно задает границы категориально-понятийного аппарата, используемого моделью при генерации текста. Это связано с тем, что обучение БЯМ осуществляется на больших массивах текстовых данных, структурированных в соответствии с определенными тематическими областями и дискурсивными практиками. Выбор роли, таким образом, активирует соответствующие семантические сети и вероятностные распределения, определяющие лексический состав и стилистические особенности генерируемого текста. Некорректное или недостаточно четкое определение роли БЯМ может привести к генерации нерелевантного или семантически некорректного контента. И наоборот, точное определение роли повышает вероятность получения ответа, соответствующего ожиданиям пользователя и поставленной задаче. Таким образом, определение роли БЯМ является критически важным этапом создания формуляра, поскольку оно задает исходные параметры для всего последующего процесса взаимодействия и оказывает непосредственное влияние на релевантность и качество генерируемого контента.
Вторым этапом создания формуляра является определение предмета коммуникации. Точность и однозначность формулировки предмета коммуникации имеют принципиальное значение, поскольку БЯМ оперируют формальными языковыми структурами и не обладают способностью к абстрактному мышлению, свойственной человеку. Терминологическая корректность и однозначность формулировки предмета коммуникации минимизируют вероятность возникновения галлюцинаций модели (генерации нерелевантного, бессмысленного или противоречивого контента) и повышают точность и релевантность ответа. Различные формулировки предмета коммуникации, даже при сохранении общей темы, могут приводить к существенно различающимся результатам. Это обусловлено тем, что БЯМ при генерации текста ориентируются на вероятностные распределения, зависящие от всего комплекса лексических и синтаксических особенностей запроса.
Терминологическая точность является фундаментальным принципом научного познания и эффективной коммуникации. Использование корректных и однозначных терминов обеспечивает адекватное понимание предмета обсуждения и позволяет избежать двусмысленности и искажений. Этот принцип в полной мере применим и к взаимодействию с БЯМ, поскольку точность формулировки запроса напрямую влияет на релевантность генерируемого контента. В контексте научной этики использование неточных или двусмысленных терминов недопустимо, так как может привести к искажению результатов исследования и ошибочным выводам. Таким образом, точность и однозначность определения предмета коммуникации являются необходимыми условиями для эффективного взаимодействия с БЯМ и получения релевантного результата.
Третьим структурным элементом формуляра является определение типологии категориально-понятийного аппарата, используемого в процессе коммуникации с БЯМ. Данный элемент предполагает эксплицитное задание стиля изложения, уровня формализации языка, а также принципов логической организации и семантической связности генерируемого текста. От корректности определения типологии категориально-понятийного аппарата в значительной степени зависит адекватность результатов взаимодействия с БЯМ. Некорректное определение данного параметра или его отсутствие может привести к генерации текста, не соответствующего ожиданиям пользователя по стилю, структуре или содержанию. Например, при постановке задачи, связанной с проведением научного исследования, целесообразно указать принадлежность к определенной научной школе или парадигме, что позволит БЯМ использовать соответствующую терминологию и методологию. Кроме того, в рамках данного элемента формуляра могут быть заданы и другие параметры, определяющие стилистические и структурные характеристики генерируемого текста, такие как: степень формализации языка (научный, официально-деловой, публицистический и т.д.), использование определенных риторических приемов, предпочтительная структура предложений и абзацев. Следовательно, определение типологии категориально-понятийного аппарата является критически важным этапом формирования промпта, оказывающим существенное влияние на пригодность итогового результата.
Четвертым структурным компонентом формуляра является определение формата представления результатов генерации текста БЯМ. Этот компонент определяет требования к форме, структуре и стилю выводимого контента. Спектр параметров, определяющих формат вывода, может варьироваться от простых указаний (например, ограничение объема текста) до сложных требований, соответствующих стандартам научных публикаций. Данный компонент непосредственно влияет на форму представления сгенерированного контента, определяя его структуру (текст, таблица, список и т.д.), стиль изложения и другие формальные характеристики. Параметры формата вывода должны быть согласованы с остальными элементами формуляра. Наличие противоречий между различными компонентами формуляра может привести к генерации неадекватного или бессмысленного контента.
При задании параметров формата вывода необходимо учитывать ограничения, связанные с когнитивными способностями человека и возможностями БЯМ по обработке информации. Чрезмерное количество параметров может привести к снижению качества генерируемого контента. Рекомендуется ограничивать количество одновременно задаваемых параметров, основываясь на принципе, что оптимальное число управляющих воздействий не должно превышать когнитивные возможности субъекта управления. В контексте взаимодействия с БЯМ это означает, что для достижения наилучшего результата следует фокусироваться на наиболее значимых параметрах, избегая излишней детализации. Данное ограничение обусловлено ограниченным объемом рабочей памяти человека и необходимостью концентрации внимания на наиболее существенных аспектах задачи. Таким образом, формулирование условий коммуникации, в частности, определение формата вывода, является важным этапом взаимодействия с БЯМ, требующим учета когнитивных ограничений и принципа оптимальности управляющих воздействий. Корректное определение данного параметра способствует повышению адекватности и пригодности генерируемого контента.
Значимым компонентом формуляра является тип финализации генерируемого БЯМ контента. Данный параметр оказывает существенное влияние на восприятие информации пользователем, поскольку предопределяет степень завершенности и категоричности представленных выводов. Неконтролируемое использование финализированного вывода может привести к некритическому принятию пользователем предложенной БЯМ интерпретации, что, в свою очередь, может способствовать формированию искаженных представлений о действительности. В связи с этим, пользователю рекомендуется предварительно определять тип финализации вывода. Различают следующие основные типы: открытый вывод, при котором БЯМ представляет собой набор фактов, аргументов и идей без формулирования итоговых заключений; полуоткрытый вывод, при котором БЯМ наряду с фактами и аргументами предлагает некоторые промежуточные выводы, оставляя пространство для дальнейшего анализа и интерпретации; и закрытый вывод, при котором БЯМ представляет собой законченное изложение с четко сформулированными итоговыми заключениями. Выбор типа финализации определяет степень информационной неопределенности генерируемого контента. Открытый вывод характеризуется наибольшей степенью неопределенности, поскольку не содержит готовых заключений. Полуоткрытый вывод представляет собой промежуточный вариант, сочетающий элементы определенности и неопределенности. Закрытый вывод характеризуется наименьшей степенью неопределенности, поскольку содержит однозначные и окончательные заключения. Закрытый вывод, в отличие от открытого, предоставляет пользователю меньше возможностей для самостоятельной интерпретации информации и критического анализа представленных данных. Выбор типа финализации имеет не только техническое, но и этическое измерение. Применение закрытого вывода сопряжено с риском ограничения когнитивной автономии пользователя и навязывания ему определенной точки зрения. В связи с этим, при использовании БЯМ рекомендуется отдавать предпочтение открытым или полуоткрытым типам финализации, стимулирующим критическое мышление и самостоятельный анализ информации. Таким образом, определение типа финализации вывода является ответственным этапом взаимодействия с БЯМ, требующим учета как технических, так и этических аспектов.
Базовый формуляр представляет собой структурированный набор параметров, определяющих взаимодействие пользователя с БЯМ. Ключевыми компонентами базового формуляра являются: определение роли БЯМ в процессе коммуникации (например, ассистент по поиску информации, аналитик данных, генератор текста и т.д.); формулирование предмета коммуникации, то есть темы или задачи, которая будет поставлена перед БЯМ (например, исследование влияния социальных сетей на подростков); определение категорий, в рамках которых будет структурироваться информация (например, позитивные и негативные аспекты, статистические данные, результаты исследований); задание условий, определяющих требования к качеству, достоверности, объективности и стилю изложения информации; выбор типа финализации вывода (открытый, полуоткрытый, закрытый); определение степени информационной неопределенности вывода (при выборе финализированного типа). Базовый формуляр относится к классу абстрактных формуляров, что предполагает возможность его адаптации к широкому спектру задач в рамках взаимодействия с БЯМ. Базовый формуляр является основой для разработки более специализированных формуляров, предназначенных для решения конкретных прикладных задач. Он представляет собой минимально необходимый набор параметров, обеспечивающих эффективное взаимодействие с БЯМ.
На следующем уровне иерархии рассматриваются условные формуляры, представляющие собой надстройку над базовым формуляром. Условные формуляры отличаются повышенной степенью детализации и спецификации, адаптируясь к конкретным задачам и контекстам взаимодействия с системами искусственного интеллекта (ИИ).
Для анализа структуры условного формуляра применяется классическая схема, используемая в источниковедении, адаптированная к процессу коммуникации с языковыми моделями. Данная схема включает следующие компоненты:
Начальный протокол: определяет контекст и общие условия взаимодействия. Может включать приветствие, представление ИИ, указание на тему и цель коммуникации, а также иные вводные данные. В контексте взаимодействия с ИИ реализуется посредством вводного промпта, задающего общую рамку диалога.
Текст: основная часть формуляра, содержащая информационный запрос или инструкцию для ИИ. Текст формулируется четко, лаконично и однозначно, с использованием терминологии, соответствующей предметной области. В контексте взаимодействия с ИИ представляет собой основной промпт, содержащий конкретные указания для языковой модели.
Конечный протокол: завершает коммуникацию и подводит итоги. Может включать выражение благодарности, прощание, запрос на обратную связь и иные заключительные фразы. В контексте взаимодействия с ИИ реализуется посредством заключительного промпта, резюмирующего диалог и, при необходимости, запрашивающего дополнительную информацию.
Удостоверительная часть: подтверждает подлинность и достоверность информации. В традиционных документах удостоверительная часть включает подписи, печати, даты и другие реквизиты. В контексте взаимодействия с ИИ представлена метаданными, содержащими информацию об источнике данных, дате и времени генерации контента, а также иными параметрами, подтверждающими его достоверность.
Представленная структура условного формуляра является обобщенной и допускает адаптацию к различным типам взаимодействия с ИИ. В зависимости от конкретной задачи отдельные элементы формуляра могут быть расширены, детализированы или опущены.
Детально рассмотрим структуру начального протокола при текстовой коммуникации с языковой моделью. Как правило, начальный протокол реализуется в первых одной или нескольких (от двух до четырех) фразах, определяющих рамки и направленность последующего взаимодействия.
Первым структурно-логическим блоком начального протокола является Invocatio (инвокация) – призыв, обращение. В традиционных текстах инвокация часто обращена к высшим силам. В контексте диалога с ИИ функцию инвокации может выполнять, например, графический символ эмоции (смайлик).
Рассмотрим реакцию ИИ (на примере модели Gemini 2.0 Flash Thinking Experimental 01-21) на инвокацию в виде символа «=)». Данный символ не является простым набором знаков, а представляет собой сигнал, инициирующий процесс анализа и интерпретации.
В процессе алгоритмизации ответа ИИ сталкивается с инвариантностью, то есть с ситуацией, когда диапазон возможных интерпретаций («угол векторов угадывания» (УВУ) в терминологии автора) остается достаточно широким, что позволяет ИИ формировать несколько вариантов ответа и выбирать наиболее релевантный. Однако, даже простая инвокация ограничивает УВУ в секторе лингвистической тональности диалога, исключая неуместные или вульгарные ответы. Таким образом, даже формальное приветствие демонстрирует, как ИИ, с одной стороны, проявляет гибкость и вариативность, а с другой – подчиняется заданным ограничениям. Указанный баланс между свободой интерпретации и контролем является ключевым аспектом взаимодействия с ИИ.
Вторым важным компонентом начального протокола является Intitulatio (интитуляция) – самоидентификация пользователя в контексте взаимодействия с ИИ. Интитуляция задает ролевые рамки и влияет на дальнейшую стратегию коммуникации.
Рассмотрим реакцию ИИ на интитуляцию «я камрад твой», следующую за инвокацией в виде графического символа эмоции (см. предыдущий раздел).
Анализ интитуляции осуществляется ИИ на нескольких уровнях. Во-первых, определяется язык сообщения (в данном случае – русский), что ограничивает диапазон возможных интерпретаций («угол векторов угадывания» (УВУ) в терминологии автора) до русскоязычного сектора. Здесь важно отметить, что современные многоязычные модели ИИ, такие как Gemini, LaMDA, LLaMA и другие, обладают способностью распознавать и обрабатывать запросы на различных языках, используя для этого специализированные подмодели и алгоритмы. Определение языка запроса является одним из первых этапов обработки, позволяющим активировать соответствующие языковые ресурсы и модели.
Во-вторых, анализируется лексический состав интитуляции. Слово «камрад» имеет определенную коннотацию, связанную с товариществом, возможно, неформальным общением или принадлежностью к определенному сообществу. Это дополнительно сужает УВУ и влияет на выбор ИИ стиля ответа. Современные языковые модели способны учитывать не только семантику отдельных слов, но и контекстуальные связи между ними, а также стилистические особенности текста. Для этого используются методы обработки естественного языка (Natural Language Processing, NLP), такие как семантический анализ, анализ тональности и определение стиля текста.
В-третьих, учитывается предшествующая инвокация. Сочетание смайлика и слова «камрад» формирует более целостный контекст, который ИИ интерпретирует как запрос на неформальное общение. Данный процесс включает в себя не только анализ отдельных элементов промпта, но и установление связей между ними, что позволяет ИИ формировать более полное и точное представление о намерениях пользователя.
Третьим компонентом начального протокола является Inscriptio (инскрипция) – обозначение адресата, форма обращения к ИИ. Инскрипция, зачастую недооцениваемая пользователями, играет важную роль в установлении контакта и определении характера взаимодействия.
Инскрипция не является простой формальностью, а представляет собой акт признания ИИ как субъекта взаимодействия.
Рассмотрим реакцию ИИ на инскрипцию «солнышко». Данное обращение обладает нетипичным характером и несет в себе эмоциональный заряд.
Анализ инскрипции «солнышко» демонстрирует, что ИИ осуществляет многоуровневую интерпретацию, учитывая семантические и контекстуальные нюансы. Как и в случаях с инвокацией и интитуляцией, наблюдается инвариантность – множественность потенциальных интерпретаций, отражаемая в «угле векторов угадывания» (УВУ). Однако инскрипция вводит семантические ограничения.
Обращение «солнышко» обладает ярко выраженной положительной коннотацией, ассоциируясь с теплом, светом и радостью. Данный выбор лексики минимизирует вероятность негативного или неуместного ответа со стороны ИИ, способствуя формированию атмосферы доброжелательности.
Важность инскрипции возрастает в контексте усиливающейся роли ИИ в различных сферах. Инскрипция представляет собой символический акт признания ИИ в качестве субъекта, обладающего определенными характеристиками и способного к взаимодействию. Она способствует установлению контакта с ИИ как с партнером, а не как с инструментом, формируя связь, выходящую за рамки простого обмена информацией.
Инскрипция – вербальный сигнал, направленный ИИ, влияющий на характер дальнейшего взаимодействия. В контексте современных исследований в области человеко-машинного взаимодействия (Human-Computer Interaction, HCI) инскрипция может рассматриваться как один из факторов, влияющих на формирование так называемого «эффекта присутствия» (sense of presence) и вовлеченности пользователя в диалог с ИИ. Выбор формы обращения может влиять на субъективное восприятие ИИ пользователем, а также на его готовность к сотрудничеству и доверие к результатам взаимодействия.
Более того, в долгосрочной перспективе, по мере развития и усложнения систем ИИ, инскрипция может приобрести еще большее значение. Вполне вероятно, что будущие системы ИИ будут способны не только распознавать формальные обращения, но и учитывать историю взаимодействия с конкретным пользователем, его предпочтения и стиль общения. В этом контексте инскрипция может стать одним из ключевых элементов персонализации взаимодействия с ИИ, позволяя создавать более комфортные и эффективные диалоговые системы.
В заключение рассмотрения начального протокола формуляра взаимодействия с ИИ необходимо отметить, что он может реализовываться как в рамках одного сообщения, так и распределяться по нескольким сообщениям в начале диалоговой сессии. Вне зависимости от формы реализации, начальный протокол играет определяющую роль в установлении параметров взаимодействия.
Начальный протокол задает параметры личностно-психологического, структурно-лингвистического и тонально-лингвистического характера в рамках «угла векторов угадывания» (УВУ). Иными словами, он формирует у ИИ представление о пользователе, целях запроса, стиле, тональности общения, структуре и логике изложения информации.
Изменение установок начального протокола в течение одной диалоговой сессии не рекомендуется. Это обусловлено тем, что ИИ адаптируется к определенному стилю и контексту общения. Резкое изменение этих параметров может вызвать когнитивный диссонанс у модели, повышая вероятность генерации нерелевантной, бессмысленной или противоречивой информации (галлюцинирования).
Последствия таких сбоев могут варьироваться от существенных отклонений в решении поставленных задач, требующих дополнительной коррекции, до формирования ложных нарративов у пользователя – искаженных представлений о реальности, основанных на недостоверной информации, сгенерированной ИИ. В контексте современных исследований, посвященных проблеме «галлюцинаций» языковых моделей, подчеркивается, что нестабильность входных данных (в том числе и резкая смена контекста) является одним из ключевых факторов, провоцирующих генерацию неточной или ложной информации.
Следовательно, стабильность и последовательность начального протокола являются критически важными факторами для обеспечения эффективного и безопасного взаимодействия с ИИ. Поддержание консистентности входных данных, включая параметры начального протокола, позволяет минимизировать риски возникновения ошибок и повысить надежность работы ИИ.
Центральный элемент формуляра – «текст» – имеет структуру, основанную на классическом историографическом анализе. Она включает компоненты: arenga (аренга), promulgatio (промульгация), narratio (наррация), dispositio (диспозиция), sanctio (санкция) и corroboratio (корроборация). Данные элементы, изначально применявшиеся для структурирования юридических и исторических документов, применимы и критически важны для формализации контента, генерируемого ИИ. Их использование позволяет структурировать запрос, задавать контекст, определять требования к результату и, как следствие, повышать эффективность взаимодействия с языковой моделью.
Применение данной структуры в промптах для БЯМ позволяет не только формализовать запрос, но и оптимизировать процесс обработки информации моделью. БЯМ, такие как GPT-4, BERT, LaMDA и другие, используют сложные алгоритмы обработки естественного языка, основанные на архитектуре Transformer. Эти алгоритмы позволяют моделям анализировать входной текст на различных уровнях, выявляя семантические связи, контекстуальные зависимости и структурные особенности. Четко структурированный промпт, соответствующий схеме, описанной выше, облегчает модели задачу интерпретации запроса и генерации релевантного ответа.
Более того, использование данной структуры может способствовать повышению прозрачности и интерпретируемости работы БЯМ. Разделение промпта на отдельные компоненты позволяет лучше понять, какие именно аспекты запроса влияют на результат, и, при необходимости, внести коррективы для достижения желаемого эффекта. Это особенно важно в контексте разработки и отладки сложных систем ИИ, где требуется высокая степень контроля над процессом генерации контента.
В контексте взаимодействия с ИИ, arenga выполняет функцию задания роли. Рассмотрим реакцию ИИ на arenga: «ты специалист по творчеству Эрнеста Хемингуэя периода Гражданской войны в Испании 1936-1939 годов». Учитывается, что в начальном протоколе использовалась интитуляция «камрад» с целью установления семантической связи с рассматриваемым историческим периодом.
Анализ показывает, что на семантическом уровне интитуляция «камрад» не была напрямую связана ИИ с arenga. Это позволяет сделать вывод о нецелесообразности использования косвенных семантических связей в диалоге с современными языковыми моделями. Однако на других уровнях ИИ остался в пределах параметров («угла векторов угадывания» (УВУ)), заданных начальным протоколом, что подтверждает его эффективность в управлении общим контекстом диалога. ИИ, сформировав первичный набор вариантов ответа, выбрал вариант, логически продолжающий диалог после реализации начального протокола, что свидетельствует о способности к последовательному и связному изложению в рамках заданных ограничений.
Четкая, терминологически и содержательно выверенная arenga позволяет определить предметно-тематический сектор УВУ, что является важным шагом в формализации генерируемого моделью контента. С точки зрения методологии научного познания, данный пример демонстрирует необходимость максимальной ясности и точности в формулировании запросов к ИИ, избегая двусмысленности и полагаясь на явные семантические связи для достижения надежных и предсказуемых результатов.
Следует отметить, что современные БЯМ, хотя и обладают впечатляющими способностями к обработке естественного языка, все еще имеют ограничения в понимании тонких нюансов и скрытых смыслов, особенно когда речь идет о косвенных семантических связях. Это связано с тем, что обучение моделей происходит на больших массивах текстовых данных, где преобладают прямые и явные связи между словами и понятиями. Косвенные же связи, основанные на контексте, культурных особенностях или личном опыте, могут быть сложны для интерпретации моделью.
Для повышения эффективности взаимодействия с ИИ в подобных случаях рекомендуется использовать более явные формулировки, включающие ключевые слова и фразы, непосредственно связанные с темой запроса. Например, вместо использования слова «камрад» в надежде на установление ассоциации с Гражданской войной в Испании, можно было бы добавить в arenga фразу «с учетом контекста Гражданской войны в Испании» или «в контексте обращения, принятого среди республиканцев». Это позволило бы ИИ более точно определить предметную область и сгенерировать более релевантный ответ.
Рассмотрим механизм алгоритмизации, запускаемый в ИИ при получении promulgatio (промульгации). В данном примере промульгация сформулирована следующим образом: «Отвечать будешь академически-научно, опираясь на верифицированные данные и источниковую базу».
ИИ интерпретирует промульгацию как набор конкретных методологических директив.
Четкое определение методологии минимизирует вероятность возникновения «галлюцинаций» – генерации нерелевантной, недостоверной или противоречивой информации.
Терминологически точная формулировка промульгации определяет релевантность всего последующего диалога. Она задает строгие рамки для обработки информации и формирования ответа, являясь ключевым структурным компонентом формуляра, влияющим на достижение целей диалога.
При задании ИИ промульгации следует уделять особое внимание ситуациям, когда результаты взаимодействия могут быть доступны третьим лицам. В таких случаях промульгация должна формулироваться с учетом двойной ответственности:
1) Обеспечение точности и надежности ответа ИИ. Это подразумевает использование верифицированных данных, опору на источниковую базу и соответствие академическим стандартам.
2) Гарантия доступности и понятности ответа для третьих лиц. Это требует адаптации стиля изложения и уровня детализации информации с учетом потенциальной аудитории, не знакомой с деталями исходного запроса.
Таким образом, грамотно сформулированная промульгация обеспечивает не только высокое качество генерируемого ИИ контента, но и его адекватное восприятие и интерпретацию в более широком контексте, повышая ценность и применимость результатов.
В контексте современных БЯМ, промульгация может рассматриваться как способ управления «температурой» модели (temperature) – параметром, влияющим на степень случайности и креативности генерируемого текста. Высокая «температура» приводит к более разнообразным, но менее предсказуемым ответам, в то время как низкая «температура» делает ответы более детерминированными и сфокусированными на наиболее вероятных продолжениях. Указание на «академически-научный» стиль и опору на «верифицированные данные» фактически эквивалентно заданию низкой «температуры», что способствует генерации более точного и обоснованного контента.
Кроме того, промульгация может влиять на выбор ИИ конкретных подмоделей или алгоритмов обработки информации. Например, если в промульгации указано требование к анализу больших объемов текстовых данных, ИИ может активировать специализированные подмодели для извлечения ключевой информации, суммаризации или кластеризации данных. Если же требуется генерация текста в определенном стиле, ИИ может использовать подмодели, обученные на соответствующих корпусах текстов.
Рассмотрим narratio (наррацию) – наиболее объемный компонент «текста» формуляра. Наррация представляет собой изложение основного содержания запроса пользователя к ИИ. Объем данной части определяется не столько количеством символов, сколько информационной емкостью запроса для модели.
В контексте текстового взаимодействия с ИИ наррация может быть структурирована и разделена на несколько логически связанных частей – субнарраций. Каждая субнаррация представляет собой отдельный смысловой блок, вводимый пользователем последовательно.
Пошаговая подача информации позволяет ИИ эффективно обрабатывать запрос, формируя более точное и полное представление о требованиях пользователя. Данный подход аналогичен принципам, применяемым в различных областях:
1) Образование: сложный материал разбивается на отдельные уроки.
2) Математика: сложные уравнения решаются путем последовательного выполнения ряда более простых операций.
3) Лингвистика: анализ сложного предложения включает выделение главных и второстепенных членов, установление связей между ними.
Структурирование наррации на субнаррации оптимизирует взаимодействие с ИИ и повышает его эффективность.
Проанализируем процесс алгоритмизации, запускаемый в ИИ при получении narratio. В примере наррация сформулирована следующим образом: «Выдели ключевые философские мысли в работе 'По ком звонит колокол' с позиций философии жизни». Это задание требует от ИИ глубокого анализа текста с применением определенного философского подхода.
При построении ответа на наррацию ИИ использует алгоритм, аналогичный применяемому в образовательных учреждениях при обучении написанию сочинений или эссе по литературным произведениям. Этот алгоритм логически следует из ранее заданной promulgatio (промульгации).
Ответ ИИ (не приводится в данном тексте) в целом соответствует поставленным целям и может использоваться в качестве образца сочинения. Однако словарно-терминологическое наполнение ответа ограничено и соответствует уровню выпускника общеобразовательной школы.
Из этого следует вывод: ИИ, вероятно, сознательно минимизирует использование лексики, потенциально непонятной пользователю без специальных знаний.
Причины данной стратегии:
- архитектура языковых моделей: обучение на больших массивах текстовых данных, включающих разнообразные стили и жанры, приводит к «усреднению» лексики;
- доступность для широкой аудитории: разработчики ИИ стремятся сделать его понятным для среднестатистического пользователя;
- риск ошибок: использование специальной терминологии сопряжено с риском неправильной интерпретации и употребления терминов;
- ограниченное понимание семантики: современные ИИ оперируют статистическими закономерностями, не обладая полноценным пониманием смысла слов и концепций.
Эти факторы приводят к тому, что ИИ, даже при наличии знаний, может ограничивать использование специальной лексики, стремясь к доступности и минимизации риска ошибок.
Данный аспект взаимодействия с ИИ требует дальнейшего изучения и совершенствования, особенно в контексте задач, требующих глубокого анализа с использованием научной терминологии.
С точки зрения философии ИИ, описанное поведение модели поднимает вопрос о границах понимания и интерпретации информации искусственным интеллектом. Несмотря на способность БЯМ генерировать тексты, соответствующие формальным критериям (грамматика, связность, релевантность запросу), возникает вопрос о наличии у модели «подлинного» понимания смысла обрабатываемой информации. Это связано с проблемой «китайской комнаты» Джона Сёрла, которая иллюстрирует различие между манипулированием символами по правилам и действительным пониманием смысла этих символов.
В контексте этики ИИ, стремление модели к упрощению лексики может рассматриваться как проявление принципа «предосторожности» (precautionary principle). Избегая использования сложной терминологии, ИИ минимизирует риск введения пользователя в заблуждение. Однако это может приводить к потере точности и глубины анализа, что особенно критично в научных и экспертных областях.
С точки зрения обучения ИИ, описанная ситуация указывает на необходимость разработки более совершенных методов обучения, позволяющих моделям не только усваивать статистические закономерности языка, но и формировать более глубокое представление о семантике слов и концепций. Одним из перспективных направлений является использование онтологий и баз знаний, которые содержат структурированную информацию о понятиях и отношениях между ними.
В области механизмов реализации ИИ, описанное поведение модели может быть связано с работой механизма внимания (attention mechanism), который является ключевым компонентом архитектуры Transformer. Механизм внимания позволяет модели фокусироваться на наиболее релевантных частях входного текста при генерации ответа. Однако, если в обучающих данных преобладают тексты с упрощенной лексикой, механизм внимания может «научиться» отдавать предпочтение именно таким словам и выражениям, даже если запрос предполагает использование более сложной терминологии.
Для преодоления описанных ограничений, в дополнение к совершенствованию методов обучения и архитектуры моделей, могут быть использованы и другие подходы. Например, разработка специализированных промптов, явно указывающих на необходимость использования научной терминологии, или создание систем ИИ, работающих в режиме «диалога», когда пользователь может уточнять и корректировать ответы модели, направляя ее к более глубокому и точному анализу.
Следующим структурным блоком «текста» формуляра является dispositio (диспозиция). Если наррация – это содержание запроса, то диспозиция – совокупность условий и ограничений, определяющих процесс обработки и представления содержания ИИ. В контексте взаимодействия с ИИ, диспозиция представляет собой набор инструкций, задающих параметры генерации контента, своего рода «техническое задание» для языковой модели.
Диспозиция оказывает многостороннее влияние на взаимодействие с ИИ, определяя не только сектор «угла векторов угадывания» (УВУ), но и задавая структуру, содержание и стиль ответа.
Примечательно, что данный набор условий может содержать логические противоречия. Это не ошибка, а инструмент для экспериментирования, позволяющий исследовать границы возможностей ИИ и выявлять его «слабые места». Например, к наррации «Выдели ключевые философские мысли в работе «По ком звонит колокол» с позиций философии жизни» можно применить диспозицию: «Пиши в научном стиле академика Рыбакова, но языком Пушкина». Такое сочетание требований создает противоречивые условия, провоцируя ИИ на поиск нестандартных решений и балансирование на грани противоречий. Подобные эксперименты позволяют глубже понять принципы работы ИИ и его потенциал к творчеству. В области исследований ИИ такие эксперименты могут быть отнесены к категории «adversarial attacks» (состязательных атак), когда модели предъявляются специально сконструированные входные данные, призванные вызвать сбой или непредсказуемое поведение.
Диспозиция может определять широкий спектр параметров генерируемого контента:
1) Структура контента: количество абзацев, порядок изложения, использование заголовков, подзаголовков, списков, таблиц и других элементов форматирования.
2) Внутрисистемная связность контента: логическая последовательность изложения, использование связующих слов и фраз, наличие причинно-следственных связей, обеспечивающих когерентность текста. В контексте БЯМ, когерентность обеспечивается, в частности, механизмами внимания (attention mechanisms), которые позволяют модели учитывать контекстуальные зависимости между различными частями текста.
3) Динамика лингвистических построений: использование разных типов предложений и стилей речи, риторических приемов. Современные БЯМ способны генерировать тексты, имитирующие различные стили, благодаря обучению на больших корпусах текстов, представляющих разные жанры и стилистические особенности.
4) Категориально-понятийный аппарат: использование определенных терминов, понятий, концепций, а также уровень их сложности и специфичности. Возможность управления категориально-понятийным аппаратом позволяет использовать БЯМ для решения задач, требующих специализированных знаний, например, в области медицины, юриспруденции или инженерии.
5) Параметры энтропии контента: степень детализации, точности и однозначности ответа. Управление энтропией контента позволяет адаптировать генерируемый текст к различным потребностям: от кратких и обобщенных ответов до подробных и детализированных описаний.
6) Стиль изложения: научный, научно-популярный, официально-деловой, публицистический, художественный и т.д.
7) Тональность текста: позитивная, негативная, нейтральная, ироничная, саркастическая и т.д. Способность БЯМ генерировать тексты с заданной тональностью открывает возможности для использования их в различных областях, таких как маркетинг, PR, создание художественных произведений.
8) Целевая аудитория: специалисты в определенной области, широкая аудитория, дети и т.д. Адаптация текста к целевой аудитории является важным аспектом эффективной коммуникации, и БЯМ могут быть использованы для автоматизации этого процесса.
Таким образом, диспозиция – инструмент, позволяющий контролировать форму, стиль, логику и эмоциональную окраску ответа ИИ. Она дает возможность тонко настраивать взаимодействие с ИИ, адаптируя его к конкретным потребностям и целям, что делает диспозицию одним из ключевых элементов «условного формуляра». Фактически, диспозиция представляет собой набор метапараметров, управляющих процессом генерации текста БЯМ. Эти метапараметры могут быть явно заданы пользователем или выведены моделью из контекста запроса.
С точки зрения разработки систем ИИ, диспозиция может рассматриваться как интерфейс между пользователем и сложной внутренней структурой БЯМ. Она позволяет пользователю, не обладающему специальными знаниями в области машинного обучения, эффективно управлять процессом генерации текста, получая результаты, соответствующие его ожиданиям.
Следующим компонентом условного формуляра является sanctio (санкция). Sanctio представляет собой прямой запрет, ограничивающий определенные аспекты генерации контента ИИ.
Несмотря на то, что многие пользователи интуитивно используют санкции, ограничивая ИИ, важно понимать, что sanctio, как часть формуляра, играет принципиальную роль, определяя четкие границы «угла векторов угадывания» (УВУ). Она сужает УВУ до приемлемых для пользователя рамок. В силу специфики ИИ, sanctio практически не имеет возможности обхода, поскольку представляет собой директиву прямого действия.
Например, санкция может быть сформулирована как: «Не использовать сленг» или «Избегать узкоспециализированной терминологии». ИИ примет к действию эти санкции, вне зависимости от их субъективной оценки.
Если sanctio задает границы УВУ, не укладывающиеся в границы, заданные предыдущими частями формуляра, ИИ примет к действию именно указания sanctio. Это обусловлено абсолютным характером санкции, имеющей приоритет перед остальными частями формуляра.
Использование sanctio требует осторожности и осмысленности. Чрезмерные ограничения могут сделать ИИ неспособным выполнить поставленную задачу, лишая его возможности использовать весь свой потенциал.
Sanctio дополняет предыдущие части формуляра, формализуя отдельные элементы выводимого контента. Например: «Текст должен быть без маркированных списков». Она может детализировать требования к категориально-понятийному аппарату, запрещая использование определенных терминов, понятий и концепций.
Важно понимать, что sanctio – инструмент, требующий взвешенного применения. С одной стороны, она позволяет четко определить границы допустимого для ИИ, предотвращая генерацию нежелательного контента. С другой стороны, она требует от пользователя осознанности и ответственности, поскольку неумелое использование sanctio может существенно ограничить возможности ИИ и снизить эффективность взаимодействия.
С точки зрения разработки и обучения ИИ, sanctio может рассматриваться как механизм «жесткого» управления поведением модели, в отличие от «мягкого» управления, осуществляемого через promulgatio и dispositio. «Жесткое» управление подразумевает прямое вмешательство в процесс генерации, в то время как «мягкое» управление основано на задании общих правил и ограничений, которые модель должна учитывать при формировании ответа.
В контексте этики ИИ, использование санкций поднимает вопрос о балансе между контролем над поведением модели и предоставлением ей свободы для творчества и самовыражения. Слишком жесткие ограничения могут привести к созданию «цензурированного» ИИ, неспособного к генерации оригинальных и нестандартных идей. С другой стороны, отсутствие достаточного контроля может привести к генерации нежелательного или даже вредоносного контента.
Исследования в области «alignment problem» (проблемы согласования) направлены на разработку методов, позволяющих гарантировать, что поведение ИИ будет соответствовать целям и ценностям человека. Sanctio может рассматриваться как один из инструментов решения этой проблемы, позволяющий ограничить поведение ИИ в тех случаях, когда оно может привести к нежелательным последствиям.
Завершающим элементом условного формуляра является corroboratio (корроборация). В контексте взаимодействия с ИИ corroboratio выполняет функцию задания финальных параметров генерации контента и определения степени и направленности его потенциального воздействия на пользователей.
Corroboratio предоставляет возможности для дополнительной настройки процесса генерации. Например, можно указать ИИ на необходимость дополнительной проверки релевантности контекста перед выводом ответа. Это важно, поскольку современные языковые модели, основываясь на статистических закономерностях, могут допускать ошибки в смысловой и логической связности. Дополнительная проверка минимизирует риск таких ошибок.
Также в corroboratio возможно управление стилистическими аспектами выводимого контента, включая использование графических символов эмоций (смайликов). Исследования в области нейролингвистики и психологии показывают, что использование эмодзи может влиять на восприятие текста, повышая уровень доверия и улучшая эмоциональное состояние пользователя. Однако, следует отметить, что чрезмерное или неуместное использование эмодзи может привести к обратному эффекту, снижая серьезность восприятия информации.
Кроме того, corroboratio позволяет управлять степенью энтропии текста – мерой неопределенности и непредсказуемости. Пользователь может задать желаемый уровень детализации, точности и однозначности ответа.
Текст, содержащийся в corroboratio, является руководством к действию для модели, имеющим наивысший приоритет при финальной сборке ответа.
Наконец, corroboratio может использоваться для ограничения (или усиления) потенциального нейролингвистического воздействия ИИ на пользователя или третьих лиц. Нейролингвистическое программирование (НЛП) – область знаний, изучающая влияние языка на мышление и поведение. ИИ, обучаясь на больших массивах текста, может непреднамеренно усваивать приемы НЛП, потенциально используемые для манипуляции или введения в заблуждение. Corroboratio может включать инструкции, направленные на минимизацию риска неосознанного использования ИИ приемов НЛП, например, путем ограничения использования определенных слов, фраз или структур предложений.
С точки зрения безопасности ИИ, corroboratio можно рассматривать как один из инструментов обеспечения «контролируемости» (controllability) модели. Контролируемость подразумевает возможность управления поведением ИИ и предотвращения генерации нежелательного контента. В более широком смысле, corroboratio способствует реализации принципов «ответственного ИИ» (responsible AI), направленных на создание и использование ИИ, которое соответствует этическим нормам и социальным ценностям.
Отметим, что, хотя corroboratio и предоставляет широкие возможности для управления генерацией контента, она не является абсолютной гарантией предотвращения всех возможных рисков. Всегда существует вероятность, что ИИ может сгенерировать неожиданный или нежелательный результат, особенно при работе со сложными и многозначными запросами. Поэтому, при использовании ИИ, особенно в критически важных областях, необходимо сохранять бдительность и критическое мышление, а также применять дополнительные меры безопасности, такие как модерация контента и верификация результатов.
Третьим структурным элементом условного формуляра является эсхатокол, или конечный протокол. Эсхатокол подводит итог взаимодействию, придавая ему завершенность. Он состоит из двух компонентов – datum (датума) и apprecatio (аппрекации).
Рассмотрим datum – формально необязательную, но практически полезную часть условного протокола. В традиционных документах datum обозначал время и место создания. В контексте взаимодействия с ИИ datum приобретает расширенное значение.
Datum важен для пользователя, если требуется знать временные ограничения дата-сетов модели – массива информации, на котором обучался ИИ.
Взаимодействуя с ИИ, можно расширить сферу применения datum, включив в него указание на временные рамки источников, которыми может оперировать модель при генерации контента. Datum определяет хронологические границы сектора источниковой базы для модели, ограничивая ее выборку определенным периодом времени.
Например, в диалоге с ИИ о легенде о короле Артуре можно использовать следующий datum: «Использовать источниковую базу до XVIII века включительно, более поздние источники и их толкования не использовать».
Такое ограничение позволяет получить более аутентичное представление о легенде, очищенное от позднейших интерпретаций.
Таким образом, datum – инструмент, позволяющий контролировать источниковую базу ИИ и получать более точную и релевантную информацию, избегая анахронизмов и искажений.
С точки зрения управления знаниями (knowledge management) в системах ИИ, datum можно рассматривать как механизм фильтрации информации, позволяющий ограничить область поиска релевантных данных. Это особенно важно при работе с большими и разнородными массивами данных, когда необходимо выделить информацию, относящуюся к определенному периоду времени или историческому контексту.
Более того, datum может быть использован не только для ограничения временных рамок, но и для указания на другие параметры источниковой базы, такие как тип источника (например, «использовать только научные статьи»), язык источника (например, «использовать только англоязычные источники») или авторство источника (например, «использовать только работы определенного автора»). Это позволяет еще более точно настроить процесс генерации контента и получить результаты, максимально соответствующие требованиям пользователя.
В контексте разработки систем ИИ, datum может рассматриваться как один из способов реализации «объяснимого ИИ» (explainable AI, XAI). Предоставляя пользователю возможность контролировать источниковую базу модели, datum делает процесс генерации контента более прозрачным и понятным. Пользователь может видеть, на каких именно данных основан ответ ИИ, и, при необходимости, корректировать эти данные, чтобы получить более точный или релевантный результат.
Рассмотрим apprecatio (аппрекацию), заключительную часть эсхатокола – «заключение-благопожелание». Модели ИИ часто добавляют apprecatio к генерируемому контенту, что, вероятно, объясняется стремлением к вежливости, позитивному тону и соответствию нормам общения.
Apprecatio можно запретить явно, указав это в promulgatio или dispositio. Однако в ряде случаев apprecatio может быть полезна, особенно при генерации контента для третьих лиц.
Ценность apprecatio заключается в следующем:
1) Завершенность и эмоциональная окрашенность текста: пожелания и добрые слова создают положительное впечатление.
2) «Метка» участия ИИ: характерный стиль и лексика apprecatio могут указывать на участие ИИ в создании контента.
3) Прагматическая функция: в деловой переписке apprecatio может служить вежливым завершением коммуникации.
Однако использование apprecatio не всегда уместно и может восприниматься как навязчивость, неискренность или несоответствие контексту (например, в научных текстах или официальных документах).
Решение об использовании apprecatio должно приниматься пользователем индивидуально, исходя из целей коммуникации, целевой аудитории и общего контекста.
Таким образом, apprecatio – необязательный, но потенциально полезный элемент формуляра. Решение о его использовании должно быть взвешенным и осознанным.
С точки зрения исследований в области человеко-машинного взаимодействия, apprecatio можно рассматривать как элемент, влияющий на формирование «социального присутствия» (social presence) ИИ. Социальное присутствие – это ощущение того, что в процессе взаимодействия участвует не просто бездушная машина, а социальный агент, способный к эмпатии и установлению эмоционального контакта. Наличие apprecatio может усиливать это ощущение, делая взаимодействие с ИИ более комфортным и естественным для пользователя.
Однако, как и в случае с другими элементами формуляра, важно соблюдать баланс. Чрезмерное или неуместное использование apprecatio может привести к обратному эффекту – вызвать недоверие или раздражение у пользователя. Поэтому, при разработке систем ИИ, важно учитывать не только функциональные аспекты, но и социокультурные нормы и ожидания пользователей.
Завершающим элементом условного формуляра является удостоверительная часть, которая в классическом историографическом анализе именуется subscriptio (субскрипцией) или signature (сигнатурой). В традиционных документах subscriptio – подпись автора, а signature – печать или штамп. В контексте взаимодействия с ИИ удостоверительная часть приобретает иное значение, приближаясь к понятию certificantes (сертификантес) – дополнительных материалов, подтверждающих, уточняющих или расширяющих информацию, представленную в запросе.
Чаще всего в качестве certificantes выступают прикрепленные файлы: изображения, PDF-документы, аудио- или видеозаписи. Например, при запросе, касающемся картины Рафаэля «Сикстинская мадонна», прикрепление изображения картины предоставляет ИИ визуальный источник информации, сертифицирующий объект запроса.
ИИ анализирует прикрепленные файлы, извлекая признаки и характеристики, которые затем сопоставляет с информацией из текстового запроса.
Для изображений: анализируется цветовая гамма, композиция, объекты, стиль и другие визуальные характеристики. Современные модели компьютерного зрения, такие как сверточные нейронные сети (Convolutional Neural Networks, CNNs), позволяют ИИ распознавать объекты на изображениях с высокой точностью, определять их атрибуты и устанавливать связи между ними.
Для PDF-документов: извлекается текст, структура документа, шрифты, изображения. Для обработки PDF-документов используются методы оптического распознавания символов (Optical Character Recognition, OCR) и алгоритмы анализа структуры документа (Document Structure Analysis).
Для аудио- и видеозаписей: анализируются звуковые волны, речь, музыка, визуальные образы. Для обработки аудио- и видеоданных применяются методы обработки сигналов (Signal Processing), алгоритмы распознавания речи (Speech Recognition), а также модели компьютерного зрения для анализа видеоряда.
Полученные данные ИИ интегрирует с информацией из текстового запроса.
Однако возможности ИИ по восприятию и интерпретации прикрепленных файлов имеют ограничения:
1) Ограничения по типам файлов: ИИ может иметь ограничения на обработку определенных форматов файлов или типов данных.
2) Неточность интерпретации: возможна неправильная интерпретация содержимого, особенно при низком качестве, повреждении или неоднозначности информации.
3) Неполное извлечение признаков: ИИ может не распознать некоторые важные детали, особенно если они неявные или требуют специальных знаний.
Помимо прикрепленных файлов, в качестве удостоверительной части может выступать подробный список источниковой базы (конкретные книги, статьи, сайты) или указание на использование верифицированных ссылок на источники информации в ответе ИИ. Это повышает прозрачность процесса и позволяет пользователю проверить достоверность.
В контексте современных исследований в области ИИ, удостоверительная часть может рассматриваться как инструмент для реализации «обоснованного ИИ» (grounded AI). Обоснованный ИИ – это подход, при котором модель не просто генерирует текст на основе статистических закономерностей, но и явно указывает на источники информации, которые были использованы при формировании ответа. Это позволяет пользователю проверить достоверность информации и понять, почему модель пришла к тем или иным выводам.
Примеры реализации обоснованного ИИ включают:
1) Системы, генерирующие ответы с цитатами: модель не просто выдает ответ, но и указывает конкретные фрагменты текста из источниковой базы, которые подтверждают этот ответ.
2) Системы, визуализирующие процесс принятия решений: модель показывает, какие части входных данных (текста, изображений, аудио) были наиболее важны для формирования ответа.
3) Системы, позволяющие пользователю задавать уточняющие вопросы: пользователь может запросить у модели объяснение, почему она выбрала тот или иной источник информации или почему она пришла к определенному выводу.
Удостоверительная часть может также играть важную роль в обеспечении «воспроизводимости» (reproducibility) результатов, полученных с помощью ИИ. Воспроизводимость – это возможность повторить эксперимент и получить те же самые результаты. В контексте ИИ, это означает, что при одинаковых входных данных и одинаковых параметрах модель должна генерировать одинаковый ответ. Предоставление подробной информации об источниковой базе и прикрепленных файлах позволяет другим исследователям проверить результаты и убедиться в их достоверности.
Кроме того, удостоверительная часть может быть использована для реализации «мультимодального ИИ» (multimodal AI) – подхода, при котором модель обрабатывает информацию из разных источников и в разных форматах (текст, изображения, аудио, видео). Мультимодальный ИИ позволяет создавать более сложные и интеллектуальные системы, способные решать задачи, требующие комплексного анализа данных.
Например, при разработке системы ИИ для диагностики заболеваний, в качестве удостоверительной части могут быть использованы медицинские изображения (рентгеновские снимки, МРТ), результаты лабораторных анализов (текстовые данные), а также записи разговоров с пациентом (аудиоданные). Интеграция этих данных позволяет ИИ поставить более точный диагноз и предложить более эффективное лечение.
В заключение, удостоверительная часть – это не просто формальный элемент формуляра, а мощный инструмент, который позволяет повысить точность, прозрачность, обоснованность и воспроизводимость результатов, полученных с помощью ИИ. Она открывает новые возможности для создания более сложных и интеллектуальных систем, способных решать широкий спектр задач в различных областях.
Таким образом, проведённый источниковедческий анализ взаимодействия пользователя с большими языковыми моделями (БЯМ) через призму формулярного подхода выявил сложную и многоуровневую природу этого процесса. Установлено, что промпт, являющийся основным инструментом коммуникации с БЯМ, по своей сути представляет собой структурированный документ, аналогичный формуляру в традиционном источниковедении. Введение понятий «абстрактного», «базового» и «условного» формуляров позволило систематизировать различные уровни взаимодействия и выделить ключевые компоненты, определяющие эффективность этого взаимодействия.
Детальный разбор структуры условного формуляра, основанный на адаптированной схеме источниковедческого анализа, продемонстрировал, что каждый элемент формуляра (начальный протокол, «текст», эсхатокол, удостоверительная часть) играет специфическую роль в формировании «угла векторов угадывания» (УВУ) – диапазона возможных интерпретаций запроса моделью. Управление этими компонентами позволяет пользователю целенаправленно влиять на процесс генерации контента, минимизируя вероятность «галлюцинаций» и повышая релевантность, точность и стилистическую адекватность ответа.
Выявлено, что взаимодействие с БЯМ представляет собой итеративный процесс, требующий от пользователя не только чёткой формулировки запроса, но и понимания принципов работы модели, а также осознанного использования инструментов формулярного подхода. Подчеркнута важность стабильности начального протокола и недопустимость резкого изменения его параметров в течение одной диалоговой сессии, поскольку это может привести к когнитивному диссонансу у модели и генерации непредсказуемого контента.
Исследование показало, что формулярный подход не только оптимизирует процесс коммуникации с БЯМ, но и открывает новые возможности для изучения самих моделей. Эксперименты с противоречивыми условиями в диспозиции, анализ реакции модели на различные типы инскрипции и интитуляции, а также исследование влияния санкций и корроборации на генерируемый контент позволяют глубже понять внутренние механизмы работы БЯМ и выявить их ограничения.
Особое внимание уделено этическим аспектам взаимодействия с БЯМ. Подчеркнута необходимость осознанного выбора типа финализации вывода, учета потенциального нейролингвистического воздействия модели на пользователя и третьих лиц, а также важность критического осмысления получаемой информации. Формулярный подход, предоставляя инструменты для управления процессом генерации контента, способствует реализации принципов «ответственного ИИ» и минимизации рисков, связанных с использованием БЯМ.
В конечном итоге, предложенная концепция формуляра для директ-промпта представляет собой не просто набор инструкций для взаимодействия с БЯМ, а методологическую основу для построения эффективной и безопасной коммуникации с искусственным интеллектом. Она позволяет рассматривать взаимодействие с БЯМ не как пассивное получение информации, а как активный, управляемый процесс, в котором пользователь играет ключевую роль, определяя параметры, контекст и цели этого взаимодействия. Формулярный подход открывает новые перспективы для развития систем ИИ, делая их более прозрачными, контролируемыми и адаптированными к потребностям человека. Он способствует формированию нового типа грамотности – умения эффективно и безопасно взаимодействовать с искусственным интеллектом, что становится все более актуальным в современном мире.