2 подписчика

Юриспруденция & ChatGPT и другие. Инструменты GPT

30 декабря 202430 дек 2024

6 мин

Части 1, 2, 3, 4-1, 4-2, 5, 6, 7, 8, 9, Стремительное развитие GPT-технологии вызывает наслоение информации о ней. Вот и OpenAI уже свое развитие не связывает с ChatGPT и развитие направления планирует под названием «o1», где цифра 1 означает первая в направлении, предлагая модели с названием «o1-mini», «o1-preview», «o1 pro mode». В новых версиях успешность ответа, в некоторых направления, выросла на 70%, по сравнению с GPT-4o. Достаточно четко оформились со стоимостью работы с этими системами 200 долларов США в месяц, при объеме 50 запросов в день к «o1-mini», в какой мере смог понять уровень связи заявлений. Существенное увеличение предполагается и к объему отдельного запроса и подключение к решению ресурсоемких задач (We’ll be adding capabilities to Pro over time to unlock more compute-intensive tasks), в том числе в области анализа судебной практики (case law analysis). Вторым ярким примером служит решение от Claude 3.5 Sonnet по управлению рабочим столом и текстовыми приложениями

Части 1, 2, 3, 4-1, 4-2, 5, 6, 7, 8, 9,

Стремительное развитие GPT-технологии вызывает наслоение информации о ней. Вот и OpenAI уже свое развитие не связывает с ChatGPT и развитие направления планирует под названием «o1», где цифра 1 означает первая в направлении, предлагая модели с названием «o1-mini», «o1-preview», «o1 pro mode». В новых версиях успешность ответа, в некоторых направления, выросла на 70%, по сравнению с GPT-4o. Достаточно четко оформились со стоимостью работы с этими системами 200 долларов США в месяц, при объеме 50 запросов в день к «o1-mini», в какой мере смог понять уровень связи заявлений. Существенное увеличение предполагается и к объему отдельного запроса и подключение к решению ресурсоемких задач (We’ll be adding capabilities to Pro over time to unlock more compute-intensive tasks), в том числе в области анализа судебной практики (case law analysis).

Вторым ярким примером служит решение от Claude 3.5 Sonnet по управлению рабочим столом и текстовыми приложениями в режиме чат-бота, через текстовые обращения, правда пока по API. Чтобы читатель мог представить сложность задачи, приведу пример. Представьте, что вы находитесь в транспортном потоке на автомобиле, далеко от офиса. В этот момент звонит помощник и сообщает, что поступил важный запрос и на него необходимо ответить, причем ответ составить можете только вы. Вы просите помощника сесть за ваш компьютер и начинаете проговаривать ему инструкции, как найти необходимый файлы у вас, что отобразить в тех или иных местах документа-ответа. Тот, кто попадал в такую ситуацию, подтвердит мои слова о том, что если в нормальном режиме такой документ составляется за 10 минут, то в режиме удаленного голосового управления это составит не менее полутора часов. Дополнительно потраченное время уйдет на формулирование выражений того о чем не задумываешься, делая сам. На проверку сделанного помощником и понимание его ответов и т.д.

В подобной представленной ситуации всегда возникает вопрос, как не запутаться в этих наслоениях информации. Для этого попробую представить упрощенное дерево событий, по которому можно ориентироваться, откуда возникло то или иное понятие.

В начале, опираясь п. 5б «Национальной стратегией развития искусственного интеллекта на период до 2030 года» утверждённой указом Президента РФ от 10.10.2019 N 490 «О развитии искусственного интеллекта в Российской Федерации» представим направления технологии ИИ:

1. Компьютерное зрение.

2. Обработку естественного языка.

3. Распознавание и синтез речи.

4. Интеллектуальную поддержку принятия решений.

5. Перспективные методы искусственного интеллекта методы. Методы, направленные на создание принципиально новой научно-технической продукции, в том числе в целях разработки универсального (сильного) искусственного интеллекта:

5.1. Автономное решение различных задач;

5.2. Автоматический дизайн физических объектов;

5.3. Автоматическое машинное обучение;

5.4. Алгоритмы решения задач на основе данных с частичной разметкой и (или) незначительных объемов данных;

5.5. Обработка информации на основе новых типов вычислительных систем, интерпретируемая обработка данных и другие методы.

Как видим, применяемая в банках технология биометрической идентификации «Оплата улыбкой» и голосовая идентификация применяют различный программный продукт и, по сути, дублируют друг друга. Но вот в то же время введенная компанией Битрикс24 технология обработки голосовой речи, которая позволяет формировать текст и разносить значения по необходимым ячейкам таблицы уже комплексные, дополняющие друг друга технологии. Предложенная Битрикс24 функция в начале распознает голос и формирует текст, а затем аналогично описанному в «Систематизация» (https://zakon.ru/blog/2024/12/06/yurisprudenciya__chatgpt_i_drugie_sistematizaciya_1) процессу, формирует таблицу базы данных для задания, возникшего в результате телефонного общения с клиентом.

Рассмотрев горизонты направлений ИИ посмотрим вглубь исторического развития. Простая схема развития, по моему разумению, выглядит списком ниже.

1. Этап становления нейронных сетей. Ярким примером являются сети способные после обучения, с высокой надежностью, определять какому автору, или какому стилю относится представленный текст. На первых этапах требовало достаточно глубоких знаний IT-технологий. Сейчас это сделать попроще, через colab.research.google можно запустить работу Jupyter Notebook и проектировать нейронные сети. Но этот инструмент требует приличной подготовки в программировании.

2. Обработка текстов на естественном языке. Алгоритмы полученные в результате симбиоза технологий машинного обучения и интеллектуального анализа текста. В этой области примерами достижений можно считать:

2.1. Категоризация текстов.

2.2. Классификация последовательностей символов.

2.3. Распознавание именованных сущностей. Пример. Высказывание: «В кустах находился красный рояль». Сущность «рояль» - музыкальный инструмент; «красный» - один из наименованных диапазонов электромагнитного излучения видимых человеческим глазом; «кусты» - объект растительного происхождения, существующий на видимой поверхности.

2.4. Определение частей речи слов.

2.5. Распознавание фраз.

2.6. Извлечение информации из текста.

2.7. Синтаксическая аннотация (ГОСТР ИСО 24615-2013).

2.8. Семантическая аннотация (Анализ тональности текста).

3. GPT-системы и технологии трансформеров которую предложили в статье «Attention is All You Need» Ашиш Васвани, Нойша Шарма, Николаус Пейпс, Джейкоб Эпплбаум и другие в 2017 году (перевод на русский. Пример ее работы можно увидеть в «Криминалистическое описание».

Значимым инструментов в общении с GPT-системами является разметка промпта. Единственное замечание используйте ее однотипно на протяжении всего сеанса, то есть не меняйте ее функциональное назначение по мере формирования сеанса. Она может быть:

1) Естественной, через правила правописания используемого языка;

2) Составленная вами, на основе вашего опыта. Допустим через использования ПРОПИСНЫХ букв, неиспользуемых комбинаций служебных знаков «::» и многое другое.

3) На основе языков программирования Python, SQL и другие.

Следующим важным аспектом является инструмент общения с GPT-системами. Видов интерфейса всего два:

1. Обыкновенный пользовательский интерфейс браузера или окна мессенджера. Доступный и понятный всем пользователям инструмент взаимодействия.

2. API (a pplication p rogramming i nterface) – программный интерфейс используемый специалистами IT-отрасли. Достаточно не простая вещь, но в принципе доступная обычному пользователю.

Ну и обязательно следует учитывать, так сказать «наклонности» GPT-систем:

1. Это меры, которые предприняты на уровне обучения не использовать «язык вражды».

2. Иногда очень явный перекос в обучении вызванный, не релевантной загрузкой обучающих текстов. Для юристов это особенно видно, когда пытаешься работать с нормативно-правовыми источниками и понимаешь, что многие источники для этих систем, попросту не существует. Вот пример, как человек обнаружил, проводя тесты, признаки доминирования некоторых показателей.

3. Иногда, в сформированном ответе GPT-системы используют служебные знаки, типа #, они обычно интерпретируются в семантике Python. Откройте отдельный сеанс и задайте вопрос: «Что означает символ «#» в семантике Python?» Получите объяснение. Можно попросить GPT-систему: Переформулируй ответ, заменяя знаки семантики языка программирования на эквивалентные формулировки русского языка».

4. «Галлюцинирование» - конфабуляция больших языковых моделей (Governing AI for humanity: Final report 2024) (конфабуляция - расстройство памяти, при котором пробелы заполняются выдуманными воспоминаниями).

На рисунке 2 представил список инструментов (техник взаимодействия) используемых при формировании промптов, которые будут актуальны для юристов. Также представил неполный список промптов, которым уже, среди пользователей, сложились названия.

Рис. 2. Техники взаимодействия и открытый список промптов.

Продолжение следует

Часть 1. Давайте дружить

Часть 2. Криминалистическое описание

Часть 3. Дефекты печати, пока не преодолимо

Часть 4-1. Систематизация (1)

Часть 4-2. Систематизация (2)

Часть 5. Инструменты GPT

Часть 6. Zero-shot - контролируй соперника

Часть 7.

Часть 8.

Часть 9.