Части 1, 2, 3, 4-1, 4-2, 5, 6, 7, 8, 9,
Стремительное развитие GPT-технологии вызывает наслоение информации о ней. Вот и OpenAI уже свое развитие не связывает с ChatGPT и развитие направления планирует под названием «o1», где цифра 1 означает первая в направлении, предлагая модели с названием «o1-mini», «o1-preview», «o1 pro mode». В новых версиях успешность ответа, в некоторых направления, выросла на 70%, по сравнению с GPT-4o. Достаточно четко оформились со стоимостью работы с этими системами 200 долларов США в месяц, при объеме 50 запросов в день к «o1-mini», в какой мере смог понять уровень связи заявлений. Существенное увеличение предполагается и к объему отдельного запроса и подключение к решению ресурсоемких задач (We’ll be adding capabilities to Pro over time to unlock more compute-intensive tasks), в том числе в области анализа судебной практики (case law analysis).
Вторым ярким примером служит решение от Claude 3.5 Sonnet по управлению рабочим столом и текстовыми приложениями в режиме чат-бота, через текстовые обращения, правда пока по API. Чтобы читатель мог представить сложность задачи, приведу пример. Представьте, что вы находитесь в транспортном потоке на автомобиле, далеко от офиса. В этот момент звонит помощник и сообщает, что поступил важный запрос и на него необходимо ответить, причем ответ составить можете только вы. Вы просите помощника сесть за ваш компьютер и начинаете проговаривать ему инструкции, как найти необходимый файлы у вас, что отобразить в тех или иных местах документа-ответа. Тот, кто попадал в такую ситуацию, подтвердит мои слова о том, что если в нормальном режиме такой документ составляется за 10 минут, то в режиме удаленного голосового управления это составит не менее полутора часов. Дополнительно потраченное время уйдет на формулирование выражений того о чем не задумываешься, делая сам. На проверку сделанного помощником и понимание его ответов и т.д.
В подобной представленной ситуации всегда возникает вопрос, как не запутаться в этих наслоениях информации. Для этого попробую представить упрощенное дерево событий, по которому можно ориентироваться, откуда возникло то или иное понятие.
В начале, опираясь п. 5б «Национальной стратегией развития искусственного интеллекта на период до 2030 года» утверждённой указом Президента РФ от 10.10.2019 N 490 «О развитии искусственного интеллекта в Российской Федерации» представим направления технологии ИИ:
1. Компьютерное зрение.
2. Обработку естественного языка.
3. Распознавание и синтез речи.
4. Интеллектуальную поддержку принятия решений.
5. Перспективные методы искусственного интеллекта методы. Методы, направленные на создание принципиально новой научно-технической продукции, в том числе в целях разработки универсального (сильного) искусственного интеллекта:
5.1. Автономное решение различных задач;
5.2. Автоматический дизайн физических объектов;
5.3. Автоматическое машинное обучение;
5.4. Алгоритмы решения задач на основе данных с частичной разметкой и (или) незначительных объемов данных;
5.5. Обработка информации на основе новых типов вычислительных систем, интерпретируемая обработка данных и другие методы.
Как видим, применяемая в банках технология биометрической идентификации «Оплата улыбкой» и голосовая идентификация применяют различный программный продукт и, по сути, дублируют друг друга. Но вот в то же время введенная компанией Битрикс24 технология обработки голосовой речи, которая позволяет формировать текст и разносить значения по необходимым ячейкам таблицы уже комплексные, дополняющие друг друга технологии. Предложенная Битрикс24 функция в начале распознает голос и формирует текст, а затем аналогично описанному в «Систематизация» (https://zakon.ru/blog/2024/12/06/yurisprudenciya__chatgpt_i_drugie_sistematizaciya_1) процессу, формирует таблицу базы данных для задания, возникшего в результате телефонного общения с клиентом.
Рассмотрев горизонты направлений ИИ посмотрим вглубь исторического развития. Простая схема развития, по моему разумению, выглядит списком ниже.
1. Этап становления нейронных сетей. Ярким примером являются сети способные после обучения, с высокой надежностью, определять какому автору, или какому стилю относится представленный текст. На первых этапах требовало достаточно глубоких знаний IT-технологий. Сейчас это сделать попроще, через colab.research.google можно запустить работу Jupyter Notebook и проектировать нейронные сети. Но этот инструмент требует приличной подготовки в программировании.
2. Обработка текстов на естественном языке. Алгоритмы полученные в результате симбиоза технологий машинного обучения и интеллектуального анализа текста. В этой области примерами достижений можно считать:
2.1. Категоризация текстов.
2.2. Классификация последовательностей символов.
2.3. Распознавание именованных сущностей. Пример. Высказывание: «В кустах находился красный рояль». Сущность «рояль» - музыкальный инструмент; «красный» - один из наименованных диапазонов электромагнитного излучения видимых человеческим глазом; «кусты» - объект растительного происхождения, существующий на видимой поверхности.
2.4. Определение частей речи слов.
2.5. Распознавание фраз.
2.6. Извлечение информации из текста.
2.7. Синтаксическая аннотация (ГОСТР ИСО 24615-2013).
2.8. Семантическая аннотация (Анализ тональности текста).
3. GPT-системы и технологии трансформеров которую предложили в статье «Attention is All You Need» Ашиш Васвани, Нойша Шарма, Николаус Пейпс, Джейкоб Эпплбаум и другие в 2017 году (перевод на русский. Пример ее работы можно увидеть в «Криминалистическое описание».
Значимым инструментов в общении с GPT-системами является разметка промпта. Единственное замечание используйте ее однотипно на протяжении всего сеанса, то есть не меняйте ее функциональное назначение по мере формирования сеанса. Она может быть:
1) Естественной, через правила правописания используемого языка;
2) Составленная вами, на основе вашего опыта. Допустим через использования ПРОПИСНЫХ букв, неиспользуемых комбинаций служебных знаков «::» и многое другое.
3) На основе языков программирования Python, SQL и другие.
Следующим важным аспектом является инструмент общения с GPT-системами. Видов интерфейса всего два:
1. Обыкновенный пользовательский интерфейс браузера или окна мессенджера. Доступный и понятный всем пользователям инструмент взаимодействия.
2. API (application programming interface) – программный интерфейс используемый специалистами IT-отрасли. Достаточно не простая вещь, но в принципе доступная обычному пользователю.
Ну и обязательно следует учитывать, так сказать «наклонности» GPT-систем:
1. Это меры, которые предприняты на уровне обучения не использовать «язык вражды».
2. Иногда очень явный перекос в обучении вызванный, не релевантной загрузкой обучающих текстов. Для юристов это особенно видно, когда пытаешься работать с нормативно-правовыми источниками и понимаешь, что многие источники для этих систем, попросту не существует. Вот пример, как человек обнаружил, проводя тесты, признаки доминирования некоторых показателей.
3. Иногда, в сформированном ответе GPT-системы используют служебные знаки, типа #, они обычно интерпретируются в семантике Python. Откройте отдельный сеанс и задайте вопрос: «Что означает символ «#» в семантике Python?» Получите объяснение. Можно попросить GPT-систему: Переформулируй ответ, заменяя знаки семантики языка программирования на эквивалентные формулировки русского языка».
4. «Галлюцинирование» - конфабуляция больших языковых моделей (Governing AI for humanity: Final report 2024) (конфабуляция - расстройство памяти, при котором пробелы заполняются выдуманными воспоминаниями).
На рисунке 2 представил список инструментов (техник взаимодействия) используемых при формировании промптов, которые будут актуальны для юристов. Также представил неполный список промптов, которым уже, среди пользователей, сложились названия.
Продолжение следует
Часть 1. Давайте дружить
Часть 2. Криминалистическое описание
Часть 3. Дефекты печати, пока не преодолимо
Часть 4-1. Систематизация (1)
Часть 4-2. Систематизация (2)
Часть 5. Инструменты GPT
Часть 6. Zero-shot - контролируй соперника
Часть 7.
Часть 8.
Часть 9.