7573 подписчика

«Юридические технологии долго были несправедливо маргинализированной сферой» // Интервью с Романом Янковским и Егором Староверовым

31 марта31 мар

17 мин

Как создать специализированного юридического ИИ-помощника? Через какие этапы разработки нужно пройти, как обучить модель и какие данные использовать? Редакция «Закон.ру» поговорила об этом с Егором Староверовым, руководителем продукта «Нейроюрист», и Романом Янковским, который участвует в разработке в качестве менеджера по развитию — помогает переводить с юридического языка на технический, рассказывает о требованиях юристов и помогает лучше понять эту сферу и, как он сам говорит, «отвечает за юридическую ДНК». В интервью они также рассказали об отличиях «Нейроюриста» от универсальных ИИ, перспективах Legal Tech и влиянии технологий на юридическую профессию и образование. — Сколько времени прошло с появления идеи «Нейроюриста» до его запуска? — Егор Староверов (Е.С.) : Сначала мы в «Яндексе» проводили много тестов и проверяли десятки гипотез, пытаясь понять, какие из функций бэк-офиса действительно можно и нужно автоматизировать. В январе 2025 года поняли, что юридическая сфера одновременно очень хорошо подходит для автоматизации и содержит такое количество долгих рутинных процессов, что у юристов откровенно не хватает времени на более сложную работу. Мы подключили к работе над проектом и наш юридический департамент, который с радостью стал вовлекаться. Так мы осознали, что получается хороший юридический продукт, который надо развивать, быстро стали появляться положительные отзывы во время тестирования, и через три-четыре месяца мы масштабировали продукт до реального применения. Но сначала мы запустили «Нейроюриста» только для трудового права, а сейчас он консультирует уже по 9 сферам, в том числе процессуальным. — На чем вы обучали и обучаете «Нейроюриста»? Какие документы, информацию вы берете для этих целей? — Е.С. : Чтобы ответить на вопрос, нужно немного углубиться в теорию того, как работают языковые модели. Образно говоря, у модели есть язык и глаза. Сначала она учится, как ребенок. Ей дают много информации и начинают обучать — в первую очередь говорить вообще, чтобы она связывала слова. Эта стадия называется pre-train (предварительное обучение. — Ред.) . На этом этапе модель смотрит на абсолютно всю информацию, которая ей доступна в Интернете. Вторая стадия — SFT ( supervised fine-tuning , контролируемая настройка. — Ред. ) Модель учат более правильно отвечать на вопросы и ставят оценки — как в школе. На последнем этапе, опять же, как в школе, появляются дополнительно предметы, дополнительные знания. Таким образом получается модель, которая умеет отвечать на большое количество вопросов, опираясь на знания из двух стадий своего обучения. Дальше мы ей даем ей опорный материал. То есть перед ответом она может подсмотреть в шпаргалку — мы это называем RAG pipeline (генерация ответа с расширенным поиском. — Ред. ). Если говорить про данные, то на первом этапе обучения модель поглощает все, что можно увидеть в Сети. Позже модель опирается уже на конкретные данные. Например, «Нейроюрист» для ответа берет их из «Гаранта». — Он берет из «Гаранта» только нормативные правовые акты? Опирается ли он в ответах на публикации в научных журналах? Или, если речь про источники в Интернете, на публикации в юридических ресурсах, например «Закон.ру»? — Е.С. : Если мы говорим про «шпаргалки» – то, куда модель посмотрит перед ответом, то это только законы, подзаконные акты, письма ведомств и так далее. Юридической литературы в шпаргалках нет. Мы смотрим в эту сторону, но есть ограничения по использованию. Например, как такие источники покупать, как вообще модель может к ним подступиться. Но модель, конечно, может увидеть информацию и в Интернете (при включенном поиске по сети) и частично использовать ее для ответа, дав на нее ссылку. — Были ли у вас технические ограничения при работе над «Нейроюристом»? — Е.С.: Есть физические ограничения — модель никогда не сходит в суд. Конечно, хочется, чтобы она могла помочь во всех ситуациях. В целом у больших языковых моделей много ограничений. Одно из самых важных — модель никогда не возьмет на себя ответственность за финальное решение. Она может интерпретировать что-то иначе, чем это сделал бы человек. Мы, конечно, пытаемся свести такие случаи к минимуму. То есть модель фактически дает только консультации, подборки материалов или краткое их изложение. Это помощь юристу. Но очень важно понимать, что технология создана, чтобы помогать, а не принимать итоговое решение. — С юридической точки зрения были ограничения? — Роман Янковский (Р.Я.): У каждой сферы знания есть своя специфика. Когда разработчики создают экспертные сервисы на базе языковых моделей, у каждой сферы, будь то программирование, медицина, финансы или юриспруденция, будут подводные камни. Например, для многих областей новые знания дополняют старые. Но юридическая информация обновляется таким образом, что старые данные становятся неактуальными — новые законы отменяют старые. Это была одна из причин, почему в «Нейроюристе» мы пришли к системе со «шпаргалками», когда модель может подсматривать в базу. Если мы просто загрузим юридическую информацию в модель, обучим ее на этой информации, то информация довольно быстро устареет, и модель будет выдавать неверные сведения. Поэтому, на мой взгляд, единственный работающий вариант — сделать так, чтобы модель постоянно обращалась к актуальным базам законодательства и судебной практике и проверяла, не отменено ли решение, на котором она строит ответ, не принято ли что-то новое по этому вопросу, не изменилась ли редакция закона. Возникают и чисто юридические моменты. Например, закон принят, но еще не вступил в силу. Или уже утратил силу, но на какой-то период в прошлом надо его знать и учитывать. Или если какой-то закон действовал раньше и срок давности позволяет нам предъявить требования по нему, хотя сейчас он уже не действует. Это тоже специфика юридических данных. — Было бы полезно при разработке законов прогонять текст через «Нейроюриста» и проверять, как инициатива вписывается в систему регулирования, не противоречит ли каким-то другим нормам. — Р.Я.: Да, это было бы полезно. Пока такой возможности нет, юристы тратят на это много времени и сил. — Сколько юристов и, может быть, не только юристов участвовало в создании «Нейроюриста»? — Е.С.: Продукт создается так: 50% — технологии, 50% — вклад юристов. Опять же напрашивается аналогия со школой: можно правильно составить расписание уроков, но насколько хорошо ребенок научится, зависит от учителя. Когда мы только запускали продукт, собрали рабочую группу примерно из 30 юристов. Первые версии были так себе, ими было тяжело пользоваться, но мы получали много обратной связи и исправляли ошибку за ошибкой. Когда появилась версия лучше, мы расширили группу до 50 человек. Сейчас в «Яндексе» больше 350 юристов пользуются «Нейюроюристом», они тоже дают нам много обратной связи. Кроме внутренних юристов, есть внешние консультанты, которые помогают оценивать ответы «Нейроюриста» по той или иной отрасли права. — Вы сами выбираете внешних юристов для получения отзывов о «Нейроюристе»? Или это просто юристы, которые уже работают с сервисом и пишут вам по собственной инициативе? — Е.С.: Если говорить про экспертизу по отдельной отрасли права, мы выбираем юридическую фирму, специализирующуюся именно на этой сфере. Агентство привлекает партнеров, старших юристов, юристов, которые разбирают сложные вопросы из практики. Таким образом модель учится не на простых задачах. При этом вокруг «Нейроюриста» уже формируется сообщество пользователей, это здорово. Люди пользуются и дают обратную связь. Пишут напрямую мне и Роману. Эту обратную связь мы тоже используем. — В чем отличие «Нейроюриста» от других ИИ-помощников? От ChatGPT , например? — Е.С.: Когда мы только начинали работу и тестировали разные сервисы, один из наших юридических партнеров сказал: «Я задаю вопрос ChatGPT , он отвечает полно, очень уверенно, очень убедительно, но юридически совсем неправильно». В этом проблема неспециализированных нейросетей. Они могут тебя убедить, но с совершенно неправильным контекстом. Правильные материалы, которые мы показываем «Нейроюристу» перед ответом, помогают этого избежать. Кроме того, мы заранее закладываем российскую юридическую специфику, чего могут не знать обычные нейросети. Они рассуждают не как юрист, а скорее как обыватель. Могут использовать неправильные документы из Интернета или даже просто-то чье-то мнение. Важно понимать, что источники, на которых основан ответ, имеют большое значение. — Р.Я.: Цикл разработки неспециализированных сервисов, нейросетей «общего назначения», построен на измерении удовлетворенности среднестатистических пользователей, а не юристов-экспертов. Соответственно, задача разработчиков — чтобы у среднестатистического пользователя возникало убеждение правильного ответа от модели. Насколько этот ответ на самом деле правильный, вопрос второй. Для базовых, непрофессиональных вопросов нейросетей обычно хватает, и ответ часто оказывается правильный. А если брать узкоспециализированные ответы, модели ошибаются. Но за счет того, что они убедительны, у пользователя создается позитивное впечатление от общения, он воспринимает такую модель как более компетентную. В «Нейроюристе» мы отталкиваемся от юридического качества ответов. Это профессиональная экспертная система. Она не стремится понравиться пользователю. Ее основная задача — дать нужную информацию, а не создать ощущение, что пользователь молодец, что задал хороший вопрос. — Можно ли сказать, что «Нейроюрист» — юридический чат-бот? Специализированный, но все же чат-бот? — Е.С.: Чат-бот — это скорее интерфейс предоставления информации. А «Нейроюрист» — ИИ -помощник, который решает большое количество задач: анализ документов, ответы на юридические вопросы, составление документов. Внутри нашего продукта больше юридической информации, чем у обычного чат-бота. Но интерфейс «Нейроюриста» — это тоже чат-бот. — Как вы думаете, будет ли рынок наполняться другими вариантами юридических ИИ-помощников? — Е.С.: Я недавно читал исследование Anthropic , где говорится, что сейчас нейросети помогают закрыть только 8–10% юридических задач. И это даже не в России, а в других странах, где нейросети по некоторым аспектам сильнее ушли вперед. Так что мы пока в самом начале пути, нам предстоит увидеть и ум этих помощников, и невероятно крутые продукты. — Есть примеры таких задач, которые нейросети еще не решают? — Е.С.: Сейчас мы решаем задачи в одно действие: задать вопрос, отредактировать документ и т.д. Но модели развиваются в сторону автономности. Например, могут проводить большое исследование, работать целый день и подбирать нужные материалы, составлять документы, перебирать всю базу знаний, редактировать шаблоны. То есть в своем развитии модель становится проактивным помощником, который постоянно приносит идеи, что-то оптимизирует. — Возможен ли выход «Нейроюриста» на международный уровень? — Е.С.: Мы делаем продукт пошагово. Например, у нас юридический помощник не по общим вопросам, а по отдельным сферам права. Каждую сферу мы тренируем отдельно. Сейчас в «Нейроюристе» девять сфер, каждая сильно отличается друг от друга. Мы не просто даем все юридические документы и требуем ответ на вопрос. У нас кропотливая работа — постепенно добавлять новые и новые материалы, смотреть, как помощник с ними работает. Сначала отладим все в России и сделаем максимально хороший продукт. А дальше – следите за обновлениями, как говорится. — Когда вы создавали «Нейроюриста», вы изучали зарубежный опыт? — Р.Я.: Да, конечно, но важно учитывать различия правовых семей. Например, в прецедентном праве другая структура юридической информации. Там более важен поиск и анализ прецедентов, построение цепочек судебных решений. Поэтому там одна из основных черт ИИ-систем в том, что они могут проводить такой поиск в автоматизированном режиме. У нас же за счет кодифицированного законодательства поиск правовой информации устроен совсем иначе. С другой стороны, поскольку прецеденты являются источником права, судебная информация в странах англо-саксонской семьи более систематизирована, у нее понятный статус. У нас же судебная практика — сложная сфера, вопрос прецедентов у нас тоже сложный. С одной стороны, это источник, с другой — нет. По этой причине многие сервисы у нас в стране ориентированы не на судебных юристов, а на «материальных», корпоративных. — Может, когда-нибудь появится глобальный интеллектуальный помощник, который включит подходы разных юрисдикций. — Р.Я.: Я не уверен, что технически можно сделать ИИ-помощник, который одинаково хорошо будет работать с правом любой юрисдикции. На фундаментальном уровне невозможно. Такие сервисы придется как-то разводить между странами именно из-за описанных мной нюансов. Провести сравнительный анализ ИИ-сервисы могут уже сейчас. Например, рассказать, что по французскому праву ваш вопрос решался бы так, а по немецкому — иначе. Но наша основная задача в «Яндексе» сейчас — сделать хороший инструмент именно для российской системы, а не продукт, который одинаково хорош везде, но будет средним по качеству. — Каким вы видите «Нейроюриста» через пять лет? — Е.С.: Каким он будет конкретно, трудно ответить, но я назову три переменные, которые повлияют на нейросети, причем не только в России. Во-первых, законодательство — как будет регулироваться распространение, обучение нейросетей. Второй фактор — капитал. Делать специализированные нейросети невероятно дорого. Это огромные инвестиции, которые окупаются годами. «Яндекс» — один из немногих, кто играет в эту игру. Какие-то задачи можно оптимизировать почти бесплатно, но если мы делаем нейросеть, которая глубоко разбирается в российском законодательстве, это очень дорого. Наконец, технологии и темп их развития. Говорят о четвертой технологической революции. При этом, хотя наука больших языковых моделей продвинулась вперед, не все технологии находят свое применение. То есть с научной точки зрения есть шансы на развитие автоматизации, но насколько быстро это будет внедряться, сказать сложно. — Роман, а вы каким видите «Нейроюриста» в будущем? — Р.Я.: Я согласен с Егором. Мы буквально каждые полгода видим новые технологические тренды. Лет пять назад, мне кажется, никто не подозревал, насколько много задач большие языковые модели смогут взять на себя. Даже когда был первый публичный релиз GPT-3 меньше пяти лет назад, все равно многим было непонятно, есть ли перспективы у технологии. Впрочем, и сейчас неясно, в какую сторону будет двигаться развитие, насколько это будет сложно и дорого. В этом смысле мы работаем в ситуации большой неопределенности. Именно поэтому мы с «Нейроюристом» ориентируемся на продуктовый подход — смотрим, чтобы качество росло, чтобы пользователи работали с сервисом, чтобы наши бизнес-метрики росли. Это дает нам почву для дальнейшего роста. — Роман, когда вы начали работать над «Нейроюристом», почувствовали ли вы, что не хватает каких-то знаний, навыков? — Р.Я.: Безусловно. В целом когда юрист приходит на позицию, глубоко погруженную в специализированные вопросы, он всегда чувствует, что ему нужно в чем-то прокачаться. У меня много знакомых, которые из консалтинга переходят в реальный сектор, и выясняется, что основное достоинство инхаус-юриста в том, что он может глубоко погрузиться в специфику своей отрасли. Если у консультанта сегодня — добывающее предприятие, завтра – какой-нибудь сельскохозяйственный холдинг, и это для него в принципе одно и то же, то для инхауса очень важно именно понимать всю производственную цепочку, чтобы проактивно учитывать ее факторы. В «Яндексе» у меня похожая роль. Я хоть и не инхаус-юрист, но погружен в разработку. Мне важно понимать наши ограничения, возможности, архитектуру и влиять на это на старте, чтобы идти по наиболее оптимальному пути развития. Часто спрашивают, нужно ли уметь программировать, чтобы работать цифровым юристом или юристом в цифровой компании. Мне кажется, что уже не нужно. Этап, когда нужны были навыки написания кода буквально руками для участия в разработке продукта, уже пройден. У нас, например, есть много ролей, которые не предполагают написание кода, но при этом связаны с разработкой продукта. — Переход от работы в юридических фирмах, от преподавательской деятельности к работе с юридической нейросетью был неожиданным для вас? — Р.Я.: До перехода в «Яндекс» я много работал в образовании — в Высшей школе экономики, в Moscow Digital School — и много сил инвестировал именно в юридическое образование. Но в какой-то момент понял, что в классическое юридическое образование я больше не готов вкладываться. Тогда я стал смотреть, куда дальше двигаться. В консалтинг возвращаться не хотелось, это было уже не так интересно. Хотелось какого-то нового удовлетворения от работы. Не просто помогать совершать сделки, помогать компаниям объединяться, разъединяться, покупать друг друга, а быть, скажем так, на передовой развития профессии. В юридическом образовании это ощущение было, есть оно и в Legal Tech . C 2022 года я создавал в Вышке программу по Legal Tech и видел, насколько это перспективно. Поэтому двигаться в сторону Legal Tech было осознанным решением. Сейчас самая востребованная часть Legal Tech — проекты, связанные с искусственным интеллектом. Юридические технологии долго были несправедливо маргинализированной сферой. Была какая-то тусовка юристов, которая просто любила технологии и программирование, но таких людей было мало. Тогда считали, что юридическая работа по своей природе не автоматизируема, и можно только сделать мелкие улучшения, какую-то форму в Excel , еще что-то. Но в масштабе индустрии это не сработает. И только с появлением больших языковых моделей, начиная с GPT-3 , стало понятно, что юридическую работу все же можно автоматизировать. Можно создать технологию, которая будет читать документы, как живой человек. Не как юрист-гений, но на уровне, позволяющем сделать такой продукт коммерчески эффективным. Сейчас юридический ИИ – это самая прогрессивная сфера. Почему появляется много сервисов, связанных именно с юридическим ИИ? Как раз потому, что юридическая работа может быть наконец-то фундаментально изменена. Профессия юриста не менялась много лет, и это тоже влияет на масштабность возможных изменений. Поэтому я и выбрал эту сферу. — Что нужно, чтобы создать своего локального юридического ИИ-помощника? Только для своей компании, например. — Р.Я.: Здесь возникает вопрос целесообразности. Я не уверен, что создавать ИИ-помощника для своей компании — хорошая идея, ведь на рынке есть готовые сервисы, которые можно настроить под себя. Зачем повторять ту работу, которую уже сделали? Это можно сравнить с изобретением велосипеда. Но если говорить более абстрактно о навыках для того, чтобы определять сценарий автоматизации для юридического бизнеса, нужно не только разбираться в юриспруденции, но понимать юридическое мышление, юридическую практику и понимать технологии. То есть это предполагает, что юрист может своими собственными руками что-то настроить и интегрировать. Также он должен понимать, как работают технологии, какие у них ограничения и варианты развития. Без глубокого понимания юрист не сможет оценить риски применения тех или иных технологий, тем более в масштабах компании. Эта та роль, которая сейчас называется Legal Operations Manager — специалист по цифровой трансформации юридического бизнеса. Они, понимая юридическую работу, накладывают на нее возможности технологий и решают, какие из операций можно упростить, облегчить, как это будет снимать юридические риски. — Планируете ли вы вернуться к преподавательской деятельности? — Р.Я.: Мы готовим программу, чтобы учить студентов-юристов правильно применять искусственный интеллект в юридической работе и в целом понимать его возможности и ограничения. — Нужно ли студентам юрфаков преподавать основы программирования? — Р.Я.: Основы программирования — скорее нет. Навыки работы с искусственным интеллектом (в том числе в контексте программирования) — скорее да. В первую очередь — давать им понимание ограничений технологий, необходимости проверять данные и каким образом. Рассказывать, какие частые ошибки совершает искусственный интеллект; в каких сферах и почему он работает лучше и когда можно доверить ему ту или иную задачу, а не делать ее самостоятельно. Сейчас многие говорят про важность критического мышления, потому что поколение, выросшее с искусственным интеллектом, может некритично относиться ко многим вещам. А уметь проверять информацию, различать разные виды аргументов и понимать, когда аргумент не по существу, — важный навык для юриста, потому что нас окружает огромный объем недостоверной информации. Вот этому отдельному навыку юристов точно нужно учить. — Преподавательский состав ведь тоже нужно готовить к таким переменам. — Р.Я.: Да, вы правы, искусственный интеллект затронет не только студентов, но и преподавателей. У нас тоже есть наработки для этого — методические материалы о том, как использовать искусственный интеллект в преподавании, как облегчить рутину. Мне кажется, это хороший инструмент, чтобы сделать преподавание более качественным. Ведь у преподавателя много рутинных задач — например, составление тестов по своим лекциям или расшифровка лекций. Это все совершенно спокойно может делать искусственный интеллект, что поможет увеличить содержательную часть работы преподавателя. И тогда преподаватель сможет больше заниматься наукой и непосредственно преподаванием, а не заполнением бумажек. Интервью взяла Гульнара Исмагилова.

]]]]>