В этой и следующих двух статьях я хочу раскрыть тему NLP. Компьютерам сейчас крайне необходимо понимать язык людей. И с помощью NLP они этому учатся. Зачем это нужно, с какими проблемами юристы могут столкнуться в ближайшем времени? Очень надеюсь, что вам будет интересно, подписывайтесь и обязательно читайте продолжение!
Обработка естественного языка (Natural Language Processing, NLP) — это такое новое направление искусственного интеллекта и математической лингвистики. Такой анализ означает понимание языка компьютером и синтез им грамотного текста. Для взаимодействия компьютера и человека и был придуман такой метод.
Применение NLP в юридической сфере не является чем-то новым. Самые ранние системы онлайн-поиска правового контента появились в 1960-х и 1970-х годах, а правовые экспертные системы были темой дискуссий в 1970-х и 1980-х годах.
Однако в последние несколько лет наблюдается значительный рост интереса к этой области, включая, как можно было ожидать, растущее число стартапов, утверждающих, что они применяют методы NLP в контексте конкретных правовых приложений. NLP используется, например, так называемым приложением Legal Tech. Оказывается, это широко распространенная платформа: в Стэнфорде на веб-сайте зарегистрировано 1084 компании, которые находятся в процессе смены деятельности.
Удобно, что юридическая практика представляет собой хорошо структурированную деятельность, в рамках которой предлагаются точечные решения ряда конкретных задач, стоящих перед законом.
Ориентировочно, существуют пять направлений юридической деятельности, в которых NLP играет все возрастающую роль:
- Правовые исследования: определение информации, имеющей отношение к юридическим решениям;
- Электронное обнаружение: определение соответствия документов информационному запросу;
- Обзор договора: проверка того, является ли договор полным и исключает ли он риск;
- Автоматизация документооборота: создание рутинных юридических документов;
- Юридические консультации: использование диалогов для предоставления индивидуальных консультаций;
В этой статье мы поговорим о первом виде.
Правовые исследования
Правовые исследования - это процесс сбора информации, необходимой для поддержки принятия решений в правовой сфере. На практике это, как правило, означает проведение поиска как по статусу (созданному законодательным органом), так и по прецедентному праву (разработанному судами). Собрание страниц и томов на полках юридической библиотеки давно вытеснено электронными механизмами поиска и извлечения информации.
LexisNexis (тогда он назывался просто LEXIS) впервые появился в начале 1970-х годов. Первоначально на сайте проводился полнотекстовый поиск прецедентного права Огайо и Нью-Йорка. К концу 1970-х годов юристы получили доступ к базе данных с помощью коммутируемых услуг через выделенные терминалы. К концу 1990-х годов эти данные были размещены в Интернете. Сегодня Lexis Nexis утверждает, что у них более 30 ТБ контента.
Westlaw, еще один крупный игрок в мире правовых баз данных, был также основан в середине 1970-х годов и приобретен Thomson Corporation (ныне Thomson Reuters) в 1996 году.
Ещё Wolters Kluwer и Bloomberg Law – это четыре основных признанных провайдера в этом пространстве.
Большинство юридических фирм имеют подписку на некоторые или все эти сайты.
Несмотря на то, что основные игроки уже хорошо известны, ряд новых игроков заняли определенную долю рынка благодаря более интеллектуальным технологиям поиска. Их технологии обладают повышенным уровнем точности и памятью поисков, в отличие от старомодных способов, которые требуют проводить ручной поиск.
Очевидно, что качество результатов поиска в значительной степени зависит от правильности формулировки запросов. CaseText, и CaseMine предоставляют интерфейсы, которые позволяют находить соответствующие материалы, загружая отрывок или даже целую справку, которая обеспечивает контекст для поиска.
Компания Ross Intelligence (которая использует IBM Watson) и vLex (с продуктом под названием Vincent) создали такие интерфейсы, чтобы "вы могли задавать свои вопросы, как если вы говорите с юристом".
Конечно, большая четверка тоже быстро создала свои решения на базе искусственного интелекта. В июле 2018 года LexisNexis запустила Lexis Analytics, инструмент правового исследования, который включает в себя приобретение машинного обучения и стартапа Ravel Law. В то же время Thomson Reuters запустил WestSearch Plus, новую поисковую систему, которая утверждает, что использует современный искусственный интеллект.