Найти в Дзене
IQ Media

Просто о сложном: как сделать законы понятными

Фото: iStock
Фото: iStock

С каждым годом язык нормативных актов становится все сложнее, и даже юристам зачастую нелегко разобраться в его хитросплетениях. При этом в большинстве случаев то же самое содержание можно выразить гораздо проще. Ученые НИУ ВШЭ создали инструмент, который помогает сделать это с помощью средств компьютерной лингвистики. Рассказываем о нем подробнее.

Для измерения синтаксической сложности текстов нормативно-правовых актов (НПА) ученые разработали собственную методику.

На первом этапе исследователи собрали корпус федеральных законов. Интересно, что уже на этом шаге стала отчетливо видна тенденция к увеличению объема нормативного текста. Среднее количество слов в каждом законе с 1991 по 2020 год выросло в 2,5 раза (с 4970 до 12 544), а среднее количество слов в статье закона — в 3 раза (с 96 до 296).

На втором этапе ученые с помощью средств компьютерной лингвистики провели синтаксический анализ собранного корпуса федеральных законов. Исследователи смогли определить средние значения по девяти параметрам, начиная от простых (например, среднее количество слов в предложении, в абзаце, доля глаголов в общем количестве слов) и заканчивая более сложными для подсчета (например, расстояние между зависимыми словами).

Почти все параметры продемонстрировали рост, в том числе некоторые метрики показали значительное увеличение. Например, среднее количество причастных оборотов после определяемого слова выросло с 0,3 до 0,5 в одном предложении. Для сравнения: этот же параметр для романа Л.Н. Толстого «Анна Каренина» составляет 0,04.

Затем, основываясь на результатах эксперимента с участием профессиональных юристов и студентов, исследователи рассчитали для каждого синтаксического параметра коэффициент значимости и разработали индекс синтаксической сложности нормативных правовых актов (ИСЗ, то есть индекс сложности законодательства).

Фото: iStock
Фото: iStock

Среднее значение ИСЗ для федеральных законов составило 40 баллов. Наиболее сложные законы имели показатель 65 баллов, а самый простой — 16 баллов.

Для сравнения исследователи привели показатели ИСЗ, рассчитанные для некоторых художественных и философских произведений. Например, синтаксическая сложность Земельного кодекса Российской Федерации (45 баллов) почти в 4 раза выше, чем у повести А.П. Чехова «Каштанка» (12 баллов), в 3 раза выше, чем у уже упомянутого романа «Анна Каренина» (16 баллов), и лишь чуть-чуть ниже, чем у знаменитого труда И. Канта «Критика чистого разума». Такие высокие показатели представляют проблему, превращая чтение НПА в тяжелое испытание даже для юристов.

Исследователи выяснили, что язык нормативных актов с каждым годом становится все сложнее. Так, если в 1991 году среднее значение ИСЗ для действующих законов составляло 30,8 балла, то к 2020 году оно выросло почти на 30% и достигло показателя 40,1 балла. Автор доклада отметил, что это связано в том числе с активным внесением в законы изменений и дополнений.

Помимо научной ценности, исследование имеет и вполне практическую значимость. В 2022 году ученые Вышки разработали Методические рекомендации по повышению удобочитаемости текстов. Документ содержит набор правил, а также пояснения, почему каждое правило важно, негативные образцы речевых практик и рекомендуемые варианты их исправления.

Так, ученые предлагают использовать краткие и емкие термины, короткие и простые предложения, компактное расположение пар «подлежащее — сказуемое», меньше повторов и умеренное количество причастных оборотов.

Кроме того, исследователи разработали специальное программное средства, которое позволяет оценить сложность любого текста. Оно
размещено в открытом доступе на сайте ВШЭ и может быть полезно студентам, преподавателям и практикующим юристам. Это средство позволяет загрузить текст, оценить показатель сложности, переписать текст, отредактировать, исправить и посмотреть, упростился ли он.

По материалам HSE Daily