Найти в Дзене

Как мы учим нашего ИИ-бота разбираться в арбитражных делах


Привет,
Спешу поделиться инсайдами из нашей лаборатории. Последние месяцы мы корпим над амбициозной задачей — учим нашего ИИ-бота ориентироваться в дебрях арбитражного делопроизводства. Да-да, именно с kad arbitr!

Что мы пытаемся сделать?

Если кратко — хотим научить нашего бота быть идеальным помощником для работы с арбитражными делами. Представьте: вы говорите боту "Найди мне все дела по банкротству ООО 'Ромашка' за последний год", и он не просто выдает сухой список ссылок, а реально въезжает в суть:
- Анализирует тексты определений и решений
- Вытаскивает ключевые моменты
- Суммирует важную инфу

Как мы это делаем

1. Парсинг и обработка данных
- Научили бота корректно читать и понимать структуру kad arbitr
- Разработали систему корректной обработки судебных документов

2. Обучение на реальных делах

- Скормили боту тонны арбитражных дел (естественно, с соблюдением всех правил)
- Постоянно тюним модель на основе фидбека от юристов

3. Интеграция с API
- Разрабатываем удобный интерфейс взаимодействия
- Решаем вопросы с таймаутами и ограничениями

С какими сложностями столкнулись

1. Капча
Kad arbitr очень не любит роботов. Пришлось подружиться с ним по-человечески.

2. Структура данных
Судебные акты — это не твиты по 280 символов. Здесь реально сложные, многостраничные документы со своей спецификой.

3. Юридическая специфика
"Решение о признании" и "признание решения" — для нас с вами похожие фразы, а для юриста — небо и земля. Учим бота понимать такие нюансы.

## Что уже умеет наш бот

- Различает типы судебных актов
- Находит связи между делами
- Вычленяет основные тезисы из текстов решений
- Формирует краткие саммари по делам

Над чем еще работаем

1. Улучшение точности
Бот уже неплохо справляется, но иногда еще путает похожие категории дел.

2. Оптимизация скорости
Работает быстрее человека, но медленнее, чем хотелось бы нам.

3. Расширение функционала
Хотим научить его предсказывать возможные исходы дел на основе анализа похожих случаев.

Планы на будущее

- Добавить возможность голосового взаимодействия
- Интегрировать с популярными юридическими CRM
- Запилить пользовательский интерфейс для тонкой настройки поиска

Немного технических деталей

- Используем комбинацию GPT для понимания контекста BERT для работы с юридическими текстами
- Крутим всё на связке Python + FastAPI
- Для хранения и индексации используем ElasticSearch

Когда ждать релиз?

Уже скоро! Мы на финальной стадии тестирования. Хотим быть уверены, что наш бот не просто работает, а реально решает проблемы пользователей.

#Бонус: забавные случаи из тестирования

- Однажды бот принял дело о банкротстве за лав стори, потому что там часто упоминались отношения (правда, между кредитором и должником)
- В другой раз решил, что судья очень любит цитировать рэп, приняв юридические термины за сленг

---

P.S. Следите за обновлениями! Скоро выкатим бету для тестирования. А пока делитесь в комментах — какие фичи вы бы хотели видеть в боте для работы с kad arbitr?

#legaltech #AI #арбитраж #автоматизация #убиваемюристов (шутка, не убиваем)
2 минуты