📰 Trunk Tools: как дообученный AI сократил проверку строительной документации с 60 дней до 10

ВчераВчера

2 мин

Большинство корпоративных данных — это не аккуратные SaaS-базы, а сущий кошмар: кривые PDF-ки, запатентованные схемы, неявные бизнес-процессы и задачи, длящиеся неделями. Обычные нейросетки на таком фоне пасуют. Поэтому строительный стартап Trunk Tools собрал собственную трёхуровневую архитектуру — восприятие, семантика, агенты — натренированную на сверхдетальных данных. Результат: циклы проверки документации сократились с месяцев до дней, а полевые ошибки, тянущие на десятки тысяч долларов, отлавливаются на этапе проектирования. Где проваливаются универсальные LLM на отраслевых данных Фундаментальные языковые модели натренированы на широту, а не на глубину. «Универсальные LLM стараются быть хороши во всём, поэтому в любой нишевой задаче они слабы», — объясняет Крити Фаудждар, старший продакт-менеджер, работающий с AI-инфраструктурой и агентными системами. Редкие термины, отраслевая логика, негласный контекст, который любой практик «просто знает» — вот где они буксуют. Разработчик С

Где проваливаются универсальные LLM на отраслевых данных

Фундаментальные языковые модели натренированы на широту, а не на глубину. «Универсальные LLM стараются быть хороши во всём, поэтому в любой нишевой задаче они слабы», — объясняет Крити Фаудждар, старший продакт-менеджер, работающий с AI-инфраструктурой и агентными системами. Редкие термины, отраслевая логика, негласный контекст, который любой практик «просто знает» — вот где они буксуют.

Разработчик Себастьен Де Больвье вторит: самый узкий бутылочный горлышко — это надёжность работы с данными, «перегруженными жаргоном, аббревиатурами и специфическими форматами». «Модель уровня GPT-4 может понять французский юридический контракт, но споткнётся на конкретных ссылках на статьи, которые обязан цитировать практик», — говорит он.

К тому же, добавляет Фаудждар, самые ценные корпоративные данные никогда не попадали в предобучение. Они сидят во внутренних системах и проприетарных форматах. «RAG помогает, но лишь даёт модели чуть более точные факты, хотя она всё равно не умеет нормально рассуждать в предметной области».

Критически важно дообучать модель на доменных данных, затем на хороших примерах задач и строить собственные системы оценки. «Несколько тысяч примеров от реальных практиков бьют миллионы наскрёбанных шумных», — уверена Фаудждар. Архитектура mixture-of-experts (MoE) даёт специализацию без взрывного роста затрат на инференс. А связка RAG с тонкой настройкой работает вдвойне: RAG подтягивает факты, а дообучение чинит словарь и рассуждения.

Де Больвье указывает на преимущество гибридных стеков: универсальная модель для рассуждений и оркестрации плюс небольшая дообученная модель или плотный поиск по курируемому корпусу для извлечения предметных данных. Его совет: «Не пытайтесь сделать модель "умнее" в домене — дообучайте её на то, чтобы она надёжнее выдавала нужный формат вывода, требуемый вашим workflow».

Строительство и смежные отрасли — как раз те сферы, где такие техники уже набирают обороты, наряду с юриспруденцией и здравоохранением. «Высокая цена ошибки плюс стандартизированные форматы документов дают чёткий ROI от доменного обучения», — отмечает Де Больвье.

Но есть и подвох, предупреждает Фаудждар: специализированные модели часто разваливаются за пределами своего домена, так что вне экспертизы они бесполезны — если, конечно, их не переобучить.

Восприятие, семантика, агенты: как устроен трёхуровневый стек Trunk

В сверхспециализированных областях вроде строительства «дампы данных» в большие языковые модели не работают, говорит технический директор Trunk Амриш Капур. Трансформеры — вероятностные модели: увидев изображение, они сообщают, что это «скорее всего» дерево или «скорее всего» ребёнок рядом с деревом. Для точной символьной интерпретации этого недостаточно....

🔗 Полный текст статьи читайте у нас на сайте: Читать на TechLoot

📢 ТехноЛут