MetalGPT-1 стала первой в семействе больших языковых моделей компании с открытым исходным кодом (open source). В отличие от универсальных GPT-моделей, обученных на общих интернет-данных, MetalGPT-1 изначально спроектирована для работы с профессиональной терминологией, аббревиатурами и сложными технологическими цепочками, что повышает качество решений, принимаемых на основе рекомендаций искусственного интеллекта.
Языковая модель включает 32 миллиарда параметров и обучена на 10 гигабайтах профильных текстов по металлургии и горнодобывающей промышленности. Этот объём сопоставимом с половиной англоязычной Википедии. Ключевое конкурентное преимущество модели – уникальное качество данных, поскольку обучение проведено на более чем миллионе документов, недоступных в открытых источниках. Это технологические протоколы, внутренние регламенты и инструкции предприятий, проектная и строительная документация, патенты, отчеты НИОКР, научно-техническая литература. Все данные прошли многоступенчатую