Компания открыла исходный код LLM с 8 миллиардами параметров, Steerling-8B, обученного с использованием новой архитектуры, разработанной для обеспечения легкой интерпретируемости его действий. — techcrunch.com Стартап Guide Labs из Сан-Франциско, основанный генеральным директором Джулиусом Адебайо и главным научным сотрудником Айей Абдельсалам Исмаил, сегодня предлагает ответ на эту проблему. В понедельник компания открыла исходный код LLM с 8 миллиардами параметров, Steerling-8B, обученного с использованием новой архитектуры, разработанной для обеспечения легкой интерпретируемости его действий: каждый токен, генерируемый моделью, может быть прослежен до его источника в обучающих данных LLM. <> Это может быть так же просто, как определение справочных материалов для фактов, цитируемых моделью, или так же сложно, как понимание того, как модель воспринимает юмор или гендер. <> «Если у меня есть триллион способов кодирования гендера, и я кодирую его в 1 миллиарде из этих триллиона вещей, к