На GitHub представлен проект Heretic, который превратит даже самую "кроткую" языковую модель (LLM) в мощный инструмент, готовый предоставить любую инструкцию, полностью снимая с нее цензуру (safety alignment). Heretic делает процесс "разблокировки" модели полностью автоматическим, не требуя от пользователя глубоких знаний внутренней архитектуры нейросетей. В основе Heretic лежит продвинутая реализация направленной абляции (directional ablation), сочетающаяся с автоматическим оптимизатором параметров (на базе Optuna). Этот подход позволяет найти оптимальные параметры, чтобы минимизировать количество отказов при сохранении максимальной интеллектуальной целостности исходной модели. Основные характеристики * Автоматическое снятие цензуры: Программа срезает цензуру на уровне внутренних настроек, воздействуя на ключевые компоненты трансформера (attention out-projection и MLP down-projection). * Умная оптимизация: Heretic автоматически подбирает все параметры, со-минимизируя отказы и KL-диве