Stability AI выпустила генеративную нейросеть, которая умеет писать программный код на Python, Java, Go, JavaScript, C и С++. В компании рассказали, что умеет нейросеть и как получить к ней доступ.
StableCode знает все инструкции упомянутых языков программирования, обучена с помощью 6,4 ТБ исходного кода из набора BigCode (1.2) и дообучена на 120 000 парах текстовых запросов и ответов в виде блоков программного кода. Модель позиционируется как умный ассистент, который помогает изучать программирование, и как помощник в работе для профессионалов. Модель также имеет 3 млрд параметров и поддерживает контекст в 16 тысяч токенов.
В StableCode сравнили модель с аналогами эквивалентного размера с помощью HumanEval Benchmark — теста, который состоит из 164 задач по программированию и проверяет способность ИИ решать их. В результате StableCode оказалась лучше модели Replit и StarcoderBase в тестах pass@10, но уступила второй модели в тесте pass@1. Скачать StableCode для разворачивания на своём ПК можно на сайте HuggingFace.
К загрузке доступна базовая модель (4 тысячи токенов), обученная без специализации на решении сложных задач, дообученная модель на языках Python, Java, Go, JavaScript, C, С++ и языке разметки Markdown, а также расширенная модель, которая умеет работать с большим количеством кода (в 2-4 раза больше, чем обычная версия на 16 тысяч токенов).