90 подписчиков
Stable Diffusion анонсировали свой аналог ChatGPT — StableLM
В релизе модели на 3B и 7B параметров, 15-65B последуют. В планах даже есть 175B. Выпущены под лицензией CC BY-SA.
StableLM натренирована на датасете The Pile расширенныв в три раза — до 1,5 триллиона токенов контента. Говорят благодаря этому удаётся получить хорошие результаты при небольшом количестве параметров.
Что важно модели сделаны с расчетов на запуск локально у себя на железе, а не работе с облаком. Можно самому тренить модели на основе StableLM, все данные хранятся у вас, а результат генераций принадлежит вам, в том числе и для коммерческих целей.
Также будут выпущены исследовательские модели, зафайнтюнненные StableLM с помощью человеческого фидбэка (RLHF). Эти модели будут комбинацией Alpaca, GPT4All, Dolly, ShareGPT, и HH и будут выпущены под некоммерческой лицензей CC BY-NC-SA 4.0.
Планируется коллаб с OpenAssistant.
В комментах примеры ответов на 7B параметров
Демо (на 7B)
Около минуты
7 мая 2023