Компания «Сбер» объявила об обновлении фирменного сервиса генерации изображений Kandinsky до версии 2.1. Среди ключевых улучшений — увеличение базы «скормленных» изображений, повышение детализации и возможность смешивания нескольких картинок в одну. При переходе на версию Kandinsky 2.1 нейросеть дополнительно обучили на 170 миллионах пар «текст — изображение». После этого ей «скормили» ещё два миллиона специально отобранных пар качественных картинок, включающих изображения лиц, тексты и другие сложные для нейросетей объекты, чтобы повысить их качество при генерации. Кроме того, система была усовершенствована за счёт новой обученной модели автоэнкодера, которая используется в том числе в качестве декодера векторных представлений изображений, что кардинально улучшило генерацию изображений в высоком разрешении. Новая версия включает 3,3 миллиарда параметров вместо 2 миллиардов в Kandinsky 2.0. Нейросеть позволяет не только генерировать изображения по текстовому описанию с применением есте
«Сбер» обновил сервис генерации изображений Kandinsky до версии 2.1
4 апреля 20234 апр 2023
49
1 мин