Команда сервиса добавила новую функцию – редактирование изображений по текстовому запросу. Теперь можно добавить или убрать объекты на фото, изменить их цвет, раскрасить и так далее. Отвечает за изменения Malvina – мультимодальный ассистент, который делает точечные, контекстные правки без нарушения общей композиции изображения. Это важно, потому что в результате не искажаются лица людей и контуры предметов. В основе Мальвины диффузионный пайплайн, усиленный визуально-языковой моделью GigaChat Vision – из-за чего генерация происходит быстрее, чем у того же ChatGPT. Важно понимать, что это не «аналог» и не «победитель» инструмента генерации картинок от ChatGPT, а другой инструмент, подходящий, соответственно, для других задач. Он менее гибкий и творческий, более нишевый, точечный. Плюсы:
- Скорость работы – практически мгновенно по сравнению с ChatGPT.
- Хорошее понимание промпта.
- Сохранение контуров и деталей объектов (в том числе лиц). Минусы:
- Ухудшает качество исходного изображени