Яндекс обновил Alice AI ART с фокусом на русский текст в изображениях. По данным компании, при правильном промптинге модель стала в 3 раза чаще корректно генерировать кириллицу, а общее качество генераций выросло примерно на треть. Проблема в том, что для диффузионных моделей буквы часто выглядят не как символы, а как текстура. С кириллицей всё ещё сложнее: в открытых датасетах меньше качественных изображений с русским текстом. Яндекс собрал собственный датасет. 30 млн текстовых семплов для претрейна и около 100 тыс. изображений для тонкой настройки. Также модель перевели на Diffusion Transformer и начали обучать на русскоязычных промптах. В итоге Alice AI ART лучше справляется с афишами, открытками, постерами, карточками товаров и обложками, где нужен русский текст. Промптинг всё ещё решает. Текст лучше брать в кавычки, сложные слова писать заглавными, а длинные фразы разбивать на части с указанием расположения. #ИИ #Яндекс #генерацияизображений 🔳 IT Vibe News
Локальные AI-модели могут выигрывать не общей мощностью, а пониманием языка и реальных задач рынка
ВчераВчера
~1 мин