Добавить в корзинуПозвонить
Найти в Дзене
IT Vibe

​​Локальные AI-модели могут выигрывать не общей мощностью, а пониманием языка и реальных задач рынка

Яндекс обновил Alice AI ART с фокусом на русский текст в изображениях. По данным компании, при правильном промптинге модель стала в 3 раза чаще корректно генерировать кириллицу, а общее качество генераций выросло примерно на треть. Проблема в том, что для диффузионных моделей буквы часто выглядят не как символы, а как текстура. С кириллицей всё ещё сложнее: в открытых датасетах меньше качественных изображений с русским текстом. Яндекс собрал собственный датасет. 30 млн текстовых семплов для претрейна и около 100 тыс. изображений для тонкой настройки. Также модель перевели на Diffusion Transformer и начали обучать на русскоязычных промптах. В итоге Alice AI ART лучше справляется с афишами, открытками, постерами, карточками товаров и обложками, где нужен русский текст. Промптинг всё ещё решает. Текст лучше брать в кавычки, сложные слова писать заглавными, а длинные фразы разбивать на части с указанием расположения. #ИИ #Яндекс #генерацияизображений 🔳 IT Vibe News

​​Локальные AI-модели могут выигрывать не общей мощностью, а пониманием языка и реальных задач рынка

Яндекс обновил Alice AI ART с фокусом на русский текст в изображениях. По данным компании, при правильном промптинге модель стала в 3 раза чаще корректно генерировать кириллицу, а общее качество генераций выросло примерно на треть.

Проблема в том, что для диффузионных моделей буквы часто выглядят не как символы, а как текстура. С кириллицей всё ещё сложнее: в открытых датасетах меньше качественных изображений с русским текстом.

Яндекс собрал собственный датасет. 30 млн текстовых семплов для претрейна и около 100 тыс. изображений для тонкой настройки. Также модель перевели на Diffusion Transformer и начали обучать на русскоязычных промптах.

В итоге Alice AI ART лучше справляется с афишами, открытками, постерами, карточками товаров и обложками, где нужен русский текст.

Промптинг всё ещё решает. Текст лучше брать в кавычки, сложные слова писать заглавными, а длинные фразы разбивать на части с указанием расположения.

#ИИ #Яндекс #генерацияизображений

🔳 IT Vibe News