Это явление является не недостатком, а общей проблемой для всех моделей, обученных на западных данных. Старые нейронные сети «рисовали» буквы по форме, не осознавая их смысла. Современные модели уже способны воспринимать текст, однако кириллица по-прежнему вызывает проблемы. В обучающих данных в основном содержится латиница, а токенизация разбивает русские слова на части. До тех пор, пока не будет проведено дообучение на большом объеме данных с кириллицей, проще создавать изображения без текста и добавлять надписи вручную. Постмейкер - автоматическое ведение канала 🤖 Анимация | СhatGPT-4 | Помощь с резюме
Русскоязычные пользователи выражают недовольство по поводу некачественной генерации изображений с текстом в GPT Image 2
7 мая7 мая
3
~1 мин