Мир замер в ожидании идеальной генерации текста на картинках. OpenAI обещали прорыв, и на латинице он действительно случился. Но как только русскоязычные пользователи попросили модель написать что-нибудь вроде «Кофе с собой» или «Вход только для работников», началось веселье. Буквы плывут, слова рассыпаются, а вместо «Пекарня» может появиться набор символов, напоминающий результат неудачного эксперимента с шифрованием. Пользователи жалуются, и их можно понять. Когда нейросеть превращает простое слово «Продукты» в нечитаемую абракадабру, это не баг в привычном понимании. Это системная проблема. Старые модели просто рисовали закорючки, похожие на буквы, не понимая их значения. Современные уже умеют читать текст, который генерируют, но только если он на латинице. С кириллицей всё сложнее. Почему так происходит? Объяснение простое и обидное для всех, кто говорит по-русски. Датасеты, на которых обучались все эти модели, состоят в основном из западного контента. Латинские буквы — миллиарды п
Кириллица не для слабонервных: GPT Image 2 снова лажает
7 мая7 мая
2
1 мин