Найти в Дзене

Облом "Flux" (Schnell) на понимание текста в контексте объекта

Формат моделей "Flux" считается как "понимающий тексты", и "корректно генерирующий тексты". Но многое все равно приходится проверять, т.к. частенько желаемое выдается за действительность. Так ли все хорошо с текстами во "Flux"? Проверим... Промпт: Первый заход: Промпт: (Даже специально указали, как правильно пишется!) Результат: Против фактов не попрешь! Как видим, даже при явном указании орфографии текста, процент попадания в текст очень низкий, поскольку Flux не может явно выделить области на изображении, что «Вот тут - область текста, а не узорчик!». Возможно, что если задать более точный и строгий промпт, что-то изменится, но пока, без строгого и явного указания ничего не получается, хотя она понимает, где именно находится этикетка, и что на ней есть текст, т.к. она его в нужном месте, хоть с ошибками, но пишет. Само шампанское - норм получилось! Но нам от этого вкуснее не стало. Продолжение следует... На главную: ( ) Удачи!
NStor
https://t.me/stable_cascade_rus
https://t.me/srige
  • Предупреждение: все изображения, представленные здесь, не являются реальными, а сгенерированы нейросетью.

Формат моделей "Flux" считается как "понимающий тексты", и "корректно генерирующий тексты". Но многое все равно приходится проверять, т.к. частенько желаемое выдается за действительность.

Так ли все хорошо с текстами во "Flux"? Проверим...

Промпт:

  • "ля-ля тополя"... бутылка шампанского "Veuve Clicquot"..."ля-ля тополя"
  • в промпте точная фраза на английском "Veuve Clicquot" !!!

Первый заход:

Облом
Облом
Облом
Облом
-3
Облом
Облом
Облом
Облом
На горлышке одна буква пропущена
На горлышке одна буква пропущена
Облом
Облом
Облом
Облом
Облом
Облом
Облом
Облом
Облом
Облом
Одна буква пропущена
Одна буква пропущена
Облом
Облом
Облом
Облом
Облом
Облом
Облом
Облом

Уточняем промпт

Промпт:

  • "ля-ля тополя"... бутылка шампанского "Veuve Clicquot"..."ля-ля тополя"
  • название марки шампанского пишется как "Veuve Clicquot"

(Даже специально указали, как правильно пишется!)

Результат:

Облом
Облом
Облом
Облом
Этикетка правильно, "колпачок" - каша
Этикетка правильно, "колпачок" - каша
Этикетка правильно, "колпачок" - каша
Этикетка правильно, "колпачок" - каша
Облом везде
Облом везде
Где видно - облом
Где видно - облом
Правильное написание на этикетке, но на "колпачке" каша...
Правильное написание на этикетке, но на "колпачке" каша...
-24
Облом
Облом
Колпачок — облом
Колпачок — облом
Облом
Облом

Против фактов не попрешь!

Как видим, даже при явном указании орфографии текста, процент попадания в текст очень низкий, поскольку Flux не может явно выделить области на изображении, что «Вот тут - область текста, а не узорчик!».

Возможно, что если задать более точный и строгий промпт, что-то изменится, но пока, без строгого и явного указания ничего не получается, хотя она понимает, где именно находится этикетка, и что на ней есть текст, т.к. она его в нужном месте, хоть с ошибками, но пишет.

Само шампанское - норм получилось! Но нам от этого вкуснее не стало.

Продолжение следует...

На главную: (

NStor - записки нейро-айтишника | Дзен

)

Удачи!
NStor
https://t.me/stable_cascade_rus
https://t.me/srigert