Найти в Дзене

"Проколы" нейросети "Flux" при генерации часов или "Неграмотно поставленная задача"?

Сейчас мы посмотрим генерации, в которых ошибки и недоработки нейросетей будут очень хорошо видны — это ЧАСЫ. Всякие — разные. Я не буду вываливать сразу кучу фото, а будут их вставлять по одной со своими комментариями об огрехах, которые я вижу. Я не буду особо сильно придираться в ошибкам, просто укажу на типичные ошибки современных нейросетей при генерации, которые случаются не только с часами, но и в принципе. Параметры: Я буду описывать только ошибки сети! 1. Римская "6" превращена в "5" 2. Цифры 6 и 12 часов как римские цифры "размазаны", явно не понимает, что там именно цифры "6" и "12". 3. Название - "От ветра башки своея". 4. Название — из головы, надпись под стрелками — каша, второй циферблат внизу — хрен поймешь для чего, то ли глубину, то ли "сколько осталось до извержения вулкана", сам залез на место цифры 6, вместо 2 стоит 9, чёрточка вместо 1 на 11 часах. 5. Непонимание значений цифирей? Вторичны циферблаты — это просто "что-то вроде кружочков с шумом". 6. "Палка" исполь
Оглавление
  • Предупреждение: все изображения, представленные здесь, не являются реальными, а сгенерированы нейросетью.

Сейчас мы посмотрим генерации, в которых ошибки и недоработки нейросетей будут очень хорошо видны — это ЧАСЫ. Всякие — разные.

Я не буду вываливать сразу кучу фото, а будут их вставлять по одной со своими комментариями об огрехах, которые я вижу. Я не буду особо сильно придираться в ошибкам, просто укажу на типичные ошибки современных нейросетей при генерации, которые случаются не только с часами, но и в принципе.

Параметры:

Часы

Я буду описывать только ошибки сети!

1. Римская "6" превращена в "5"

2. Цифры 6 и 12 часов как римские цифры "размазаны", явно не понимает, что там именно цифры "6" и "12".

-2

3. Название - "От ветра башки своея".

-3

4. Название — из головы, надпись под стрелками — каша, второй циферблат внизу — хрен поймешь для чего, то ли глубину, то ли "сколько осталось до извержения вулкана", сам залез на место цифры 6, вместо 2 стоит 9, чёрточка вместо 1 на 11 часах.

-4

5. Непонимание значений цифирей? Вторичны циферблаты — это просто "что-то вроде кружочков с шумом".

-5

6. "Палка" используется как цифра "1".

-6

7. Оригинальная находка — цифра "10" римская, вторичные циферблаты — как всегда — просто "вроде надо".

-7

8. Ух ты! Только "VI" человек поймет, если головы по вертикали на 180 градусов развернет. Но тут хоть поняла, что это "цифири".

-8

9. Слева у "10" единичка потерялась.

-9

10. Вторичные циферблаты - "вроде надо".

-10

11. Непонятно что в окошке даты.

-11

12. Симпатичная находка — прозрачный фон-окно на вид механизма, но грубо исполнено.

-12

13. Названия — каша, вторичные циферблаты — каша.

-13

14. Название переврано — непонимание содержания текста, т.к. есть Швейцарские часы "Bulova", изобразила так, как ей кажется.

-14

15. Дорого-богато, то надо четыре циферблата внутри убрать, и надписи тоже )

-15

16. Две минутные стрелки, одна наверно запасная. А так — есть Швейцарская часовая марка "BLED".

-16

17. Вот когда ни названий (текста), ни цифр нет, то еще похоже что-то.

-17

17. Один из экземпляров, кода "Flux" модели указали точное написание текста, которое надо вписать в марку часов на циферблате - "NStor". И после этого кто-то говорит, что у Flux с изображением текста все ОК?

-18

18. Дизайн — ОК, название что-то похожее на "Patek Philippe" (просто угадывается), мелкие циферблаты — каша.

-19

19. Все бы ничего, но оригинальная римская "4", или она издевается? )))

-20

20. В названии угадывается "Rolex", коронка завода уехала вниз.

-21

21. Шоп те самой такой будильник на руке носить! И еще такой же на ногу!

-22

22. Красивенько! Но "NStor" переврала!

-23

23. Размерчик, тексты, вторичные циферблаты.

-24

24. Название, вторичные циферблаты.

-25

25. В названии угадывается "Furla" (марка швейцарских часов), цифры — куча-мала, вторичные циферблаты тоже.

-26

26. Убрать тексты, вместо цифр просто "палки" оставить, было бы лучше.

-27

27. Вторичные циферблаты — каша, текст — каша.

-28

28. Цифры, текст.

-29

29. Шкала на вторичном циферблате.

-30

30. Лучше бы просто "палочки" вместо цифр. Текст — прост узор.

-31

31. А ведь понимает римские цифры то! Только на "3" забила. Такое чувство, что понимает, но специально "издевается"!

-32

32. Опять на "3" забила. Вторичные циферблаты — каша.

-33

33. Вторичные циферблаты — каша. Тексты — каша.

-34

34. Часы "Cerruti" (как я догадался). Мелкие стрелки потеряла.

-35

35. )))))))))))))

-36

36. Тут похоже, что две модели в одну "упихала". Вторая головка завода есть! (как раз для второго механизма наверно).

-37

37. Вообще в ювелирку "свалилась", без комментариев.

-38

38. Если китайские часы "Holuns". ЦИФРЫ!!!!

-39

39. Тексты, цифры.

-40

40. Текст не угадывается.

-41

41. Название даже гадать не буду. Вторичные циферблаты более или менее хоть стрелки нормальные.

-42

42. Цифры "3" и "5" (внизу), тексты — каша.

-43

43. Тексты — каша.

-44

44. Опять свалилась в гигантизм. В текстах — импровизирую как хочу!

-45

45. "6" внизу.

-46

46. Цифры, етить-колотить!

-47

47. По размерам — это "на ногу".

-48

48. По исполнению — это "в перстень".

-49

49. Текст!

-50

50. Текст!

-51

51. Без комментариев

-52

52. Опять издевается, ведь понимает, зараза, что цифры!!! Ведь в ряду римских поставила одну арабскую, вместо 4 и 8 "кружева" (причем в симметрию попала)!!!

-53

53. Цифры на циферблатах, мелкие стрелки пропали.

-54

54. Такое чувство, что все понимает, и вместо "NStor" специально пишет начиная с "No*" !!! )))

-55

55. Ути-пусечка!!! )))

-56

56. Тексты. А вот цифры понимает!!! Но нужные ставить не хочет! Такое ощущение, что "так запрограммировано", определенная логика просматривается уже.

-57

57. Есть марка "LA MER"

-58

58. Текст.

-59

59. Тексты. Цифры на шкалах.

-60

60. Тексты. Мелкие стрелки потеряла.

-61

61. Мелкие шкалы.

-62

62. Опять издевается! Вместо 4 поставила 3 !!! Вот и говорите потом, что "она не понимает!"

-63

Ну, кот как то так.

Выводы

С текстами, их пониманием и воспроизведением проблема как была, так и остается, до полного понимания текстов еще очень далеко.

А вот с цифрами выявилась закономерность, нейросеть все понимает, все может сделать "как надо", но как будто в ее настройки специально внесена "погрешность", которая специально вносит "момент хаоса и непредсказуемости результата".

Вы все видели, судите сами...

Лучше всего нейросеть справляется с графическими и "фантазийными" объектами у которых нет четкой и зафиксированной формы, к примеру:

  • "Облака. Какие они?"
  • Ну это... всякие...

Или: "Ремешок для часов их крокодильей кожи".

  • А какой он? Какой точно узор?
  • А точного нет... "Как получится"... "Какой кусок кожи попадётся"... "Так что — всякий..."

Вот там, где "всякие" и "как попадется", там нейросеть и хороша, а там, где "Четко прописано!", там - "Мсье Пардон! Это не к нам".

P.S.

Но вот "четко прослеживаемая логика в последовательности подмены цифр" меня наводит на размышления...

Говорят - "Нужен подробный промпт!"

ОК! Задание остается то же самое, но запрос другой:

  • Prompt (привожу на русском!):

    Мужские золотые часы-браслет orient с платиновым циферблатом и светящимися стрелками и маркерами, часы имеют окошко даты в положении 3 часа, отображающее время в виде 8 часов, и серебряную секундную стрелку, указывающую час, стрелки золотые с черными цифрами и отметками, а часовые маркеры бриллиантовые, название бренда orient заметно отображается в положении 12 часов, с логотипом бренда в верхней части циферблата, в центре циферблата находится небольшая эмблема в форме золотой звезды, указывающая название бренда, наручные часы водонепроницаемы до 30 метров, с корпусом и браслетом из золота, общий дизайн современный люкс, с чистыми линиями и мелкой ювелирной гравировкой, типичной для люксовых часов, фон изображения черный, благодаря чему часы заметно выделяются, делая их центром кадра, изображение кажется сделанным в студийной обстановке, без дополнительных объектов или отвлекающих факторов, что фокусирует внимание на дизайне и функциях часов
    \(orient\), мужские наручные часы, номер модели, название продукта,

Результат:

63. "58 марта", "ORICENT"

-64

64. "ORIGENT"

-65

65. "OROGNT" - вот только не говорите мне, что "она буквы путает!". У меня ощущение, что она специально "помеху" вносит, ка и с цифрами...

-66

Уточним задачу

Добавим в задачу:

  • the brand name 'Orient' on face

Результат:

66. Я же говорю - "Она специально ИЗДЕВАЕТСЯ!!!"

-67

Меняем модель на "DEV" (кто занимается, тот поймет, для остальных "на профессиональную тяжелую модель"), и повторяем все то же, но уже на DEV-модели.

Результат:

67. Название теперь точно написало, в остальных местах вместо текста каша + окно с датой = каша.

-68

68. Появился месяц "Diek"... Вот смотрите, она ведь понимает, что это "месяц", и знает их названия, почему она ошибку вставляет? Я вот не верю, что обученная нейросеть поняла, что это окошко даты, что в дате есть года, месяца и числа, сообразила размер проставить окошка такой, чтобы все влезло, и в самый последний момент... бац!

Это как компьютерная игра биллиард, иногда намеренно проигрывает, чтобы человеку было интересно с ней играть, а то что это за игра, когда она все время выигрывает... и ту то же самое...

-69

69. Опять намеренная ошибка в цифрах числа!

-70

70. Ну ведь понимает, что это циферблат, и как специально цифры местами меняет и пишет неправильно!

-71

Нет... нейросеть точно что-то задумала! Она намеренно пытается казаться глупее, чем она есть. А может ее так обучили?

Продолжение следует...

На главную: (

NStor - записки нейро-айтишника | Дзен

)

Удачи!
NStor
https://t.me/stable_cascade_rus
https://t.me/srigert