Время - деньги. Незнание - сила. Пуля - дура. Фабрики - рабочим. Китай - город. Скрипка - лиса.
Боевой устав робототехники, глава 42.
Современные нейросети умеют потрясающе делать очень ограниченный набор вещей. Взять кусок картинки, повернуть, передвинуть, растянуть, красиво поменять текстуру. Чуть хуже - комбинировать два или три разных преобразования. Но любое более-менее абстрактное действие это для них пытка. Поэтому очень часто на одних и тех же заданиях разные нейронки ошибаются так, что ни повторами ни подбором параметров добиться результат нельзя.
Например, я полчаса потратил на то, чтобы нейронка выдала мне Пиноккио, и не совладал (листайте галереи, там много картинок):
Хозяйке на заметку - если робота не учили, где на картинке нос, ты не можешь сказать "сделай нос длинным". Не прокатит.
С трансформациями частей тела у нейронок все плохо. Потому что нейросеть умеет только двумерные трансформации! Зацените:
Как только вы попытаетесь скомбинировать две сущности, редко встречающиеся рядом, нейросеть всегда будет пасовать. Тут, кстати, старая сеть DALL-E справилась даже лучше SD 2.0.
И даже в обычных ситуациях у бывают совершенно дурацкие выходные данные:
Поэтому, если что-то не получилось с первого раза - не думайте, что вы неправильно спрашиваете робота. Никто вам не скажет, почему желаемая картинку у него не выходит :)
Напоследок мой любимый пример. Всему сеть обучена - и про бутылки знает, и про льющееся шампанское, и про бокалы. Но поставить все на нужные места - извини, чувак, тут же думать надо!
Девять женщин не родят ребенка за месяц. А девять нейросетей не родят мысль вообще никогда.