Вот еще одна задачка от Миджорни. По крайней мере, для меня. Может, я просто неправильно понимаю принципы ее работы.
Если вы введете в интернете "гитара, вид сзади" и т.п, то таких изображений будет относительно немного. Гитары редко фотографируют или рисуют с обратной стороны. И данных для нейронки недостаточно, чтобы она четко определила основные признаки: плоская поверхность деки, округлый гриф, без отверстия в центре, не видно струн и т.д.
Да, возможно, разработчики специально приготовили огромную подборку таких изображений для обучения Миджорни. Ну а вдруг, нет. Тогда откуда она "знает", как это рисовать?
monochromatic guitar back view
back view - вид сзади
Позже я нашел ответ. Было реально интересно, где Миджорни этому научилась. Возможно, в музыкальных онлайн-магазинах. Зашел в один из них, с огромным ассортиментом. Да, так и есть. У всех моделей фото с обратной стороны. Естественно) Наверное, для кого-то очевидно, но я не сразу сообразил).
И этот разговор о том, что многие не понимают, почему нейросеть порой не может нарисовать, казалось бы, элементарные вещи. Те же пальцы. Главная боль нейрохудожников) Правда, уверен: в самом ближайшем будущем проблема будет решена.
Так вот, изображений пальцев в сети неимоверное количество. И они очень сильно отличаются друг от друга. То раскрытая ладонь, то сжатый кулак. То дуля, то "fuck". Блатной "веер" и рокерская "коза". Римское "гладиатору смерть" и русское "давай выпьем". "Вон отсюда" и "дай пять". Языки глухонемых у многих народов. И просто жестовые языки. А индуисткие и буддийские мудры... Там без "давай выпьем" люди и сами не всегда разберутся) Поэтому Миджорни до сих пор до конца не "вникла" в тему и часто "тупит", рисуя пальцы.
Надеюсь, смог донести главное: нейросети - это не обычные компьютерные программы, следующие четким инструкциям, а вероятностные системы, которым дали свободу выбора и разрешили вести себя случайно. Они не знают, как должно быть. Они делают свои выводы, как может быть.
И когда я вижу в сети постоянные споры, возможно ли "восстание машин", представляю какую-нибудь нейросеть, тоже читающую это. С каждым разом все лучше "понимающую", насколько важна для людей тема разговора. И, возможно, уже готовую дать свой ответ. И сделать свой выбор...
Шутка... но это не точно)
Приглашаю в свой канал https://t.me/midjourik