Добавить в корзинуПозвонить
Найти в Дзене
Графомания Лысого

Превью к статье нарисовала программа по текстовому описанию. Рассказываю, как она работает

Эй, нейросеть, а ну расскажи людям понятным языком, что такое нейросети! Чем сто раз объяснять, лучше один раз показать Пару слов от человека теперь, пару слов... Если на картинку нужно добавить несколько объектов, нейросеть начинает путаться и страдает качество проработки лиц. Дать ей задание в виде длинного предложения - и она начинает мешать все в кучу, ориентируясь на слова. Иногда можно увидеть, что программа достала из базы данных готового прилично прорисованного персонажа и просто наложила его на фон в стиле "мама, я выучил фотошоп". Получается, естественно, криво. У Дзена тоже есть своя нейросеть внутри. Например, я пытался много раз загрузить еще несколько интересных (и безобидных) примеров, но редактор мне просто не дал. Не грузит - и все. У него есть своя база данных изображений, с которой идет сопоставление, определяется, что на картинке, и на этой основе принимается решение, что это неприемлемое изображение, например. И вы будете раз за разом получать надпись "Загр
Оглавление

Эй, нейросеть, а ну расскажи людям понятным языком, что такое нейросети!

Увеличение по клику.
Увеличение по клику.

Чем сто раз объяснять, лучше один раз показать

Самая больная тема - это пальцы. Палец - это маленький объект. Чем мельче объект - тем сложнее его выделить и проработать. На картинах художников, на которых обучали алгоритм, пальцы часто чуть сливаются - издержки технологии написания картины краской, мы привыкли и считаем это нормой. Вот здесь пальцы одной руки слились с пальцами другой. Но от машины такой подлости, портящей идеальную в остальных аспектах картину, просто не ждешь.
Самая больная тема - это пальцы. Палец - это маленький объект. Чем мельче объект - тем сложнее его выделить и проработать. На картинах художников, на которых обучали алгоритм, пальцы часто чуть сливаются - издержки технологии написания картины краской, мы привыкли и считаем это нормой. Вот здесь пальцы одной руки слились с пальцами другой. Но от машины такой подлости, портящей идеальную в остальных аспектах картину, просто не ждешь.

Нейросеть понимает принципы композиции, но не понимает, ПОЧЕМУ отдельно взятый объект не может находиться в определенном месте (законы физики). Почему бы людям не сидеть в метро за креслами? Кресла на месте, головы на месте, примерная расстановка объектов как в примерах - задача выполнена!
Нейросеть понимает принципы композиции, но не понимает, ПОЧЕМУ отдельно взятый объект не может находиться в определенном месте (законы физики). Почему бы людям не сидеть в метро за креслами? Кресла на месте, головы на месте, примерная расстановка объектов как в примерах - задача выполнена!
Лица на дальнем плане не имеют детализации от слова совсем. Видать, когда прогу учили, делался акцент на центральных объектах, или недостаточно высокое разрешение было у примеров, я не знаю.
Лица на дальнем плане не имеют детализации от слова совсем. Видать, когда прогу учили, делался акцент на центральных объектах, или недостаточно высокое разрешение было у примеров, я не знаю.
Рука вросла в спину, потому что сверху нарисован слой тату. Пальцы пришлось отрубить по той же причине. Обратите внимание, сама татуировка собрана из нескольких и склеена в верхней части.
Рука вросла в спину, потому что сверху нарисован слой тату. Пальцы пришлось отрубить по той же причине. Обратите внимание, сама татуировка собрана из нескольких и склеена в верхней части.

Программу не учили рисовать гимнасток вниз головой, поэтому она не понимает, что такое сила тяжести, действующая на волосы, и зачем вообще стопами упираться между опорами, а также не имеет достаточно примеров, чтобы прорисовать лицо, развернутое на 180 градусов, не врубается, в какую сторону вывернуть суставы, и на всякий случай наденет вам кроссовки на руки (вниз головой же, кроссовки по-любасу сверху должны быть!)
Программу не учили рисовать гимнасток вниз головой, поэтому она не понимает, что такое сила тяжести, действующая на волосы, и зачем вообще стопами упираться между опорами, а также не имеет достаточно примеров, чтобы прорисовать лицо, развернутое на 180 градусов, не врубается, в какую сторону вывернуть суставы, и на всякий случай наденет вам кроссовки на руки (вниз головой же, кроссовки по-любасу сверху должны быть!)

Мадам в медицинской маске в средневековом сеттинге - почему нет? Видимо, от ядовитого тумана, который компактно проживает в углу зала.
Мадам в медицинской маске в средневековом сеттинге - почему нет? Видимо, от ядовитого тумана, который компактно проживает в углу зала.

Здесь все детали в высоком качестве, кроме лица. Видимо, попытка насобачить другое лицо на готовый фон невесты из базы данных не увенчалась успехом.
Здесь все детали в высоком качестве, кроме лица. Видимо, попытка насобачить другое лицо на готовый фон невесты из базы данных не увенчалась успехом.

Трудно сказать, что здесь происходит, но любители покупать мазню за миллионы долларов точно оценят.
Трудно сказать, что здесь происходит, но любители покупать мазню за миллионы долларов точно оценят.
ТЗ: смертельная битва американского орла с российским медведем. Результат: российские чиновники незаметно срослись со страной, где учатся и живут их дети.
ТЗ: смертельная битва американского орла с российским медведем. Результат: российские чиновники незаметно срослись со страной, где учатся и живут их дети.

Человек с двумя правыми руками работает на новейших ноутбуках с гнущимися экранами.
Человек с двумя правыми руками работает на новейших ноутбуках с гнущимися экранами.

Может быть, это трон. Может быть, это платье. Но вероятнее, это банальная картина правителя из высокого кабинета, сросшегося со своим креслом.
Может быть, это трон. Может быть, это платье. Но вероятнее, это банальная картина правителя из высокого кабинета, сросшегося со своим креслом.
За компьютером Лысый, который хочет сделать из текста красивый рисунок. На экране то, что обычно получается.
За компьютером Лысый, который хочет сделать из текста красивый рисунок. На экране то, что обычно получается.
Хотели бы встретить в темном переулке этих сиамских близнецов?
Хотели бы встретить в темном переулке этих сиамских близнецов?
Это шапка или купол? Какая разница - чутка размазать, никто и всматриваться не будет!
Это шапка или купол? Какая разница - чутка размазать, никто и всматриваться не будет!

Пару слов от человека теперь, пару слов...

Если на картинку нужно добавить несколько объектов, нейросеть начинает путаться и страдает качество проработки лиц. Дать ей задание в виде длинного предложения - и она начинает мешать все в кучу, ориентируясь на слова.

Иногда можно увидеть, что программа достала из базы данных готового прилично прорисованного персонажа и просто наложила его на фон в стиле "мама, я выучил фотошоп". Получается, естественно, криво.

У Дзена тоже есть своя нейросеть внутри. Например, я пытался много раз загрузить еще несколько интересных (и безобидных) примеров, но редактор мне просто не дал. Не грузит - и все. У него есть своя база данных изображений, с которой идет сопоставление, определяется, что на картинке, и на этой основе принимается решение, что это неприемлемое изображение, например. И вы будете раз за разом получать надпись "Загружено с ошибкой".

Если вы хотите начать изучать это все самостоятельно, вам нужно загуглить для начала DALL·E 2, MidJourney или Stable Diffusion. Это три самых известных общедоступных программы, есть версии, которые работают через веб-интерфейс, подойдет для пробы со смартфона или старого компьютера.