Как распознать фото от нейросети?

26 июля 202326 июл 2023

2 мин

Оглавление

1. Строение человеческого тела
2. Искажения в деталях
3. Логотипы, надписи, узоры

С помощью нейросетей можно генерировать оригинальные картинки для своих проектов. Но иногда нейросеть обманывает пользователей. Но, скажем так, нечаянно. Программа молодая и только учится.

Поэтому мы можем выделить несколько критериев, по которым отличим настоящее фото от сгенерированной картинки.

Погнали!

1. Строение человеческого тела

Нейросеть пока только учится генерировать людей с нужным количеством пальцев. Поэтому часто кисти рук получаются несуразными и с шестью, семью пальцами или вовсе переплетающихся между собой. Как тот странный помидор на огороде.

Такая же проблема может возникнуть с количеством зубов. Отчего улыбка человека становится очень странной. А вот с глазами, точнее количеством, всё хорошо. Но вот души в них нет. Смотрят люди пространно и остекленело.

2. Искажения в деталях

Чтобы изобразить крупный план, нейросеть проанализирует соответствующие примеры, не вдаваясь в подробности. И мы тоже ничего не заметим, если не приглядимся. Также нейросети хитрят: размывают фон за главным персонажем, чтобы не утруждать себя в прорисовке декораций.

Нейросети ведь «просматривают» миллионы картинок, но не задумываются о назначении той или иной детали в реальной жизни. Поэтому в сгенерированной картинке появляются ноухау, которые бесполезны для использования.

Обратите внимание на куртку на манекене справа. Сколько пуговец и дырочек насчитали?

3. Логотипы, надписи, узоры

Нейросеть ещё не умеет понимать текст. Поэтому, если попросить программу нарисовать картинку с надписью, получится подобие иероглифов. То же самое с логотипами, татуировками и так далее. Нейросети не дано понять, что означает тот или иной символ — она просто смешивает их в кучу.

Вот что получилось, когда мы создали запрос: «Кружка с надписью Жопа»:

4. Симметрия

Пока что нейросети не до конца научились делать симметричные объекты, поскольку не совсем понимают, что же они рисуют. За время обучения алгоритмы хорошо усваивают, как устроены лица и морды животных, симметрия тела и насекомых. При этом им пока что не под силу опознать устройство, например, человеческой одежды. Нередко пиджаки имеют полы разной длины, левая часть предмета не соответствует правой.

На правом ботинке пять отверстий для шнурков, а на левом ― только четыре

5. Культурный контекст

Несмотря на то что нейронные сети быстро учатся, они ещё не могут разбираться в исторических и культурных реалиях. И здесь бывает много смешных ошибок. Например, три одновременно надетых православных крестика, ордена за военные заслуги, распределённые по всему мундиру, нелепая шляпка, не соответствующая эпохе. Именно поэтому нейросетям лучше всего даются вымышленные, фантастические сюжеты.

Конечно же, сноубордисты носят только одну пару очков: или на лице, или на шлеме
Изображение: Midjourney / Skillbox Media — Конечно же, сноубордисты носят только одну пару очков: или на лице, или на шлеме Изображение: Midjourney / Skillbox Media

Как итог

Midjourney сегодня ― один из лучших инструментов для создания изображений при помощи искусственного интеллекта. Алгоритмы сети постоянно совершенствуются и хорошо интерпретируют задания пользователей. Нейросеть по-прежнему совершает ошибки, которые выявить становится всё более сложно. К сожалению, сейчас её бесплатные возможности сильно ограничены, но недорогая подписка предоставляет широчайшие возможности для использования заложенного в сеть функционала.

💡Подписывайся на наш канал — здесь очень много интересного!

🎤 А еще у нас есть телеграм, где каждый день выходит по несколько полезных публикаций: https://t.me/AI_Russia_community