Найти тему
Рисование и живопись

Нейросеть не умеет рисовать руки? Проверим!

В последнее время вижу кучу статей о том, что нейросети не умеют рисовать руки. Эти тексты сопровождаются ладошками с шестью пальцами и прочими иллюстрациями. Я рещила проверить, действительно ли нейросети не умеют рисовать руки. Вот, что из этого вышло.

Запрос "Нарисуй ладонь":

Вполне неплохой результат, правда? Непного перенапряжены мышцы большого пальца, при этом сам палец расслаблен - такое противоречие делает иллюстрацию менее правдоподобной.

Запрос: "Нарисуй руки в замке":

-2

А вот и шесть пальцев! При том, что илллюстрация мало напоминает руки в замке. Интересно, как тогда по мнению ИИ выглядит рукопожатие.

Запрос "Нарисуй рукопожатие":

-3

Примерно то же самое. Забавно, что у одной руки все-таки 5 пальцев. Хотя смущают не только пальцы, но и текстура мышц, больше похожая на корни деревьев.

Запрос: "Нарисуй жест "окей"":

-4

Снова проблема с мышцами большого пальца, но в целом неплохо. Согласны?

Запрос "Нарисуй потирание рук"

-5

А вот и странные ИИ-картинки. Но зато пять пальцев.

Запрос: "Нарисуй кулак"

-6

По сравнению с предыдущими вариантами, по-моему, неплохо.

Почему рисование рук становится испытанием для нейросетей?

Сложность анатомии

Руки человека – это сложная комбинация костей, суставов, мышц и кожи, которая может принимать огромное количество различных поз и форм. Для нейросети, обученной на большом количестве изображений, правильное воссоздание всех этих элементов – настоящий вызов. Каждый сгиб пальца, его положение относительно других пальцев, детали освещения и тени – все это требует точной работы алгоритма.

Проблемы с обучающими данными

Качество работы нейросети во многом зависит от обучающих данных. Фотографии и изображения рук, которые используются для обучения, могут быть разнообразными, но зачастую они не покрывают все возможные позы и углы обзора. Это приводит к тому, что нейросеть может неадекватно воссоздавать некоторые позиции рук или делать их непропорциональными.

Сложности с восприятием пространства

Руки часто взаимодействуют с другими объектами или частями тела, что создает дополнительные трудности для нейросетей. Понимание того, как рука взаимодействует с предметами или как она должна выглядеть в разных пространственных контекстах, требует сложных вычислений и глубокого понимания физических законов, что пока остается сложной задачей для искусственного интеллекта.

Выводы

В целом, проблемы с изображением рук нейросетями свидетельствуют о сложности воспроизведения человеческой анатомии и взаимодействия объектов в пространстве. По мере развития технологий и улучшения алгоритмов обучения нейросетей, качество их работы с изображением рук, скорее всего, будет улучшаться. Однако на данный момент это остается одной из ключевых задач, которые стоят перед разработчиками нейросетевых технологий.