Найти тему
Логово ИИ

Почему у ИИ-арта слишком много пальцев?

Примечательной особенностью искусства ИИ является то, что оно часто изображает людей с очень странными руками. «Странная причуда рук» становится распространенным показателем того, что искусство было создано искусственно. Эта странность позволяет лучше понять, как работает (и не работает) генеративный ИИ.

Как работает генеративный ИИ?

Генеративный ИИ использует машинное обучение для обработки огромного количества визуальных или текстовых данных, большая часть которых взята из Интернета. Затем определяет, какие вещи, скорее всего, появятся рядом с другими вещами. Большая часть работы по программированию генеративного ИИ уходит на создание алгоритмов, которые могут различать «вещи», представляющие интерес для создателей ИИ — слова и предложения в случае чат-ботов, таких как ChatGPT, или визуальные элементы для DALL-E.

Но, по сути, генеративный ИИ создает свои результаты, оценивая огромный массив данных, на которых он был обучен. А затем – отвечая на подсказки чем-то, что попадает в область вероятности, определяемую этим запросом.

Автозаполнение – когда ваш мобильный телефон предлагает варианты следующего слова в предложении, которое вы печатаете, это низкоуровневая форма генеративного ИИ. Такие модели, как ChatGPT и DALL-E, просто доводят идею до значительно более высоких высот.

Но почему все же пальцев так много?

Мы уже определили, что Midjourney и аналогичные инструменты визуального генеративного ИИ обучены на множестве изображений. И изображения людей обычно дают хорошее представление об их лицах... но их руки часто частично скрыты или показаны под странным углом, поэтому вы не можете видеть все пальцы сразу.

Добавьте к этому тот факт, что руки имеют сложную структуру — их очень трудно рисовать даже обученным художникам. Да и сборка сложной 3D-модели рук на основе различных 2D-изображений в обучающем наборе простоты не добавляет.

Все, что может делать ИИ, это попытаться предсказать, основываясь на имеющихся у него изображениях, как может выглядеть похожее изображение. Несмотря на огромное количество обучающих данных, эти прогнозы часто не оправдываются.

Подписывайтесь на канал, чтобы не пропускать новые публикации.