Найти в Дзене

Перевернет ли сгенерированная рука с пятью пальцами мировую экономику?


Коммент к посту выше, заставил задуматься о конспирологии в области ИИ.

Всегда испытывал симпатии к теориям заговоров, но в основном к их эстетике, нежели к логике.

Основной тезис, звучал так — корпорации искусственно ограничивают развитие нейронок.

Судя по реакциям, некоторые "вайбуют" с этим утверждением. Отчасти это так, но по моему мнению, причины ограничений не в желании затормозить развитие человечества. Давайте разберемся:

В открытом доступе безусловно есть нейросети, которые могут сгенерировать руку с 5-тью пальцами. И даже тот-же Midjourney это иногда делает, правда не всегда получается когда от руки требуется исполнить какую-то сложную манипуляцию или жест.

У меня есть сомнения, что появление нейросетей, которые в совершенстве посчитают пальцы на руках и покажут мировому сообществу анатомически корректный фак, приведет к уничтожению мировой экономики.

Обычно, ограничения нейронок связаны не с намеренным "обрезанием" возможностей, а с техническими трудностями в обучении моделей на данных, где такие детали могут быть искажены или недостаточно представлены. А так-же не забываем, про следование маркетинговым принципам закона MAYA.

Скрывают ли от нас военные 100% понимание промпта?

Думаю военным по барабану на дизайн сообщество. Скорее всего там действительно ведутся серьезные разработки в области машинного обучения, но количество пальцев на руках нарисованных людей им не мешает думать о том, о чем мы никогда не узнаем. Или узнаем в виде количества жертв с той или иной стороны конфликта.

Что действительно происходит?

А вот крупные игроки на рынке визуальной коммуникации действительно озабочены тем чтобы опередить конкурентов и дать модель которая будет одним промптом делать все. Все ждут Сору, но китайцы выпускают аналогичный по качеству Клинг, и теперь фокус битвы сместился с визуала в область консистентности и понимания промпта. Midjourney уже давно уперся в пределы реализма. Различия между версиями 6 и 6.1 минорны, а пониманию промпта еще далеко до уравня Dalle 3. Тем временем, Адоб оказался так себе в генерации внутри фотошопа, но зато выкатил киллер фичу для иллюстратора, которая позволяет натягивать логотип на любую поверхность.

Так-же многие модели разрабатываются в рамках открытого сотрудничества и выкладываются на платформах с открытым доступом вроде Guhub или huggingface. Откуда все желающие разбирают веса и тренируют свои модели.

Откуда берутся ограничения?

Да, многие коммерческие ИИ-системы имеют встроенные ограничения, но они обычно связаны с этическими и правовыми соображениями. Это не столько "заговор", сколько необходимость соблюдения правил и защиты пользователей (себя) от потенциальных рисков (исков). Хотя я бы охотно поверил в теорию заговора, где ИИ отберёт у человечества возможность различать соски и забыть о грудном вскармливании. Это наконец бы снизило рождаемость и золотой миллион смог бы спать спокойно.

Возвращаюсь к примеру с жрецами древнего Египта. Исторически действительно существовало и продолжает существовать неравенство в доступе к знаниям, но в современном мире уже есть интернет и образование. Помните как изобретение печатных станков немножко (чуть более чем полностью) пошатнуло христианские догматы?

И совершенно верно, что неравенство в доступе к технологиям остается, но думаю это больше вопрос экономических и инфраструктурных факторов, чем намеренного сокрытия.

Так случилось, что технологии всегда остаются за пределами полного понимания, пока мы не освоим их сами.

Здесь хочется перефразировать древнюю китайскую поговорку про указательный палец и луну. Вопрос, куда мы смотрим, на количество пальцев на руке или на сосок, куда она указывает?
Перевернет ли сгенерированная рука с пятью пальцами мировую экономику?  Коммент к посту выше, заставил задуматься о конспирологии в области ИИ.
3 минуты