Сидите вы вечером, и решаете сгенерировать какое-нибудь изображение для работы, соцсетей или просто для себя. Пишите, как вам кажется идеальный промт, например, черный дракон парит над замком в грозу, невероятная детализация, фотореализм. Нажимаете кнопку, пара секунд ожидания и нейросеть выдает вам… маленького дракончика размером с котенка, который сидит на крыше и глупо улыбается. Давайте честно признаем что любой, кто хотя бы пару раз пользовался нейросетями, сталкивался с такой проблемой. Пишите промт, надеетесь на один результат, а в итоге получаете совершенно не то. Знакомо? Это, как мне кажется, и есть главная проблема современных генеративных нейросетей. По-сути процесс напоминает игру в рулетку. Вы пишете промпт, нажимаете кнопку, и никогда не знаете, что именно выпадет. И вот вчера, задумавшись об этом, я подумал о следующем. А что, если дать нам, пользователям, настоящие инструменты управления? Представьте себе интерфейс, где вы не подбираете слова, чтобы объяснить ИИ, где
Следующий этап в развитии генеративного ИИ. Почему будущее генеративного ИИ за визуальным контролем
4 марта4 мар
10
3 мин