Популярный сервис для создания изображений с использованием искусственного интеллекта Midjourney внедрил одну из своих наиболее часто запрашиваемых функций: возможность последовательного воссоздания персонажей на новых изображениях.
На сегодняшний день это было серьезным препятствием для генераторов изображений с искусственным интеллектом по самой их природе. Это потому, что большинство генераторов изображений AI полагаются на “модели распространения”, инструменты, аналогичные или основанные на алгоритме генерации изображений с открытым исходным кодом Stable Diffusion от Stable AI, которые работают грубо, беря текст, введенный пользователем, и пытаясь собрать попиксельно изображение, соответствующее этому описанию, как следует из похожих изображений и текстовых тегов в их огромном (и противоречивом) наборе обучающих данных из миллионов изображений, созданных человеком. Однако, как и в случае с текстовыми моделями больших языков (LLM), такими как ChatGPT от OpenAI или Cohere's new Comm