Диффузионные модели генерируют невероятные изображения. Если попросить DALL-E 2, систему генерации изображений, созданную OpenAI, нарисовать картину “золотых рыбок, глотающих кока-колу на пляже”, она выдаст сюрреалистическое изображение именно того, что вы просили. Программа могла столкнуться с изображениями пляжей, золотых рыбок и кока-колы во время обучения, но маловероятно, чтобы она увидела изображение, в котором все три составляющие были бы вместе. Тем не менее, DALL-E 2 может собрать эти концепции в нечто, чем мог бы гордиться сам Дали. Ключевая идея, позволяющая создавать изображения DALL-E 2, а также его конкурентов Stable Diffusion и Imagen, пришла из мира физики. Система, лежащая в их основе, известная как модель диффузии, в значительной степени вдохновлена неравновесной термодинамикой, которая регулирует такие явления, как распространение жидкостей и газов. "Есть много методов, которые изначально были изобретены физиками, а теперь очень важны в машинном обучении", - говорит