когда ошибки становятся поводом для смеха Современные нейросети, способные создавать изображения и даже целые видеоролики на основе текстовых описаний, уже давно перестали быть чем-то вроде научной фантастики. Однако, несмотря на поразительный прогресс в области искусственного интеллекта, эти системы всё ещё далеки от идеала — особенно когда речь заходит о понимании логики, контекста и человеческой эстетики. Иногда их "ошибки" вызывают не только недоумение, но и искренний смех. Генеративные модели вроде DALL·E, MidJourney, Stable Diffusion или новейшие видеогенераторы вроде Sora действительно умеют создавать впечатляюще реалистичные изображения и видеосцены. Но стоит задать им что-то чуть более сложное, чем "кошка на диване", как начинается самое интересное. Попробуйте запросить у нейросети, например: "человек играет на пианино, сидя спиной к камере" . Вместо аккуратного профиля музыканта вы можете получить человека с тремя руками, двумя головами или вообще без ног, словно он приклеен