ИИ уже умеет писать, считать и рассуждать.
Но есть область, где он особенно впечатляет — создание изображений.
Красивые арты, реалистичные фото, обложки, логотипы, мемы — всё это сегодня генерируют нейросети.
И за этим чудом стоят так называемые диффузионные модели. Если объяснить без формул, то диффузионная модель — это ИИ, который учится превращать шум в картинку. Представь, что у тебя есть фотография, и ты постепенно добавляешь в неё шум, пока она не станет серой “кашей из пикселей”.
А потом ИИ учится делать этот процесс наоборот: шаг за шагом убирать шум и восстанавливать картинку.
Со временем он понимает, какие узоры и цвета образуют “кошку”, “лес”, “планету” или “портрет”, и может создавать что-то новое — по твоему описанию. 📸 То есть ты пишешь: “собака в очках на скейтборде, в стиле комикса” —
а модель превращает случайный шум в именно такую сцену. Одна из самых популярных моделей — Midjourney, созданная одноимённой калифорнийской компанией.
Она работает прямо в Discord