В Японском передовом институте науки и технологий (JAIST) разработали диффузионную модель искусственного интеллекта, выполняющую архитектурный эскиз по текстовому запросу. Разработка описана в журнале Frontiers of Architectural Research. Она значительно превзошла аналоги, которые зачастую выдают визуально эффектные, но абсурдные результаты. Новая система генерирует изображения зданий, подчиняющиеся архитектурной логике, что ее по-настоящему полезным и надежным инструментом. Работа архитектора состоит, по сути, в том, чтобы воплотить концептуальный замысел в наглядный образ. Модели «текст-в-изображение» в этом смысле — настоящая находка: они рисуют высококачественный рендер по словесному описанию. Некоторые из таких систем могут даже учитывать наброски или данные о глубине. Но чаще они «не понимают» заданные параметры. Например, даже прямой запрос «сгенерируй пятиэтажное здание» может дать на выходе картинку с другим количеством этажей. Причина кроется в обучающих выборках: в них отсут