Китайские исследователи представили UniCorn — своеобразный «реабилитационный курс» для мультимодальных моделей, который учит ИИ замечать собственные сбои и самостоятельно их исправлять. Сегодня многие мультимодальные системы умеют не только понимать изображения, но и создавать их. Однако между этими двумя умениями нередко появляется неожиданная пропасть. Модель, например, может безошибочно определить: пляж расположен слева, а волны — справа, но стоит ей самой сгенерировать картинку — и стороны вдруг меняются местами, будто в зеркале. Учёные из Университета науки и технологий Китая (USTC) и ряда других вузов называют этот странный эффект «проводниковой афазией» — аналогией с неврологическим расстройством, при котором человек понимает речь, но не может правильно её воспроизвести. UniCorn призван ликвидировать этот разрыв между пониманием и созданием. Основная задумка UniCorn проста, почти интуитивна: если модель лучше оценивает изображение, чем генерирует его, то её способность оценивать