Российские исследователи создали ИИ для распознавания абсурдных изображений

Разработанный ими метод TLG (Through the Looking Glass, «В Зазеркалье») использует ИИ для создания текстовых описаний картинок и обнаружения противоречий при сопоставлении с визуальным содержанием.Anti-Malware.ru
Исследователи из AIRI, Сколтеха, MWS AI и МФТИ по-новому решили одну из наиболее сложных задач компьютерного зрения — выявление изображений с нелогичным содержанием, вроде рыцаря с мобильником или пингвина на велосипеде.Anti-Malware.ru
Тестирование алгоритма показало точность распознавания до 87,5%, что на 0,5-15% выше показателей других существующих моделей, а также большую экономию вычислительных ресурсов.Anti-Malware.ru
Для разработчиков: использовать открытые библиотеки, поддерживающие мультимодальные модели (например, CLIP или BLIP-2), чтобы обучать ИИ пониманию текста и изображения одновременно.MoneyTimes.Ru
Эта новость в СМИ