Исследователи компании Apple создали новую модель ИИ с открытым исходным кодом, способную редактировать изображения на основе инструкций пользователя на естественном языке (через VentureBeat). Названная «MGIE», что означает MLLM-Guided Image Editing, она использует мультимодальные модели большого языка (MLLM) для интерпретации запросов пользователя и выполнения манипуляций на уровне пикселей. Модель способна редактировать различные аспекты изображений. Глобальные улучшения фотографий могут включать в себя яркость, контрастность или резкость, а также применение художественных эффектов, таких как наброски. Локальное редактирование может изменять форму, размер, цвет или текстуру определенных областей или объектов на изображении, а модификации в стиле Photoshop могут включать обрезку, изменение размера, поворот и добавление фильтров, или даже изменение фона и смешивание нескольких изображений в одно. Пользователь может ввести для фотографии пиццы команду «сделать ее более здоровой». Исполь
Новая модель ИИ от Apple редактирует изображения на основе естественного языка
10 февраля 202410 фев 2024
1
2 мин