Apple продемонстрировала свои возможности в области искусственного интеллекта (ИИ) с новой открытой моделью MLLM-Guided Image Editing (MGIE) для редактирования изображений. Эта модель использует мультимодальные модели больших языков (MLLM), чтобы интерпретировать текстовые команды при редактировании изображений. С помощью MGIE пользователь может редактировать фотографии, вводя текстовые команды. Например, можно попросить улучшить изображение пиццы, и ИИ интерпретирует это как «добавить овощные топпинги» и редактирует фото соответственно. Помимо значительных изменений, MGIE также умеет обрезать, изменять размер и вращать фотографии, а также улучшать их яркость, контраст и цветовой баланс. Этот инструмент также может редактировать конкретные области фотографии, изменять внешность человека или удалять элементы из заднего плана. Модель была представлена в открытый доступ через GitHub, и пока не ясно, планирует ли Apple интегрировать полученные знания в свои продукты.
Apple представила открытую модель ИИ для редактирования изображений
8 февраля 20248 фев 2024
14
~1 мин