Корпорация Apple совместно с учеными из Калифорнийского университета в Санта-Барбаре выпустила мультимодальную модель искусственного интеллекта MGIE Чтобы отредактировать снимок, пользователю достаточно обычным языком описать, что он желает получить. Нейросеть MGIE (Multimodal Large Language Model-Guided Image Editing) может применяться для решения задач различной сложности, связанных с редактированием изображений — можно добавлять на изображение объекты, убирать или изменять их. При получении команды модель интерпретирует слова пользователя в команды. Среди примеров работы MGIE статье приводятся несколько примеров её работы. Когда модели поручили отредактировать фотографию пиццы и предложили «сделать ее более здоровой», нейросеть добавила овощей. Слишком темный снимок гепарда в пустыне по запросу «добавить контраста, имитируя больше света» нейросеть сделала ярче. MGIE уже доступна для бесплатного скачивания на GitHub, а опробовать ИИ в работе можно на платформе Hugging Face Spaces. В
Apple разработала нейросеть для редактирования фотографий. С помощью текстовых команд
9 февраля 20249 фев 2024
16
~1 мин