Найти тему
130,8K подписчиков

Новый генератор изображений ИИ от Meta был обучен на 1,1 млрд фотографий из Instagram и Facebook

Для того чтобы создать результат на основе текстового ввода, чат-бот с искусственным интеллектом должен быть обучен на данных. Те, кто выдает текстовый результат, обучаются на письменных материалах, а те, кто создает изображения, - на большом кэше фотографий.

Компания Meta (признана в России экстремистской организацией; деятельность на территории РФ запрещена) недавно запустила свой новый генератор изображений на основе ИИ, и в одном из отчетов было предложено количество изображений, используемых для обучения базовой модели.

Для того чтобы создать результат на основе текстового ввода, чат-бот с искусственным интеллектом должен быть обучен на данных.

Бесплатный автономный сайт Meta - Imagine, генерирующий изображения с помощью ИИ, основан на модели синтеза изображений Emu. Согласно отчету Arstechnica, компания использовала 1,1 млрд общедоступных изображений Facebook и Instagram для обучения модели ИИ. Это означает, что если у пользователя не заблокирован аккаунт в Facebook или Instagram, есть вероятность, что его фотографии были использованы для обучения Emu.

По состоянию на 2016 год пользователи Instagram загружали более 95 млн фотографий в день, что позволяет предположить, что набор данных, использованный компанией Meta для обучения своей модели ИИ, гораздо меньше предполагаемой библиотеки фотографий.

Создатель изображений Meta основан на Emu, модели искусственного интеллекта, лежащей в основе новых функций Meta по созданию изображений. В сентябре 2023 года компания опубликовала исследовательскую работу, в которой подробно описала, что технология Emu получает способность генерировать высококачественные изображения благодаря процессу, называемому настройкой качества. Однако эти предварительно обученные модели часто сталкиваются с проблемами, когда речь идет о создании высокоэстетичных изображений, говорится в статье компании. Поэтому возникает необходимость в эстетическом выравнивании после предварительного обучения. Настройка качества направляет предварительно обученную модель на создание изображений, сохраняя при этом общность визуальных концепций.

Разработчики предварительно обучают модель скрытой диффузии на 1,1 млрд пар изображение-текст и настраивают ее с помощью всего нескольких тысяч тщательно отобранных высококачественных изображений. Полученная модель Emu достигает 82,9% по сравнению с аналогом, прошедшим предварительное обучение, говорится в заявлении компании.

На 9 декабря 2023 года компания Meta не уточнила, откуда были взяты данные для обучения, но, как сообщается, президент Meta по глобальным вопросам Ник Клегг сообщил о том, что компания использовала посты в социальных сетях в качестве обучающих данных для моделей ИИ, включая изображения, загруженные в Emu.

📃 Читайте далее на сайте