Найти тему
Просто о технологиях

Будущее графического дизайна: как Stable Diffusion 3 обещает изменить все

Оглавление

Stability AI взрывает интернет своим последним творением - Stable Diffusion 3. Это не просто еще одна версия их модели искусственного интеллекта для создания изображений - это настоящий прорыв. Пока подробности остаются в тени, но одно очевидно: они стремятся защитить свою позицию от конкуренции со стороны OpenAI и Google, которые только что анонсировали свои новые продукты.

Публичный доступ уже скоро

Более подробный технический анализ всего этого будет доступен скоро, но на данный момент вам стоит знать, что Stable Diffusion 3 (SD3) основана на новой архитектуре и будет работать на различных типах оборудования (хотя вам все еще понадобится что-то мощное). Модели еще нет в открытом доступе, но вы можете записаться в список ожидания на официальном сайте Stability AI.

Stable Diffusion 3 применяет новейшую технологию под названием "диффузионный трансформатор", которая была разработана в 2022 году, затем улучшена в 2023 году и теперь обеспечивает высокую масштабируемость. Этот подход позволяет улучшить качество генерируемых изображений без увеличения вычислительной нагрузки. Вероятно, подобные принципы применяются и в видеогенераторе Sora от OpenAI, о чем может свидетельствовать сотрудничество Уилла Пиблса, одного из соавторов статьи, с проектом Sora. Также в SD3 используется технология "сопоставление потоков", которая также способствует улучшению качества результатов.

Предыдущая модель Stable Diffusion
Предыдущая модель Stable Diffusion

Количество параметров модели варьируется от 800 миллионов (меньше, чем в широко используемой SD 1.5) до 8 миллиардов (больше, чем в SD XL), с целью работать на различном оборудовании. Вам, вероятно, все еще понадобится серьезный GPU и настройка, предназначенная для работы с машинным обучением, но вы не ограничены использованием API, как это обычно бывает с моделями от OpenAI и Google.

Предыдущая модель Stable Diffusion
Предыдущая модель Stable Diffusion

На X, бывшем Twitter, глава Stable Diffusion Эмад Мостак отмечает, что новая модель способна к обработке информации из разных источников, а также к генерации видео (неужели как Sora от Open AI?), все то, на что его конкуренты делают акцент в своих API-ориентированных конкурентах. Эти возможности пока теоретические, но похоже, что технических препятствий для их включения в будущих релизах нет.

Преимущества Stable Diffusion

Сравнивать эти модели невозможно, потому что ни одна из них еще не выпущена, и все, что у нас есть, это конкурирующие заявления и подобранные примеры. Но у Stable Diffusion есть одно определенное преимущество: это генерация изображений где угодно, без подписок и даже подстраиваясь под необходимый стиль. (Действительно, по всей вероятности, SD3 почти наверняка введет в эпоху искусственного интеллекта новую эру генерации порнографического контента.)

Похоже, Stable Diffusion стремится стать стандартом в сфере генеративного искусства, неотъемлемым инструментом для всех, кто работает с искусственным интеллектом, в то время как другие решения могут быть восприняты как нечто необязательное или непонятное. Для этого компания совершенствует свои инструменты, чтобы сделать их более доступными, но конкретные улучшения остаются под вопросом.

Интересно, что компания делает акцент на безопасности в своем объявлении, говоря:

Мы предпринимаем и продолжаем предпринимать разумные меры для предотвращения недобросовестного использования Stable Diffusion 3. Безопасность начинается еще на этапе обучения модели и продолжается на протяжении тестирования, оценки и внедрения. В преддверии этого раннего предпросмотра мы ввели множество защитных механизмов. Постоянно сотрудничая с исследователями, экспертами и нашим сообществом, мы намерены продолжать инновации с сохранением неприкосновенности в подходе к публичному выпуску модели.

Что именно представляют собой эти меры безопасности? Нет сомнений, что предварительная информация включает в себя некоторые аспекты этого вопроса, но детали могут быть дополнительно уточнены или даже подвергнуты цензуре при публичном выпуске, в зависимости от вашей точки зрения на подобные вопросы. Ожидается, что мы скоро узнаем больше, а пока мы продолжим изучать технические аспекты, чтобы лучше понять теорию и методы этого нового поколения моделей.

Читайте также: https://dzen.ru/a/Zdbm0laa7nu0IRbU

Конкуренция между компаниями стимулирует постоянное улучшение качества и возможностей искусственного интеллекта. Однако остается множество вопросов, на которые пользователи ещё не получили ответов. Какие новые технологии использованы в SD3? Какие возможности предоставит новая модель для обработки данных и генерации контента?
Жду ваших предположений в комментариях!

Если статья Вам была интересна, не забудьте поставить лайк и подписаться на канал, вас ждут свежие технологические новости, полезные обзоры и экспертные советы по работе с техникой и искусственным интеллектом!