Найти в Дзене
Нейросети и музыка

От Midjourney до дельфинов: главные новости генеративного ИИ за апрель

​В апреле 2025 года мир генеративных нейросетей переживает настоящий бум. От визуального редактирования до общения с дельфинами — технологии стремительно развиваются. Предлагаю обзор самых ярких новинок, которые уже сейчас меняют творческие индустрии.​ Midjourney представила обновлённый редактор изображений с поддержкой слоёв, умным выделением объектов и возможностью загружать собственные изображения. Теперь пользователи могут создавать сложные композиции, объединяя сгенерированные и реальные изображения, а затем перегенерировать их в единое гармоничное полотно. ​ ByteDance выпустила модель Seaweed-7B, способную генерировать реалистичные видео с высокой точностью соответствия промптам. Несмотря на относительно небольшой размер (7 миллиардов параметров), Seaweed демонстрирует впечатляющие результаты в генерации видео и изображений. ​ Arcads AI представила функцию Reactions, позволяющую задавать эмоции для AI-аватаров в видео. Пользователи могут выбрать аватара, задать желаемую эмоцию и
Оглавление

​В апреле 2025 года мир генеративных нейросетей переживает настоящий бум. От визуального редактирования до общения с дельфинами — технологии стремительно развиваются. Предлагаю обзор самых ярких новинок, которые уже сейчас меняют творческие индустрии.​

Midjourney V7: слои, загрузка изображений и редактирование

Midjourney представила обновлённый редактор изображений с поддержкой слоёв, умным выделением объектов и возможностью загружать собственные изображения. Теперь пользователи могут создавать сложные композиции, объединяя сгенерированные и реальные изображения, а затем перегенерировать их в единое гармоничное полотно. ​

Seaweed от ByteDance: лёгкая модель с мощными возможностями

ByteDance выпустила модель Seaweed-7B, способную генерировать реалистичные видео с высокой точностью соответствия промптам. Несмотря на относительно небольшой размер (7 миллиардов параметров), Seaweed демонстрирует впечатляющие результаты в генерации видео и изображений. ​

Arcads AI: управление эмоциями в видео

Arcads AI представила функцию Reactions, позволяющую задавать эмоции для AI-аватаров в видео. Пользователи могут выбрать аватара, задать желаемую эмоцию и получить видео с реалистичным выражением чувств. Это открывает новые возможности для создания эмоционально насыщенного контента. ​

Google Veo 2: текст в видео за секунды

Google запустила модель Veo 2 для подписчиков Gemini Advanced. Теперь пользователи могут создавать 8-секундные видео в разрешении 720p, просто введя текстовый запрос. Модель обеспечивает кинематографическое качество и реалистичную анимацию. Также доступна функция Whisk Animate, позволяющая анимировать статические изображения.

Kling 2.0: новый уровень генерации видео

Kuaishou представила Kling 2.0 — модель генерации видео с улучшенной физикой, стабильностью объектов и плавной анимацией камеры. Пользователи отмечают высокое качество и реалистичность создаваемых видео, что делает Kling 2.0 одним из лидеров в своей области. ​

DolphinGemma: общение с дельфинами

Google разработала модель DolphinGemma, способную анализировать и воспроизводить звуки дельфинов. Модель обучена на данных проекта Wild Dolphin Project и уже используется для полевых исследований, позволяя ученым лучше понимать коммуникацию этих морских млекопитающих. ​

-2

Higgsfield AI: спортивные пресеты для генерации видео

Платформа Higgsfield AI, специализирующаяся на кинематографичной генерации видео, представила новое обновление — набор спортивных пресетов. Теперь пользователи могут создавать реалистичные видеоролики с движениями из мира бейсбола, скейтбординга, сноубординга и других активных видов спорта.

Это обновление значительно расширяет возможности генерации динамичных сцен и даёт авторам инструмент для имитации сложной спортивной хореографии без участия реальных актёров или студийной съёмки. Использование спортивных пресетов особенно ценно для рекламных роликов, трейлеров, клипов и промо-кампаний, ориентированных на энергичную визуальную подачу.

Ray-Ban Glasses: взгляд от первого лица

Очки Ray-Ban (от компании, запрещенной в РФ) становятся популярными среди фотографов и видеографов. Они позволяют снимать видео от первого лица, не отвлекаясь на камеры или смартфоны. Это особенно актуально для съёмки мероприятий, где важна естественность и спонтанность моментов. ​

-3

Заключение

Генеративные нейросети продолжают стремительно развиваться, открывая новые горизонты для творчества и коммуникации. От редактирования изображений до общения с животными — возможности безграничны. Следите за нашими обновлениями, чтобы быть в курсе самых свежих новостей в мире нейросетей и ИИ-музыки.​

Подписывайтесь на канал "Нейросети и музыка", чтобы не пропустить самые интересные новости и обзоры из мира искусственного интеллекта и творчества.