Найти в Дзене
OpenAI выпустили новую модель o1 (ту самую Strawberry)⁠⁠
OpenAI снова наделали шума в мире искусственного интеллекта, запустив preview-версию своей новой модели o1, также известной как Strawberry (и Q* для тех, кто в теме). Эта модель — следующий шаг после GPT-4o и обещает значительно улучшить способность машин к рассуждениям. Что это значит для нас, простых пользователей? Вот краткий гид: Модель еще не в полной боевой готовности, но она уже показывает серьёзный потенциал...
8 месяцев назад
Adobe Firefly Video: Новая глава для видео с генеративным AI
Adobe представила Firefly Video Model — инструмент, который поможет создавать видео с помощью текстовых запросов. Эта модель была анонсирована как часть генеративных AI решений Adobe, уже применяемых для фото и дизайна, и теперь она будет доступна и для видеомонтажа. Теперь можно сгенерировать видео буквально за несколько минут, просто описав его. Например, захотелось дрон-видео над песками пустыни или макросъёмку одуванчика — вводите запрос, и Firefly создаёт нужный ролик. И хотя пока модель лучше...
8 месяцев назад
StoryGraph: новый инструмент для трекинга книг и анализа чтения⁠⁠
StoryGraph — бесплатное приложение для тех, кто хочет не только отслеживать прочитанные книги, но и получать более глубокое понимание своих читательских привычек. Приложение предлагает детализированную статистику: количество книг, страниц, скорость чтения по месяцам и даже анализ настроения при выборе книг. StoryGraph: новый инструмент для трекинга книг и анализа чтения Искусственный интеллект, Нейронные сети, Посоветуйте книгу, Книги, Ищу книгу Главная особенность StoryGraph — использование ИИ для персонализированных рекомендаций...
8 месяцев назад
FusionBrain Lab анонсировала новый метод редактирования изображений Guide-and-Rescale
FusionBrain Lab представила новый метод редактирования изображений под названием Guide-and-Rescale, который был принят на конференцию ECCV 2024. Этот метод использует диффузионные модели для выполнения изменений в изображениях на основе текстовых описаний, сохраняя при этом основные структурные элементы. Основные особенности Guide-and-Rescale: Для получения дополнительной информации и доступа...
9 месяцев назад
Safe Superintelligenc: стартап которому удалось привлечь миллиард долларов!
В то время как одни стартапы едва дотягивают до своего первого года, компания Safe Superintelligence (SSI), основанная уроженцем Нижнего Новгорода Ильей Суцкевером, бывшим главой науки OpenAI, привлекла ошеломляющие 1 миллиард долларов всего за три месяца своего существования. Оценка стартапа на данный момент составляет колоссальные 5 миллиардов долларов. SSI ставит перед собой амбициозную цель – разработать сверхразумный ИИ, который будет безопаснее и эффективнее человеческого интеллекта. Фокус...
9 месяцев назад
Как ИИ меняет будущее создания карточек товара для маркетплейсов
В мире онлайн-продаж создание привлекательных и эффективных карточек товара становится всё более важным аспектом успеха. Однако, как и многое другое, этот процесс тоже не стоит на месте. Искусственный интеллект (ИИ) открывает новые горизонты и революционизирует способы, которыми мы создаём и управляем карточками товаров. Давайте рассмотрим, как ИИ может изменить будущее создания карточек и какие перспективы открываются перед продавцами на маркетплейсах. Одной из самых заметных перемен, которую приносит ИИ, является автоматизация создания карточек товара...
9 месяцев назад
Melodio AI: бесконечная генерация text2music⁠⁠
Появился новый инструмент для создания музыки — Melodio AI, который предлагает пользователям возможность генерировать бесконечные музыкальные потоки, идеально подходящие под их настроение или задачи. Это особенно полезно для YouTube-каналов, стримингов, или как фоновая музыка для работы или отдыха. Сервис обещает адаптироваться в реальном времени, создавая звуковую атмосферу под любое действие — от тренировок до спокойных вечеров. Melodio AI генерирует короткие музыкальные фрагменты и объединяет их в бесконечный поток...
9 месяцев назад
Новая звезда в мире text2music моделей: FluxMusic⁠⁠
FluxMusic — это новый проект, который предлагает способ создания музыки на основе текстовых описаний, используя архитектуру Flux. По замыслу модель напоминает такие проекты, как Stable Audio и MusicLM, но с уникальной реализацией диффузионной модели с ректифицированным потоком. Как работает FluxMusic? Основная идея FluxMusic — преобразовывать текстовые подсказки (например, описание жанра, стиля или настроения) в музыкальные композиции. Модель использует несколько ключевых компонентов, включая VAE...
9 месяцев назад
MARS5 — новая бесплатная нейросеть для клонирования голоса на 140 языках⁠⁠
Вышла MARS5 — нейросеть от CAMB.AI, способная клонировать голос на более чем 140 языках. Это одна из самых многоязычных моделей среди аналогов. Ключевая особенность MARS5 — способность сохранять интонацию и эмоциональную окраску оригинального голоса при клонировании. MARS5 поддерживает русский язык и автоматически генерирует субтитры на языках, на которые выполняется перевод. Эта функция значительно упрощает локализацию контента, делая его доступным для широкой многоязычной аудитории. Субтитры создаются синхронно с переводом, что делает процесс удобным и быстрым при работе с видеоконтентом...
9 месяцев назад
Luma обновила Dream Machine:управление камерой в генераторе видео
Компания Luma выпустила обновление для своего популярного генератора видео Dream Machine, добавив в версию 1.6 расширенные возможности управления виртуальной камерой. Теперь пользователи могут не только создавать впечатляющие 3D-анимации, но и управлять движением камеры, добавляя динамики и глубины в свои проекты. В Dream Machine появились следующие опции управления камерой: - Move — плавное движение камеры влево, вправо, вверх или вниз. Идеально для создания плавных кадров, где камера «плывет» по сцене. - Push/Pull — позволяет приближать или отдалять камеру от объекта, создавая эффект увеличения или уменьшения масштаба...
9 месяцев назад
Анимация на основе 2D от Котиков до Голливуда⁠⁠
Тиаго Порто, человек с внушительным послужным списком, связанный с такими гигантами, как Mill VFX, Deep Voodoo LA и Technicolor, заставляет мир машинного обучения и компьютерного зрения двигаться в новом направлении. Его работа на передовой постпродакшена говорит о том, что за плечами у него не одна тысяча часов работы с топовыми студиями по всему миру. И вот что интересно: технологии, которые мы привыкли видеть в забавных роликах с танцующими девушками и анимированными котиками, уже становятся частью реальных кинопроизводственных пайплайнов. Тиаго не только экспериментирует с этими инструментами, но и открывает двери для всех желающих на своей платформе Thiago Porto Tplay...
9 месяцев назад
Hugging Face представили Speech-to-Speech модель⁠⁠
Команда Hugging Face представила новую разработку — Speech-to-Speech модель, которая, по их словам, является шагом на пути к созданию опенсорсной и модульной версии GPT-4. В отличие от мультимодальных решений от OpenAI, эта модель построена на основе комбинации отдельных компонентов, что дает пользователям больше гибкости. Проект собрал уже более 2700 звезд на GitHub и включает следующие ключевые элементы: Voice Activity Detection (VAD): Модель использует Silero VAD v5 для обнаружения активности голоса и управления процессом обработки...
9 месяцев назад