Найти в Дзене
80 подписчиков

Дайджест:


📹 ВИДЕО + АРТ 🎨

Dashtoon: генерим и публикуем комиксы.

Tldraw: интерфейс обзавёлся русским языком и ещё по мелочи изменения в UI/UX.

LGM: используем гауссианы для создания 3D моделей из картинки, текста, или оных вместе взятых. Есть установка через Pinokio.

3DTopia: модель для генерации 3D, работающая в 2 этапа: создание чернового меша и полировки (refinement).

threefiner: улучшатель сгенерированных 3D мешей.

DreamMatcher: улучшаем консистентность генерируемых изображений на основе рефа.

Unity: в коллабе со Stability работают над Holo-gen, генератором PBR изображений на основе 3D геометрии и текстового промта.

Adobe: генерим изображения с пошаговым предугадыванием движения в кадре.

Гауссианы теперь нативно поддерживаются в Gradio. Кратко как собрать своё AI-приложение с 3D.

ByteDance: анимируем в Boximator картинки через выделение объектов.

V-JEPA: обученная на видео модель, которая понимает происходящее в кадре и может заполнять пробелы за маской.

Magic-Me: генератор видео с целевым лицом, похожий на InstantID, который для картинок.

🎸 ЗВУК 🎸

В Audacity появилась поддержка AI-плагинов для генерации музыки, смены её стиля, и выделения стэмов.

Stability: выпустили инструменты лежащие в основе Stable Audio. Ещё сделали страницу с демками.

Редактирование аудио с помощью текста.

🤖 ЧАТЫ 🤖

SPIN: нейронка генерит тренировочные данные и сама себя файнтюнит.

OpenAI: у ChatGPT теперь есть память, и его знания переносятся между чатами.

Сравниваем чаты по визуалу (VLM) через WildVision Arena.

Вышел Mistral Next . Можно сравнить тут бок-об-бок с Mixtral и другими моделями.

Gradio: появился компонент Gradio Notebook для возможности делиться своими AI-сборками в интерактивном режиме схожим с Google Colab.

GPT для нахождения и чата по бумагам на Arxiv.

Масштабируем контекстное окно LLM до 128К .

Яндекс: добавили в браузер выжимку длинных видео на русском и другие AI-фичи.
Дайджест:  📹 ВИДЕО + АРТ 🎨  Dashtoon: генерим и публикуем комиксы.  Tldraw: интерфейс обзавёлся русским языком и ещё по мелочи изменения в UI/UX.
1 минута