80 подписчиков

Дайджест:

📹 ВИДЕО + АРТ 🎨

Midjourney: выпустили Character Reference для генерации изображений человека по рефу. Мне казалось это уже было реализовано у них, но ок.

Neurogen: SD Portable обновлён до V 1.3, за счёт интеграции SD Fast повышена производительность в 2 раза, плюс другие улучшения.

DanTagGen: инструмент, генерирующий подробные описания для text-2-image моделей.

Tencent: через ELLA снабжаем генераторы изображений улучшенным пониманием промтов без дополнительной тренировки.

SLD: скрипт для самокорректировки генерации картинок.

🎸 ЗВУК 🎸

Google: добавили режим диджея в музыкальный генератор MusicFX. Задаём промтами какой звук нужно подмешать и микшируем ползунками.

Bland: голосовой чат, который можно прикрепить к своему сайту и другим проектам.

🤖 ЧАТЫ 🤖

Groq (не путать с Grok от Маска): очень быстрая генерация текста словно это LCM для языковых моделей. На их сайте выбор шире (Mixtral, Gemma, лама).

Vercel: выпустили Generative UI + SDK 3 для генерации компонентов интерфейса на React и работы с данными в реальном времени.

Cohere: релизнули языковую модель (LLM) C4AI Command-R с контекстом 128К (можно книжки скармливать) и 35B параметрами. Имеет хорошие RAG-способности (анализ и обработка внешних данных).

MoAI: смесь экспертов (MoE) для чата по картинкам. Нечто похожее на SegMoE.

VideoMamba: модель для чата по коротким и длинным видео.

Gradio: теперь поддерживает Kubernetes.

DeepSeek-VL: визуальная языковая модель (VLM), с которой можно початиться по веб-страницам, диаграммам, формулам, картинкам, итд.

Google: презентовали библиотеку FAX для распределённых и федеративных вычислений.

FastV: подключаемое решение, позволяющее в теории ускорить инференс VLM на 45%.

Dateno: инструмент для поиска датасетов. У Hugging Face есть нечто похожее.

01.ai: выпустили модель Yi на 9B параметров.

Исследование:

* Крадём через API проекционные матрицы языковых моделей вроде ChatGPT или PaLM-2.

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude

Дайджест: 📹 ВИДЕО + АРТ 🎨 Midjourney: выпустили Character Reference для генерации изображений человека по рефу. Мне казалось это уже было реализовано у них, но ок.

1 минута

15 марта 2024