80 подписчиков
Дайджест:
📹 ВИДЕО + АРТ 🎨
Midjourney: выпустили Character Reference для генерации изображений человека по рефу. Мне казалось это уже было реализовано у них, но ок.
Neurogen: SD Portable обновлён до V 1.3, за счёт интеграции SD Fast повышена производительность в 2 раза, плюс другие улучшения.
Tencent: через ELLA снабжаем генераторы изображений улучшенным пониманием промтов без дополнительной тренировки.
🎸 ЗВУК 🎸
Google: добавили режим диджея в музыкальный генератор MusicFX. Задаём промтами какой звук нужно подмешать и микшируем ползунками.
🤖 ЧАТЫ 🤖
Groq (не путать с Grok от Маска): очень быстрая генерация текста словно это LCM для языковых моделей. На их сайте выбор шире (Mixtral, Gemma, лама).
Vercel: выпустили Generative UI + SDK 3 для генерации компонентов интерфейса на React и работы с данными в реальном времени.
Cohere: релизнули языковую модель (LLM) C4AI Command-R с контекстом 128К (можно книжки скармливать) и 35B параметрами. Имеет хорошие RAG-способности (анализ и обработка внешних данных).
DeepSeek-VL: визуальная языковая модель (VLM), с которой можно початиться по веб-страницам, диаграммам, формулам, картинкам, итд.
Исследование:
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
1 минута
15 марта 2024