75 подписчиков
Дайджест:
📹 ВИДЕО + АРТ 🎨
FeatUp: повышение семплирования визуала, для увеличения пространственного разрешения любой модели в 16+ раз.
Stability AI: веб-интерфейс Stable Swarm, с нодовым UI и возможностью роботы в распределёнке на множестве GPU, перешёл в стадию беты. Добавилась поддержка Cascade, генерации видео через SVD, лицензия сменилась на MIT. Подробнее о Stable Swarm писал ранее.
Также они выпустили ещё одну модель для генерации 3D — StableVideo 3D. Состоит из двух частей: одна генерит из картинки видео с круговым облётом, а вторая делает 3D. По качеству — CRM лучше.
Isotropic3D: здесь же модель для получения 3D, и по качеству уже сопоставимо с CRM, но нужна как минимум A100 чтобы её гонять.
Shutterstock: а вот тут уже генерация 3D даже получше, чем CRM. Причём можно и скачать glb, и зарефайнить, и поиграться с параметрами.
MindEye2: обновлённому проекту по генерации изображений из мыслей на основе снимков фМРТ теперь достаточно 1 часа данных.
🎸 ЗВУК 🎸
Natural Speech 3: конвертор одного голоса в другой с соблюдением акустических деталей. XTTS и HierSpeech++ всё ещё лучше. Но у них скоро появится конкурент.
🤖 ЧАТЫ 🤖
Microsoft: под капотом бесплатной версии Copilot теперь GPT-4 Turbo с контекстом 128К (можно скармливать книжки). Работает в "Креативном" и "Точном" режимах.
LlamaFactory: фреймворк для файнтюна 100+ LLM (языковых моделей) без необходимости кодить. На русском в том числе.
Common Corpus: крупнейший публичный датасет из 500 млрд. слов для тренировки LLM на разных языках, не нарушая авторских прав.
Gorilla: инструмент для расширения функционала опенсорсных LLM через API обзавёлся фильтрацией ненужных документов (RAFT) перед генерацией ответа.
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
2 минуты
22 марта 2024