75 подписчиков
Дайджест:
📹 ВИДЕО + АРТ 🎨
🎸 ЗВУК 🎸
MusicGen: недавно Gradio добавили в интерфейс стриминг аудио, так что можно генерить музыку и слушать её намного быстрее.
UniAudio: фреймворк для гененрирования музыки, клонирования голоса, улучшения качества записи, и не только.
Инструкция как с нуля натренировать GPT-2 для генерации музыки.
🤖 ЧАТЫ 🤖
MistralAI, 7B модель превосходящая на бенчах ламу-2 13B, теперь доступна в hugging.chat. Народ уже пилит возможность общаться с ней голосом.
LLAVA: визуальная языковая модель (VLM) для чата по картинкам обновилась до v 1.5. Это опенсорсный соперник GPT-4 Vision, который на 11 бенчах лучше Qwen-VL (Alibaba) и IDEFICS (HuggingFace). При этом натренирована на разительно меньшем количестве данных.
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
1 минута
10 октября 2023