71 подписчик
Дайджест:
📹 ВИДЕО + АРТ 🎨
Corgi (Shifted Diffusion): модель может обучаться и генерировать изображения даже тогда, когда только небольшая часть или вовсе нет изображений в обучающем наборе, которые имеют связанные с ними текстовые описания.
LLM-grounded Diffusion: использование больших языковых моделей для генерации картинок и редактирования содержимого на них словами.
🎸 ЗВУК 🎸
WavJourney: фреймворк в котором LLM может управлять разными звуковыми моделями для генерации речи и звукового сопровождения, формируя нарратив. Код будет позже.
🤖 ЧАТЫ 🤖
WebArena: фреймворк для создания AI-агентов и бенчмарка их производительности. Пока рейтинг успешности 10%.
LoraHub: фреймворк, позволяющий объединять несколько LoRA языковых моделей, обученных на разных задачах. Цель состоит в том, чтобы на нескольких примерах, не требующих дополнительных параметров и обучения, добиться хорошей производительности на непредвиденных задачах.
Llama2-webui: ещё один веб-интерфейс для ламы 2. Поддерживает 4 и 8 бит квантизированные модели и на инференс нужно всего лишь 6 ГБ видеопамяти. Запускается и на CPU.
CodeGeeX2: генератор кода, обучен на 100+ языках и 600B данных кода, есть плагины для VSCode и JetBrains. Превосходит StarCoder-15B на 10% хотя у модели всего 6B параметров.
BigCode: при этом сами StarCoder, обучили на 1Т токенов для 80+ языков программирования маленькие модели 1B /3B /7B, которые лучшие в своём классе.
GOAT-7B: новая модель на основе первой ламы, по метрикам лучше других 7B лам из первой волны в своём классе.
💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
1 минута
28 июля 2023