Найти тему
76 подписчиков

Дайджест:


📹 ВИДЕО + АРТ 🎨


Плагин "3D Gaussians" теперь доступен на Unreal Engine Marketplace.

HDTR: модель с фокусом на реконструкции движений лица и губ.

🤖 ЧАТЫ 🤖

IBM: опубликовали метод ModuleFormer, представляющий собой коллаб LLM-экспертов (MoE). Легко справляется с забыванием контекста и расширением знаний, при этом производительнее и использует компьют только тех экспертов, которые релевантны. Вместе с этим опубликовали модели MoLM на 4B и 8B, которые натренены на 300B открытых данных.

Shampoo: метод распределенной тренировки AI на множестве GPU, который на 10% эффективнее других методов за счет распределения памяти и вычислений, связанных с блоками каждого параметра, через структуру данных DTensor в PyTorch и выполнения примитива AllGather для вычисленных направлений поиска на каждой итерации.

Agents: опенсорсный фреймворк AI-агентов для выполнения веб-навигации и использования AI-инструментов с уровнем контроля на уровне задач и SOP.

CulturaX: огромный очищенный датасет из 6,4Т токенов для LLM на 167 языках.

LayoutNUWA: вписываем текст, генерируемый LLM в макеты.

PDFTriangle: метод для обработки PDF доков LLM с сохранением структуры и контекста.

Исследования:
* контрастивное декодирование улучшает рассуждения в больших языковых моделях
* Sorted LLaMA: меняем Supervised Fine-Tuning (SFT) на Sorted Fine-Tuning (SoFT) и получаем большую производительность модели за меньший компьют.
* три бумаги на тему музыки: раз + два + три

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
Дайджест:  📹 ВИДЕО + АРТ 🎨  Веб-интерфейс для генерации оптических иллюзий.  Плагин "3D Gaussians" теперь доступен на Unreal Engine Marketplace.
1 минута