Найти тему
76 подписчиков

Дайджест:


📹 ВИДЕО + АРТ 🎨

LASDFD: перевод 2D объектов в 3D и контроль локальной геометрии. Работает в две диффузионные стадии: создание превью с низким разрешением, и затем генерация объекта в высоком разрешении по намеченной геометрии.

MS-NeRF: генерация NeRF-сцен с использование нескольких параллельных подпространств для более точного рендеринга, особенно в случаях, когда в кадре есть отражающие объекты. Превосходит существующие методы NeRF в качестве визуализации сцен с сложными световыми путями через зеркальные объекты.

🤖 ЧАТЫ 🤖

RedPajama: вышла RedPajama-INCITE-Chat-3B-v1, усовершенствованная модель чат-бота с высокой few-shot и zero-shot производительностью.

ZipIt!: объединяем разные модели, каждая из которых решает отдельную задачу, в одну многозадачную модель без дополнительного обучения.

Plan-and-Solve (PS) Prompting: улучшаем способности LLM к решению задач в области обработки естественного языка, используя входные сигналы для подсказки правильного порядка выполнения шагов в задачах многошагового рассуждения. Можно автоматически разбить большую задачу на более мелкие и подробно описать, как выполнить каждый шаг.

Residual Prompt Tuning: улучшаем производительность и стабильность тюнинга промтов, через параметризацию эмбедингов и неглубокую сеть с остаточной связью

Vcc: исследование масштабирования трансформеров до 128К токенов, но в отличии от предыдущих проектов на эту тему, авторы добились 3х увеличения скорости на 4к и 16к токенов.

X-LLM: метод, который позволяет LLM обрабатывать не только текст, но и другие типы информации, такие как изображения и речь, путем преобразования мультимодальной информации в иностранные языки и ввода их в большую языковую модель.

Multi-modal GPT: ещё одна мульти-модальная модель, под капотом OpenFlamingo.
Дайджест:  📹 ВИДЕО + АРТ 🎨  LASDFD: перевод 2D объектов в 3D и контроль локальной геометрии.
1 минута