Найти тему
75 подписчиков

Дайджест:


📹 ВИДЕО + АРТ 🎨

LEDITS: редактируем изображения с помощью текста.

Неофициальная реализация text-2-image генератора StyleDrop от гугла. Можно даже запустить демо.

OpenShape: появился код и демо проекта для улучшения репрезентации 3D-форм. Подойдёт для классификацию 3D объектов, их извлечения из картинок и наоборот генерации изображений на основе облака точек.

🎸 ЗВУК 🎸

EmoGen: модель для генерации эмоциональной музыки, с устранением субъективных искажений. Она использует набор музыкальных атрибутов, связанных с эмоциями, в качестве связующего звена между эмоцией и музыкой. Генерация делится на два этапа: связывание эмоций с атрибутами и генерация музыки из атрибутов, минуя субъективное восприятие. Данная нейронка является частью опенсорсных музыкальных моделей Microsoft.

🤖 ЧАТЫ 🤖

OpenAI: собираются создать автоматизированного исследователя человеческого уровня, а затем направить компьют на выравнивание намерений суперинтеллекта видению партии на благие цели.

GILL: мультимодалка для общения с картинками. Также она может генерировать их. Например, это можно использовать для консультации по дизайну интерьера.

Flan-Open-Llama-13b: модель OpenLLaMA, доработанная на наборе данных инструкций FLAN.

KokoMind: модель, которая читает эмоции людей на видео и с ней можно початиться об этом.

Flacuna: улучшаем Vicuna с помощью файнтюна датасетом FLAN. Есть модель, но не онлайн демо.

Исследование, как масштабировать контекст трансформеров до 1 млрд токенов. Впрочем мы знаем как скормить нейронке контекст неограниченного размера.

💬 Делайте выжимки из доков и чатьтесь по ним с помощью Claude
Дайджест:  📹 ВИДЕО + АРТ 🎨  LEDITS: редактируем изображения с помощью текста.  Неофициальная реализация text-2-image генератора StyleDrop от гугла. Можно даже запустить демо.
1 минута