Найти тему
75 подписчиков

Nvidia: выпустили NVLM 1.0, серию мультимодальных моделей для чата по тексту и визуалу (картинки, pdf доки, графики, рукописный текст, итд).


Первой вышла в релиз версия NVLM-D размером 72B, анонсированная в середине сентября. На бенчах бьёт GPT-4o и Llama 3-V 405B, но с тех пор уже вышла лама 3.2 и возможно детище Nvidia ей проигрывает. Ещё и потому что она есть только в одном большом размере, который дома запустить проблема, а лама есть всех мастей от мала до велика.

Но пишут, что можно запустить в multi-GPU режиме. Будем наблюдать, что ещё выпустят.

Nvidia: выпустили NVLM 1.0, серию мультимодальных моделей для чата по тексту и визуалу (картинки, pdf доки, графики, рукописный текст, итд).
Около минуты