Vishal Bansal, Unsplash NVIDIA объявила в своём блоге, что её библиотекой с открытым исходным кодом TensorRT-LLM, которая ранее была анонсирована для центров обработки данных, теперь можно воспользоваться на компьютерах под управлением Windows, сообщает Neowin. Библиотека TensorRT-LLM позволяет LLM работать до четырёх раз быстрее на ПК с видеокартами NVIDIA GeForce RTX. В блоге NVIDIA описывает преимущества TensorRT-LLM как для разработчиков, так и для обычных пользователей: «При больших объёмах пакетов это ускорение значительно улучшает работу более сложных LLM — например, помощников по написанию и программированию, которые выдают сразу несколько уникальных результатов в автоматическом режиме. В результате повышается производительность и качество, а пользователи получают возможность выбирать самые лучшие результаты». Также был показан пример работы TensorRT-LLM совместно с языковой моделью Llama 2 и другими инструментами. Базовая модель мало что знает о технологиях NVIDIA, поэтому на
Библиотека NVIDIA TensorRT-LLM для ускорения языковых моделей теперь доступна на Windows
18 октября 202318 окт 2023
4
1 мин