В сегодняшней записи в блоге инженеры Apple поделились новыми подробностями о сотрудничестве с NVIDIA, направленном на повышение скорости генерации текста большими языковыми моделями (LLM). Ранее в этом году Apple опубликовала и открыла исходный код своей методики Recurrent Drafter (ReDrafter). Этот метод обеспечивает новый подход к генерации текста, обеспечивая существенно более высокую скорость и «достигая передовых результатов в отрасли». Он сочетает в себе два подхода: beam search (поиск по нескольким возможным вариантам) и dynamic tree attention (динамическое древовидное внимание) для эффективной обработки разных вариантов. Несмотря на то, что исследования Apple продемонстрировали впечатляющие результаты, компания пошла дальше и совместно с NVIDIA применила ReDrafter на практике. В рамках этой коллаборации метод ReDrafter был интегрирован в NVIDIA TensorRT-LLM — инструмент, помогающий ускорить работу LLM на графических процессорах NVIDIA. Чтобы осуществить интеграцию ReDrafter, NV
Apple сотрудничает с NVIDIA для ускорения работы больших языковых моделей
19 декабря 202419 дек 2024
1
2 мин