Добавить в корзинуПозвонить
Найти в Дзене
РР-Новости

Яндекс опубликовал библиотеку для ускорения изучения языковых моделей

Яндекс разработал и выложил в публичный доступ библиотеку YaFSDP, которая помогает ускорить процесс изучения больших языковых моделей искусственного интеллекта (LLM). Технология позволяет сократить время на процедуру обучения до 25%. Экономия ресурсов графических процессоров благодаря YaFSDP может достигать 20%. Благодаря своей эффективности YaFSDP особенно полезен для крупных проектов, требующих значительных ресурсов. Яндекс планирует сделать эту технологию общедоступной, чтобы ее могли использовать другие компании, разработчики и исследователи по всему миру. Код библиотеки уже доступен на GitHub, где вы можете найти подробные инструкции по ее использованию и примеры использования. Это еще один шаг Яндекса к открытому сотрудничеству со своим сообществом, которое активно развивается благодаря подобным инициативам. Яндекс регулярно делится своими разработками с сообществом. Так, в 2022-м компания обнародовала нейросеть для генерации и обработки текстов YaLM 100B и фреймворк userver для

Яндекс разработал и выложил в публичный доступ библиотеку YaFSDP, которая помогает ускорить процесс изучения больших языковых моделей искусственного интеллекта (LLM).

Технология позволяет сократить время на процедуру обучения до 25%. Экономия ресурсов графических процессоров благодаря YaFSDP может достигать 20%.

Благодаря своей эффективности YaFSDP особенно полезен для крупных проектов, требующих значительных ресурсов. Яндекс планирует сделать эту технологию общедоступной, чтобы ее могли использовать другие компании, разработчики и исследователи по всему миру.

Код библиотеки уже доступен на GitHub, где вы можете найти подробные инструкции по ее использованию и примеры использования. Это еще один шаг Яндекса к открытому сотрудничеству со своим сообществом, которое активно развивается благодаря подобным инициативам.

Яндекс регулярно делится своими разработками с сообществом. Так, в 2022-м компания обнародовала нейросеть для генерации и обработки текстов YaLM 100B и фреймворк userver для создания высоконагруженных приложений на языке C++, а в 2023-м — платформу для работы с большими данными YTsaurus.

]]>