Добавить в корзинуПозвонить
Найти в Дзене
Короче, Техника

Яндекс нашел способ обучать нейросети быстрее и дешевле. Экономия — 4,8 млрд рублей в год 🇷🇺💸

Пока мировые гиганты вроде Meta* и AMD гонятся за новыми чипами, Яндекс пошел другим путём — оптимизировал то, что уже есть. И результаты впечатляют.
Команда компании серьёзно прокачала обучение больших языковых моделей (LLM). Главное достижение — годовая экономия 4,8 млрд рублей. Это почти 400 миллионов в месяц, которые раньше уходили впустую.
📍 Что именно сделали?
1. Своя библиотека YCCL 🖥️

Пока мировые гиганты вроде Meta* и AMD гонятся за новыми чипами, Яндекс пошел другим путём — оптимизировал то, что уже есть. И результаты впечатляют.

Команда компании серьёзно прокачала обучение больших языковых моделей (LLM). Главное достижение — годовая экономия 4,8 млрд рублей. Это почти 400 миллионов в месяц, которые раньше уходили впустую.

Логотип YandexGPT
Логотип YandexGPT

📍 Что именно сделали?

1. Своя библиотека YCCL 🖥️

Разработка Яндекса, которая ускоряет обмен данными между графическими процессорами в 2 раза и уменьшает объём передаваемой информации. Самое интересное — такие библиотеки есть только у Meta*, AMD и китайских IT-гигантов. Яндекс теперь в этом списке.

2. Умные вычисления

Переход на формат FP8 (пониженная точность вычислений) дал:

· ускорение обучения на 30%

· сокращение коммуникаций в 2 раза

3. Оптимизация процессов

Яндекс увеличил батч (объём данных за один цикл) до 16–32 млн токенов. Это позволило обучать модели без простоев графических процессоров — они работают постоянно, а не простаивают в ожидании.

4. Надёжность

Снизили число аппаратных сбоев и расходы на перезапуск обучения. Звучит не так эффектно, но в мире дата-центров это святое.

🤔 Почему это важно?

Обычно, когда говорят об ИИ, все смотрят на чипы (Nvidia, AMD) или на сами модели (ChatGPT, YandexGPT). Но инфраструктура — это та самая скрытая магия, которая делает обучение возможным и доступным.

Яндекс не просто купил побольше железа — он заставил его работать эффективнее. А это значит, что:

· новые модели будут обучаться быстрее

· затраты (а значит, и цена для нас) могут снижаться

· технологический суверенитет крепчает

🔎 А что с конкурентами?

В Яндексе прямо говорят: аналоги YCCL есть только у Meta*, AMD и китайских гигантов. Ни Samsung, ни Apple, ни даже Google в этом списке не упомянуты. Конечно, у каждой компании свои подходы, но сам факт — Яндекс в одной фразе с такими именами.

📝 Итог: что это даёт нам?

Пользователям — в перспективе более умные и быстрые нейросети, которые при этом могут стать дешевле в разработке.

Индустрии — повод уважать российскую инженерную школу.

Яндексу — место за столом с мировыми лидерами.

Как вам такие новости? Следите за разработками Яндекса или кажется, что до мирового уровня ещё далеко? 👇

___________________________________________

**Компания Meta (Facebook и Instagram) признана в России экстремистской и запрещена