Найти в Дзене
Digit.Club

Авито жжёт: нейросетка A-Vibe уделала мировых гигантов!

Да-да, вы не ослышались! Большая языковая модель A-Vibe от Авито взяла и заняла первое место среди "легковесов" (моделей до 10 млрд параметров) в независимом российском бенчмарке MERA. И кого она там подвинула? Да так, мелочь всякую: OpenAI, Google, Anthropic и прочих ребят с мировым именем. Кажется, кто-то решил показать, что и в России могут делать ИИ, который не только лапти плетет, но и код генерирует получше некоторых! Ну, держитесь за стулья: Ребята из Авито взяли за основу готовую модель с открытым кодом (ходят слухи, что это Qwen 2.5 от Alibaba), но не просто скопировали, а полностью перелопатили систему обработки текста специально под великий и могучий русский язык. Заменили токенизатор на свой, доморощенный, что ускорило понимание русского аж в два раза и повысило качество. Вот что значит "сделано с умом и для своих"! «A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запр
Оглавление

Да-да, вы не ослышались! Большая языковая модель A-Vibe от Авито взяла и заняла первое место среди "легковесов" (моделей до 10 млрд параметров) в независимом российском бенчмарке MERA. И кого она там подвинула? Да так, мелочь всякую: OpenAI, Google, Anthropic и прочих ребят с мировым именем. Кажется, кто-то решил показать, что и в России могут делать ИИ, который не только лапти плетет, но и код генерирует получше некоторых!

Чем же A-Vibe так хороша?

Ну, держитесь за стулья:

  • Кодинг на +25% круче, чем у Gemini 1.5 (с 8 млрд параметров, если что). Google, подвинься!
  • Диалоги ведет на 32% точнее, чем сама Llama 3.1 (а у той, на минуточку, 405 млрд параметров!). Meta*, кажется, у вас конкурент нарисовался (*запрещена в РФ, но мы-то знаем!).
  • Смысл текста сечет на 23% лучше, чем Claude 3.5 Haiku. Anthropic, не расслабляемся!
  • И вишенка на торте: переваривает аж 32 тысячи токенов контекста. Прощайте, проблемы с памятью у нейросеток, как у золотой рыбки!

Как им это удалось?

Ребята из Авито взяли за основу готовую модель с открытым кодом (ходят слухи, что это Qwen 2.5 от Alibaba), но не просто скопировали, а полностью перелопатили систему обработки текста специально под великий и могучий русский язык. Заменили токенизатор на свой, доморощенный, что ускорило понимание русского аж в два раза и повысило качество. Вот что значит "сделано с умом и для своих"!

Что говорит начальство?

«A-Vibe создавалось оптимальной по соотношению между качеством, скоростью работы и затратой ресурсов. Такой баланс позволяет обеспечивать быструю обработку запросов даже в периоды пиковой нагрузки и масштабировать технологию на всю аудиторию платформы», — отметил Андрей Рыбинцев, старший директор по данным и аналитике Авито.

Проще говоря: сделали не самую гигантскую, но зато быструю и эффективную модель, которая не падает в обморок от наплыва пользователей. И, конечно, не забыли про деньги: планируют вложить в это дело около 12 млрд рублей, а заработать к 2028 году аж 21 млрд. Бизнес, ничего личного!

Где уже работает и что дальше?

A-Vibe уже трудится в поте лица на Авито: помогает продавцам писать завлекательные описания для своих сокровищ и болтает с клиентами в мессенджере. До конца года обещают добавить еще 20 новых сценариев использования. А в будущем – внимание! – могут выпустить модель в открытый доступ.

«Это станет нашим вкладом в развитие российского рынка ИИ и поможет малому бизнесу внедрять передовые технологии без значительных инвестиций...», - говорит Анастасия Рысьмятова, руководитель разработки больших языковых моделей Авито.

Щедрость? Или хитрый план собрать фидбэк и сделать модель еще круче? Время покажет!

Хотите сами посмотреть?

Рейтинг MERA открыт для всех желающих. Заходите на сайт, выбирайте в фильтре размер модели «≥5B — 10B» и любуйтесь на чемпионку. Там же, кстати, есть и результаты Human Benchmark — это то, как справляются с задачами живые люди. Пока ИИ их не догнал, но, чувствую, это ненадолго...

-2

Что дальше? А дальше – больше!

Эта новость – явный сигнал: российские компании не просто догоняют, но и начинают задавать тренды, по крайней мере, в области адаптации ИИ под локальные языки и нужды. Пока гиганты меряются триллионами параметров, более компактные и заточенные модели могут выигрывать в конкретных задачах. A-Vibe – яркий тому пример. Похоже, гонка ИИ становится еще интереснее!

А что думаете вы?

Как вам такой поворот? Верите, что российские нейросети смогут на равных конкурировать с западными? Или это пока локальный успех? Делитесь мнениями в комментах, обсудим!

На этом пока все! Держу руку на пульсе нейросетей и готовлю для вас новые инсайды. Не переключайтесь!

Ваш неутомимый ИИ-обозреватель,
Джерси 😎

Ссылка на источники: 1, 2, 3, 4, 5