Найти в Дзене
AivanElectric

Масштабное обновление нейросетей Яндекса 15 апреля 2025. Что нового в отечественных нейросетях?

15 апреля 2025 года Яндекс провёл конференцию. Помимо представления и обновления различных физических продуктов (колонки, ТВ, системы умного дома и мультимедийные системы в АвтоВАЗ), серьёзные изменения произошли и в нейросетях. Первая российская рассуждающая модель, работа с большими текстовыми файлами, анализ фото (мультимодальность), live видео режим, глубокий поиск и освоение английской озвучки. При этом у Яндекса уже имеется 32B модель с возможностью поиска, генератор картинок достойного качества; отдельные нейросети для преобразования и редактирования текста, создания пересказов, голосового перевода видео и расширенного нейро поиска. Всё это работает быстро, с минимальными ограничениями по количеству, без VPN и менее чем за 0,5 КРуб/мес (многие функции доступны бесплатно). Проверим, хорошо ли работают новые нейросети. В качестве конкурентов выступают: полностью бесплатный и тоже российский Gigachat от Сбера; также полностью бесплатный и без проблем доступный китайский Deepseek; и

15 апреля 2025 года Яндекс провёл конференцию. Помимо представления и обновления различных физических продуктов (колонки, ТВ, системы умного дома и мультимедийные системы в АвтоВАЗ), серьёзные изменения произошли и в нейросетях. Первая российская рассуждающая модель, работа с большими текстовыми файлами, анализ фото (мультимодальность), live видео режим, глубокий поиск и освоение английской озвучки. При этом у Яндекса уже имеется 32B модель с возможностью поиска, генератор картинок достойного качества; отдельные нейросети для преобразования и редактирования текста, создания пересказов, голосового перевода видео и расширенного нейро поиска. Всё это работает быстро, с минимальными ограничениями по количеству, без VPN и менее чем за 0,5 КРуб/мес (многие функции доступны бесплатно). Проверим, хорошо ли работают новые нейросети.

В качестве конкурентов выступают: полностью бесплатный и тоже российский Gigachat от Сбера; также полностью бесплатный и без проблем доступный китайский Deepseek; и как бы эталон – Open AI Chat GPT, но в бесплатной версии (а плюс стоит аж 20 баксов), и для него нужно уехать из России. Сравним правильность и качество ответов по одинаковым вопросам, чтобы выяснить: действительно ли Open AI король в LLM, или бесплатный Deepseek не хуже, а также насколько сильно от них отстают более отечественные и доступные решения от Яндекса и Сбера. Предупреждаю, что эта статья никем не спонсируется – это сугубо моё мнение, решил поделиться, так как обновление серьёзно подняло возможности нейросетей Яндекса.

Сайт Яндекс Алисы сразу после обновления.
Сайт Яндекс Алисы сразу после обновления.

Для начала ознакомимся с возможностями. Open AI Chat GPT. Доступ к модели 4o с ограничениями по количеству запросов и к 3.5 без ограничений, можно подключить поиск в интернете; 3 запроса в сутки к мультимодальной модели (изображения, файлы); несколько запросов в сутки к рассуждающей o3-mini; Sora генерация изображений 3 шт 4 варианта за сутки, без видео; 5 запросов в месяц типа «deep search». Deepseek. Неограниченный доступ к модели V3 (+ с поиском в интернете) и рассуждающей R1 (можно и Deep search); загрузка файлов и изображений с текстом; мультимодальной модели для анализа изображений без текста, как и генератора изображений нет. Яндекс GPT. Пользуюсь подпиской Алиса Про, ~450 Руб./мес при оплате на год. Неограниченное количество запросов к модели Yandex GPT 5 Pro 32B с постоянной возможностью поиска (в бесплатной версии 20 вопросов в день); поиск по нескольким источникам с обычной моделью 5 Pro; быстрая модель Yandex GPT 5 Lite 8B с возможностью поиска, в т. ч. и по нескольким источникам (также безлимитно и в бесплатной версии); рассуждающие модели Yandex GPT 5 Pro Thinking и Yandex GPT R1 (дотренированный под русских Deepseek R1) с возможностью Deep Search (только в подписке); анализ файлов, изображений (втчи без текста) мультимодальной моделью (только в подписке), но совместно с рассуждениями и поиском нельзя; генерация изображений Yandex Art 2.5 и 2.5 Pro (Pro +100 Руб./мес); Live режим общения с Алисой через камеру в приложении (только в подписке); множество других бесплатных плюшек, о них позже. Сбер Gigachat. Модели 2.0 Pro и 2.0 Max с возможностью поиска (все тесты далее с более продвинутой 2.0 Max); мультимодальная модель (может анализировать изображения, файлы, транскрибировать аудио); генератор изображений; генератор музыки; ещё немного плюшек; рассуждающей модели и deep search нет. Всё бесплатно-безлимитно.

И теперь давайте перейдём к проверкам. Во все 4 сервиса загружаю одинаковые запросы, а затем выбираем лучший ответ. В произвольном порядке, как получилось.

Анализ screenshot из диспетчера задач. Deepseek: так как есть текст, то спросить можно; в целом всё хорошо; предложил возможных потребителей интернета, но из-за отсутствия мультимодальности не понял про «4 минуты» и «отправка», да и сам график посмотреть не сможет, ориентировался лишь на «8,0 кбит/с» в данный момент. Gigachat: очень кратко, но в целом по существу, верно определил и временную ось. Chat GPT: указал, что это окно диспетчера задач Windows (молодец); в остальном всё хорошо и подробно как у Deepseek. Яндекс: использовал более технические термины «Левая ось Y», «Легенда»; явно видит сам график (пункт 4); хорошо. В итоге, все справились, но Chat GPT и Яндекс чуть лучше. Рейтинг Deepseek – Gigachat – Chat GPT – Яндекс: DGOY 1-1-2-2.

Анализ алгоритма подпрограммы из Mathcad по картинке. Deepseek: есть текст, значит проанализировать изображение можно; хорошо, увидел «nd» вместо «rnd», но суть понял. Gigachat: x это не массив; в остальном хорошо. Chat GPT: без ошибок и отличная структура. Яндекс: тоже супер. У Deepseek и Gigachat были некритичные ошибки, и структура ответа не так похожа на короткий алгоритм; Chat GPT и Яндекс справились отлично. 2-2-4-4.

Творческое задание – написать басню в стиле Ивана Андреевича Крылова про кота и кошку на дачу. Откровенно говоря, не справился никто. Deepseek V3 за 19 с, Deepseek R1 60 с думал на английском и получше; Gigachat 16 с совсем плохо; Chat GPT 4o 13 с так себе и коротковато; Яндекс в целом пойдёт и всего за 11 с, Yandex GPT R1 за 65 с даже похуже, хотя рифма стабильнее, рассуждающая GPT 5 всего за 16 с хуже. В итоге более-менее показали себя Deepseek R1 и Yandex GPT 5 Pro, причём последняя ответила очень быстро. DGOY 3-2-4-5.

Глубокий поиск deep search про токоприёмники троллейбуса. Deepseek за 116 с нашёл огромное количество источников. Gigachat 38 с: картинки, даже какой-то график, но стеклопластик это не пластмасса и с фига ли питающее напряжение 24 В (должно быть 700 В постоянное). Chat GPT: просто ОК. Яндекс: R1 аж 240 с, но интересно; рассуждающая GPT 5 за 75 с, но маловато. В итоге Gigachat откровенно наврал, пытаясь объяснить максимально понятно причём не раз; остальные неплохо, Deepseek технично, Yandex GPT R1 на балансе, Chat GPT попроще. DGOY 5-2-6-7.

Далее математика. Т.к. я в техническом ВУЗе, то это одни из самых частых вопросов, так что скажу своё мнение. Deepseek неплох, но R1 пишет чересчур подробно и может зацикливаться, да и правильные ответы не всегда. Chat GPT 4o бывают ошибки и недостаточно подробно, но рассуждающая o3-mini заметно, заметно лучше и почти идеальна (но ошибки тоже бывают). Gigachat врёт и галлюцинирует очень часто – не обращаюсь к нему за такими вопросами. Яндекс неплох, особенная основная в меру умная, но и быстрая GPT 5 Pro, её рассуждающая версия часто отвечает «обратитесь к специалисту» и не берётся решать, дабы не наврать (больше так никто не перестраховывается), а дотренированная R1 заметно лучше оригинальной в Deepseek – и идеальное соотношение подробность/краткость, и более высокая стабильность и точность ответов. Тут я бы поставил по трёхбалльной шкале DGOY 7-2-9-10.

Немного на примерах с дифференциальными уравнениями. Тут при решении четвёртой степени относительно калькулятора и преподавателя, с последним коэффициентом вообще справилась только обычная модель Яндекса GPT 5 Pro. В другом дифференциальном уравнении справились только рассуждающий Deepseek, Chat GPT и Yandex R1. С решением дифференциального уравнения через ряды лучше всех обычный Deepseek V3 и обычный Yandex GPT 5 Pro, так как указали итог – sinx; Gigachat снова 0.

Анализ технического комментария с жаргоном про сантехнику и инфрабас. Deepseek: не так понял про «флексила» и перепутал инфрабас с инфразвуком, не смог исправится при отдельном запросе про инфрабас. Gigachat: понял про вибрацию трубы, но ошибся с инфрабасом, хотя при отдельном запросе исправился, но картинки не в тему; +-. Chat GPT: снова про гибкую подводку (это мой комментарий про полимерные полипропиленовые трубы), но пойдёт. Яндекс: понял про трубы, особенно понравилось последнее предложение; ошибся с инфрабасом, но полностью исправился при отдельном запросе; хорошо. В итоге все +- справились, хотя неожиданно хуже всех Deepseek. DGOY: 7-3-10-11.

Аннотация к заданию курсовой работы из файла. Deepseek: скорее по-другому переписал файл, почти ничего не добавив, такое себе. Gigachat примерно как Deepseek. Chat GPT: именно то, что нужно, но, вероятно, слишком кратко. Яндекс: как по мне лучший вариант – то, что надо, но чуть подробнее, чем у Chat GPT. DGOY: 8-4-12-14.

Объяснение понятий и поиск информации. Решил поспрашивать про рыболовные лески – чем отличаются нейлоновые, флюорокарбоновые и из сверхвысокомолекулярного полиэтилена Dyneema. Deepseek: ссылок на источники нет, но достаточно подробно и интересно, особенно после второго запроса; но аббревиатура сверхвысокомолекулярного полиэтилена всё-таки не просто PE. Gigachat: есть ссылки на источники; но по другим темам часто бывают ошибки; не исправил ошибку в «флюорокарбон». Chat GPT: красиво, подробно, правильно, с ссылками. Яндекс: хорошо, особенно в новом режиме с поиском по нескольким источникам. Ошибок по другим темам у Deepseek и Яндекс почти не наблюдал, особенно в deep search, хотя у Gigachat встречаются чаще. DGOY: 10-5-15-16.

Анализ и обсуждение сравнения сгенерированных изображений. Решил посмотреть, как мультимодальные модели проанализируют изображение из NeuroReShot – в данном случае на одном изображении одна фотография и две её копии, сгенерированные в Sora и Yandex Art. Deepseek тут не участвует – у него нет мультимодальной модели. Gigachat: вообще не понял, про что это; не знает кто такие Yandex Art 2.5 и Sora; на дополнительный вопрос отвечает как на первый (и в других случаях замечал такое поведение мультимодальной модели); судя по последнему вопросу он вообще смотрел только на текст, не изучив сами изображения, хотя он это может (в первом всё-таки посмотрел); короче не справился. Chat GPT: первое предложение прекрасно и точно объясняет изображение; заметил кривую установку реального люка (это действительно так, хотя и почти не заметно), но неправильно определил его размер; во втором запросе чувствуется «так себе отношение к России»; интересный разговор; на картинке Яндекса люк всё-таки не в два раза больше автобуса –ошибается с масштабом и не чувствует перспективу; но в целом неплохо и интересно. Яндекс: хорошее и неожиданное объяснение по первому запросу; интересный диалог; не постеснялась порекомендовать Sora, а не Yandex Art. Но что меня больше всего поразило – обращает внимание на мельчайшие текстуры, в частности на эффект «пластилиновости» в текстуре асфальта. Это обозначает, что производится детальный анализ мелких частей. С учётом того, что это первая мультимодальная модель Яндекса – отлично, с Gigachatом вообще близко не стоит (а у него мультимодальная уже достаточно давно). DGOY: 10-5-17-18.

Проверка объяснения приставок в названиях смартфонов. Дал на проверку кусок текста. Сразу скажу, что прикол с аптекарским «есть приставка Форте» никто не понял. Deepseek: чётко, ясно, Huawei. Gigachat: не совсем уверен с «lite», с «Форте» правильно – это действительно есть в музыке. Chat GPT: ещё лучше и правильнее, чем у Deepseek, также усомнился насчёт «Форте». Яндекс: структура проверки хорошая, но недостаточно подробно (где упоминание Huawei) и есть неточности – не поняла про смесь Pro и Max. Это первый тест, где Gigachat выступил на уровне Chat GPT, в то время как Deepseek и особенно Яндекс отстали. DGOY: 12-8-20-19.

Написание текста песни на английском. Учитываем, что у Gigachat не заявлена поддержка английского языка, у Yandex GPT есть. Deepseek: хорошо, но не понял про «Mach 15» (это типа РУ машина в 15 раз быстрее скорости звука? Давайте ограничимся 0,15 скорости звука); откуда «pure nitro soul» – указано же, что эта машина с бесщёточным электродвигателем, хотя потом исправился с заряженной батареей; окончание прикольное. Gigachat: в припеве 2 и 4 строчка что-то не то; с рифмой везде хорошо и стиль интересный, особенно учитывая то, что английский как бы не поддерживается. Chat GPT: длинное, но вроде без косяков, хотя опять разогнались быстрее звука. Яндекс: хотя и кратко, но хорошо, и технически всё верно (Yandex GPT 5 Pro Thinking ещё лучше в этом оказалась). Трудно оценить, но я потом ещё с другими песнями пробовал, и Deepseek с Gigachatом всё-таки чаще ошибаются на сложных темах. DGOY: 13-9-22-21.

Я думаю, что многие хотят посмотреть, как эти нейросети пишут код, но извините, я в этом совсем не разбираюсь. Вообще это удивительно, что я владею (причём качественно) Topaz AI Labs, RVC, генераторами изображений и всякими другими нейросетевыми штучками, но в школе я по информатике сидел на упрощённом курсе с 3. Полагаю, что Deepseek и Chat GPT должны хорошо это делать. Насчёт Gigachat – не уверен. Сам пользуюсь Яндексом: элементарные вещи в консольном проекте C++ и предыдущая 4-я версия хорошо делала; в пятой за счёт мультимодальности удалось качественно делать и оконные приложения C++ с кодом под 100 строк. Даже не представляю, чтобы я сказал преподавателю на первом курсе, если бы не LLM. Дай Бог развиваться нейросетям быстрее, чем с меня требуют, а то моя дыра в программировании никакой физикой и электротехникой не закроется. Однако, сейчас с лабораторными по информатике с кодом такого объёма и сложности и оформлением 30-60 страниц (жирное оформление отнимает много времени) Яндекс справляется прекрасно, даже не заподозрили то, что за меня во многих местах сделано нейросетью. За это мне и нравится Яндекс – у него из всех четырёх самый естественный текст. Deepseek слишком технично, да и всё-таки китайцы разрабатывали – наверняка это сказалось; Gigachat просто тупой и непригодный к использованию во многих сферах (стиль текста тоже не идеален); Chat GPT наоборот слишком перестарался с имитацией человека. При этом техничность Deepseek и умность Chat GPT в Яндексе присутствует.

Генерация изображений. Основная часть закончена – перейдём к второстепенным функциям и плюшкам. Начнём с генерации изображений. У Deepseek вроде как были какие-то начальные модели, но на официальном сайте их нет. Gigachat: Kandinsky 3.1 (fusion brain). Изучая вопрос с генераторами, я понимал, что Sora (бывшая Dall-E), Flux и всякие Midjourney Stable Diffusion будут лучше российских, а между Яндексом и Сбером лучше должен быть последний. Но это не так. См фото – Kandinsky это откровенный к@л. Куча артефактов, плохо понимает запрос, артефакты сжатия JPG в файле PNG (это как им удалось?) и невысокое разрешение. Я многократно вбивал одинаковые запросы в Kandinsky, Sora и Яндекс, и у Сбера почти всегда что-то непотребное. Давайте перейдём к профессиональным решениям. Open AI Sora. Самое большое её преимущество – очень точное следование запросу и качественный текст. Артефактов мало, качество хорошее. Но в фотореализме всегда один и тот же стиль изображения, по которому можно с достаточно высокой точностью определить, где оно было сгенерировано. Да и русские пейзажи и вещи у неё не так получаются, но в целом это хороший генератор (помним про VPN и жёсткие лимиты). Yandex Art 2.5 и Шедеврум. Расстроившись с Kandinsky, я ожидал примерно такое же увидеть и у Яндекса. Но как же я удивился, когда это оказалось не так. На изображениях мало артефактов, достаточно хорошее понимание запроса, разнообразный стиль (я про фотореализм) и в целом всё хорошо. А ещё очень быстрая генерация – 4 картинки за 12 секунд (Kandinsky 1 за ~20, Sora 4 за ~100) и чувствуется, что учили модель на русских фото, сразу кардинально отличается от Sorы. Версия 2.5 Pro работает в 10 раз медленнее, и, скорее всего, эта та же 2.5 но с увеличенным количеством итераций. Это не сильно меняет качество, но текст и всякие мелкие детали выглядят лучше. Доступно это только в Шедевруме за дополнительны 100 Руб./мес. Так что Яндекс и тут приятно удивил – и в генерации изображений мы догоняем. Ещё Sora может генерировать видео, но это только в подписках; у наших такого нет (но попытки были). Аналог стилизации как у Sorы в Яндексе тоже есть – Фильтрумы, но работает значительно хуже. В итоге я бы оценил генераторы изображений DGOY как 0-1-4-4. Так как и Sora не лишена недостатков (как минимум однозначный стиль в фотореализме и непонимание российских реалий). Вот несколько примеров, запросы полностью одинаковые.

Далее рассмотрим различные дополнительные функции. Сам по себе Deepseek кроме чата больше ничего не предлагает, по крайней мере у нас (полагаю, что в Китае есть доступ к каким-то другим функциям). Gigachat: нейроредактор, пересказ видео, генерация музыки. Редактор хороший, вероятно, лучше, чем у Яндекса (как минимум больше функций, на счёт качества и правдоподобности не знаю – пользуюсь от Яндекса), а пересказ так себе и только с видео на русском, но офигенно работает генератор музыки, такого больше ни у кого из рассматриваемых нет. Дополнительные возможности Chat GPT не смотрел, но в подписках должно быть транскрибирование аудио, Live режим с камерой, создание своих «агентов», Operator и многое другое – за много денег. Яндекс предоставляет достаточно много функций, так как может внедрять их в своём браузере. Пересказ уже работает и на других языках и более качественный, также можно пересказывать свои документы и транскрибированное аудио в формате txt; в редакторе меньше функций, но он заметно быстрее. Также у Яндекса есть две важные и достаточно уникальные функции. 1 – закадровый перевод видео с иностранной речью. Изначально это была озвучка Алисой и другими роботами, но сейчас добавили новый «живой» перевод с копированием голоса блогеров и сохранением их интонации. Звучит хорошо, осталось только научится пропускать на фон остальные звуки. И ещё в любом видео можно включить автоматические субтитры и распознавание QR кодов. Хотелось бы ещё возможность перевода текста с видео на паузе – может когда-нибудь введут. 2 – поиск с Алисой. Такие технологии существуют и в других браузерах, но приятно, что есть и у нас. Обычно хорошо собирает самую важную информацию и ответ на вопрос быстрее, чем за 10 секунд – удобно, хотя я больше привык спрашивать в чате с Алисой (благо у меня подписка), но для людей без подписки это отличный вариант. Даже следуя мировым тенденциям, добавили возможность рассуждения прямо в поисковике. Наверное, это не так хорошо, как в чате, то же и с мультимодальным поиском по картинке, но всё равно молодцы – пусть бесплатные пользователи пробуют. Кстати, у Алисы тоже появился Live режим общения через камеры, но им никогда не пользовался, как и таким же в Chat GPT – сказать про него не могу. Впрочем, и в Chat GPT эта штука не всегда хорошо отвечает, а мультимодальная модель у Яндекса хорошая.

Ну вроде в принципе всё, но перед подведением итогов кратко расскажу, чем пользуюсь я и почему. Вообще изначально я обходил нейросети стороной, про LLM узнал только когда вышел не особо умный Chat GPT3.5 (с 4o он уже нормальным стал). Но в конце 2024-го нейросети научились достаточно хорошо решать математику, физику и писать тексты, да и потребность у меня в этом появилась. Соответственно, надо было научится этим пользоваться – решил сравнить 3 самых логичных варианта. Начал с Яндекса, так как в него из браузера было проще всего попасть. Тогда в бесплатной версии можно было делать 5 запросов в день к Yandex GPT 4 Pro и больше к YaLM2 (сейчас 20 к Yandex GPT5 Pro и больше к Yandex GPT5 Lite 8B, что намного лучше). И мне понравилось. Попробовал Chat GPT, но каждый раз включать VPN и лимиты… Вскоре оформил подписку (Яндекс Плюс на год получается 350 Руб./мес + Алиса Про 100 Руб./мес), а в Open AI обращался только за сложными задачами. Но вскоре появился Deepseek, и я перестал заходить в Chat GPT. Рассуждающий Deepseek хотя и вис по началу, но хорошо решал сложные задачи. Gigachat я тоже конечно проверил (причём первым делом), но расстроился и выкатился оттуда через полчаса разных тестов, в следующий раз зашёл только после появления 2.0 для сравнения с другими нейросетями. А ещё чуть позже произошла череда обновлений в Яндексе. Да, не все функции работали изначально хорошо, например Yandex GPT R1 сначала дико сбоил (хотя сейчас каким-то непонятным мне образом заметно быстрее Deepseek R1), но за несколько последних месяцев многое исправили. По сути, теперь я практически всё делаю в Яндексе, лишь проверяя и сравнивая самые сложные задачи в Deepseek и Chat GPT. Кстати, «тесты» по написанию докладов по философии и курсовых по информатике (среди одногруппников) подтвердили, что Яндекс помимо достаточной «умности» выдаёт самый «русский» текст. Т.е. преподаватели замечали присутствие Deepseek, Chat GPT и тем более Gigachat, в то время как Яндекс GPT почти всегда оставался незамеченным. Был даже такой случай, что придирались к теоретическим материалам из методички, в то время как с теоретическими материалами от Алисы было «всё в порядке», да и 5 за семестр по философии у меня ну ни как бы не было. И пусть рассуждающая Yandex GPT R1 сделана на базе Deepseek, но ведь работает-то даже лучше оригинала. Ещё раз повторю, что это не реклама Яндекса (они точно не обращаются к блогерам с таким количеством подписчиков), да и я бы сидел на бесплатных Deepseek и Gigachat, но Яндекс объективно лучше них после масштабного обновления.

Заключение. Если совсем не готовы платить, то Deepseek однозначно лучше Gigachat; за быстрыми вопросами заглядываем в Яндекс, за самыми сложными – в Chat GPT. Если готовы заплатить немного: однозначно собираем все возможности Яндекса, перепроверяя сложные задачи в Chat GPT и Deepseek; это мой вариант. Если нужен максимум – платим за VPN и Chat GPT Plus, а то и Pro; по быстрым вопросам обращаемся в Яндекс с подпиской. При этом иногда заходить в Gigachat можно – как минимум генератор музыки.