Где-то год назад я писал пост с кратким анализом деятельности больших языковых моделей и тогда приходил к выводу, что по уровню ответов и качеству помощи, такие модели как ChatGPT 4 были способны помогать на уровне джуна или стажера. То есть информацию давали, но ее все-равно надо было перерабатывать. За прошедший год технологии сделали значительный скачок вперед, и сегодня мы наблюдаем совершенно новый уровень возможностей ИИ. Особенно впечатляющими оказались достижения китайских разработчиков, которые представили модель, способную конкурировать даже с самыми продвинутыми западными аналогами. Эта неделя началась с Китайского нового года, в честь которого была выпущена модель Qwen-2.5 MAX. В отличие от других Qwen-моделей, она меня действительно впечатлила (после чего меня ввели в недоумение посты с хвальбой Deepseek - он совсем не о чем в сравнении даже с Qwen-2.5 Plus). Данная модель представляет собой настоящий прорыв в области обработки естественного языка и генерации контента. Раз
Qwen-2.5 MAX - Middle, унижающий Junior-LLM модели
30 января 202530 янв 2025
1
3 мин