Найти тему

Насыщенная неделька, сразу 2 мощных релиза:


Не дав нам возможности насладиться Llama 3.1, в среду Mistral выпустила новую флагманскую модель, Large 2, которая, по ее словам, находится на одном уровне с последними передовыми моделями OpenAI и Meta с точки зрения генерации кода, математики и рассуждений.

Выпуск Mistral Large 2 произошел всего через день после того, как Meta выпустила свою последнюю и лучшую модель с открытым исходным кодом Llama 3.1 405b.

Mistral утверждает, что Large 2 поднимает планку производительности и стоимости для открытых моделей, подкрепляя это несколькими бенчмарками.
Large 2, по-видимому, превосходит Llama 3.1 405B по производительности генерации кода и математических вычислений, и делает это с параметрами, уступающими ему втрое: 123 миллиарда, если быть точным.

Парижский стартап в области искусственного интеллекта недавно привлек $640 млн в раунде финансирования серии B, возглавляемом General Catalyst, при оценке в $6 млрд.

Однако, любое коммерческое применение модели требует платной лицензии. И хотя она более открыта, чем, скажем, GPT-4o, мало кто в мире обладает опытом и инфраструктурой для внедрения такой большой модели. (Это вдвойне касается и 405В Llama, конечно.)
Чего не хватает в Mistral Large 2, а также в релизе Meta Llama 3.1, так это мультимодальных возможностей.
OpenAI намного опережает конкурентов в отношении мультимодальных систем, способных обрабатывать изображения и текст одновременно.

Модель имеет окно в 128 000 токенов, Large 2 понимает английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский, а также 80 языков кодирования.
Large 2 выдает более краткие ответы, чем ведущие модели ИИ, которые имеют тенденцию болтать.
1 минута