731 подписчик
Насыщенная неделька, сразу 2 мощных релиза:
Не дав нам возможности насладиться Llama 3.1, в среду Mistral выпустила новую флагманскую модель, Large 2, которая, по ее словам, находится на одном уровне с последними передовыми моделями OpenAI и Meta с точки зрения генерации кода, математики и рассуждений.
Выпуск Mistral Large 2 произошел всего через день после того, как Meta выпустила свою последнюю и лучшую модель с открытым исходным кодом Llama 3.1 405b.
Mistral утверждает, что Large 2 поднимает планку производительности и стоимости для открытых моделей, подкрепляя это несколькими бенчмарками.
Large 2, по-видимому, превосходит Llama 3.1 405B по производительности генерации кода и математических вычислений, и делает это с параметрами, уступающими ему втрое: 123 миллиарда, если быть точным.
Парижский стартап в области искусственного интеллекта недавно привлек $640 млн в раунде финансирования серии B, возглавляемом General Catalyst, при оценке в $6 млрд.
Однако, любое коммерческое применение модели требует платной лицензии. И хотя она более открыта, чем, скажем, GPT-4o, мало кто в мире обладает опытом и инфраструктурой для внедрения такой большой модели. (Это вдвойне касается и 405В Llama, конечно.)
Чего не хватает в Mistral Large 2, а также в релизе Meta Llama 3.1, так это мультимодальных возможностей.
OpenAI намного опережает конкурентов в отношении мультимодальных систем, способных обрабатывать изображения и текст одновременно.
Модель имеет окно в 128 000 токенов, Large 2 понимает английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский, а также 80 языков кодирования.
Large 2 выдает более краткие ответы, чем ведущие модели ИИ, которые имеют тенденцию болтать.
1 минута
25 июля 2024