15 подписчиков
🚀 Mistral представила флагманскую модель Large 2: новый стандарт для открытых ИИ
На этой неделе в мире передовых ИИ-моделей произошло сразу два значимых события. Вслед за выпуском новой модели Llama 3.1 405B от Meta, компания Mistral представила свою новейшую модель Large 2, которую она называет конкурентом последних разработок OpenAI и Meta в области генерации кода, математики и логики.
🔍 Что нового в Large 2? Mistral утверждает, что Large 2 превосходит Llama 3.1 405B в производительности по генерации кода и математическим задачам, при этом имея менее трети параметров — 123 миллиарда против 405 миллиардов у Meta. Особое внимание при обучении модели уделялось минимизации проблем с "галлюцинациями" — Large 2 обучена признавать, когда она чего-то не знает, вместо того чтобы создавать правдоподобные, но ложные ответы.
💡 Технические характеристики и возможности:
• Мультиязычная поддержка: Large 2 понимает 12 языков, включая английский, французский, немецкий, испанский, итальянский, португальский, арабский, хинди, русский, китайский, японский и корейский, а также 80 языков программирования.
• Большое окно ввода: Модель способна обрабатывать до 128,000 токенов в одном запросе, что эквивалентно 300-страничной книге.
• Сжатые ответы: Mistral утверждает, что Large 2 предоставляет более лаконичные ответы по сравнению с ведущими ИИ-моделями, которые часто склонны к избыточности.
💼 Коммерческое использование и доступность: Mistral недавно привлекла $640 миллионов в рамках серии B, оценивая компанию в $6 миллиардов. Хотя модели Mistral не являются полностью открытыми, для их коммерческого использования требуется платная лицензия. Модель доступна на Google Vertex AI, Amazon Bedrock, Azure AI Studio и IBM watsonx.ai, а также на платформе Mistral под названием “mistral-large-2407”. Вы можете бесплатно протестировать её на конкуренте ChatGPT от Mistral — le Chat.
🔗 Ограничения и перспективы: Стоит отметить, что, как и у модели Meta, у Large 2 отсутствуют мультимодальные возможности, которые позволяют OpenAI обрабатывать изображения и текст одновременно. Это направление все больше привлекает внимание стартапов.
1 минута
25 июля 2024