Компания Google объявила о выпуске Gemma 2B и 7B, набора моделей искусственного интеллекта с открытым исходным кодом. Эти модели позволяют разработчикам использовать исследования, заложенные в основную модель Google, Gemini, в более свободном режиме. Gemini, крупномасштабная закрытая модель искусственного интеллекта, является прямым конкурентом ChatGPT от OpenAI. Однако ожидается, что более компактные модели Gemma подойдут для менее сложных задач, таких как базовые чат-боты или задачи обобщения.
Несмотря на меньший размер, Google утверждает, что модели Gemma превосходят более крупные модели по ключевым показателям и могут работать непосредственно на ноутбуке или настольном компьютере разработчика. Эти модели будут доступны через Kaggle, Hugging Face, Nvidia's NeMo и Google Vertex AI.
Выпуск Gemma в экосистему с открытым исходным кодом контрастирует с выпуском Gemini. Несмотря на то что Gemini допускает разработку через API или на платформе Google Vertex AI, она остается закрытой моделью ИИ. Выпустив Gemma с открытым исходным кодом, Google предоставляет более широкий спектр экспериментов со своей технологией ИИ.
Обе модели Gemma будут доступны по коммерческой лицензии, независимо от размера организации, количества пользователей или типа проекта. Однако Google, как и другие компании, часто ограничивает использование своих моделей для решения конкретных задач, например, программ по разработке оружия.
Gemma будет оснащена "инструментарием для ответственного ИИ", поскольку открытые модели могут представлять больше трудностей в обеспечении безопасности по сравнению с более закрытыми системами, такими как Gemini. Трис Варкентин, директор по управлению продуктами Google DeepMind, заявил, что компания провела более тщательное тестирование Gemma из-за рисков, связанных с открытыми моделями.
Инструментарий ответственного ИИ позволит разработчикам устанавливать собственные правила или список запрещенных слов при внедрении Gemma в свои проекты. Он также включает в себя инструмент отладки модели, позволяющий пользователям изучать поведение Gemma и устранять проблемы.
По словам Варкентина, в настоящее время модели наиболее эффективны для задач, связанных с английским языком. Однако он выразил надежду, что сотрудничество с сообществом поможет удовлетворить потребности рынка не только в англоязычных задачах.
Разработчики могут бесплатно использовать Gemma в Kaggle, а первые пользователи Google Cloud получат 300 долларов в виде кредитов на использование моделей. Google также заявила, что исследователи могут претендовать на облачные кредиты в размере до 500 000 долларов.
Хотя спрос на небольшие модели, подобные Gemma, неясен, другие компании, занимающиеся разработкой ИИ, также выпустили облегченные версии своих флагманских базовых моделей. Например, в прошлом году Meta выпустила Llama 2 7B, самую маленькую итерацию Llama 2. Gemini выпускается в нескольких размерах, включая Gemini Nano, Gemini Pro и Gemini Ultra, а Google недавно анонсировала более быстрый Gemini 1.5 для бизнес-пользователей и разработчиков.
Наконец, стоит отметить, что термин "Gemma" переводится как "драгоценный камень".