28 подписчиков

Google запускает две новые открытые программы LLM

22 февраля 202422 фев 2024

2 мин

Всего через неделю после запуска последней версии модели Gemini компания Google объявила о выпуске Gemma, нового семейства легких моделей. Начиная с Gemma 2B и Gemma 7B , эти новые модели были «вдохновлены Gemini» и доступны для коммерческого и исследовательского использования. Google не предоставил нам подробного описания того, как эти модели работают по сравнению, например, с аналогичными моделями от Meta и Mistral, а лишь отметил, что они «самые современные». Однако компания отметила, что это модели с плотным декодированием, и это та же самая архитектура, которую она использовала для своих моделей Gemini (и более ранних моделей PaLM ), и что мы увидим тесты позже в таблице лидеров Hugging Face . Чтобы начать работу с Gemma, разработчики могут получить доступ к готовым к использованию блокнотам Colab и Kaggle, а также к интеграции с Hugging Face, MaxText и NeMo от Nvidia. После предварительного обучения и настройки эти модели смогут работать где угодно. Хотя Google подчеркивает, что

Google не предоставил нам подробного описания того, как эти модели работают по сравнению, например, с аналогичными моделями от Meta и Mistral, а лишь отметил, что они «самые современные». Однако компания отметила, что это модели с плотным декодированием, и это та же самая архитектура, которую она использовала для своих моделей Gemini (и более ранних моделей PaLM ), и что мы увидим тесты позже в таблице лидеров Hugging Face .

Чтобы начать работу с Gemma, разработчики могут получить доступ к готовым к использованию блокнотам Colab и Kaggle, а также к интеграции с Hugging Face, MaxText и NeMo от Nvidia. После предварительного обучения и настройки эти модели смогут работать где угодно.

Хотя Google подчеркивает, что это открытые модели, стоит отметить, что они не имеют открытого исходного кода. Действительно, на пресс-брифинге перед сегодняшним объявлением Джанин Бэнкс из Google подчеркнула приверженность компании открытому исходному коду, но также отметила, что Google очень внимательно относится к моделям Gemma.

«Открытые модели сейчас стали довольно распространенными в отрасли», — сказал Бэнкс. «И это часто относится к моделям с открытыми синаптическими весами, где разработчикам и исследователям предоставляется широкий доступ к настройке и точной калибровке моделей, но в то же время к условиям использования — таким вещам, как перераспределение, а также право собственности на те варианты, которые разрабатываются — варьируются в зависимости от конкретных условий использования модели. Итак, мы видим некоторую разницу между тем, что мы традиционно называем открытым исходным кодом, и решили, что имеет смысл называть наши модели Gemma открытыми моделями».

Это означает, что разработчики могут использовать модель для вывода и точной настройки по своему усмотрению, и команда Google утверждает, что эти размеры моделей хорошо подходят для многих случаев использования.

«Качество генерации значительно возросло за последний год», — сказала директор по управлению продуктами Google DeepMind Трис Варкентин. «То, что раньше было прерогативой чрезвычайно больших моделей, теперь возможно с помощью современных моделей меньшего размера. Это открывает совершенно новые способы разработки приложений ИИ, которые нас очень радуют, включая возможность выполнять логические выводы и выполнять настройку на локальном настольном компьютере или ноутбуке разработчика с графическим процессором RTX или на одном хосте в GCP с облачными TPU».

Это справедливо и в отношении открытых моделей конкурентов Google в этой области, поэтому нам придется посмотреть, как модели Gemma работают в реальных сценариях.

В дополнение к новым моделям Google также выпускает новый ответственный генерирующий набор инструментов искусственного интеллекта, который предоставит «руководства и основные инструменты для создания более безопасных приложений искусственного интеллекта с помощью Gemma», а также инструмент отладки.

Источник: techcrunch.com