1 подписчик

Google Gemini: все возможности и самые важные факты

9 декабря 20239 дек 2023

2 мин

Главной новостью дня, затмившей даже анонс Realme GT5 Pro, стал выход мультимодальной ИИ модели от Google. Надо признать, демонстрация возможностей Google Gemini впечатляет. Что такое Google Gemini? Gemini — не обособленная генеративная модель, а целый набор генеративных сервисов искусственного интеллекта. Создавался он проектом Google DeepMind. Технически Gemini — это LLM (large language model) или большая языковая модель, то есть среда машинного обучения, в которую помещается множество человеческих данных (в основном онлайн-контента) и создаются правила для понимания этого контента. При достаточном объеме данных, языковые модели могут создавать собственные предложения и имитировать стили. Как это работает, мы уже видели на примере ChatGPT и других чат-ботов. И чем больше модели обучаются, тем лучше будет результат. Возможности Новая модель от Google демонстрирует впечатляющий набор возможностей. Большинство популярных ИИ-моделей специализируются на чем-то одном, например, создании те

Оглавление

Что такое Google Gemini?
Возможности
Версии

Что такое Google Gemini?

Gemini — не обособленная генеративная модель, а целый набор генеративных сервисов искусственного интеллекта. Создавался он проектом Google DeepMind. Технически Gemini — это LLM (large language model) или большая языковая модель, то есть среда машинного обучения, в которую помещается множество человеческих данных (в основном онлайн-контента) и создаются правила для понимания этого контента. При достаточном объеме данных, языковые модели могут создавать собственные предложения и имитировать стили. Как это работает, мы уже видели на примере ChatGPT и других чат-ботов. И чем больше модели обучаются, тем лучше будет результат.

Возможности

Новая модель от Google демонстрирует впечатляющий набор возможностей. Большинство популярных ИИ-моделей специализируются на чем-то одном, например, создании текстов или изображений. Тем временем Google Gemini — это система все-в-одном, которая может вести полноценный диалог с пониманием контекста, переводить информацию, оценивать фото, видео и текстовые данные, которые вы ей предлагаете, генерировать разнообразный контент на основе введенных данных, находить в них паттерны и даже предугадывать или, по крайней мере, пытаться предугадывать дальнейшие события. Благодаря такой универсальности, Gemini может использоваться в разнообразных сферах деятельности.
Обязательно посмотрите видео ниже, чтобы оценить способности ИИ-модели.

Версии

Модель предлагается в трех вариациях: “облегченный” Gemini Nano будет автономно использоваться на смартфонах, а первым его получит Pixel 8 Pro с декабрьским Feature Drop. Базовая версия Gemini Pro будет встроена в фирменный чат-бот Bard, а флагманом этой маленькой флотилии с самым широким набором функций стал Gemini Ultra, ориентированный на корпоративных клиентов и центры обработки данных. Сторонние разработчики смогут использовать Gemini Pro API, чтобы встраивать эту модель в свои продукты.

Google Gemini лучше чем ChatGPT?

Потенциально Gemini очень хорош: он набрал 90 % в тесте на понимание многозадачного языка (MMLU). Google также утверждает, что Gemini превосходит существующие модели искусственного интеллекта в 30 из 32 академических тестов, используемых для получения степени LLM. В других отчетах говорится, что, Gemini Pro может превзойти GPT-3.5, но уступает более новому GPT-4, а Gemini Ultra незначительно превосходит GPT-4.

Ограничения

На данный момент Gemini работает только на английском. Gemini Pro будет доступен пользователям Bard и разработчикам начиная с 13 декабря, другие версии появятся позже и постепенно будут встроены во все сервисы Google.
В остальном же, Gemini ориентирован скорее на организации, которые смогут встроить ИИ в свои продукты.

Это безопасно?

Создатели Gemini отмечают, что модель была создана с учетом всех требований безопасности и, скорее всего, создание недопустимого, агрессивного или противозаконного контента с ней просто невозможно.
С другой стороны, не очень понятно, что происходит с тем контентом, который пользователи “скармливают” ИИ самостоятельно, насколько надежно хранятся эти насколько этично они используются. В любом случае, рекомендуем читателям использовать любые языковые модели ответственно.