Найти тему

Google Gemini: все возможности и самые важные факты

Оглавление

Главной новостью дня, затмившей даже анонс Realme GT5 Pro, стал выход мультимодальной ИИ модели от Google. Надо признать, демонстрация возможностей Google Gemini впечатляет.

Что такое Google Gemini?

Gemini — не обособленная генеративная модель, а целый набор генеративных сервисов искусственного интеллекта. Создавался он проектом Google DeepMind. Технически Gemini — это LLM (large language model) или большая языковая модель, то есть среда машинного обучения, в которую помещается множество человеческих данных (в основном онлайн-контента) и создаются правила для понимания этого контента. При достаточном объеме данных, языковые модели могут создавать собственные предложения и имитировать стили. Как это работает, мы уже видели на примере ChatGPT и других чат-ботов. И чем больше модели обучаются, тем лучше будет результат.

Возможности

Новая модель от Google демонстрирует впечатляющий набор возможностей. Большинство популярных ИИ-моделей специализируются на чем-то одном, например, создании текстов или изображений. Тем временем Google Gemini — это система все-в-одном, которая может вести полноценный диалог с пониманием контекста, переводить информацию, оценивать фото, видео и текстовые данные, которые вы ей предлагаете, генерировать разнообразный контент на основе введенных данных, находить в них паттерны и даже предугадывать или, по крайней мере, пытаться предугадывать дальнейшие события. Благодаря такой универсальности, Gemini может использоваться в разнообразных сферах деятельности.
Обязательно посмотрите видео ниже, чтобы оценить способности ИИ-модели.

Версии

Модель предлагается в трех вариациях: “облегченный” Gemini Nano будет автономно использоваться на смартфонах, а первым его получит Pixel 8 Pro с декабрьским Feature Drop. Базовая версия Gemini Pro будет встроена в фирменный чат-бот Bard, а флагманом этой маленькой флотилии с самым широким набором функций стал Gemini Ultra, ориентированный на корпоративных клиентов и центры обработки данных. Сторонние разработчики смогут использовать Gemini Pro API, чтобы встраивать эту модель в свои продукты.

Google Gemini лучше чем ChatGPT?

Потенциально Gemini очень хорош: он набрал 90 % в тесте на понимание многозадачного языка (MMLU). Google также утверждает, что Gemini превосходит существующие модели искусственного интеллекта в 30 из 32 академических тестов, используемых для получения степени LLM. В других отчетах говорится, что, Gemini Pro может превзойти GPT-3.5, но уступает более новому GPT-4, а Gemini Ultra незначительно превосходит GPT-4.

Ограничения

На данный момент Gemini работает только на английском. Gemini Pro будет доступен пользователям Bard и разработчикам начиная с 13 декабря, другие версии появятся позже и постепенно будут встроены во все сервисы Google.
В остальном же, Gemini ориентирован скорее на организации, которые смогут встроить ИИ в свои продукты.

Это безопасно?

Создатели Gemini отмечают, что модель была создана с учетом всех требований безопасности и, скорее всего, создание недопустимого, агрессивного или противозаконного контента с ней просто невозможно.
С другой стороны, не очень понятно, что происходит с тем контентом, который пользователи “скармливают” ИИ самостоятельно, насколько надежно хранятся эти насколько этично они используются. В любом случае, рекомендуем читателям использовать любые языковые модели ответственно.