Главной новостью дня, затмившей даже анонс Realme GT5 Pro, стал выход мультимодальной ИИ модели от Google. Надо признать, демонстрация возможностей Google Gemini впечатляет.
Что такое Google Gemini?
Gemini — не обособленная генеративная модель, а целый набор генеративных сервисов искусственного интеллекта. Создавался он проектом Google DeepMind. Технически Gemini — это LLM (large language model) или большая языковая модель, то есть среда машинного обучения, в которую помещается множество человеческих данных (в основном онлайн-контента) и создаются правила для понимания этого контента. При достаточном объеме данных, языковые модели могут создавать собственные предложения и имитировать стили. Как это работает, мы уже видели на примере ChatGPT и других чат-ботов. И чем больше модели обучаются, тем лучше будет результат.
Возможности
Новая модель от Google демонстрирует впечатляющий набор возможностей. Большинство популярных ИИ-моделей специализируются на чем-то одном, например, создании текстов или изображений. Тем временем Google Gemini — это система все-в-одном, которая может вести полноценный диалог с пониманием контекста, переводить информацию, оценивать фото, видео и текстовые данные, которые вы ей предлагаете, генерировать разнообразный контент на основе введенных данных, находить в них паттерны и даже предугадывать или, по крайней мере, пытаться предугадывать дальнейшие события. Благодаря такой универсальности, Gemini может использоваться в разнообразных сферах деятельности.
Обязательно посмотрите видео ниже, чтобы оценить способности ИИ-модели.
Версии
Модель предлагается в трех вариациях: “облегченный” Gemini Nano будет автономно использоваться на смартфонах, а первым его получит Pixel 8 Pro с декабрьским Feature Drop. Базовая версия Gemini Pro будет встроена в фирменный чат-бот Bard, а флагманом этой маленькой флотилии с самым широким набором функций стал Gemini Ultra, ориентированный на корпоративных клиентов и центры обработки данных. Сторонние разработчики смогут использовать Gemini Pro API, чтобы встраивать эту модель в свои продукты.
Google Gemini лучше чем ChatGPT?
Потенциально Gemini очень хорош: он набрал 90 % в тесте на понимание многозадачного языка (MMLU). Google также утверждает, что Gemini превосходит существующие модели искусственного интеллекта в 30 из 32 академических тестов, используемых для получения степени LLM. В других отчетах говорится, что, Gemini Pro может превзойти GPT-3.5, но уступает более новому GPT-4, а Gemini Ultra незначительно превосходит GPT-4.
Ограничения
На данный момент Gemini работает только на английском. Gemini Pro будет доступен пользователям Bard и разработчикам начиная с 13 декабря, другие версии появятся позже и постепенно будут встроены во все сервисы Google.
В остальном же, Gemini ориентирован скорее на организации, которые смогут встроить ИИ в свои продукты.
Это безопасно?
Создатели Gemini отмечают, что модель была создана с учетом всех требований безопасности и, скорее всего, создание недопустимого, агрессивного или противозаконного контента с ней просто невозможно.
С другой стороны, не очень понятно, что происходит с тем контентом, который пользователи “скармливают” ИИ самостоятельно, насколько надежно хранятся эти насколько этично они используются. В любом случае, рекомендуем читателям использовать любые языковые модели ответственно.