Гугл наконец расчехлил свою флагманскую языковую нейросетку под названием Gemini. Типа, «Близнецы» – что странно: с учетом релиза в начале декабря должна бы быть Стрельцом (кругом обман какой-то, никому нельзя верить).
Модель сразу заявлена как мультимодальная и способная принимать на вход в том числе видео. Как показывают у себя на сайте сами гугловцы – Джеминай якобы кроет GPT4 как бык овцу чуть ли не во всех подряд сложных задачах. Правда, с GPT4 они сравнивают в основном свою супер-передовую модель Gemini Ultra – которую пощупать еще никому нельзя, и вообще хз, когда станет возможным (подробнее читайте у Сергея Цыпцына вот здесь).
В презентационном ролике (см. ниже, он довольно короткий) нейросетка тоже ведет себя на редкость бодро и сообразительно.
Правда, почти сразу после публикации этих новостей вокруг новой модели разразился скандал: выяснилось, что в красивом гугловском видео уж очень многое было «для красоты» подрихтовано. Если аналогичные презентации от OpenAI по большей части проходили в реальном времени и можно было наблюдать настоящее поведение ChatGPT – то в своем ролике Google предпочел вырезать «лишние» моменты (где Gemini размышляла над задачей), а также не показывать настоящие промпты, с помощью которых удалось добиться от нее таких ловких ответов. По видео создается ощущение, будто она понимает всё буквально с полуслова и прямо с видео/звука – на деле же ей скидывали отдельные картинки с текстом и направляли мысль куда надо с помощью подсказок.
Павел Комаровский
Больше финансовых новостей и авторской аналитики у меня в Телеграм-канале.