Найти в Дзене
Нейроарт Мастерская

Почти ChatGPT. Google Gemini. Как пользоваться в России.

Здравствуйте, дорогие друзья! Сегодня я хочу поделиться с вами информацией о Gemini от Google, который, по сути, является ChatGPT, но немного в другой обёртке.

Не так давно он назывался Bard, но Google зачем то переименовали его в Gemini. Ребрендинг был объяснен тем, что компания стремится создать экосистему вокруг нейросети Gemini, и отдельное название для сервиса не требуется. Основные функции и интерфейс чат-бота остались неизменными со времен Bard. Нейросеть продолжает отвечать на русском языке, распознавать контекст, запоминать детали разговора и выходить в интернет. Количество диалогов и запросов в сутки не ограничено.

Конечно же вместе с ребрендингом в нейросеть добавили новые функции.

Gemini – это чат-бот, который работает и выглядит как Chat GPT, но с некоторыми дополнительными возможностями. Бесплатная версия чат-бота от Google имеет доступ к интернету и может создавать изображения по запросу. Нейросеть может отвечать на вопросы, писать код, распознавать изображения, помогать с контентом и делать многое другое.

Существуют три модели Gemini, которые доступны широкой аудитории. Доступ к ним и их способности немного различаются. В этом тексте я расскажу, как пользоваться разными версиями чат-бота из России и какие функции они поддерживают.

Какие версии Gemini существуют?

Всего доступно три версии Gemini: бесплатные 1.0 Pro и 1.5 Pro, а также платная версия 1.0 Ultra.

Gemini 1.0 Pro. На его основе работает чат-бот Gemini. Он может помочь вам приготовить пятнистого суслика в собственном соку или написать инструкцию по вышиванию крестиком, объяснить суть теории струн, создать пост для соцсетей, помочь с кодом (но я бы посоветовал в этом вопросе сильно ему не доверять), сценарием для вашего фильма или даже помочь с планом для статьи.

Ну и в феврале 2024 года пользователям, наконец то, стала доступна функция генерации изображений.

Gemini 1.0 Ultra. Возможно, это то же самое, что и Gemini 1.0 Pro, но с еще более расширенными возможностями. По крайней мере, так говорят в Google. На этой модели установлен платный чат-бот Gemini Advanced, который должен гораздо лучше справляться с сложными запросами: писать код, рассуждать, выполнять детальные инструкции и помогать в креативных задачах.

Gemini 1.5. 15 февраля компания Google представила ограниченную предварительную версию модели Gemini 1.5 Pro через AI Studio. Эта модель способна обрабатывать до миллиона токенов, что значительно больше, чем у Chat GPT с контекстным окном в 128 тысяч токенов.

Это означает, что Gemini 1.5 Pro может распознавать час видео, 11 часов аудио, более 30 тысяч строк кода и свыше 700 тысяч слов, что делает ее одной из самых мощных моделей на рынке.

По заверениям представителей Google, модель может анализировать любую предоставляемую информацию и "вылавливать" из неё информацию в мелких деталях. Не могу сказать, что делает это он со 100 процентной точностью, но иногда можно посмеяться над "ошибками" нейросети.

Но при этом Gemini Pro 1.5 не может генерировать картинки и не имеет доступа к интернету.

Как получить доступ ко всем версиям Gemini в России.

Всеми моделями Google Gemini можно свободно пользоваться из России. Единственное, что может отличаться, это некоторые нюансы, связанные с доступом.

Небольшое отступление. У меня не получилось зайти на сайт и начать пользоваться чат-ботом без танцев с бубном. Гугл упорно мне заявлял, что лицом не вышел и пользоваться нашим Gemini не будешь. Если вам интересна эта нейросеть, думаю не будет проблемой объяснить гуглу что вы вообще не местный и вам очень нужно!

Модель Gemini 1.0 Pro предоставляется бесплатно и работает на официальном сайте Gemini. Чтобы использовать чат-бот, вам нужно войти в свой аккаунт Google, предварительно изменив регион в настройках системы. Дальше все по классике, не мне вам рассказывать, что нужно делать в подобных случаях.


Нейросеть Gemini также доступна в
приложении Google для iOS. Чтобы получить доступ к ней, на главном экране приложения нажмите на иконку с синей звездой – откроется чат с ботом. Обратите внимание, что для iOS у нас нет отдельного приложения Gemini, но в магазине приложений App Store можно найти множество сервисов с похожим названием, которые могут имитировать работу нейросети, делая свои мелкие гадости в фоновом режиме. Если вы не уверены, что это именно настоящее приложение, не рискуйте понапрасну.

Для пользователей смартфонов на
Android OS есть даже приложение Gemini. Но к сожалению, оно недоступно в российском магазине для скачивания без танцев с бубном. Опять же, вы знаете, что нужно делать в таких случаях.

Gemini 1.0 Ultra доступен для покупки на официальном сайте Gemini. Для этого потребуется войти в систему, с помощью аккаунта Google и неместного IP.

Подписка на сервис стоит 20 вечнозеленых рублей в месяц. Однако, вы можете воспользоваться двухмесячным бесплатным тестовым периодом. Для этого необходимо привязать банковскую карту зарубежного банка. По окончании тестового периода, с вашей карты будет списана стоимость подписки за следующий месяц.

Gemini 1.5 Pro доступна для бесплатного использования, но только в Google AI Studio. На сайт нужно заходить с неместным IP-адресом. Для входа понадобится гугл-аккаунт, можно кстати использовать российский. Ну и желательно в настройках профиля поменять язык на английский, чтобы точно все заработало.

Как Gemini работает с текстом и поиском, в сравнении с Bard.

Чат с помощником и подсказки расположены справа, а все чаты с нейросетью – слева. Интерфейс переведен на русский язык по умолчанию, если ваш гугл-аккаунт привязан к российскому региону и языку.

Добавлены новые возможности. На них я остановлюсь немного подробнее и расскажу, что в целом может Gemini.

Главный экран Gemini
Главный экран Gemini

А может он генерировать тексты. Нейросеть отвечает на простые вопросы и объясняет сложные термины, как это делает бесплатная версия Chat GPT. Gemini также имеет доступ к актуальной информации, поэтому может выходить в интернет и предоставлять ссылки на источники.

Как и у Bard, у Gemini есть свои недостатки. Иногда нейросеть может давать неверные ответы или отказываться отвечать на вопросы без видимой причины. Также, она не всегда предоставляет ссылки на источники информации.

Несколько раз я замечал, что Gemini начинает упорно впаривать мне подписку, что сильно напрягает. WTF!?

И это вплоне нормальное явление при общении с Gemini
И это вплоне нормальное явление при общении с Gemini

Хотя стоит отметить, когда у Gemini есть настроение "пообщаться" то делает он это вполне себе адекватно.

-3

Google в своих пресс-релизах подчеркивает, что инструмент Gemini может быть полезен для программирования, он знает разные языки программирования, может искать ошибки и объяснять их. На момент написания статьи к сожалению не могу вам показать какие то конкретные ошибки, но с ними по мере использования сталкиваешься не только при использовании Gemini.

Нейросеть умеет ходить по ссылкам которые вы ей даете и даже вроде бы читает и понимает содержимое, но зачастую выдает совершенно неприемлемые результаты.

Так же нейросеть возможно использовать и для самообразования, как генератор идей. Она будет пытаться помогать вам во всем, что только в голову взбредет, конечно в разумных пределах.

-4
-5
-6

Также, этот сервис умеет кратко пересказывать содержание текста или видео, хотя сейчас этим уже вряд ли кого-то удивишь. Однако, с YouTube у него не очень хорошие отношения, и 9 из 10 запросов не дадут ожидаемого результата. Странно и непонятно, с чем это связано.

-7
-8


Но, несмотря на некоторые недостатки, со времен Bard, функция стала работать лучше. Нейросеть действительно пытается пересказать текст, а не выдает случайные факты на тему и не отказывается выполнять задание в целом, как это было раньше. Однако, до идеала всезнайки, который любит делиться знаниями, ему еще далеко.

Модель Gemini обладает способностью искать по картинкам в интернете и описывать фотографии, которые вы отправляете в чат. Она справляется с простыми задачами, но более сложные, такие как поиск суслика на картинке с несколькими животными, ей не под силу.

-9


Кроме того, модель не может работать с изображениями людей. То есть, с помощью нейросети невозможно взаимодействовать с фотографиями или даже рисунками, на которых есть любой человек, независимо от того, известен он или нет.


По утверждениям Google, Gemini умеет генерировать изображения по запросу. А так же генерировать изображение и текст одновременно. Нейросеть является мультимодальной — то есть может обрабатывать текст и изображения в рамках одного запроса. Это означает, что Gemini можно попросить сочинить историю и сгенерировать иллюстрации к ней. Удобно. Но не знаю как у гугла, но у меня так и не вышло заставить его генерировать изображения, какие бы я запросы не вводил.

-10

Была информация, что у Google, возникли некоторые проблемы с использованием своей технологии. После того, как пользователи начали создавать исторических личностей на изображениях, система по каким-то причинам начала выдавать изображения темнокожих людей. Это, конечно же, вызвало обвинения в расовой дискриминации белых, и поэтому на неопределенное время возможность генерации людей была временно отключена.

Есть еще Gemini Advanced — продвинутая версия чата, доступная по платной подписке и работающая на основе модели 1.0 Ultra. Если вы подпишетесь на платную версию, чат автоматически изменит тему на черную, однако в настройках вы сможете вернуть белую тему. Переключиться между бесплатной и платной версиями можно с помощью кнопки «Gemini» / «Gemini Advanced».

Что умеет платная версия.

Генерировать тексты. В простых запросах качество ответов Gemini Advanced не сильно отличается от базовой версии. По одним и тем же запросам выдаются почти одинаковые ответы.

Google утверждает, что разницу можно заметить при решении более сложных задач, таких как составление пошаговых инструкций, обучение и создание креативного контента.

Кратко пересказывать. Gemini Advanced немного лучше перескажет вам любой материал нежели это сделает базовая версия. Но и здесь расслабляться и доверять на все 100 в достоверности текста не стоит.

Распознаёт изображения. Я вставил изображение и спросил что изображено на нём.

-11

Вполне себе результат. Но стоит ли это 20 $ в месяц?

Что умеет Gemini 1.5 Pro.

Gemini 1.5 Pro доступна бесплатно на сайте AI Studio. Она не может создавать изображения и выходить в интернет, но зато может обрабатывать намного больший объем данных. Правда модель была обучена на данных до начала 2023 года.

Интерфейс доступен только на английском языке, но нейросеть понимает русский. Запрос можно ввести в поле «Type Something» или загрузить медиа-файлы — с помощью кнопки «Image», «Video», «File» или «Folder».

Версия нейросети находится в стадии тестирования, поэтому у нее есть ограничение: история чатов не сохраняется. Если вы хотите начать новый диалог, нажмите «Создать новый». Если вам нужны данные из диалога с нейросетью, вы можете сохранить их вручную.

Генерировать тексты в этой версии получается немного лучше, она лучше справляется со «сложными» запросами, немного адекватней работает с HTML-кодом, да и в общем работает лучше во всех направлениях.

Обрабатывать больше объемы данных. Вы можете загрузить любой PDF-файл с необходимой информацией, написать запрос, указав, что именно вы хотите получить от нейросети и загруженного файла и модель предоставит вам ответ в сжатом или более развернутом виде, перескажет текст или выполнит другую задачу. На данный момент, это значительное преимущество версии 1.5 Pro по сравнению с аналогами, так как она позволяет работать с большими документами. Например, быстро найти ответ на вопрос в длинной статье или двухчасовом подкасте. Мне кажется, даже платный Chat GPT не может этого сделать.

Распознавать изображения. В отличие от других версий, 1.5 Pro может обрабатывать изображения с людьми. Она может определить, кто изображен на фото и даже указать место. Также она может распознавать кадры из фильмов.

Что в итоге

Gemini – это бесплатная мультимодальная нейросеть, которая генерирует картинки и текст на приемлемом уровне. На фоне платных или сложных в использовании конкурентов, это хороший и доступный вариант. Единственный очевидный недостаток – невозможность создавать изображения с людьми.

Продвинутая версия Gemini Advanced работает незначительно лучше, чем ее бесплатный аналог. Очевидных причин покупать подписку нет. Однако, если есть желание, можно воспользоваться тестовым периодом.

Gemini 1.5 Pro также доступна бесплатно и лучше работает с текстом, кодом и распознаванием изображений, чем другие версии. В ней можно обрабатывать целые книги или час видео. Такой возможности нет даже в платном ChatGPT. Однако, 1.5 Pro не может генерировать картинки и работать в интернете.

-12

Всем спасибо за внимание. Всего доброго и до новых встреч.

Ну и конечно же, если вам понравилась эта статья, буду рад вашим подпискам, комментариям и лайкам. Недавно я запустил Discord-канал и постараюсь поддерживать его насколько возможно, там вы сможете не только следить за новостями, но и общаться, делиться опытом и приобретать новые знания о нейросетях. Чтобы всегда быть в курсе моих новых материалов, подписывайтесь на мой Boosty, Telegram-канал и страницу "ВКонтакте". Пока что нас немного, но я надеюсь, что с течением времени сообщество станет больше. Это станет отличной мотивацией для меня активно работать и над другими социальными сетями.