Здравствуйте, дорогие друзья! Сегодня я хочу поделиться с вами информацией о Gemini от Google, который, по сути, является ChatGPT, но немного в другой обёртке.
Не так давно он назывался Bard, но Google зачем то переименовали его в Gemini. Ребрендинг был объяснен тем, что компания стремится создать экосистему вокруг нейросети Gemini, и отдельное название для сервиса не требуется. Основные функции и интерфейс чат-бота остались неизменными со времен Bard. Нейросеть продолжает отвечать на русском языке, распознавать контекст, запоминать детали разговора и выходить в интернет. Количество диалогов и запросов в сутки не ограничено.
Конечно же вместе с ребрендингом в нейросеть добавили новые функции.
Gemini – это чат-бот, который работает и выглядит как Chat GPT, но с некоторыми дополнительными возможностями. Бесплатная версия чат-бота от Google имеет доступ к интернету и может создавать изображения по запросу. Нейросеть может отвечать на вопросы, писать код, распознавать изображения, помогать с контентом и делать многое другое.
Существуют три модели Gemini, которые доступны широкой аудитории. Доступ к ним и их способности немного различаются. В этом тексте я расскажу, как пользоваться разными версиями чат-бота из России и какие функции они поддерживают.
Какие версии Gemini существуют?
Всего доступно три версии Gemini: бесплатные 1.0 Pro и 1.5 Pro, а также платная версия 1.0 Ultra.
Gemini 1.0 Pro. На его основе работает чат-бот Gemini. Он может помочь вам приготовить пятнистого суслика в собственном соку или написать инструкцию по вышиванию крестиком, объяснить суть теории струн, создать пост для соцсетей, помочь с кодом (но я бы посоветовал в этом вопросе сильно ему не доверять), сценарием для вашего фильма или даже помочь с планом для статьи.
Ну и в феврале 2024 года пользователям, наконец то, стала доступна функция генерации изображений.
Gemini 1.0 Ultra. Возможно, это то же самое, что и Gemini 1.0 Pro, но с еще более расширенными возможностями. По крайней мере, так говорят в Google. На этой модели установлен платный чат-бот Gemini Advanced, который должен гораздо лучше справляться с сложными запросами: писать код, рассуждать, выполнять детальные инструкции и помогать в креативных задачах.
Gemini 1.5. 15 февраля компания Google представила ограниченную предварительную версию модели Gemini 1.5 Pro через AI Studio. Эта модель способна обрабатывать до миллиона токенов, что значительно больше, чем у Chat GPT с контекстным окном в 128 тысяч токенов.
Это означает, что Gemini 1.5 Pro может распознавать час видео, 11 часов аудио, более 30 тысяч строк кода и свыше 700 тысяч слов, что делает ее одной из самых мощных моделей на рынке.
По заверениям представителей Google, модель может анализировать любую предоставляемую информацию и "вылавливать" из неё информацию в мелких деталях. Не могу сказать, что делает это он со 100 процентной точностью, но иногда можно посмеяться над "ошибками" нейросети.
Но при этом Gemini Pro 1.5 не может генерировать картинки и не имеет доступа к интернету.
Как получить доступ ко всем версиям Gemini в России.
Всеми моделями Google Gemini можно свободно пользоваться из России. Единственное, что может отличаться, это некоторые нюансы, связанные с доступом.
Небольшое отступление. У меня не получилось зайти на сайт и начать пользоваться чат-ботом без танцев с бубном. Гугл упорно мне заявлял, что лицом не вышел и пользоваться нашим Gemini не будешь. Если вам интересна эта нейросеть, думаю не будет проблемой объяснить гуглу что вы вообще не местный и вам очень нужно!
Модель Gemini 1.0 Pro предоставляется бесплатно и работает на официальном сайте Gemini. Чтобы использовать чат-бот, вам нужно войти в свой аккаунт Google, предварительно изменив регион в настройках системы. Дальше все по классике, не мне вам рассказывать, что нужно делать в подобных случаях.
Нейросеть Gemini также доступна в приложении Google для iOS. Чтобы получить доступ к ней, на главном экране приложения нажмите на иконку с синей звездой – откроется чат с ботом. Обратите внимание, что для iOS у нас нет отдельного приложения Gemini, но в магазине приложений App Store можно найти множество сервисов с похожим названием, которые могут имитировать работу нейросети, делая свои мелкие гадости в фоновом режиме. Если вы не уверены, что это именно настоящее приложение, не рискуйте понапрасну.
Для пользователей смартфонов на Android OS есть даже приложение Gemini. Но к сожалению, оно недоступно в российском магазине для скачивания без танцев с бубном. Опять же, вы знаете, что нужно делать в таких случаях.
Gemini 1.0 Ultra доступен для покупки на официальном сайте Gemini. Для этого потребуется войти в систему, с помощью аккаунта Google и неместного IP.
Подписка на сервис стоит 20 вечнозеленых рублей в месяц. Однако, вы можете воспользоваться двухмесячным бесплатным тестовым периодом. Для этого необходимо привязать банковскую карту зарубежного банка. По окончании тестового периода, с вашей карты будет списана стоимость подписки за следующий месяц.
Gemini 1.5 Pro доступна для бесплатного использования, но только в Google AI Studio. На сайт нужно заходить с неместным IP-адресом. Для входа понадобится гугл-аккаунт, можно кстати использовать российский. Ну и желательно в настройках профиля поменять язык на английский, чтобы точно все заработало.
Как Gemini работает с текстом и поиском, в сравнении с Bard.
Чат с помощником и подсказки расположены справа, а все чаты с нейросетью – слева. Интерфейс переведен на русский язык по умолчанию, если ваш гугл-аккаунт привязан к российскому региону и языку.
Добавлены новые возможности. На них я остановлюсь немного подробнее и расскажу, что в целом может Gemini.
А может он генерировать тексты. Нейросеть отвечает на простые вопросы и объясняет сложные термины, как это делает бесплатная версия Chat GPT. Gemini также имеет доступ к актуальной информации, поэтому может выходить в интернет и предоставлять ссылки на источники.
Как и у Bard, у Gemini есть свои недостатки. Иногда нейросеть может давать неверные ответы или отказываться отвечать на вопросы без видимой причины. Также, она не всегда предоставляет ссылки на источники информации.
Несколько раз я замечал, что Gemini начинает упорно впаривать мне подписку, что сильно напрягает. WTF!?
Хотя стоит отметить, когда у Gemini есть настроение "пообщаться" то делает он это вполне себе адекватно.
Google в своих пресс-релизах подчеркивает, что инструмент Gemini может быть полезен для программирования, он знает разные языки программирования, может искать ошибки и объяснять их. На момент написания статьи к сожалению не могу вам показать какие то конкретные ошибки, но с ними по мере использования сталкиваешься не только при использовании Gemini.
Нейросеть умеет ходить по ссылкам которые вы ей даете и даже вроде бы читает и понимает содержимое, но зачастую выдает совершенно неприемлемые результаты.
Так же нейросеть возможно использовать и для самообразования, как генератор идей. Она будет пытаться помогать вам во всем, что только в голову взбредет, конечно в разумных пределах.
Также, этот сервис умеет кратко пересказывать содержание текста или видео, хотя сейчас этим уже вряд ли кого-то удивишь. Однако, с YouTube у него не очень хорошие отношения, и 9 из 10 запросов не дадут ожидаемого результата. Странно и непонятно, с чем это связано.
Но, несмотря на некоторые недостатки, со времен Bard, функция стала работать лучше. Нейросеть действительно пытается пересказать текст, а не выдает случайные факты на тему и не отказывается выполнять задание в целом, как это было раньше. Однако, до идеала всезнайки, который любит делиться знаниями, ему еще далеко.
Модель Gemini обладает способностью искать по картинкам в интернете и описывать фотографии, которые вы отправляете в чат. Она справляется с простыми задачами, но более сложные, такие как поиск суслика на картинке с несколькими животными, ей не под силу.
Кроме того, модель не может работать с изображениями людей. То есть, с помощью нейросети невозможно взаимодействовать с фотографиями или даже рисунками, на которых есть любой человек, независимо от того, известен он или нет.
По утверждениям Google, Gemini умеет генерировать изображения по запросу. А так же генерировать изображение и текст одновременно. Нейросеть является мультимодальной — то есть может обрабатывать текст и изображения в рамках одного запроса. Это означает, что Gemini можно попросить сочинить историю и сгенерировать иллюстрации к ней. Удобно. Но не знаю как у гугла, но у меня так и не вышло заставить его генерировать изображения, какие бы я запросы не вводил.
Была информация, что у Google, возникли некоторые проблемы с использованием своей технологии. После того, как пользователи начали создавать исторических личностей на изображениях, система по каким-то причинам начала выдавать изображения темнокожих людей. Это, конечно же, вызвало обвинения в расовой дискриминации белых, и поэтому на неопределенное время возможность генерации людей была временно отключена.
Есть еще Gemini Advanced — продвинутая версия чата, доступная по платной подписке и работающая на основе модели 1.0 Ultra. Если вы подпишетесь на платную версию, чат автоматически изменит тему на черную, однако в настройках вы сможете вернуть белую тему. Переключиться между бесплатной и платной версиями можно с помощью кнопки «Gemini» / «Gemini Advanced».
Что умеет платная версия.
Генерировать тексты. В простых запросах качество ответов Gemini Advanced не сильно отличается от базовой версии. По одним и тем же запросам выдаются почти одинаковые ответы.
Google утверждает, что разницу можно заметить при решении более сложных задач, таких как составление пошаговых инструкций, обучение и создание креативного контента.
Кратко пересказывать. Gemini Advanced немного лучше перескажет вам любой материал нежели это сделает базовая версия. Но и здесь расслабляться и доверять на все 100 в достоверности текста не стоит.
Распознаёт изображения. Я вставил изображение и спросил что изображено на нём.
Вполне себе результат. Но стоит ли это 20 $ в месяц?
Что умеет Gemini 1.5 Pro.
Gemini 1.5 Pro доступна бесплатно на сайте AI Studio. Она не может создавать изображения и выходить в интернет, но зато может обрабатывать намного больший объем данных. Правда модель была обучена на данных до начала 2023 года.
Интерфейс доступен только на английском языке, но нейросеть понимает русский. Запрос можно ввести в поле «Type Something» или загрузить медиа-файлы — с помощью кнопки «Image», «Video», «File» или «Folder».
Версия нейросети находится в стадии тестирования, поэтому у нее есть ограничение: история чатов не сохраняется. Если вы хотите начать новый диалог, нажмите «Создать новый». Если вам нужны данные из диалога с нейросетью, вы можете сохранить их вручную.
Генерировать тексты в этой версии получается немного лучше, она лучше справляется со «сложными» запросами, немного адекватней работает с HTML-кодом, да и в общем работает лучше во всех направлениях.
Обрабатывать больше объемы данных. Вы можете загрузить любой PDF-файл с необходимой информацией, написать запрос, указав, что именно вы хотите получить от нейросети и загруженного файла и модель предоставит вам ответ в сжатом или более развернутом виде, перескажет текст или выполнит другую задачу. На данный момент, это значительное преимущество версии 1.5 Pro по сравнению с аналогами, так как она позволяет работать с большими документами. Например, быстро найти ответ на вопрос в длинной статье или двухчасовом подкасте. Мне кажется, даже платный Chat GPT не может этого сделать.
Распознавать изображения. В отличие от других версий, 1.5 Pro может обрабатывать изображения с людьми. Она может определить, кто изображен на фото и даже указать место. Также она может распознавать кадры из фильмов.
Что в итоге
Gemini – это бесплатная мультимодальная нейросеть, которая генерирует картинки и текст на приемлемом уровне. На фоне платных или сложных в использовании конкурентов, это хороший и доступный вариант. Единственный очевидный недостаток – невозможность создавать изображения с людьми.
Продвинутая версия Gemini Advanced работает незначительно лучше, чем ее бесплатный аналог. Очевидных причин покупать подписку нет. Однако, если есть желание, можно воспользоваться тестовым периодом.
Gemini 1.5 Pro также доступна бесплатно и лучше работает с текстом, кодом и распознаванием изображений, чем другие версии. В ней можно обрабатывать целые книги или час видео. Такой возможности нет даже в платном ChatGPT. Однако, 1.5 Pro не может генерировать картинки и работать в интернете.
Всем спасибо за внимание. Всего доброго и до новых встреч.
Ну и конечно же, если вам понравилась эта статья, буду рад вашим подпискам, комментариям и лайкам. Недавно я запустил Discord-канал и постараюсь поддерживать его насколько возможно, там вы сможете не только следить за новостями, но и общаться, делиться опытом и приобретать новые знания о нейросетях. Чтобы всегда быть в курсе моих новых материалов, подписывайтесь на мой Boosty, Telegram-канал и страницу "ВКонтакте". Пока что нас немного, но я надеюсь, что с течением времени сообщество станет больше. Это станет отличной мотивацией для меня активно работать и над другими социальными сетями.