Найти в Дзене
Герман Геншин

Google Gemini: Все, что вам нужно знать о новом AI!

Оглавление

Искусственный интеллект (AI) сейчас на пике популярности. Приложения вроде ChatGPT ежедневно обсуждаются в новостях, а другие, как Claude, используются для написания сопроводительных писем и (да, иногда неудачных) романов. Google Gemini — это последний шаг компании Google в мир AI, который во многом заменяет Google Assistant и уже стал частью многих мобильных устройств, включая линейку телефонов Google Pixel.

Хотя может показаться, что разобраться, что такое Gemini и какие возможности он предоставляет, сложно, на самом деле это гораздо проще. Он способен существенно облегчить повседневные задачи и помочь найти ответы на вопросы, о которых вы даже не догадывались, избегая необходимости листать бесконечные статьи. Вот что вам нужно знать, чтобы начать использовать Gemini и настроить его под себя.

Что такое Google Gemini?

Вы когда-нибудь пользовались Google Assistant? Если да, то у вас уже есть общее представление о том, что привело к созданию Google Gemini. Этот ассистент стал важной частью системы умного дома Google, а затем интегрировался в телефоны, хотя ему всегда не хватало определённой функциональности, и он не выглядел как «настоящий» AI.

Gemini — это эволюция Google Assistant. Это многомодальная AI-модель, способная обрабатывать информацию из различных источников и «понимать» её в контексте. Она умеет распознавать изображения, слушать записи и читать текст, предоставляя понятные ответы.

Первые слухи о Gemini появились на конференции разработчиков Google I/O в 2023 году. Сначала он носил кодовое название Titan (по имени спутника Сатурна), но позже был переименован в Gemini. Gemini — это не только созвездие, но и латинское слово, означающее «близнецы», что особенно уместно, поскольку AI разрабатывался двумя независимыми командами Google: DeepMind и Google Brain.

AI был запущен в декабре 2023 года и с тех пор активно развивается. Другие проекты Google, такие как Bard и Duet AI, теперь также входят в общую экосистему Gemini. Эта языковая модель интегрирована во множество телефонов, ноутбуков и других устройств, а её возможности по работе с различными приложениями не имеют аналогов.

Недавняя версия, Gemini 2.5 Pro, доступна всем пользователям Gemini и способна «обдумывать» вопросы, предоставляя более развернутые и целенаправленные ответы.

В чем отличия Gemini от Google Assistant?

Google Gemini — это полноценный искусственный интеллект с гораздо более широкими возможностями, тогда как Google Assistant представляет собой набор стандартных функций с ограниченной вычислительной мощностью. Google Assistant выполняет ограниченное количество задач, но не может искать ответы или обрабатывать запросы так, как это делает Gemini.

Основное отличие заключается в следующем: Gemini — это искусственный интеллект, а Google Assistant — нет.

Что может сделать Gemini?

Гораздо проще спросить, что Gemini не может сделать. Ответ прост: он не может выполнять физические задачи (хотя это может измениться в будущем). Gemini Robotics (другое подразделение Google) работает над роботизированными помощниками, которые смогут выполнять такие задачи, как складывание одежды, уборка и даже игра в баскетбол.

На самом деле сказать, что Gemini не может делать эти вещи, не совсем правильно. Он способен понять, как это сделать, ему просто нужен интерфейс, чтобы это реализовать. Мы часто шутим, что AI похож на Розу из Семейки Джетсонов, но на самом деле мы ближе к этому, чем многие думают.

Что касается возможностей Gemini, то они зависят от ваших потребностей.

Создание видео

Если вы подписаны на Google One AI Premium (платный доступ, открывающий дополнительные функции), вы можете использовать инструмент Google Veo 2 для создания видео всего лишь на основе пары строк текста.

На данный момент Veo 2 способен создавать восьмисекундные клипы в разрешении 720p. По данным Google, Veo 2 «понимает уникальный язык кинематографии». Вы можете запросить определённые фокусные расстояния, эффекты и многое другое, разрешение до 4K и продолжительность до нескольких минут. Кроме того, Veo 2 обладает меньшим количеством «галлюцинаций», чем его конкуренты, что означает, что у вас будет меньше персонажей с лишними пальцами.

Обработка информации

Google Gemini способен анализировать до 30,000 строк кода или около 1,500 страниц текста одновременно. Дайте ему роман, и он сможет подвести итог сюжета, выделить темы, сформулировать вопросы для обсуждения и многое другое. Он помогает выявлять ошибки в коде и помогает программистам с устранением неполадок.

Если вы предоставите Gemini подкаст или аудиозапись, он сможет прослушать их и ответить на конкретные вопросы с указанием временных меток. Gemini также может интегрироваться с другими приложениями Google, такими как Gmail, и создавать маршруты путешествий на основе информации из вашего почтового ящика.

Я мог бы привести десятки других примеров. В случае с Gemini, способы его использования разнообразны, и невозможно упомянуть все их здесь.

Создание изображений

Gemini также способен генерировать изображения на основе текстовых описаний. Он использует Imagen 3, которую Google называет «моделью наивысшего качества для преобразования текста в изображения». Скажите ему, что вы хотите увидеть в изображении, стиль и другие детали, и он сможет создать все — от мультипликации до фотореалистичных ландшафтов.

После создания изображения вы можете доработать его, чтобы оно больше соответствовало вашим ожиданиям.

Исследования

Одной из самых мощных возможностей Gemini является способность к глубоким исследованиям. Он может за считанные минуты просматривать сотни различных источников в реальном времени, чтобы находить необходимые ответы. Например, вы можете попросить Gemini найти лучшие места в мире для поиска пляжного стекла. Он изучит всё: от туристических блогов до отзывов пользователей на Google Maps, чтобы найти локации и предложить их вам. После этого вы можете спросить его о наилучшем времени для покупки билетов на рейсы в эти места.

Глубокие исследования могут сэкономить вам часы ручного поиска, а поскольку Gemini предоставляет источники, откуда он берет информацию, вы можете перепроверить её точность. Google приложил много усилий, чтобы гарантировать, что Gemini предоставляет верные ответы, но всегда лучше проверять информацию самостоятельно, не принимая её на веру.

Gemini Live

Вы даже можете вести беседу с Gemini через Gemini Live. Это позволяет вам говорить напрямую с Gemini, не вводя вопрос в текстовом формате, и он будет отвечать так, будто вы общаетесь с реальным человеком. Вы также можете перебить Gemini в середине предложения, чтобы задать следующий вопрос. Это почти как разговор с настоящим собеседником.

Gemini Live отлично подходит для использования на ходу, особенно если вы используете Bluetooth наушники и пытаетесь получить информацию, находясь в движении. Gemini может обрабатывать видео в реальном времени, предоставляя ответы на то, что вы видите, когда гуляете по улице.

На каких устройствах доступен Gemini?

Google Gemini в настоящее время доступен как приложение для устройств на Android и iOS. Вы можете скачать его и опробовать его возможности, также доступна месячная бесплатная пробная версия подписки на Google One. В этом году Google планирует заменить Google Assistant на Gemini на большинстве устройств, включая умные колонки, телевизоры и другие.

Тем не менее, не все устройства получат это обновление. Устройство должно работать на Android 10 или выше и иметь более 2 ГБ оперативной памяти, чтобы поддерживать Gemini. Хотя подавляющее большинство современных гаджетов справятся с приложением, некоторые старые устройства на Android могут не подойти.

Gemini также совместим с устройствами Samsung и будет использовать встроенные приложения Samsung для получения необходимой информации.

Как изменить настройки Gemini?

На текущий момент возможности изменения настроек Gemini достаточно ограничены. Вот как вы можете их настроить.

На сайте gemini.google.com нажмите на три полоски в верхнем левом углу экрана и выберите Настройки. Отсюда вы можете выбрать Сохраненная информация, Приложения, Ваши публичные ссылки или переключить режим Темная тема.

Сохраненная информация позволяет вам предоставить Gemini информацию о себе, такую как предпочтения в питании, желаемый стиль ответов и другое.

Приложения — это понятное дело. Это ряд переключателей, которые позволяют вам связать Gemini с Google Workspace, YouTube и другими приложениями.

Ваши публичные ссылки — это чаты, которые вы выбрали для совместного использования с другими. Вы можете увидеть, с кем поделились чатом, и удалить или отозвать доступ с этой страницы.

Что лучше: Siri или Gemini?

Gemini безусловно лучше.

С технической точки зрения Gemini значительно превосходит все, о чем может мечтать Siri. Хотя есть надежда, что Siri улучшится с выходом новой версии голосового помощника от Apple, их график обновления уже сильно задерживается.

Siri придется изрядно постараться, чтобы хотя бы приблизиться к тому, что может Gemini сейчас. Преостановка развития Siri делает это почти невозможным. Если вы являетесь пользователем iPhone и задаетесь вопросом, ждать ли улучшений Siri или попробовать Gemini, просто скачайте приложение Gemini для iOS. Вы получите гораздо больше удовольствия от него прямо сейчас и всегда сможете вернуться к Siri, если новая версия когда-либо появится.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Вы также можете найти наши материалы в:

Google
89,1 тыс интересуются