Добавить в корзинуПозвонить
Найти в Дзене

Google представил Gemini 1.5: новый этап в гонке ИИ

14 мая Google (GOOGL) провела свою ежегодную конференцию для разработчиков Google I/O, где среди прочих инноваций представила свою новую большую языковую модель Gemini 1,5 Pro и её облегченную версию Gemini 1,5 Flash. Презентация состоялась на следующий день после того, как OpenAI анонсировала свою новейшую модель ИИ GPT-4o, делающую упор на мультимодальность и скорость взаимодействия. Подробнее об этом можно прочитать в нашем материале. Google продолжает планомерно развивать свою экосистему технологий искусственного интеллекта. После презентации OpenAI инвесторов интересовало, насколько конкурентным будет ответ Google. И действительно, большая языковая модель Gemini 1,5 Pro продемонстрировала заметное улучшение качества ответов, а также вдвое увеличила размер контекстного окна – объема доступной для ввода пользователем информации. Теперь Gemini 1,5 Pro способна обрабатывать запросы до 2,0 млн токенов, что эквивалентно примерно 30 тыс. строк компьютерного кода, книге объемом 2 000 тыс.

14 мая Google (GOOGL) провела свою ежегодную конференцию для разработчиков Google I/O, где среди прочих инноваций представила свою новую большую языковую модель Gemini 1,5 Pro и её облегченную версию Gemini 1,5 Flash. Презентация состоялась на следующий день после того, как OpenAI анонсировала свою новейшую модель ИИ GPT-4o, делающую упор на мультимодальность и скорость взаимодействия. Подробнее об этом можно прочитать в нашем материале.

Google продолжает планомерно развивать свою экосистему технологий искусственного интеллекта. После презентации OpenAI инвесторов интересовало, насколько конкурентным будет ответ Google. И действительно, большая языковая модель Gemini 1,5 Pro продемонстрировала заметное улучшение качества ответов, а также вдвое увеличила размер контекстного окна – объема доступной для ввода пользователем информации.

Теперь Gemini 1,5 Pro способна обрабатывать запросы до 2,0 млн токенов, что эквивалентно примерно 30 тыс. строк компьютерного кода, книге объемом 2 000 тыс. страниц или часовому видео. Руководство Google заявило, что ставит перед собой задачу добиться бесконечного контекстного окна. У модели Gemini 1,5 Flash объем контекстного окна ровно в два раза меньше – 1,0 млн токенов, что всё ещё впечатляет. Для сравнения, GPT-4o на данный момент может обработать до 128 тыс. токенов, а модель Claude 3 от стартапа Anthropic – 200 тыс. токенов.

Важно отметить, что, несмотря на значительный прогресс в объеме обрабатываемой информации, Gemini 1,5 Pro и, тем более, Gemini 1,5 Flash заметно уступают модели от OpenAI по функционалу и умственным возможностям.

Хотя на данный момент у моделей семейства Gemini есть очевидные минусы в сравнении с GPT, Google компенсирует это за счет ценовой политики. Так, к примеру, модель Gemini 1,5 Flash более чем в 14 раз дешевле в расчете на один входящий токен и в 28 раз дешевле в расчете на один исходящий токен.

Если сравнивать функционал, и в частности, мультимодальные возможности продуктов OpenAI и Google, то здесь успехи стартапа выглядят более убедительными, чем у корпоративного гиганта. ChatGPT уже запустила весь спектр возможных способов взаимодействия ИИ, в то время как у Google ещё не всё готово к запуску.

Среди прочего на конференции Google представила следующие ИИ-инструменты:

  • Нейросеть Veo для генерации видео в разрешении до 1080p по тексту, изображению или другому видео.
  • Project Astra — мультимодальный ИИ-ассистент, который распознаёт внешний мир через камеру смартфона и динамики.
  • AI Overviews — расширенный с помощью ИИ функционал поиска в браузере. Функция станет доступна в США уже на этой неделе.
  • Google Lens теперь может искать информацию во время съёмки видео.
  • Google Chrome на ПК получит ИИ-ассистента Gemini Nano.

Также Google представила свои новые серверные ИИ-чипы нового поколения TPU v5p Trillium, которые обеспечат прирост вычислительной производительности в 1,7 раза по сравнению с TPU v4. Напомним, что Google не продает свои чипы, а только сдаёт в аренду серверы на их основе.

Google
89,1 тыс интересуются