7737 подписчиков

Open AI представили нейросеть GPT-4o, которая научилась отвечать на вопросы и общаться как человек

14 мая 202414 мая 2024

2 мин

Оглавление

ЧТО В НЕЙ ХОРОШЕГО
А МОЖНО ДВЕ?

Каждый день приходят новости про нейросети. Компании соревнуются, у кого ИИ будет быстрее, точнее, и станет настоящим помощником человеку во всех вопросах (и как на этом можно заработать много денег). И судя по тому, что представила на суд пользователям Open AI в своей весенней презентации Spring Update, именно эта исследовательская организация выбивается в лидеры.

Разработчики показали GPT-4o – это новая мультимодальная генеративная модель, которую тренировали на текстах, фотографиях и видео.

Она умнее своих предшественников по всем параметрам, также обходит и коллег у конкурентов. Посмотрите табличку.

MMLU - тест с вопросами на общие знания, GPQA - сложные вопросы из области физики, биологии, химии и т.д., MATH - проверка математических знаний, HumanEval - тест на возможность генерацию кода, MGSM - навык понимания математических и языковых задач на разных языках,

ЧТО В НЕЙ ХОРОШЕГО

Она дает генерацию не только текстом, но и голосом. И если раньше между вопросом и ответом было порядка 3 секунд, то сейчас около 320 милллисекунд, то есть аналогично реакции человека в беседе. Все дело в том, что раньше, чтобы появился голос, приходилось задействовать 3 нейронки, сейчас GPT-4o делает все самостоятельно. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью».

GPT-4o может менять интонации в зависимости от предмета разговора.

Посмотрите видео ниже, как она знакомится с собакой. Не похоже на робота, словно слышишь человеческий голос, но только по телефону.

Эта нейросеть за несколько секунд дает выжимку из видео, причем достаточно точно и корректно.

Запоминает контекст не только одной беседы, но и всех чатов с этим конкретным пользователем.

Знает 50 языков. Доступна функция переводчика. Идеально работает на английском, чуть хуже на всех остальных. Но это почти не заметно.

Может синтезировать объекты в 3D.

Лучше, чем GPT-4 Turbo анализирует данные, в том числе графики, диаграммы, скриншоты.

Пользуется интернетом, чтобы дать самые актуальные ответы

Отлично работает с кодом и текстами.

Умеет объяснять, подстраиваясь под пользователя. Например, не просто предоставляет школьнику решение задачи, но объясняет доступным для него языком.

С разрешения обрабатывает информацию с рабочего стола компьютера или экрана смартфона.

Объясняет не только то, что изображено на фото, но и то, что показывает камера смартфона. Например, поймет, что у человека день рождения, если показать торт со свечкой.

Как утверждают в Open AI, проработали и вопрос с безопасностью данных, к которым получает доступ новая мультимодальная модель.

А МОЖНО ДВЕ?

Пока нет. Создатели обещают бесплатный доступ для всех. Но сейчас пользоваться GPT-4o могут только разработчики и избранные техноблогеры, причем без «голосовой» функции. В июне выдадут разрешение владельцам платной подписки Plus, у которых кстати, будет в два раза больше возможностей, чем у остальных. Но дойдет дело и до обычных людей. Так что очень ждем.

А пока пересматриваем фильм “Она” с Хоакином Фениксом про отношения человека с ИИ и решаем вопрос со стабильным интернетом и подходящим тарифом у ведущих операторов: МТС, Ростелеком, Дом.ру, ТТК, билайн.

Ждем вас в нашем Telegram, где публикуем самые интересные новости из мира технологий. Скучно точно не будет.

#домконнект #домашнийинтернет #домашнеетелевидение #домашнеетв #провайдерыроссии #мтс #билайн #подключитьинтернет #mts #beeline #domkonnekt #rostelecom#провайдеры#GPT-4o#нейросети#ИИ#