Каждый день приходят новости про нейросети. Компании соревнуются, у кого ИИ будет быстрее, точнее, и станет настоящим помощником человеку во всех вопросах (и как на этом можно заработать много денег). И судя по тому, что представила на суд пользователям Open AI в своей весенней презентации Spring Update, именно эта исследовательская организация выбивается в лидеры.
Разработчики показали GPT-4o – это новая мультимодальная генеративная модель, которую тренировали на текстах, фотографиях и видео.
Она умнее своих предшественников по всем параметрам, также обходит и коллег у конкурентов. Посмотрите табличку.
ЧТО В НЕЙ ХОРОШЕГО
Она дает генерацию не только текстом, но и голосом. И если раньше между вопросом и ответом было порядка 3 секунд, то сейчас около 320 милллисекунд, то есть аналогично реакции человека в беседе. Все дело в том, что раньше, чтобы появился голос, приходилось задействовать 3 нейронки, сейчас GPT-4o делает все самостоятельно. «В случае с GPT-4o мы обучили единую новую модель сквозному анализу текста, изображения и аудио; это означает, что все входные и выходные данные обрабатываются одной и той же нейронной сетью».
GPT-4o может менять интонации в зависимости от предмета разговора.
Посмотрите видео ниже, как она знакомится с собакой. Не похоже на робота, словно слышишь человеческий голос, но только по телефону.
Эта нейросеть за несколько секунд дает выжимку из видео, причем достаточно точно и корректно.
Запоминает контекст не только одной беседы, но и всех чатов с этим конкретным пользователем.
Знает 50 языков. Доступна функция переводчика. Идеально работает на английском, чуть хуже на всех остальных. Но это почти не заметно.
Может синтезировать объекты в 3D.
Лучше, чем GPT-4 Turbo анализирует данные, в том числе графики, диаграммы, скриншоты.
Пользуется интернетом, чтобы дать самые актуальные ответы
Отлично работает с кодом и текстами.
Умеет объяснять, подстраиваясь под пользователя. Например, не просто предоставляет школьнику решение задачи, но объясняет доступным для него языком.
С разрешения обрабатывает информацию с рабочего стола компьютера или экрана смартфона.
Объясняет не только то, что изображено на фото, но и то, что показывает камера смартфона. Например, поймет, что у человека день рождения, если показать торт со свечкой.
Как утверждают в Open AI, проработали и вопрос с безопасностью данных, к которым получает доступ новая мультимодальная модель.
А МОЖНО ДВЕ?
Пока нет. Создатели обещают бесплатный доступ для всех. Но сейчас пользоваться GPT-4o могут только разработчики и избранные техноблогеры, причем без «голосовой» функции. В июне выдадут разрешение владельцам платной подписки Plus, у которых кстати, будет в два раза больше возможностей, чем у остальных. Но дойдет дело и до обычных людей. Так что очень ждем.
А пока пересматриваем фильм “Она” с Хоакином Фениксом про отношения человека с ИИ и решаем вопрос со стабильным интернетом и подходящим тарифом у ведущих операторов: МТС, Ростелеком, Дом.ру, ТТК, билайн.
Ждем вас в нашем Telegram, где публикуем самые интересные новости из мира технологий. Скучно точно не будет.
#домконнект #домашнийинтернет #домашнеетелевидение #домашнеетв #провайдерыроссии #мтс #билайн #подключитьинтернет #mts #beeline #domkonnekt #rostelecom#провайдеры#GPT-4o#нейросети#ИИ#