18,5K подписчиков

Вышла новая модель искусственного интеллекта GPT-4o

Революционный GPT-4o от OpenAI: новые возможности искусственного интеллекта. Так пишут сегодня зарубежные СМИ.

Революционный GPT-4o от OpenAI: новые возможности искусственного интеллекта. Так пишут сегодня зарубежные СМИ.

13 мая компания OpenAI представила свою последнюю разработку - GPT-4o, обновленную версию популярной языковой модели ChatGPT. Этот шаг стал ответом на ожидаемый анонс модели Gemini AI от Google на конференции I/O 2024.

Главным нововведением GPT-4o стала его мультимодальность - способность воспринимать не только текстовую, но и аудио- и видеоинформацию. Благодаря этому ИИ может напрямую анализировать речь пользователя, распознавать эмоции, окружение и даже действия, происходящие в кадре. Скорость реакции модели на голосовые сообщения также значительно возросла - до 232-320 миллисекунд, что сопоставимо с человеческой.

"Мы ушли от устаревшей трехэтапной схемы обработки аудио, - комментирует технический директор OpenAI Мира Мурати. - Теперь GPT-4o может напрямую воспринимать речь, анализировать ее контекст и формировать ответ". В демо-версии ИИ не только описал внешность, эмоции и окружение человека, но и сочинил и исполнил для него песню.

Помимо мультимодальности, разработчики также улучшили языковые способности GPT-4o. Модель стала лучше справляться с иностранными языками, выдавая более точные переводы в режиме реального времени. Это открывает новые возможности для пользователей, например, просмотр зарубежных шоу без ожидания выхода перевода.

Таким образом, GPT-4o демонстрирует значительный прогресс в развитии искусственного интеллекта. Объединение текстовых, аудио- и визуальных возможностей в одной модели - серьезный шаг на пути к созданию полноценного цифрового ассистента. Эксперты с нетерпением ждут, какие еще сюрпризы готовит OpenAI в ближайшем будущем.

Одним из ключевых нововведений стала улучшенная поддержка иностранных языков, что позволяет использовать ИИ в качестве переводчика в режиме реального времени.

Согласно демонстрации разработчиков, GPT-4o способна быстро переводить речь, открывая захватывающие перспективы для зрителей. Теперь они смогут смотреть шоу и сериалы на иностранных языках без необходимости ждать официального перевода.

Кроме того, компания увеличила производительность программы на других языках, чтобы сделать ChatGPT более полезным для зарубежных пользователей. Разработчикам удалось уменьшить количество токенов, необходимых для обработки текстов на английском и других языках, что положительно скажется на скорости работы ИИ.

Одним из ключевых улучшений GPT-4o стала значительно сокращенная задержка при ответе на голосовые сообщения. По заявлениям разработчиков из OpenAI, скорость, с которой программа реагирует на голосовые запросы, практически сравнялась с быстротой реакции живых людей.

Если предыдущие модели ChatGPT отвечали пользователям с задержкой в диапазоне 2,8–5,4 секунд при использовании голосового режима, то в GPT-4o это время удалось радикально сократить. Согласно заверениям компании, новый искусственный интеллект анализирует голосовую информацию всего за 232–320 миллисекунд (0,232–0,32 секунды).

Такое существенное повышение скорости реакции открывает новые горизонты для применения GPT-4o в повседневной жизни. Пользователи смогут вести более естественный диалог с ИИ, получая мгновенные ответы на свои голосовые запросы.

Новая версия ChatGPT получила название GPT-4o, символизирующее расширенные возможности

В названии обновленной версии языковой модели ChatGPT - GPT-4o - заключен особый смысл. Согласно заявлениям компании OpenAI, разработавшей этот искусственный интеллект, буква "о" в названии является отсылкой к латинскому префиксу omni, который на русский язык переводится как "все".

Таким образом, создатели GPT-4o намеревались подчеркнуть мультимодальность и новые широкие возможности обновленной версии своей знаменитой языковой модели. Данное название призвано отразить универсальность и всеохватность GPT-4o, способной работать с различными типами данных и выполнять разнообразные задачи.

Действительно, в новой версии разработчикам удалось значительно расширить функционал ChatGPT, добавив поддержку голосовых запросов, улучшенную обработку изображений и другие инновационные функции.