На смену популярному ChatGPT пришла модель OpenAI GPT-4, которая дебютировала год назад. По заявлениям разработчика, она предоставляет более точные и оперативные ответы. Однако со временем в GPT-4 обнаружились проблемы - наблюдалась деградация качества и нежелание модели отвечать на некоторые запросы. В попытке решить эту проблему был выпущен GPT-4 Turbo.
Интересно, что большая часть данных, используемых для обучения таких крупных языковых моделей, принадлежит правообладателям. OpenAI открыто выступает против ограничения доступа к этой информации.
В настоящий момент компания продолжает разработку GPT-5. После завершения обучения модель пройдет всестороннее тестирование на безопасность и различные стрессовые сценарии, чтобы выявить и устранить потенциальные проблемы. Точные сроки обновленного релиза GPT-5 пока не определены.
Судя по всему, OpenAI нацелена на дальнейшее усовершенствование своих ключевых продуктов в стремлении упрочить лидерство в бурно развивающемся сегменте крупных языковых моделей искусственного интеллекта. Об этом свидетельствуют планы по выпуску GPT-5 в середине 2024 года, а также позитивные отзывы корпоративных клиентов, уже ознакомившихся с демоверсиями новой модели.
Компания также упоминает о ряде дополнительных, пока не реализованных функций GPT-5, включая автономное выполнение задач с помощью ИИ-агентов. Это позволяет предположить, что OpenAI планирует расширять возможности своих продуктов, стремясь обеспечить их лидирующие позиции на рынке.
А пока же.... Пока вышла некая новая бета-версия "пятерки". Официально она называется GPT-4 Omni (GPT-4o) от все той же компании OpenAI. Но эксперты говорят, что в ней уже вставлены зачатки и фрагменты GPT-5. Эта нейросеть обладает улучшенными качествами по сравнению с предыдущими версиями и приближается к "уровню человека" в плане понимания и обработки информации.
Важным отличием GPT-4o является ее мультимодальность - чат-бот способен воспринимать и обрабатывать данные различных типов, включая текст, аудио, изображения и видео. Помните, как в фильмах про будущее, где герои общаются со встроенным в дом/космический корабль собеседником?
Обновления GPT-4o включают улучшенное понимание естественного языка, распознавание речи, а также возможности по распознаванию и анализу визуальной информации. Благодаря этому модель может применяться в широком спектре задач:
- Перевод, распознавание речи, работа с изображениями и видео
- Генерация контента, в том числе видео, и комментирование медиаматериалов
- Ведение последовательных диалогов, помощь в обучении и выполнении рабочих задач
- Разработка программного кода, подготовка отчетов, создание дизайна и многое другое
По оценкам, GPT-4o может быть крайне полезен для бизнеса, образования, сферы услуг и других областей. Хотя в России модель пока официально недоступна, есть возможность получить к ней доступ через различные платные и бесплатные платформы.
Учитывая всесторонние возможности GPT-4o, можно предположить, что данная разработка OpenAI станет важной вехой в развитии крупных мультимодальных языковых моделей искусственного интеллекта. Ее широкое применение способно качественно трансформировать многие сферы человеческой деятельности в ближайшие годы.