Лаборатория OpenAI представила новую мультимодальную модель искусственного интеллекта GPT-4o. Согласно заявлению компании, эта технология является еще одним шагом к более естественному взаимодействию человека с компьютером.
Буква "o" в названии модели означает "omni" - GPT-4o может обрабатывать любую комбинацию текста, аудио и изображений и предоставлять информацию во всех этих форматах. Кроме того, модель способна распознавать эмоции, прерывать себя в процессе речи и реагировать на общение так же быстро, как и человек.
Технический директор OpenAI Миры Мурати отметил, что новый алгоритм предоставляет интеллект "уровня GPT-4", но обладает лучшими возможностями в различных модальностях и средах.
Во время демонстрации OpenAI GPT-4o продемонстрировала свои возможности. Алгоритм в прямом эфире переводил текст с английского на итальянский, помогал исследователю решить линейное уравнение на бумаге в реальном времени и давал рекомендации по глубокому дыханию.
Отличие GPT-4o от предыдущих в