13 мая OpenAI провела презентацию, где была представлена новая улучшенная модель GPT-4o, или просто GPT-4o Omni. Эта модель одновременно обрабатывает текст, изображения, видео и аудио, что является значительным прорывом в мире мультимодальных нейросетей. 💫 В отличие от Google, OpenAI продемонстрировала новые функции в прямом эфире, что подчеркивает скорость и прямоту подхода. GPT-4o Omni способна генерировать и обрабатывать текст, аудио и изображения в режиме реального времени, что делает взаимодействие с ней более естественным. 🙌 Одним из наиболее впечатляющих достижений GPT-4o является ее способность реагировать на запросы голосового помощника практически в режиме реального времени. Среднее время реакции составляет 232 миллисекунды, что сопоставимо со временем реакции человека🤯 Этот рекордный отклик в сочетании с возможностью работы с английским текстом и кодом, а также улучшенным пониманием неанглийских языков, делает GPT-4o Omni значительным событием в мире разговорных ИИ. API э