Компания OpenAI совершила тройной запуск, выпустив специализированные модели для работы с голосом в реальном времени: флагманскую GPT-Realtime-2, переводчик GPT-Realtime-Translate и транскрибатор GPT-Realtime-Whisper. Все три уже доступны разработчикам через API. Главная звезда анонса — GPT-Realtime-2, первая аудиомодель с логическим мышлением «класса GPT-5». Она на 11 процентов превосходит предшественницу по производительности, а ее контекстное окно расширено с 32 до 128 тысяч токенов, что позволяет дольше удерживать нить беседы. Модель научилась выполнять параллельные действия и вставлять короткие реплики вроде «сейчас проверю», делая диалог почти неотличимым от человеческого. В компании Zillow после внедрения новинки зафиксировали скачок успешных звонков с 69 до 95 процентов — рост на 26 пунктов. Цены остались прежними: 32 доллара за миллион токенов аудиовхода и 64 доллара за аудиовыход. Вторая модель, GPT-Realtime-Translate, решает задачу синхронного перевода. Она понимает более 70