Найти тему
380 подписчиков

AI новости последней недели: Вышел Flux 1.1 [pro], OpenAI анонсировала Realtime API для Voice Engine


Flux 1.1

Пока что доступна только Pro версия, речи о dev версии пока не идет. Что же касается Pro версии, то на данный момент она является лучшей моделью для генерации изображений, при этом генерация изображения происходит в несколько раз быстрее, по сравнению с прошлой версией.

Протестировать можно тут. Также бесплатно (пока что) и быстро протестировать модель можно на сервисе BlinkShot.

Realtime API

Realtime API позволяет разработчикам внедрить в свои продукты speech-to-speech, который будет работать с минимальной задержкой, по сравнению с текущими известными решениями. По факту, это позволяет использовать ряд возможностей из нового VoiceEngine, создавая продвинутых голосовых ассистентов. Новый функционал доступен в рамках модели gpt-4o-audio-preview. C документацией уже можно ознакомиться тут.

Цена использования API:
Текст: 5$/1M токенов на вход и 20$/1M токенов на выходе
Аудио: 100$/1M на вход и 200$/1M токенов на выход, или же 0.06$ за 1 минуту аудио на входе и 0.24$ за минуту на выходе.

Пока что для работы будет поддерживаться текст и аудио, но в будущем планируется также добавить поддержку видео. Также планируется выпустить поддержку realtime api на основе gpt-4o-mini

#ainews #chatgpt #flux #txt2img

1 минута