380 подписчиков
AI новости последней недели: Вышел Flux 1.1 [pro], OpenAI анонсировала Realtime API для Voice Engine
Flux 1.1
Пока что доступна только Pro версия, речи о dev версии пока не идет. Что же касается Pro версии, то на данный момент она является лучшей моделью для генерации изображений, при этом генерация изображения происходит в несколько раз быстрее, по сравнению с прошлой версией.
Протестировать можно тут. Также бесплатно (пока что) и быстро протестировать модель можно на сервисе BlinkShot.
Realtime API
Realtime API позволяет разработчикам внедрить в свои продукты speech-to-speech, который будет работать с минимальной задержкой, по сравнению с текущими известными решениями. По факту, это позволяет использовать ряд возможностей из нового VoiceEngine, создавая продвинутых голосовых ассистентов. Новый функционал доступен в рамках модели gpt-4o-audio-preview. C документацией уже можно ознакомиться тут.
Цена использования API:
Текст: 5$/1M токенов на вход и 20$/1M токенов на выходе
Аудио: 100$/1M на вход и 200$/1M токенов на выход, или же 0.06$ за 1 минуту аудио на входе и 0.24$ за минуту на выходе.
Пока что для работы будет поддерживаться текст и аудио, но в будущем планируется также добавить поддержку видео. Также планируется выпустить поддержку realtime api на основе gpt-4o-mini
#ainews #chatgpt #flux #txt2img
1 минута
5 октября 2024