Компания OpenAIt из Сан-Франциско, создавшая ChatGpt, объявила о выпуске GPT-4o - улучшенной версии модели Gpt-4, на которой основаны возможности популярного чатбота, генерирующего тексты и изображения, как это делал бы человек.
Мира Муратите, главный технический директор OpenAI, то есть руководитель, контролирующий и определяющий технологическую стратегию компании, заявила во время потокового мероприятия, что новая модель "гораздо быстрее" предшествующих и обладает более широкими возможностями в плане "обработки текста, изображений и звука".
Буква "o" в GPT-4o означает "omni" - от латинского "omnis", " всё" - что относится к многорежимности GPT-4o.
В OpenAI также подчеркнули "впечатляющую" скорость реакции Gpt-4 при использовании аудиоввода: "Он может реагировать на аудиовход всего за 232 миллисекунды, в среднем за 320 миллисекунд, что приближается к времени реакции человека при разговоре", - утверждает компания из Сан-Франциско. Но эти показатели, очевидно, нужно будет проверить.
ChatGpt уже давно предлагает своим пользователям возможность прослушивать - с помощью виртуального голоса - ответы, сгенерированные искусственным интеллектом. Но благодаря Gpt-4o чатбот стал больше похож на виртуального помощника.
Новая модель, например, позволит пользователям ChatGpt задавать искусственному интеллекту дополнительные вопросы - или прерывать его - пока тот продолжает "говорить". До сих пор приходилось ждать, пока закончится генерация текста и соответствующего аудио. Таким образом, человек и машина будут общаться - если все будет работать так, как ожидает OpenAI.
Как бы это делали бы два реальных человека.
Gpt-4o также позволит ChatGpt распознавать эмоции в голосе пользователя, генерируя ответы с соответствующими тонами.
Во время живого общения Мурати также отметила, что "визуальные" возможности искусственного интеллекта быстро улучшаются: "Сегодня GPT-4o позволяет, например, сфотографировать меню на другом языке и перевести его на лету. В будущем с помощью ChatGPT можно будет "смотреть" спортивные соревнования в прямом эфире и объяснять правила игры".
Важным аспектом, особенно для пользователей за пределами США, является то, что Gpt-4o демонстрирует явное улучшение по сравнению с Gpt-4 Turbo в работе с текстами на языках, отличных от английского.
Все пользователи ChatGpt смогут воспользоваться возможностями новой модели Gpt-4o в отношении текстов и изображений. Даже те, кто пользуется чатботом без оплаты. Это важное изменение направления для OpenAI. До сих пор, по сути, только подписчики ChatGpt Plus - 20 евро в месяц плюс налоги - могли иметь предварительный доступ к новым функциям и самой продвинутой модели ИИ.
Мира Мурати, однако, заверила, что пользователи "Plus" сохранят привилегии, включая ограничение на запросы к высшему чат-боту не менее пяти раз по сравнению с теми, кто пользуется ChatGpt бесплатно. Напомним, что для пользователей ChatGpt Plus также действует лимит на взаимодействие: 40 раз в три часа.
Словом, Сэм Альтман говорил правду, сообщая " о некоторых новостях" относительно OpenAI, о поисковой системе, оснащенной искусственным интеллектом, которую компания, по слухам, намерена запустить в самое ближайшее время.
OpenAI анонсировал Gpt-4o, новую модель ИИ, бесплатную для тех, кто пользуется ChatGpt
14 мая 202414 мая 2024
1
2 мин