5 подписчиков

OpenAI готовит преемника GPT-4. Вот 3 крупных обновления, которых стоит ожидать от GPT-5

29 мая 202429 мая 2024

4 мин

Оглавление

Более высокая точность
Возросшая мультимодальность
Способность действовать автономно (AGI)

Станет ли GPT-5 первым магистром права с AGI? Вот что нам известно на данный момент.

Несмотря на то, что недавно выпущенная модель OpenAI, GPT-4o, значительно повысила спрос на большие языковые модели (LLM), компания уже работает над своей следующей флагманской моделью, GPT-5.

В преддверии весеннего мероприятия, на котором был анонсирован GPT-4o, многие люди надеялись, что компания запустит долгожданный GPT-5. Чтобы пресечь слухи, генеральный директор Сэм Альтман даже написал на X: "Это не gpt-5, это не поисковая система".

это не gpt-5, не поисковая система, но мы усердно работали над некоторыми новыми вещами, которые, как мы думаем, понравятся людям! для меня это похоже на волшебство. - Сэм Альтман

Теперь, всего две недели спустя, в сообщении в блоге, в котором сообщается о новом комитете по безопасности, сформированном правлением OpenAI для выработки рекомендаций по безопасности, компания подтвердила, что готовит свою следующую флагманскую модель, скорее всего, речь идет о преемнике GPT-4, GPT-5.

"OpenAI недавно приступила к разработке своей модели next frontier, и мы ожидаем, что полученные системы выведут нас на новый уровень возможностей на нашем пути к AGI [общему искусственному интеллекту]", - говорится в сообщении компании в блоге.

Несмотря на то, что могут пройти месяцы, если не больше, прежде чем GPT-5 станет доступен для клиентов - обучение LLM может занять много времени, - вот некоторые ожидания относительно того, что сможет сделать модель OpenAI следующего поколения, от наименее захватывающих до наиболее захватывающих.

Более высокая точность

Следуя прошлым тенденциям, мы можем ожидать, что GPT-5 станет более точным в своих ответах, поскольку он будет обучаться на большем количестве данных. Модели генеративного ИИ, такие как ChatGPT, работают, используя свой арсенал обучающих данных для получения ответов, которые они предоставляют. Следовательно, чем на большем количестве данных обучается модель, тем лучше ее способность генерировать согласованный контент, что приводит к повышению производительности.

С каждой выпущенной моделью объем обучающих данных увеличивался. Например, в отчетах говорится, что GPT-3.5 был обучен 175 миллиардам параметров, в то время как GPT-4 был обучен одному триллиону. Вероятно, с выпуском GPT-5 мы увидим еще больший скачок.

Возросшая мультимодальность

Оценивая возможности GPT-5, мы можем обратить внимание на различия между всеми основными флагманскими моделями, начиная с GPT-3.5, включая GPT-4 и GPT-4o. С каждым скачком модель становилась все более интеллектуальной и могла похвастаться множеством улучшений, включая цену, скорость, длину контекста и модальность.

GPT-3.5 может вводить и выводить только текст. С GPT-4 Turbo пользователи могут вводить текст и изображения для получения текстовых выходных данных. С помощью GPT-4o пользователи могут вводить комбинацию текста, аудио, изображений и видео и получать любую комбинацию текста, аудио и изображений на выходе.

Следуя этой тенденции, следующим шагом для GPT-5 станет возможность вывода видео. В феврале OpenAI представила свою модель преобразования текста в видео Sora, которая может быть встроена в GPT-5 для вывода видео.

Способность действовать автономно (AGI)

Нельзя отрицать, что чат-боты - это впечатляющие инструменты искусственного интеллекта, способные помогать людям во многих задачах, включая генерацию кода, формул Excel, эссе, резюме, приложений, диаграмм и таблиц и многое другое. Однако мы наблюдаем растущую потребность в ИИ, который знает, что вы хотите сделать, и может сделать это с минимальными инструкциями, - в общем искусственном интеллекте, или AGI.

С помощью AGI пользователи просили бы агента достичь конечной цели, и он мог бы добиться результата, рассуждая о том, что необходимо сделать, планируя, как это сделать, и выполняя задачу. Например, в идеальном сценарии, когда в GPT-5 был бы включен AGI, пользователи могли бы запросить такую задачу, как "Закажите мне бургер в McDonald's", и искусственный интеллект мог бы выполнить ряд задач, включая открытие сайта McDonald's и ввод вашего заказа, адрес и способ оплаты. Все, о чем вам нужно было бы беспокоиться, - это съесть бургер.

Стартап Rabbit R1 пытается достичь той же цели, создавая гаджет, который может использовать агентов для упрощения выполнения задач в реальном мире, таких как заказ такси Uber или еды. Устройство было распродано множество раз, несмотря на то, что оно не могло выполнять более сложные задачи, упомянутые выше.

Являясь следующим этапом развития искусственного интеллекта, AGI может полностью усовершенствовать тип помощи, которую мы получаем от ИИ, и полностью изменить наше представление о помощниках. Вместо того чтобы полагаться на помощников с искусственным интеллектом, которые будут сообщать нам, скажем, о погоде, они смогут помогать нам выполнять задачи от начала до конца, чего, если хотите знать мое мнение, стоит ожидать с нетерпением.

Оригинал: OpenAI is training GPT-4's successor. Here are 3 big upgrades to expect from GPT-5