48 подписчиков

OpenAI выпускает более дешевую и умную модель

18 июля 202418 июл 2024

3 мин

OpenAI выпускает более легкую и дешевую модель, с которой разработчикам придется повозиться, под названием GPT-4o Mini. Она стоит значительно дешевле полноразмерных моделей и, как говорят, более производительна, чем GPT-3.5. Создание приложений с использованием моделей OpenAI может потребовать огромных затрат. Разработчики, у которых нет средств, чтобы позволить себе возиться с ней, могут полностью отказаться от нее и могут выбрать более дешевые модели, такие как Google Gemini 1.5 Flash или Anthropic Claude 3 Haiku. Теперь OpenAI вступает в игру с легкими моделями. “Я думаю, GPT-4o Mini действительно соответствует миссии OpenAI - сделать искусственный интеллект более доступным для людей. Если мы хотим, чтобы ИИ приносил пользу каждому уголку мира, каждой отрасли, каждому приложению, мы должны сделать ИИ намного более доступным ”, - сказал Оливье Годемент, руководитель продукта API platform, The Verge. С сегодняшнего дня пользователи ChatGPT по тарифам Free, Plus и Team могут использова

Создание приложений с использованием моделей OpenAI может потребовать огромных затрат. Разработчики, у которых нет средств, чтобы позволить себе возиться с ней, могут полностью отказаться от нее и могут выбрать более дешевые модели, такие как Google Gemini 1.5 Flash или Anthropic Claude 3 Haiku. Теперь OpenAI вступает в игру с легкими моделями.

“Я думаю, GPT-4o Mini действительно соответствует миссии OpenAI - сделать искусственный интеллект более доступным для людей. Если мы хотим, чтобы ИИ приносил пользу каждому уголку мира, каждой отрасли, каждому приложению, мы должны сделать ИИ намного более доступным ”, - сказал Оливье Годемент, руководитель продукта API platform, The Verge.

С сегодняшнего дня пользователи ChatGPT по тарифам Free, Plus и Team могут использовать GPT-4o Mini вместо GPT-3.5 Turbo, а корпоративные пользователи получат доступ на следующей неделе. Это означает, что GPT-3.5 больше не будет доступен для пользователей ChatGPT, но он по-прежнему будет доступен разработчикам через API, если они предпочтут не переходить на GPT-4o Mini. Годемент сказал, что GPT-3.5 в какой-то момент будет удален из API — они просто не уверены, когда.

Новая облегченная модель также будет поддерживать текстовые и визуальные функции в API, и компания заявляет, что вскоре она будет обрабатывать все мультимодальные входы и выходы, такие как видео и аудио. Со всеми этими возможностями это может выглядеть как более способные виртуальные помощники, которые могут понять ваш маршрут путешествия и внести предложения. Однако модель предназначена для простых задач, поэтому никто точно не создает Siri по дешевке.

Эта новая модель набрала 82% баллов по тесту Measuring Massive Multitask Language Understanding (MMLU), базовому экзамену, состоящему примерно из 16 000 вопросов с множественным выбором по 57 учебным предметам. Когда MMLU был впервые представлен в 2020 году, большинство моделей справлялись с этим довольно плохо, что и было целью, поскольку модели стали слишком продвинутыми для предыдущих тестов. GPT-3.5 набрал 70 процентов в этом бенчмарке, GPT-4o - 88,7 процента, а Google утверждает, что у Gemini Ultra самый высокий за всю историю показатель - 90 процентов. Для сравнения, конкурирующие модели Claude 3 Haiku и Gemini 1.5 Flash набрали 75,2% и 78,9% соответственно.

Стоит отметить, что исследователи с опаской относятся к эталонным тестам, таким как MMLU, поскольку способы их проведения немного различаются от компании к компании. Существует также проблема с тем, что ИИ потенциально может иметь эти ответы в своем наборе данных, что, по сути, позволяет ему жульничать, и, как правило, сторонние оценщики не участвуют в процессе.

Для разработчиков, жаждущих создавать приложения с искусственным интеллектом по дешевке, запуск GPT-4o Mini дает им еще один инструмент для пополнения своего инвентаря. OpenAI позволила стартапу финансовых технологий Ramp протестировать модель, используя GPT-4o Mini для создания инструмента, который извлекает данные о расходах из квитанций. Таким образом, вместо того, чтобы перебирать текстовые поля, пользователь может загрузить фотографию своего чека, и модель отсортирует все это за него. Почтовый клиент Superhuman также протестировал GPT-4o Mini и использовал его для создания функции самовнушения ответов по электронной почте.

Цель состоит в том, чтобы предоставить разработчикам что-то легкое и недорогое для создания всех приложений и инструментов, которые они не могли себе позволить создавать с помощью более крупной и дорогой модели, такой как GPT-4. Многие разработчики обратились бы к Claude 3 Haiku или Gemini 1.5 Flash, прежде чем оплачивать ошеломляющие вычислительные затраты, необходимые для запуска одной из самых надежных моделей.

Итак, почему OpenAI потребовалось так много времени? Годемент сказал, что это была “чистая расстановка приоритетов”, поскольку компания была сосредоточена на создании более крупных и совершенных моделей, таких как GPT-4, что требовало много “человеческих и вычислительных усилий”. С течением времени OpenAI заметила тенденцию к тому, что разработчики стремятся использовать модели меньшего размера, поэтому компания решила, что сейчас самое время вложить свои ресурсы в создание GPT-4o Mini.

Оригинал статьи на theverge.com