Хотя он и не уточнил, похоже, что Альтман в первую очередь говорит об изменениях в модели, которые сделали ее ответы при использовании в качестве чат-бота "более прямыми, менее многословными", для чего OpenAI приводит следующий пример: Обновленная модель также получает более высокие оценки по большинству распространенных тестов искусственного интеллекта, включая тест вопросов и ответов Google-Proof для выпускников. Этот сложный набор данных был разработан для проверки способностей студентов LLM и включает в себя тест из 448 вопросов с несколькими вариантами ответов, вопросы которых распределены по всем научным областям. Вопросы разработаны экспертами в соответствующих областях, чтобы оценить не только то, насколько хорошо LLM могут отвечать на вопросы, но и насколько хорошо они могут контролироваться людьми. Этот тест является самым слабым тестом GPT-4, и новая версия улучшает его результат в этом тесте примерно с 35% до чуть менее 50%, что является отличным результатом в этом сложном
OpenAI объявила об обновлении ChatGPT GPT-4 Turbo с некоторыми довольно существенными изменениями
15 апреля 202415 апр 2024
27
1 мин