Мы можем ожидать его выхода в ноябре, возможно, в 2-ю годовщину запуска легендарного Chat GPT.
В аналогичные сроки мы также получим Gemini 2 Ultra, LLaMA-3, Claude-3, Mistral-2 и многие другие новаторские модели.
(Gemini от Google, похоже, уже составляет жесткую конкуренцию GPT-4 turbo)
Практически очевидно, что GPT-5 будет выпущен поэтапно, при этом промежуточные контрольные точки будут устанавливаться во время обучения модели.
Само обучение может занять 3 месяца, а еще 6 месяцев - тестирование безопасности.
Чтобы дать представление о GPT-5, давайте сначала взглянем на характеристики GPT-4: Оценки модели GPT-4 Масштаб: GPT-4 имеет ~1,8 триллиона параметров в 120 слоях, что в 10 раз больше, чем у GPT-3. Смесь экспертов (MoE): OpenAI использует 16 экспертов в своей модели, каждый с ~111 млрд параметров для MLP (многослойный перцептрон). Набор данных: GPT-4 обучается на ~13Т токенах, включая как текстовые, так и кодовые данные, с некоторыми данными для точной настройки от ScaleAI и внутр