Архитектура трансформера, представленная в 2017 году, стала основой современных языковых моделей. В 2018 году OpenAI выпустила GPT-1 с 117 млн параметров — модель, способную создавать связный текст, но с ограниченным пониманием контекста. В 2019 году появилась GPT-2 с 1,5 млрд параметров и способностью выполнять задачи без дополнительного обучения (zero-shot learning). Значительный прорыв случился с GPT-3 в 2020 году — моделью на 175 млрд параметров, способной решать сложные задачи и писать код. На её базе создан ChatGPT — первый диалоговый ИИ, популярный среди широкой аудитории, несмотря на ограничения точности. В 2023 году вышла GPT-4, способная обрабатывать текст и изображения, что ознаменовало начало мультимодальности — работы с разными типами данных одновременно. Мультимодальные ИИ одновременно обрабатывают текст, изображение, звук и другие данные. Это позволяет глубже анализировать контекст и создавать универсальные решения, важные для медицины (анализ снимков и текстов), образов
Эволюция нейросетей: от больших языковых моделей к мультимодальным системам
20 августа 202520 авг 2025
2
1 мин